Anda di halaman 1dari 133

APOSTILA

ESTATSTICA BSICA A
(STC 210)

Ivanor Mller, Dr.


ivanormuller@smail.ufsm.br

D E - UFSM
2 0 10

1 Estatstica
1.1 O que Estatstica?
A Estatstica um conjunto de mtodos destinados coleta,
organizao, resumo, apresentao e anlise de dados de observao,
bem como da tomada de decises razoveis baseadas em tais anlises.
A Estatstica um conjunto de processos ou tcnicas
empregadas na investigao e anlise de fenmenos coletivos ou de
massa.
A Estatstica a matemtica aplicada aos dados de observao.
1.2 O que devemos saber sobre a Estatstica?
O que modernamente se conhece como Cincias Estatsticas, ou
simplesmente Estatstica, um conjunto de tcnicas e mtodos de
pesquisa que entre outros tpicos envolve o planejamento do
experimento a ser realizado, a coleta qualificada dos dados, a
inferncia, o processamento e anlise das informaes e a disseminao
das informaes.
O desenvolvimento e o aperfeioamento de tcnicas estatsticas de
obteno e de anlise de informaes permite o controle e o estudo
adequado de fenmenos, fatos, eventos e ocorrncias, em diversas
reas do conhecimento. A Estatstica tem por objetivo fornecer mtodos
e tcnicas para se lidar, racionalmente, com situaes sujeitas a
incertezas.
Apesar da Estatstica ainda ser uma rea de pesquisa
relativamente recente, ela remonta antigidade onde operaes de
contagem populacional j eram utilizadas para obteno de informaes
sobre os habitantes, riquezas e poderio militar dos povos. Aps a idade
mdia os governantes na Europa Ocidental, preocupados com a difuso
de doenas endmicas que poderiam devastar populaes e tambm
acreditando que o tamanho da populao poderia afetar o poderio
militar e poltico de uma nao, comearam a obter e armazenar
informaes sobre os batizados, casamentos e funerais. Entre os
sculos XVI e XVIII, quando as aspiraes mercantilistas levaram as
naes a buscarem o poder econmico como forma de poder poltico,
informaes estatsticas, referentes a variveis econmicas tais como:

comrcio exterior, produo de bens e de alimentos, comeou a serem


coletadas pelos governantes.
Atualmente as informaes estatsticas so obtidas, classificadas e
armazenadas em meio magntico e disponibilizadas em diversos
sistemas
de
informaes
abrangentes
que
fornecem
aos
pesquisadores/cidados e s organizaes da sociedade informaes
estatsticas inteligentes e necessrias ao desenvolvimento de suas
atividades. A expanso no processo de obteno, armazenamento e
disseminao de informaes estatsticas, extensivamente facilitadas
pelo uso dos recursos computacionais, tm sido acompanhada pelo
rpido desenvolvimento de novas tcnicas e metodologias estatsticas
de anlise estatstica de dados.
1.3 Aplicaes
Grande parte das informaes divulgadas pelos meios de
comunicao atuais provm de pesquisas e estudos estatsticos. Os
ndices de inflao e de emprego e desemprego, divulgado e analisado
pela mdia so um exemplo de aplicao da Estatstica no nosso dia a
dia. O Instituto Brasileiro de Geografia e Estatstica IBGE
(www.ibge.gov.br) o qual a Escola Nacional de Cincias Estatsticas
(www.ibge.gov.br/ence) est vinculada, o rgo responsvel pela
produo das estatsticas oficiais que subsidiam estudos e
planejamentos governamentais no Brasil.
Os conceitos estatsticos tm exercido profundas influncias na
maioria dos campos do conhecimento humano. Mtodos estatsticos
vm sendo utilizados no aprimoramento de produtos agrcolas, no
desenvolvimento de equipamentos espaciais, no controle do trfego, na
previso de surtos epidmicos bem como em melhorias de processos de
gerenciamento, tanto na rea governamental como nos negcios, de um
modo geral.
Na prtica, a Estatstica pode ser empregada como ferramenta
fundamental em vrias outras cincias. Na rea mdica, por exemplo, a
Estatstica fornece metodologia adequada que possibilita decidir sobre
a eficincia de um novo tratamento no combate determinada doena.
A Estatstica permite identificar situaes crticas e, conseqentemente,
atuar em seu controle, desempenhando papel crucial, por exemplo, no
estudo da evoluo e incidncia da AIDS. Na rea tecnolgica, o
advento da era espacial suscitou diversos problemas relacionados ao
clculo de posio de uma astronave, cuja soluo depende
fundamentalmente de conceitos e teorias estatsticas mais elaboradas,
considerando que estas informaes (por exemplo, sinais de satlites)
so recebidas de forma ruidosa e incerta.

O crescente uso da Estatstica vem ao encontro da necessidade de


realizar anlises e avaliaes objetivas e fundamentadas em
conhecimentos cientficos. As organizaes modernas esto se tornando
cada vez mais dependentes de dados e informaes estatsticas para
obter informaes essenciais sobre seus processos de trabalho e
principalmente sobre a conjuntura econmica e social.
As informaes estatsticas so concisas, especficas, eficazes e,
quando analisadas com a ajuda dos instrumentos/tcnicas formais de
anlise estatstica, fornecem subsdios imprescindveis para as tomadas
racionais de deciso. Neste sentido, a Estatstica fornece ferramentas
importantes para que as empresas ou instituies possam definir
melhores suas metas, avaliar sua performance, identificar seus pontos
fracos e atuar na melhoria contnua de seus processos.

1.4 O Perfil do Estatstico


A formao acadmica do estatstico est fundamentada em
conhecimentos de Matemtica, Clculo e Teoria das Probabilidades,
Tcnicas e Mtodos Estatsticos, Computao, Mtodos de Anlise Estatstica
e Disciplinas Profissionalizantes.
Essa formao acadmica bsica permite ao estatstico utilizar tcnicas para:
efetuar levantamentos e anlises de informaes;
planejar e realizar experimentos e pesquisas em vrias reas cientficas;
e
formular a soluo para os mais variados e complexos problemas
concernentes melhoria e otimizao dos mais variados processos.
A explorao de vastas e diversas bases de dados estatsticos hoje
existentes requer um profissional capaz de extrair da relevantes informaes
atravs do uso de modernas tcnicas de amostragem, modelagem e inferncia,
que so algumas das ferramentas usuais da Estatstica.

A formao do estatstico desenvolve aptides que lhe permitam


solucionar problemas atuando como um detetive em busca de
evidncias quantitativas sobre determinados fenmenos.
preciso, pois:
Construir uma slida base de conhecimentos em matemtica;
Incorporar habilidades no uso de computadores;
Desenvolver uma boa comunicao oral e escrita;
Estar permanentemente aberto ao aprendizado de novas tcnicas
e mtodos de trabalho;

Aprender a trabalhar em conjunto com profissionais de diferentes


reas do conhecimento.

2 Conceitos Bsicos
2.1 Populao x Amostra

Populao (N): Conjunto de todos os elementos relativos a um


determinado fenmeno que possuem pelo menos uma caracterstica
em comum, a populao o conjunto Universo, podendo ser finita ou
infinita.

Finita - apresenta um nmero limitado de observaes, que passvel de


contagem.
Infinita - apresenta um nmero ilimitado de observaes que impossvel de
contar e geralmente esta associada a processos.

Amostra (n): um subconjunto da populao e dever ser


considerada finita, a amostra deve ser selecionada seguindo certas
regras e deve ser representativa, de modo que ela represente todas
as caractersticas da populao como se fosse uma fotografia desta.

Uma populao pode, mediante processos operacionais, ser considerada infinita,


pois a mesma ir depender do tamanho da amostra. Se a freqncia relativa entre
amostra e populao for menor do que 5% ela considerada infinita, se a
freqncia relativa for maior do 5% ela considerada finita.

2.2 Censo x Amostragem

Pesquisa Estatstica: qualquer informao retirada de uma


populao ou amostra, podendo ser atravs de Censo ou
Amostragem.

Censo: a coleta exaustiva de informaes das "N" unidades


populacionais.

Amostragem: o processo de retirada de informaes dos "n"


elementos amostrais, no qual deve seguir um mtodo criterioso e
adequado (tipos de amostragem).

2.3 Dado x Varivel

Dados estatsticos: qualquer caracterstica que possa ser


observada ou medida de alguma maneira. As matrias-primas da
estatstica so os dados observveis.

Varivel: aquilo que se deseja observar para se tirar algum tipo de


concluso, geralmente as variveis para estudo so selecionadas por
processos de amostragem. Os smbolos utilizados para representar
as variveis so as letras maisculas do alfabeto, tais como X, Y, Z, ...
que pode assumir qualquer valor de um conjunto de dados. As
variveis podem ser classificadas dos seguintes modos:
-

Qualitativas (ou atributos): So


populao que no pode ser medidas.

caractersticas

de

uma

Nominal : so utilizados smbolos, ou nmeros, para representar


determinado tipo de dados, mostrando, assim, a qual grupo ou
categoria eles pertencem.
Ordinal ou por Postos: quando uma classificao for dividida
em categorias ordenadas em graus convencionados, havendo uma
relao entre as categorias do tipo maior do que, menor do
que, igual a, os dados por postos consistem de valores relativos
atribudos para denotar a ordem de primeiro, segundo, terceiro e,
assim, sucessivamente.
- Quantitativas: So caractersticas populacionais que podem ser
quantificadas, sendo classificadas em discretas e contnuas.
Discretas: so aquelas variveis que pode assumir somente
valores inteiros num conjunto de valores. gerada pelo processo
de contagem, como o nmero de veculos que passa em um posto
de gasolina, o nmero de estudantes nesta sala de aula.
Contnuas: so aquelas variveis que podem assumir um valor
dentro de um intervalo de valores. gerada pelo processo de
medio. Neste caso serve como exemplo o volume de gua em
um reservatrio ou o peso de um pacote de cereal.
2.4 Parmetros x Estatsticas

Parmetros: so medidas populacionais quando se investiga a


populao em sua totalidade, neste caso impossvel fazer
inferncias, pois toda a populao foi investigada.

Estatsticas ou Estimadores: so medidas obtidas da amostra,


torna-se possvel neste caso utilizarmos as teorias inferncias para
que possamos fazer concluses sobre a populao.

2.5 Arredondamento de Dados


Regras: Portaria 36 de 06/07/1965 - INPM Instituto Nacional
de Pesos e Medidas.
1a) Se o primeiro algarismo aps aquele que formos arredondar
for de 0 a 4, conservamos o algarismo a ser arredondado e
desprezamos os seguintes.
Ex.: 7,34856 (para dcimos) 7,3

2a) Se o primeiro algarismo aps aquele que formos arredondar


for de 6 a 9, acrescenta-se uma unidade no algarismo a ser
arredondado e desprezamos os seguintes.
Ex.: 1,2734 (para dcimos) 1,3

3a) Se o primeiro algarismo aps aquele que formos arredondar


for 5, seguido apenas de zeros, conservamos o algarismo se
ele for par ou aumentamos uma unidade se ele for mpar,
desprezando os seguintes.
Ex.: 6,2500 (para dcimos) 6,2
12,350 (para dcimos) 12,4

Se o 5 for seguido de outros algarismos dos quais, pelo menos um diferente de


zero, aumentamos uma unidade no algarismo e desprezamos os seguintes.
Ex.: 8,2502 (para dcimos) 8,3
8,4503 (para dcimos) 8,5

4a) Quando, arredondarmos uma srie de parcelas, e a soma


ficar alterada, devemos fazer um novo arredondamento (por
falta ou por excesso), na maior parcela do conjunto, de modo
que a soma fique inalterada.
7

Ex.
:

17,4%

18,4
%

12,3
%

29,7
%

22,2
%

arredondando para inteiro:


17%

18%

12%

+ 30%

22%

= 99%

17%

18%

12%

+ 31%

22%

100
%

100
%

2.6 Fases do mtodo estatstico


O mtodo estatstico abrange as seguintes fases:
a) Definio do Problema
Consiste na:
- formulao correta do problema;
- examinar outros levantamentos realizados no mesmo campo
(reviso da literatura);
- saber exatamente o que se pretende pesquisar definindo o
problema corretamente (variveis, populao, hipteses, etc.)
b) Planejamento
Determinar o procedimento
problema:

necessrio

para

resolver

- Como levantar informaes;


- Tipos de levantamentos: Por Censo (completo);
Por Amostragem (parcial).
- Cronograma, Custos, etc.
c) Coleta ou levantamento dos dados
Consiste na obteno dos dados referentes ao trabalho que
desejamos fazer.
A coleta pode ser: Direta
Indireta

- diretamente da fonte;
- feita atravs de outras fontes.

Os dados podem ser obtidos pela prpria pessoa (primrios) ou


se baseia no registro de terceiros (secundrios).
d) Apurao dos Dados ou sumarizao
Consiste em resumir os dados, atravs de uma contagem e
agrupamento. um trabalho de coordenao e de tabulao.
Apurao: manual, mecnica, eletrnica e eletromecnica.
e) Apresentao dos dados
a fase em que vamos mostrar os resultados obtidos na coleta e
na organizao.
Esta apresentao pode ser:
Tabular
(apresentao
numrica)
Grfica (apresentao geomtrica)
9

f) Anlise e interpretao dos dados


a fase mais importante e tambm a mais delicada. Tira
concluses que auxiliam o pesquisador a resolver seu problema.

10

3 Distribuio de Freqncia
Consiste em dispor os dados em linhas e colunas distribudas de
modo ordenado. A elaborao de tabelas obedece Resoluo n o 886,
de 26 de outubro de 1966, do Conselho Nacional de Estatstica. As
normas de apresentao so editadas pela Fundao Brasileira de
Geografia e Estatstica (IBGE).
3.4 Distribuio de Freqncia
o tipo de srie estatstica na qual permanece constante o fato, o
local e a poca. Os dados so colocados em classes preestabelecidas,
registrando a freqncia de ocorrncia. Uma distribuio de freqncia
pode ser classificada em discreta e intervalar.
a) Distribuio de Freqncia Discreta ou Pontual: uma srie de
dados agrupados na qual o nmero de observaes est relacionado
com um ponto real.
Notas do Aluno "X" na Disciplina de Estatstica segundo
critrios de avaliao do DE da UFSM 1990
Xi
6,3
8,4
5,3
9,5
6,5

fi
2
3
2
3
5
15

Fonte: Departamento de Estatstica (1990)

11

b) Distribuio de Freqncias Intervalar: Na distribuio de


freqncia, os intervalos parciais devero ser apresentados de maneira
a evitar dvidas quanto classe a que permanece determinado
elemento.
O tipo de intervalo mais usado do tipo fechado a esquerda e
aberto a direita, representado pelo smbolo: |---.
Altura em centmetros de 160 alunos do Curso de Administrao da
UFSM - 1990
Altura (cm)
15
0
15
8
16
6
17
4
18
2
19
0

|--|--|--|--|--|---

15
8
16
6
17
4
18
2
19
0
19
8

Xi
154

fi
18

162

25

170

20

178

52

186

30

194

15

----

160

Fonte: Departamento de Estatstica (1990)

Elementos de uma Distribuio de Freqncias:


Classe ou Classe de Freqncia (K): cada subintervalo (linha)
na qual dividimos o fenmeno.
Para determinar o nmero de classes a partir dos dados no
tabelados, podemos usar a Frmula de Sturges, mas deve-se saber
que existem outros mtodos de determinao do nmero de classes em
uma tabela de freqncia. O que se deseja fazer apenas comprimir um
conjunto de dados em uma tabela, para facilitar a visualizao e
interpretao dos mesmos.
n(K) 1 3,3 log n , onde n no de informaes.

Alm da Regra de Sturges, existem outras frmulas empricas para resolver o


problema para determinao do nmero de classes [n(k)], h quem prefira
n ( k ) n . Entretanto, a verdade que essas frmulas no nos levam a uma
deciso final; esta vai depender na realidade de um julgamento pessoal, que

12

dever estar ligado a natureza dos dados, procurando, sempre que possvel,
evitar classes com freqncias nulas ou freqncias relativas exageradamente
grandes.

Limite de Classe (li ou Li): So os valores extremos de cada


classe.
li = limite inferior da i-sima classe;
Li = limite superior da i-sima classe;

13

Amplitude do intervalo de classe (h): a diferena entre dois


limites inferiores ou superiores consecutivos.
h l n ln 1 ou h = L n L n 1

A amplitude do intervalo de classe deve ser constante em todo a distribuio de


freqncias intervalar.

Amplitude total (H): a diferena entre o limite superior da


ltima classe e o limite inferior da 1 classe, ou a diferena entre
ltimo e o primeiro elemento de um conjunto de dados postos em
ordem crescente.
H L n l1

Ponto mdio de classe (Xi): a mdia aritmtica simples do limite


inferior com o limite superior de uma mesma classe.
l Li
Xi i
2
ou a partir do X1 os demais pontos mdios pode ser determinado por:
X n X n 1 h

Quando substituirmos os intervalos de classes pelos pontos mdios (X i), ter-se-


uma distribuio de freqncia pontual.

Freqncia absoluta (fi): a quantidade de valores em cada


classe
n

n f i f 1 f 2 ... f n
i 1

Freqncia Acumulada (Fi): o somatrio da freqncia absoluta


da i-sima classe com a freqncia absoluta das classes anteriores,
ou a freqncia acumulada da classe anterior.
n

Fn f i n
i 1

Freqncia Relativa (fri): o quociente entre a freqncia


absoluta da i-sima classe com o somatrio das freqncias.

fri

fi

f
i 1

Obs.:

fr
i 1

14

Freqncia Relativa Acumulada (Fri): o somatrio da


freqncia relativa da i-sima classe com as freqncias relativas
das classes anteriores.
n

Frn fri 1
i 1

15

4 Representao grfica
Os grficos so uma forma de apresentao visual dos dados.
Normalmente, contm menos informaes que as tabelas, mas so de
mais fcil leitura. O tipo de grfico depende da varivel em questo
4.1 Grficos utilizados para a anlise de uma distribuio de
freqncia
4.7.1 Histograma
Altura em centmetros de 160 alunos do Curso de Administrao da UFSM - 1990

Fonte: Departamento de Estatstica (1990)

4.7.2 Polgono de Freqncias


Altura em centmetros de 160 alunos do Curso de Administrao da
UFSM - 1990

Fonte: Departamento de Estatstica (1990)

16

17

4.7.3 Ogivas
Altura em centmetros de 160 alunos do Curso de Administrao da
UFSM 1990
Ogiva Crescente

Ogiva Decrescente

4.7.4 Grfico em segmentos de reta vertical


utilizado para representar uma distribuio de freqncia
pontual, onde os segmentos de reta so proporcionais s respectivas
freqncias absolutas.
Altura em centmetros de 160 alunos do Curso de Administrao da UFSM - 1990

Fonte: Departamento de Estatstica (1990)

18

5 Medidas Descritivas
Tem por objetivo descrever um conjunto de dados de forma
organizada e compacta que possibilita a visualizao do conjunto
estudado por meio de suas estatsticas, o que no significa que estes
clculos e concluses possam ser levados para a populao.
Podemos classificar as medidas de posio conforme o esquema
abaixo:
5.1 Medidas de Posio
Representativas

Separatrizes

Dominantes

Mdia Aritmtica
Mdias
Mdia Geomtrica
Mdia Harmnica

Mediana
Quartis
Decis
Centis ou Percentis
Moda Bruta
Moda de Czuber

5.1.1 Representativas (Mdias)


So medidas descritivas que tem por finalidade representar um
conjunto de dados.
a) Mdia Aritmtica: Amostral ( X ); Populacional ()
Dados No Tabelados
n

19

X
i 1

ou =

X
i 1

Dados Tabelados com Valores Ponderados


Mdia Aritmtica Ponderada ( X w ), (onde Wi o peso)

Nota do aluno "X"


semestre de 1994

UFSM

Notas
(Xi)
7.8
8.3
9.2
5.8

Pesos
(Wi)
2
3
2
3
10

Xw

X .W
i

i 1

i=1

Fonte: Dados Hipotticos

Distribuio de freqncias
- Mdia Aritmtica ( X )
Altura em centmetros de 160 alunos
do
Curso de Administrao da UFSM 1990
Altura (cm)
150
158
166
174
182
190

|--|--|--|--|--|--

158
166
174
182
190
198

Xi
154
162
170
178
186
194
----

fi
18
25
20
52
30
15
16
0

Xi . fi
2763,0
4037,5
3390,0
9230,0
5565,0
2917,5
5
27903

X .f
i

i 1

i=1

Fonte: Departamento de Estatstica (1990)

Caractersticas da Mdia Aritmtica Simples


1a) A Mdia Aritmtica Simples dever estar entre o menor e o
maior valor observado, X min. X X max.

20

2a) A soma algbrica dos desvios calculados entre os valores


observados e a mdia aritmtica igual a zero;

desvios = d x i

i 1

i 1

d (x

) zero

3a) Somando-se ou subtraindo-se todos os valores (X i) da srie por


uma constante "k" (k 0), a nova mdia aritmtica ser igual a
mdia original somada ou subtrada por esta constante "k".
xi

yi x i k

Y Xk

4a) Multiplicando-se ou dividindo-se todos os valores (X i) da srie


por uma constante "k" (k 0), a nova mdia aritmtica ser
igual a mdia original multiplicada ou dividida por esta
constante "k".
xi

yi x i k

yi x i k

Y Xk

Y Xk

b) Mdia Geomtrica: (Xg):


A aplicao da mdia geomtrica deve ser feita, quando os valores
do conjunto de dados considerado se comportam segundo uma
progresso geomtrica (P.G.)ou dela se aproximam.
Dados No Tabelados
Xg n

X
i 1

n X1 .X 2 . ... .X n

Dados Tabelados
Xg n

fi
i

n X 1 1 .X 2 2 . ... .X n

fn

i 1

Usando um artifcio matemtico, pode-se usar para calcular a


mdia geomtrica a seguinte frmula:
X g 10

1
f1 . log X1 f 2 . log X 2 ... f n . log X n
n

21

10

1
n

f i . log X i
i 1

c) Mdia Harmnica (Xh)


usada para dados inversamente proporcionais.
Ex.: Velocidade Mdia, Preo de Custo Mdio
5.1.2 Emprego da mdia
1) Deseja-se obter a medida de posio que possui a maior
estabilidade;
2) Houver necessidade de um tratamento algbrico ulterior.
Dados No Tabelados
Xh

n
n

X
i 1

Dados Tabelados

Xh

n
n

fi

X
i 1

Deve-se observar esta propriedade entre as mdias X X

n
1
1
1

...
X1 X 2
Xn

f1 f 2 ... f n
f1 f 2
f

... n
X1 X 2
Xn

Xh

5.1.3 Dominantes - Moda (Mo)


definida como sendo a observao de maior freqncia.
a) Dados no tabelados
Mo = 4 (unimodal)
Mo = (amodal)
Mo1 = 3 Mo2 = 5 (bimodal)
Mo = (amodal)
Mo1 = 5 Mo2 = 6
Mo3 = 7

Ex.: 3 4 4 4 5 5 6 6 7 8 9
5 6 7 8 9 10 11 12 13
1 1 2 2 3 3 3 4 5 5 5
5 5 6 6 7 7 8 8
5 5 6 6 7 7 8
(multimodal)

Acima de 3 modas usamos o termo multimodal.


Dados Tabelados
a) Distribuio de freqncias pontual

22

- Moda Bruta (Mob): o ponto mdio da classe de maior


freqncia
Mo b X i

b) Distribuio de freqncias intervalar


- Moda de Czuber (Moc): O processo para determinar a moda
usado por Czuber leva em considerao as freqncias anteriores e
posteriores classe modal.

1 f Mo f ant
1
.h
1 2
2 f Mo f pos

Mo c l Mo
onde:

l Mo

f Mo

fant
f pos

limite inferior da classe modal;


freqncia absoluta da classe modal;
amplitude do intervalo de classe;
freqncia absoluta da classe anterior a classe modal;
freqncia absoluta da classe posterior a classe modal;

5.1.4 Emprego da moda


1) Quando se deseja obter uma medida rpida e aproximada de
posio;
2) Quando a medida de posio deve ser o valor mais tpico da
distribuio.
5.1.5 Separatrizes (Mediana, Quartis, Decis e Centis ou
Percentis)
So medidas de posio que divide o conjunto de dados em partes
proporcionais, quando os mesmos so ordenados.
a) Dados no tabelados
Antes de determinarmos as separatrizes devemos em primeiro
lugar encontrar a posio da mesma.
- Se o nmero de elementos for par ou mpar, as separatrizes
seguem a seguinte ordem:

23

Posio
i 1

se for mediana S 2

i(n + 1)
S
1 i 3
S4

se for quartis

1 i 9

1 i 99

se for decis S 10

se for centis S 100

Dados Tabelados
b) Distribuio de freqncias pontual: segue a mesma
regra usada para dados no tabelados
c) Distribuio de freqncias intervalar
i.n

Fant .h

Si lSi
f Si

onde:
Si
Si
Si
Si

Md i = 1;
Qi 1 i 3;
Di 1 i 9 ;
C i ou Pi 1 i 99

l Si

i.n
S

Fant
h

fS i

limite inferior da classe que contm a separatriz;


posio da separatriz;
freqncia acumulada da classe anterior a que contm a separatriz;
amplitude do intervalo de classe;
freqncia absoluta da classe que contm a separatriz;

5.1.6 Emprego da mediana


1) Quando se deseja obter um ponto que divide a distribuio em
partes iguais;
2) H valores extremos que afetam de uma maneira acentuada a
mdia;
3) A varivel em estudo salrio.
5.1.7 Posio relativa da mdia, mediana e moda
24

Quando uma distribuio simtrica, as trs medidas coincidem.


Porm, a assimetria torna-as diferentes e essa diferena tanto maior
quanto maior a assimetria. Assim, em uma distribuio temos:
x Md Mo curva simtrica

x Md Mo curva assimtrica negativa


Mo Md x curva assimtrica positiva

x M d M o

M oda

M e d ia n a
M d ia
M o

M d

x M d

M o

5.1.8 Exerccios
Para os dados abaixo calcule: Md; Q1; Q3; D3; C70
1)
3

10

12

13

15

17

18

21

11

13

14

17

18

19

22

2)
Alturas dos alunos da Turma X
no 1o sem. de 1994 - UFSM
Alturas
63
75
84

fi
15
25
30
25

25

91

20
90

Fonte: Dados Hipotticos

26

3)
Alturas dos alunos da Turma Y
no 1o sem. de 1994 UFSM
Alturas
6
1
6
5
6
9
7
3
7
7

|---

65

fi
12

|---

69

23

35

|---

73

34

69

|---

77

26

95

|---

81

15

110

110

110

Fi
12

Fonte: Dados Hipotticos

5.2 Medidas de Variabilidade ou Disperso


Visam descrever os dados no sentido de informar o grau de
disperso ou afastamento dos valores observados em torno de um valor
central representativo chamado mdia. Informa se um conjunto de
dados homogneo (pouca variabilidade) ou heterogneo (muita
variabilidade).
As medidas de disperso podem ser:
Absoluta

Desvio
Desvio
Desvio
Desvio

extremo - amplitude
Mdio
Padro
quadrtico - Varincia

Para estudarmos as medidas de variabilidade para dados no


tabelados usaremos um exemplo prtico. Supomos que uma empresa
esteja querendo contratar um funcionrio, e no final da concorrncia
sobraram dois candidatos para uma nica vaga. Ento foi dado 4
tarefas para cada um, onde as mesmas tiveram como registro o tempo
(em minutos) de execuo.
TAREFAS
OPERRIO 1
(TEMPO)
OPERRIO 2 (TEMPO

1
55

2
45

3
52

4
48

30

70

40

60

- Anlise Grfica
27

- Medidas de disperso Absoluta:


- Desvio Extremo ou Amplitude de Variao (H): a
diferena entre o maior e o menor valor de um conjunto de dados

H X max X min

- Desvio Mdio ( d ): Em virtude do


n

X
n

i 1

X 0 , usamos para

calcular o desvio mdio X i X 0 , assim ficando:


i 1

Para dados no tabelados


n

i 1

X1 X X 2 X ... X n X
n

Para dados tabelados

f
n

i 1

Xi X

i
n

f
i 1

f 1 X 1 X f 2 X 2 X ... f n X n X
n

i 1

- Desvio Quadrtico ou Varincia : S2 (amostra) ou 2


(populao)
Para dados no tabelados:

28

i 1

S
2

i 1

n 1

X X 2 X ... X n X
n

X X 2 X ... X n X
n 1

Para dados tabelados

f X

i 1

f 1 X 1 X f 2 X 2 X ... f n X n X
2

fi

i 1

f X
n

S
2

i 1

f
i 1

i 1

f 1 X 1 X f 2 X 2 X ... f n X n X
2

i 1

- Desvio Padro: S (amostra) ou (populao)


Para dados no tabelados:

X
n

i 1

X
n

i 1

X X 2 X ... X n X
n

X X 2 X ... X n X
n 1

n 1

Para dados tabelados

f X
n

i 1

fi

f 1 X 1 X f 2 X 2 X ... f n X n X
2

i 1

i 1

29

f X
n

i 1

f i 1

f 1 X 1 X f 2 X 2 X ... f n X n X
2

i 1

i 1

(n - 1) usado como um fator de correo, onde devemos considerar a varincia


amostral como uma estimativa da varincia populacional.

- Propriedades da Varincia
1) Somando-se ou subtraindo-se uma constante k a cada valor observado a
varincia no ser alterada;
2) Multiplicando-se ou dividindo-se por uma constante k cada valor observado
a varincia ficar multiplicada ou dividida pelo quadrado dessa constante.

30

5.3 Medidas de Disperso Relativa

- Varincia relativa
Relativa
- Coeficiente de Variao (Pearson)
a medida de variabilidade que em geral expressa em
porcentagem, e tem por funo determinar o grau de concentrao dos
dados em torno da mdia, geralmente utilizada para se fazer a
comparao entre dois conjuntos de dados em termos percentuais, esta
comparao revelar o quanto os dados esto prximos ou distantes da
mdia do conjunto de dados.
- Varincia Relativa
V. R.

2
S2
ou 2
2

- Coeficiente de Variao de Pearson


C.V.

S
ou
x 100

C.V. 50% a mdia representativa


C.V. 0 a maior representatividade da mdia (S = 0)
5.4 Exerccios
Para os exerccios abaixo construa uma tabela de disperso o
suficiente para determinar as medidas de posio (mdia aritmtica,
mediana e moda de czuber), disperso (desvio padro e varincia,
coeficiente de variao de Pearson), assimetria (coeficiente de
assimetria, e coeficiente de curtose). Faa um relatrio referente ao
comportamento dos dados em funo dos resultados obtidos.
1) De um exame final de Estatstica, aplicado a 50 alunos da
Universidade Luterana,Ano 1999 resultaram as seguintes notas:
4,0
5,3
6,6

4,2
5,3
6,7

4,3
5,5
6,8

4,4
5,7
6,9

4,5
5,8
7,0

4,5
6,0
7,2
31

4,6
6,1
7,5

5,0
6,3
7,6

5,1
6,4
7,7

5,2
6,5
7,9

8,0
9,3

8,3
9,4

8,5
9,4

8,6
9,5

8,8
9,5

8,9
9,6

32

9,0
9,7

9,1
9,8

9,2
9,9

9,3
10,0

2) Os dados a seguir refere-se a altura em centmetros de 70


alunos da PUCC, turma 6, ano 2000.
153
162
168
172
179
188
193

154
162
168
173
179
188
194

155
163
169
173
180
189
194

156
163
169
174
182
189
195

158
164
170
174
183
190
197

160
164
170
175
184
191
197

160
165
170
175
185
192
199

161
166
171
176
186
192
200

161
167
171
177
186
192
201

161
167
172
178
187
192
205

3) Os dados a seguir referem-se aos salrios anuais pagos em


dlares a 60 funcionrios da Empresa PETA S.A. em 1997.
50,00
58,50
66,00
77,00
90,00
100,1
0

52,50
59,00
66,25
78,00
91,35
100,2
0

53,50
60,30
67,50
80,00
92,10
101,0
0

54,00
61,50
68,00
81,50
93,20
102,0
0

54,20
62,00
68,70
82,50
94,00
103,4
0

55,50
62,90
69,50
83,50
95,25
104,3
0

33

56,30
63,50
70,00
85,00
96,00
105,0
0

56,50
64,00
72,00
87,30
97,00
107,0
0

57,00
64,30
75,00
88,00
98,00
108,0
0

58,10
65,00
76,50
89,10
99,80
109,1
0

6 Probabilidade e Variveis
Aleatrias
6.1 Modelos Matemticos
Podem-se distinguir dois tipos de modelos matemticos:
6.1.1 Modelos Determinsticos
Refere-se a um modelo que estipule que as condies sob as
quais um experimento seja executado determinem o resultado do
experimento.
Em outras palavras, um modelo determinstico
"Consideraes Fsicas" para prever resultados,

emprega

6.1.2 Modelos No Determinsticos ou Probabilsticos


So aqueles que informam com que chance ou probabilidade os
acontecimentos podem ocorrer. Determina o "grau de credibilidade"
dos acontecimentos. (Modelos Estocsticos).
Em outras palavras, um modelo probabilstico emprega uma
mesma espcie de consideraes para especificar uma distribuio de
probabilidade.

6.2 Conceitos em Probabilidade


Os conceitos fundamentais em probabilidade so experimentos
aleatrios, espao amostral e eventos.
6.2.1 Experimento aleatrio ()
Qualquer processo aleatrio, capaz de produzir observaes, os
resultados surgem ao acaso, podendo admitir repeties no futuro. Um
experimento aleatrio apresenta as seguintes caractersticas:

34

a - os resultados podem repetir-se n vezes (n );


b - embora no se possa prever que resultados ocorrero, podese descrever o conjunto de resultados possveis;
c - a medida que se aumenta o nmero de repeties, aparece
uma certa regularidade nos resultados.
6.2.2 Espao Amostral (S)
o conjunto de resultados possveis, de um experimento
aleatrio. Quanto ao nmero de elementos pode ser:
6.2.2.1 Finito
Nmero limitado de elementos;
Ex.: S = {1, 2, 3, 4, 5, 6}
6.2.2.2 Infinito
Nmero ilimitado de elementos, pode ser sub-dividido em:
a - Enumervel
Quando os possveis resultados puderem ser postos em
concordncia biunvoca com o conjunto dos nmeros naturais (N) (caso
das variveis aleatrias discretas).
Ex.: N
b - No Enumervel
Quando os possveis resultados no puderem ser postos em
concordncia biunvoca com o conjunto dos nmeros naturais (caso das
variveis aleatrias contnuas).
Ex.: R
6.2.3 Evento (E)
Um evento (E) qualquer subconjunto de um espao amostral
(S).
Pode-se ter operaes entre eventos da mesma forma que com
conjuntos, como mostra a seguir.
6.2.4 Operaes com Eventos
35

6.2.4.1 A unio B
Smbolo utilizado " ", o evento que ocorrer se, e somente se,
A ou B ou ambos ocorrerem;

FIGURA 6.1 - Evento A unio B


6.2.4.2 A interseo B
Smbolo utilizado " ", o evento que ocorrer se, e somente se,
A e B ocorrem simultaneamente.

FIGURA 6.2 - Evento A interseo B


6.2.4.3 Complementar de A
_

Simbologia " A ", o evento que ocorrer se, e somente se A no


ocorrer.

36

FIGURA 6.3 - Evento complementar de A ( A )


6.2.5 Tipos de eventos
6.2.5.1 Eventos Mutuamente Excludentes
So ditos eventos mutuamente excludentes, quando a ocorrncia
de um implica ou no ocorrncia de outro, isto , no pode ocorrer
juntos, e conseqentemente, A B o conjunto vazio ().

FIGURA 6.4 - Eventos mutuamente excludentes


6.2.5.2 Eventos No Excludentes ou Quaisquer
So ditos eventos no excludentes quando a ocorrncia de um
implica na ocorrncia do outro, isto , so aqueles que ocorrem ao
mesmo tempo, A B .

37

FIGURA 6.5 - Evento no excludentes


6.2.5.3 Eventos Independentes
So aqueles cuja ocorrncia de um evento, no possui efeito
algum na probabilidade de ocorrncia do outro.
A B , se A e B forem Quaisquer;
A B , se A e B forem Mutuamente Excludentes.

logo,
P A B P( A ) . P(B)

Ex.: A e B eventos Quaisquer


S = { 1, 2, 3, 4 }

A = {1, 2 }

A B =

B = { 2, 4 }

{2}
P A B P(A ) . P(B)

P(A )

2
4

P ( B)

2
4

P A B

1
4

6.2.5.4 Eventos Dependentes ou Condicionados


Existem varias situaes onde a ocorrncia de um evento pode
influenciar fortemente na ocorrncia de outro.
38

Assim, se (A) e (B) so eventos, deseja-se definir uma quantidade


denominada probabilidade condicional do evento (A) dado que o evento
(B) ocorre, ou sob a forma simblica

B .

PA

Assim, d-se a seguinte definio:

PA

B)
P(AP(B)

onde P(B) > 0. Se P(B) = 0, tem-se que

B no definida.

PA

6.2.5.5 Eventos Coletivamente Exaustivos


So aqueles que ocorrem se nenhum outro ocorrer.

A B C D
FIGURA 6.6 - Evento coletivamente exaustivos

6.3 Conceitos de Probabilidade


6.3.1 Conceito Emprico de Probabilidade (Definio
Frequencial)
O problema fundamental da probabilidade consiste em atribuir
um nmero a cada evento (E), o qual avaliar quo possvel ser a
ocorrncia de "E", quando o experimento for realizado.
Uma possvel maneira de tratar a questo seria determinar a
freqncia relativa do evento E (fr(E)),

39

f r ( E)

nmero de ocorrncias do evento (E) .


nmero de repeties do experimento ( )

Surgem, no entanto, dois problemas:


a - Qual deve ser o nmero de repeties do experimento ();
b - A sorte ou habilidade do experimentador poder influir nos
resultados, de forma tal que a probabilidade definida como sendo:

P(E) = limn f r (E) ,


onde "n" o nmero de repeties do experimento .
6.3.2 Definio
Probabilidade

Clssica

ou

Enfoque

"A

priori"

de

Se existe "a" resultados possveis favorveis a ocorrncia de um


evento "E" e "b" resultados possveis no favorveis, sendo os mesmos
mutuamente excludentes, ento:
P(E) =

a
,
a+b

onde os resultados devem ser verossmeis (possvel e verdadeiro) e


permite a observao dos valores da probabilidade antes de ser
observado qualquer amostra do evento (E).
6.3.3 Definio Axiomtica
Seja () um experimento, seja (S) um espao amostral associado
a (). A cada evento (E) associa-se um nmero real representado por
P(E) e denominaremos de probabilidade de E, satisfazendo as seguintes
propriedades:
a - 0 P(E) 1;
b - P(S) = 1;
c - Se A e B so eventos mutuamente excludentes, ento:

40

P(A B) = P(A) +
P(B).
d - Se A1, A2, ..., An so eventos mutuamente excludentes dois a
dois, ento:
P(A1 A2 ... An ) = P(A1) + P(A2) + ...
+P(An)
ou
n

P( A i )
i=1

P(A ) .
i

i=1

As propriedades anteriores so conhecidas como axiomas da


teoria da probabilidade. Os axiomas, muitas vezes, se inspiram em
resultados experimentais e que, assim, definem a probabilidade de
forma que possa ser confirmada experimentalmente.
6.3.4 Teoremas Fundamentais
Teorema 1 - Se for evento vazio, ento P() = 0.
Prova: Seja um evento A = . Assim, A = A , como A = , de
acordo com o item (3.2.3.4), A e so mutuamente excludentes,
ento:
P(A) = P(A )
P(A) = P(A) + P()
P() = P(A) - P(A)
P() = 0.
_

Teorema 2 - Se o evento A for o evento complementar de A, ento P( A


)=1-P(A).
_

Prova: A A = S, mas A e A so mutuamente excludentes, ento:


_

P(A A ) = P(S)
_
_
P(A A ) = P(A) + P( A )
41

P(A) + P( A ) = 1
logo,
_

P( A )

P(A).
Teorema 3 - Se A e B so eventos quaisquer, ento:
P(A B) = P(A) + P(B) - P(A
B)
Prova: Para provar o Teorema 3 devemos transformar A B em eventos
mutuamente excludentes, conforme a FIGURA 6.

FIGURA 6 - Decomposio de eventos quaisquer em mutuamente


excludentes
Tem-se ento que:
_

(A B) = A (B A )
e
_
B = (A B) (B A )
logo pela propriedade (c) temos:
_

P(A B) = P[A (B A )]

42

P(A B) = P(A) + P(B A )


e
_
P(B) = P[(A B) (B A )]

()

P(B) = P(A B) + P(B A )


ou
_
P(B A ) = P(B) - P(A B)

()

substituindo-se a equao () na equao () tem-se:


P(A B) = P(A) + P(B) - P(A
B).
Decorrncias do Teorema 3:
Sejam A, B e C eventos quaisquer:
P(A B C) = P[(A B) C]
P(A B C) = P(A B) + P(C) - P[(A B) C]
P(A B C) = P(A) + P(B) + P(C) - P(A B) - P[(A C) (B C)]
P(A B C) = P(A) + P(B) + P(C) - P(A B) - [P(A C) + P(B C) - P(A
B C)]
P(A B C) = P(A) + P(B) + P(C) - P(A B) - P(A C) - P(B C) + P(A B
C)
Sejam A1, A2, ..., An eventos quaisquer:
n

P(A 1 A 2 ... A n ) P(A i )


i 1

P(A i A j )

i j 2

P(A

P(A

A j A k )

i j k 3

A j A k A ) ... ( 1) n 1P(A 1 A 2 ... A n ).

i j k 4

43

RESUMO

Mutuamente Excludentes P(A B) = P(A) + P(B)

A B

(OU)

Quaisquer P(A B) = P(A) + P(B) - P(A B)

A B

Independentes P(A B) = P(A) x P(B)



A B

x (E) Dependentes P(A B) = P(A) x P(B/A)

44

6.4 Exerccios
1) A probabilidade de 3 jogadores marcarem um penalti
respectivamente: 2/3; 4/5; 7/10 cobrando uma nica vez.
a) todos acertarem. (28/75)
b) apenas um acertar. (1/6)
c) todos errarem. (1/50)
2) Numa bolsa com 5 moedas de 1,00 e 10 moedas de 0,50. Qual a
probabilidade de ao retirarmos 2 moedas obter a soma 1,50.
(10/21)
3) Uma urna contm 5 bolas pretas, 3 vermelhas e 2 brancas. Trs
bolas so retiradas. Qual a probabilidade de retirar 2 pretas e 1
vermelha ?
a) sem reposio (1/4)
b) com reposio (9/40)
4 ) Numa classe h 10 homens e 20 mulheres, metade dos homens
e metade das mulheres possuem olhos castanhos. Ache a
probabilidade de uma pessoa escolhida ao acaso ser homem ou
ter olhos castanhos. (2/3)
5) A probabilidade de um homem estar vivo daqui a 20 anos de
0.4 e de sua mulher de 0.6 . Qual a probabilidade de que:
a) ambos estejam vivos no perodo ? (0.24)
b) somente o homem estar vivo ? (0.16)
c) ao menos a mulher estar viva ? (0.6)
d) somente a mulher estar viva? (0.36)
6) Faa o exerccio anterior considerando 0,5 a chance do homem
estar vivo e 0,2 a chance da mulher estar viva e compara os
resultados.
7) Uma urna contm 5 fichas vermelhas e 4 brancas. Extraem-se
sucessivamente duas ficha, sem reposio e constatou-se que a
1 branca.
a) qual a probabilidade da segunda tambm ser branca ? (3/8)
b) qual a probabilidade da 2 ser vermelha ? (5/8)
8) Numa cidade 40 % da populao possui cabelos castanhos, 25%
olhos castanhos e 15% olhos e cabelos castanhos. Uma pessoa
selecionada aleatoriamente.
a) se ela tiver olhos castanhos, qual a probabilidade de tambm ter
cabelos castanhos?

45

b) se ela tiver cabelos castanhos, qual a probabilidade de ter olhos


castanhos ? (3/5) (3/8)

46

9) Um conjunto de 80 pessoas tem as caractersticas abaixo:

MASCULIN
O
FEMININO
TOTAL

BRASILEI
RO
18

ARGENTIN
O
12

URUGUAI
O
10

TOTAL

20
38

05
17

15
25

40
80

40

Se retirarmos uma pessoa ao acaso, qual a probabilidade de que


ela seja:
a) brasileira ou uruguaia. (63/80)
b) do sexo masculino ou tenha nascido na argentina. (9/16)
c) brasileiro do sexo masculino. (18/80)
d) uruguaio do sexo feminino. (15/80)
e) ser mulher se for argentino. (5/17)
10) Um grupo de pessoas est assim formado:
Mdico
Masc.
Femin.

21
12

Engenheir
o
13
08

Veterinr
io
15
17

Escolhendo-se, ao acaso, uma pessoa do


probabilidade de que seja:
a) Uma mulher que fez o curso de medicina ?
b) Uma pessoa que fez o curso de medicina ?
c) Um engenheiro dado que seja homem ?
d) No ser mdico dado que no seja homem ?

grupo,

qual

11) Num ginsio de esportes, 26% dos frequentadores jogam vlei,


36% jogam basquete e 12% praticam os dois esportes. Um dos
frequentadores sorteado para ganhar uma medalha. Sabendose que ele joga basquete, qual a probabilidade de que tambm
jogue vlei ?
12) A probabilidade de um aluno resolver um determinado
problema de 1/5 e a probabilidade de outro de 5/6. Sabendo
que os alunos tentam solucionar o problema independentemente.
Qual a probabilidade do problema ser resolvido :
a) somente pelo primeiro ?
b) ao menos por um dos alunos ?
c) por nenhum ?
47

6.6 Variveis aleatrias


Ao descrever um espao amostral (S) associado
a um
experimento () no especifica-se que um resultado individual
necessariamente, seja um nmero. Contudo, em muitas situaes
experimentais, estaremos interessados na mensurao de alguma coisa
e no seu registro como um nmero.
Definio: Seja () um experimento aleatrio e seja (S) um espao
amostral associado ao experimento. Uma funo de X, que
associe a cada elemento s S um nmero real x(s),
denominada varivel aleatria.

FIGURA 1 - Representao de uma varivel aleatria


Uma varivel X ser discreta (V.A.D.) se o nmero de valores de
x(s) for finito ou infinito numervel. Caso encontrarmos x(s) em forma
de intervalo ou um conjunto de intervalos, teremos uma varivel
aleatria contnua (V.A.C.).

6.7 Funo de Probabilidade


A probabilidade de que uma varivel aleatria "X" assuma o
valor "x" uma funo de probabilidade, representada por P(X = x) ou
P(x).
6.7.1 Funo de Probabilidade de uma V.A.D.

48

A funo de probabilidade para uma varivel aleatria discreta


chamada de funo de probabilidade no ponto, ou seja, o conjunto de
pares (xi;P(xi)), i = 1, 2, ..., n, ..., conforme mostra a FIGURA 6.1.

FIGURA 6.1 - Distribuio de probabilidade de uma V.A.D.


Para cada possvel resultado de x teremos:
0 P(X) 1;

P(X ) 1
i

i 1

6.7.2 Funo de
Distribuio Acumulada)

Repartio

para

V.A.D.

(Funo

Seja X uma varivel aleatria discreta.


Define-se Funo de Repartio da Varivel aleatria X, no ponto
xi, como sendo a probabilidade de que X assuma um valor menor ou
igual a xi, isto :
F(X) P X x i

Propriedades:

P x

1a)

F(X)

2a)
3a)
4a)

F( ) 0

xi x

F( ) 1
P a x b F(b) F(a )

49

5a)
6a)

P a x b F(b) F(a ) P ( X a )
P a x b F(b) F(a ) P( X b)

lim F(X) F X o
7a) F(X) contnua direita x
x0

8a) F(X) descontnua esquerda, nos pontos em que a


probabilidade diferente de zero.
lim F(X) F X o , para P(X = xo ) 0

x x 0

9a) A funo no decrescente, isto , F(b) F(a) para b > a,


pois:
P(a < X b) = F(b) F(a) 0
6.7.3 Esperana Matemtica de V.A.D.
Definio: Seja X uma V.A.D., com valores possveis x1, x2, ...,
xn,... ; Seja P(xi) = P(X = xi), i = 1, 2, ..., n, ... . Ento, o
valor esperado de X (ou Esperana Matemtica de X),
denotado por E(X) definido como

E(X) x i P(x i )
i 1

se a srie

E(X) x i P(x i )

convergir

absolutamente, isto , se

i 1

|x | P(x ) , este nmero tambm denominado o valor mdio de X,


i

i 1

ou expectncia de X.
6.7.4 Varincia de uma V.A.D.
Definio: Seja X uma V.A.D. . Define-se a varincia de X,
denotada por V(X) ou 2x, da seguinte maneira:

V(X) x i E(X) .P(x i ) ou V(X) E(X 2 ) E(X)

i 1

2
2
onde E(X ) x i P(x i ) e a raiz quadrada positiva de V(X) denominada
i 1

o desvio-padro de X, e denotado por x.


6.7.5 Funo de Probabilidade de uma V.A.C.

50

No instante em que X definida sobre um espao amostral


contnuo, a funo de probabilidade ser contnua, onde a curva
limitada pela rea em relao ao valores de x ser igual a 1.

FIGURA 6.2 - Distribuio de probabilidade de uma V.A.C.


Se quisermos calcular a probabilidade de X assumir um valor x
entre "a" e "b" devemos calcular:
b

P(a x b) f(x) dx
a

Pelo fato de que a rea representa probabilidade, e a mesma


tem valores numricos positivos, logo a funo precisa estar
inteiramente acima do eixo das abscissas (x).
Definio: A
funo f(x) uma Funo Densidade de
Probabilidade (f.d.p.) para uma V.A.C. X, definida nos
reais quando
f (x) 0 para todo x Rx;

f(x) dx = 1 ;

Para quaisquer a, b, com - < a < b < +, teremos


b

P(a x b) f(x) dx .
a

Alm disso, para a < b em Rx P(a < x < b) =


6.7.6 Funo de
Distribuio Acumulada)

Repartio

51

para

f ( x )dx

V.A.C.

(Funo

Seja X uma varivel aleatria contnua.


Define-se Funo de Repartio da Varivel aleatria X, no ponto
xi, como sendo:
F( X)

f ( x) dx

P a x b P a x b P a x b P a x b

6.7.7 Esperana Matemtica de uma V.A.C.


Definio: Seja X uma V.A.C. com f.d.p. f(x). O valor esperado de
X definido como
E(X)

x.f(x) dx

pode acontecer que esta integral imprpria no convirja.

| x

Conseqentemente, diremos que E(X) existir se, e somente se,


| f(x) for finita.
6.7.8 Varincia de uma V.A.C.
Definio: Seja X uma V.A.C. de uma funo distribuio de
probabilidade (f.d.p.). A varincia de X :

2
x E(X) f(x) dx

V(X)

ou V(X) E(X 2 ) E(X)

onde

E(X 2 ) x 2 f(x) dx

6.8 Exemplos
- Varivel Aleatria Discreta
Seja X o lanamento de duas moedas e descrever o experimento
em funo da obteno do nmero de caras:
52

i) determinar a funo de probabilidade e represente


graficamente;
ii) construir a funo de repartio e represente graficamente;
iii) Use as propriedades para determinar:
a) P(0 < x < 2); b) P(0 x 1); c) P(0 < x 2); d) F(1); e) F(2)
iv) E(X) e V(X)
i)

Representao grfica
0,6
0,5
0,4
0,3
0,2
0,1
0

ii)

Representao grfica

F(x) = 0 se x<0
F(X) = 1/4 se 0 x < 1
F(X) = 3/4 se 1 x < 2
F(X) = 1 se x 2
iii)
a) P 0 x 2 F(2) F(0) P(X 2) 1
b) P 0 x 1 F(1) F( 0) P( X 0)
c) P 0 x 2 F(2) F(0) 1
d) F(1) = 3/4

1
3

4
4

e) F(2) = 1

53

1 1 3

4 4 4

3 1 1
3

4 4 4
4

iv) Esperana Matemtica

E(X) x i P(x i ) = 0 .
i 1

1
2
1
1 .
2 .
1
4
4
4

Varincia

E(X 2 ) x 2i P(x i ) = 02 .
i 1

V(X) E(X 2 ) E(X)

1 2 2
1 6
1 .
22 .

4
4
4 4

6 4 2
0.5
4 4 4

54

- Varivel Aleatria Contnua


Seja X uma varivel aleatria contnua:
2 x, para 0 x 1
0, para qualquer outro valor

f (x)

i) represente graficamente funo densidade de probabilidade;


ii) determinar a funo de repartio e represente graficamente;
3
1
1

x e P
x 1
4
4
4

iii) Determine P
iv) E(X) e V(X)
i)

ii)
para x<0 F(X )

0 dx 0

para 0 x < 1 F(X) 0 dx 0 2x dx 0 x 2 0 x 2


x

para x 1

F(X) 0 dx 0 2x dx 1 0 dx 0 x 2 0 0 1
x

55

Representao grfica

iii)

1
P x
4

3
3
2
4
1 2 x dx = x 41
4
4
4

E(X 2 )

x 2 f(x) dx =

x 2 2x dx =

iv) E(X) x f(x) dx = x 2x dx =


0

8
0,5
16

2 x 2 f(x) dx =

2 x 3 f(x) dx =

2 31 2
x

3
0 3

2 41 1
x

4
0 2

logo,
V(X) E(X2 ) E(X)
2

1 2

2 3

98 1

18
18

6.9 Exerccios
1) Admita que a varivel X tome valore 1, 2 e 3 com
probabilidades 1/3, 1/6 e 1/2 respectivamente.
a) Determine sua funo de repartio e represente
graficamente.
b) Calcule usando as propriedades:
b.1) a) P(1 < x < 3); b) P(1 x 2); c) P(1 < x 3); d) F(1); e)
F(2)
c) E(X) e V(X)

56

2) No lanamento simultneo de dois dados, considere as


seguintes variveis aleatrias:
X = nmero de pontos obtidos no 1o dado.
Y = nmero de pontos obtidos no 2o dado.
a) Construir a distribuio de probabilidade atravs de uma
tabela e grfico das seguinte variveis:
i) W = X - Y
ii) A = 2 Y
iii) Z = X . Y
b) Construir a funo de repartio das Variveis W, A e Z
c) Aplicar as propriedades e determinar:
i) P (-3 < W 3)
ii) P (0 W 4)
iii) P (A > 6)
iv) P (Z 5.5)

v) P (Z = 3)
vi) P (A 11)
vii) P (20 Z 35)
viii) P 3,5 < Z < 34)

d) Determine E(W), E(A), E(Z), V(W), V(A) e V(Z)


3) Uma varivel aleatria discreta tem a distribuio de
probabilidade dada por:
P X

K
para x = 1, 3, 5 e 7
x

a) calcule o valor de k
c) E(X)

b) Calcular P(X=5)
d) V(X)

4) Seja Z a varivel aleatria correspondente ao nmero de


pontos de uma pea de domin.
a) Construir a tabela e traar o grfico P(Z).
b) Determinar F(Z) e traar o grfico.
c) Calcular P(2 Z < 6).
57

d) Calcular F(8).
e) E(Z) e V(Z).

3
1 x2 , 0 x 1
5) Seja f ( x ) 2
,
0, caso contrrio
i) Ache a funo de repartio e esboce o grfico.
ii) Determine E(X) e V(X).

1
x, 0 x 2
6) Seja f ( x ) 2
,
0, caso contrrio
i) Ache a funo de repartio e esboce o grfico.
ii) P(1< x < 1,5).
iii) E(X) e V(X).

7) Uma varivel aleatria X tem a seguinte f.d.p.:


x<0
f(x) = 0
0x<2
f(x) = k
2x<4
f(x) = k(x - 1)
x4
f(x) = 0
a) Represente graficamente f(x).
b) Determine k.
c) Determine F(X) e faa o grfico
d) E(X) e V(X)
8)

funo

de

6 x 1 x , 0 x 1
f (x )
0, caso contrrio

probabilidade

de

uma

a) Determine F(X) e represente graficamente.

1
2

b) Calcule P x

c) E(X) e V(X)

58

V.A.C.

9) Uma varivel aleatria X tem a seguinte f.d.p.:


f(x) = 0
x<0
f(x) = Ax
0 x < 500
f(x) = A(100 - x)
500 x < 1000
f(x) = 0
x 1000
a) Determine o valor de A.
b) P (250 x 750).
10) Dada a funo de repartio:
F(X) = 0
para x < -1
F(X) =

x 1
2

para -1 x < 1
para x 1

F(X) = 1

a) Calcule: P x , b) P(X = 0)
2
2

59

7 Distribuies de Probabilidade
Aps termos visto as definies de V.A.D. e V.A.C., citaremos as
principais distribuies de probabilidade relacionadas a estas variveis.

7.1 Distribuies Discretas de Probabilidade


7.1.1 Distribuio Binomial
O termo "Binomial" utilizado quando uma varivel aleatria
esta agrupada em duas classes ou categorias. As categorias devem ser
mutuamente excludentes, de modo a deixar bem claro a qual categoria
pertence determinada observao; e as classes devem ser
coletivamente exaustivas, de forma que nenhum outro resultado fora
delas possvel
Sejam, "p" probabilidades de sucesso e "q" probabilidades de
falha, ou seja p + q = 1.
A probabilidade de x sucessos em x tentativas dado por p x e
de (n - x) falhas em (n - x) tentativas dado por q n-x, onde o nmero de
vezes em que pode ocorrer x sucessos e (n-x) falhas dado por:
n
n!
C n, x
x! (n x)!
x

logo, a probabilidade de ocorrer x sucessos com n tentativas ser


n x nx
p q
x

P(X x)

Propriedades necessrias
Distribuio Binomial:

para

haver

uma

utilizao

1a) Nmero de tentativas fixas;


2a) Cada tentativa deve resultar numa falha ou sucesso;

60

da

3a) As probabilidades de sucesso devem ser iguais para todas as


tentativas;
4a) Todas as tentativas devem ser independentes.

7.1.11 Esperana Matemtica de Distribuio Binomial


E(X) n . p

7.1.2.2 Varincia de uma Distribuio Binomial


V(X) n.p.q
7.1.2 Distribuio de Poisson
Quando numa distribuio binomial o tamanho "n" das
observaes for muito grande e a probabilidade "p" de sucesso for
muito pequena, a probabilidade x de ocorrncia de um determinado
nmero de observaes segue uma Distribuio de Poisson.
A aplicao da distribuio segue algumas restries:
- Somente a chance afeta o aparecimento do evento, contando-se
apenas com a sua ocorrncia, ou seja, a probabilidade de sucesso "p".
- Uma vez no conhecido o nmero total de eventos, a
distribuio no pode ser aplicada.
7.1.2.1 Esperana Matemtica da Distribuio de Poisson
E(x) =
7.1.2.2 Varincia da Distribuio de Poisson
V(X)

61

7.2 Exerccios
1) Admitindo-se o nascimento de meninos e meninas sejam
iguais, calcular a probabilidade de um casal com 6 filhos ter:
a) 4 filhos e 2 filhas
b) 3 filhos e 3 filhas
2) Em 320 famlias com 4 crianas cada uma, quantas se
esperaria que tivessem:
a) nenhuma menina;
b) 3 meninos
c) 4 meninos
3) Um time X tem 2/3 de probabilidade de vitria sempre que
joga. Se X jogar 5 partidas, calcule a probabilidade de:
a) X vencer exatamente 3 partidas;
b) X vencer ao menos uma partida;
c) X vencer mais da metade das partidas;
d) X perder todas as partidas;
4) A probabilidade de um atirador acertar um alvo 1/3. Se ele
atirar 6 vezes, qual a probabilidade de:
a) acertar exatamente 2 tiros;
b) no acertar nenhum
tiro.
5) Num teste de certo-errado, com 100 perguntas, qual a
probabilidade de um aluno, respondendo as questes ao acaso,
acertar 70% das perguntas ?
6) Se 5% das lmpadas de certa marca so defeituosas, achar a
probabilidade de que, numa amostra de 100 lmpadas,
escolhidas ao acaso, tenhamos:
a) nenhuma defeituosa (use binomial e poisson)
b) 3 defeituosas;
c) mais do que uma boa;
7) Uma fabrica de pneus verificou que ao testar seus pneus nas
pistas, havia em mdia um estouro de pneu a cada 5.000 km.
a) qual a probabilidade que num teste de 3.000 km haja no
mximo um pneu estourado ?
62

b) Qual a probabilidade de um carro andar 8.000 km sem


estourar nenhum pneu ?
8) Certo posto de bombeiros recebe em mdia 3 chamadas por
dia. Calcular a probabilidade de:
a) receber 4 chamadas num dia;
b) receber 3 ou mais chamadas num dia;
c) 22 chamadas numa semana.
9) A mdia de chamadas telefnicas em uma hora 3. Qual a
probabilidade:
a) receber exatamente 3 chamadas numa hora;
b) receber 4 ou mais chamadas em 90 minutos;
c) 75 chamas num dia;
10) Na pintura de paredes aparecem defeitos em mdia na
proporo de 1 defeito por metro quadrado. Qual a
probabilidade de aparecerem 3 defeitos numa parede 2 x 2
m?
11) Suponha que haja em mdia 2 suicdios por ano numa
populao de 50.000 hab. Em uma cidade de 100.000
habitantes, encontre a probabilidade de que um dado ano
tenha havido: a) nenhum suicdio; b) 1 suicdio; c) 2 ou mais
suicdios.
12) Suponha 400 erros de impresso distribudos aleatoriamente
em um livro de 500 pginas. Encontre a probabilidade de que
uma dada pgina contenha:
a) nenhum erro;
b) 100 erros em 200 pginas.
7.3 Distribuies Contnuas de Probabilidade
7.3.1 Distribuio Uniforme ou Retangular

63

uma distribuio de probabilidade usada para variveis


aleatrias contnuas, definida num intervalo a, b , e sua funo
densidade de probabilidade dada por:
1

f(x) b a
0

se a x b
se x < a ou x > b

FIGURA 7.1 - Representao de uma Distribuio Uniforme


7.3.1.1 Esperana Matemtica da Distribuio Uniforme
E(X)

(b + a)
2

7.3.1.2 Varincia da Distribuio Uniforme


(b a) 2
V(X)
12
7.3.2 Distribuio Normal ou Gaussiana
um modelo de distribuio contnua de probabilidade, usado
tanto para variveis aleatrias discretas como contnuas.
Uma varivel aleatria X, que tome todos os valores reais - < x
< + tem distribuio normal quando sua funo densidade de
probabilidade (f.d.p.) for da forma:

64

f(x)

1
2

1 x

, x < +

Os parmetros e seguem as seguintes condies:


< < + e > 0 .

65

7.3.2.1 Propriedades da Distribuio Normal


a) O aspecto grfico da funo f(x) tem:
- Semelhana de um sino, unimodal e simtrico em relao a
mdia .
- A especificao da mdia e do desvio padro
completamente evidenciado.
- A rea total da curva equivale a 100%.
- A rea total da curva equivale a 100%.

FIGURA 7.2 - Distribuio Normal em funo da e


7.3.2.2 Esperana Matemtica da Distribuio Normal
E(X) =
7.3.2.3 Varincia da Distribuio Normal
V(X) =

66

7.3.2.4 Distribuio Normal Padronizada


Tem como objetivo solucionar a complexidade da f(x) atravs da
mudana de varivel. f(z).

FIGURA 7.4 - Complemento da Distribuio Normal Padronizada


Fazendo z

x
e z ~ N(0,1) temos que

z2

1
f(z) =
e 2,
2

com E(z) = 0 e VAR(z) = 1.


onde:
z = nmero de desvios padres a contar da mdia
x = valor arbitrrio
= mdia da distribuio normal
= desvio padro da distribuio normal
Estas probabilidades esto tabeladas e este caso particular
chamado de Forma Padro da Distribuio Normal.

67

7.3.3 Distribuio t de Student


Trata-se de um modelo de distribuio contnua que se
assemelha distribuio normal padro, N ~ (0,1). utilizada para
inferncias estatsticas, particularmente, quando se tem amostras com
tamanhos inferiores a 30 elementos.
A distribuio t tambm possui parmetros denominado "grau de
liberdade - ". A mdia da distribuio zero e sua varincia dada
por:

VAR t 2 t

, para > 2.

A distribuio t simtrica em relao a sua mdia.

7.4 Exerccios
1) As alturas dos alunos de uma determinada escola so
normalmente distribudas com mdia 1,60 m e desvio padro
0,30 m. Encontre a probabilidade de um aluno escolhido ao
acaso medir:
a) entre 1,50 e 1,80 m
b) mais que 1,75 m
c) menos que 1,48 m
d) entre 1,54 e 1,58 m
e) menos que 1,70 m
f) exatamente 1,83 m
2) A durao de certo componente eletrnico tem mdia 850 dias
e desvio padro 45 dias. Qual a probabilidade do componente
durar:
a) entre 700 e 1000 dias
b) menos que 750 dias
c) mais
que 850 dias
d) Qual deve ser o nmero de dias necessrios para que
tenhamos de repor 5% dos componentes. (R = 776 dias)
3) Um produto pesa, em mdia, 10 g, com desvio padro de 2 g.
embalado em caixas com 50 unidades. Sabe-se que as caixas

68

vazias pesam 500 g, com desvio-padro de 25 g. Admitindo-se


uma distribuio normal dos pesos e independncia entre as
variveis dos pesos do produto e da caixa, calcule a
probabilidade de uma caixa cheia pesar mais de 1050 g.
Xgeral 1000, Vgeral 50 Vp Vc , Sgeral Vgeral 28. 73 (R = 0.04093)
4) Em uma distribuio normal 28% dos elementos so
superiores a 34 e 12% inferiores a 19. Encontrar a mdia e a
varincia da distribuio. (R = X 29. 03, S2 73. 44 )
5) Suponha que a durao de vida de dois equipamentos E 1 e E2
tenham respectivamente distribuies N(45 ; 9) e N(40 ; 36).
Se o equipamento tiver que ser usado por perodo de 45 horas,
qual deles deve ser preferido? (R = E1)
6) A precipitao pluviomtrica mdia em certa cidade, no ms
de dezembro, de 8,9 cm. Admitindo a distribuio normal
com desvio padro de 2,5 cm, determinar a probabilidade de
que, no ms de dezembro prximo, a precipitao seja (a)
inferior a 1,6 cm, (b) superior a 5 cm mas no superior a 7,5
cm, (c) superior a 12 cm.
7) Em uma grande empresa, o departamento de manuteno tem
instrues para substituir as lmpadas antes que se queimem
(no esperar que queimem para ento substitu-las). Os
registros indicam que a durao das lmpadas tem
distribuio N(900 ; 75) (horas). Quando devem ser
substitudas as lmpadas de modo que no mximo 10% delas
queimem antes de serem trocadas? (R = 889 horas)
8) Os registros indicam que o tempo mdio para se fazer um
teste aproximadamente N(80 ; 20) (min.). Determinar:
a) a percentagem de candidatos que levam menos de 60 min ?
b) se o tempo concedido de 1h, que percentagem no
conseguir terminar o teste ?

69

9) A profundidade dos poos artesianos em um determinado


local uma varivel aleatria N(20 ; 3) (metros). Se X a
profundidade de determinado poo, determinar (a) P(X < 15),
(b) P(18 < X < 23), (c) P (X > 25).
10) Certa mquina de empacotar determinado produto oferece
variaes de peso com desvio padro de 20 g. Em quanto deve
ser regulado o peso mdio do pacote para que apenas 10%
tenham menos que 400 g? Calcule a probabilidade de um
pacote sair com mais de 450 g. [R = a) = 425.6 b) 0.11123 )]

70

8 Amostragem
8.1 Conceitos em Amostragem
Inferncia Estatstica - o processo de obter informaes
sobre uma populao a partir de
resultados observados ma Amostra.
Amostragem: o processo de retirada de informaes dos "n"
elementos amostrais, na qual deve seguir um
mtodo adequado (tipos de amostragem).

8.2 Plano de Amostragem


1o) Definir os Objetivos da Pesquisa
2o) Populao a ser Amostrada
- Parmetros a ser Estimados (Objetivos)
3o) Definio da Unidade Amostral
- Seleo dos Elementos que faro parte da amostra
4o) Forma de seleo dos elementos da populao
71

Aleatoria Simples
Sistematica

- Tipo de Amostragem
Estratificada

por Conglomerados

5o) Tamanho da Amostra


Ex.: Moradores de uma Cidade (populao alvo)
prpria

Objetivo: Tipo de Residncia alugada

emprestada

um piso

dois pisos

tres ou mais pisos

Unidade Amostral: Domiclios (residncias)


Elementos da Populao: Famlia por domiclio
aleatoria simples

Tipo de Amostragem: sistematica


estratificada

8.3 Tipos de Amostragem


8.3.1 Amostragem Simples ou Ocasional
o processo mais elementar e freqentemente utilizado. Todos
os elementos da populao tem igual probabilidade de serem
escolhidos. Para uma populao finita o processo deve ser sem
reposio. Todos os elementos da populao devem ser numerados.
Para realizar o sorteio dos elementos da populao devemos usar a
Tabela de Nmeros Aleatrios.
8.3.2 Amostragem Sistemtica
Trata-se de uma variao da Amostragem Aleatria Ocasional,
conveniente quando a populao est naturalmente ordenada, como
fichas em um fichrio, lista telefnica, etc.
Ex.: N = 5000

n = 50, ento r

72

N
10 , (P.A. de razo 10)
n

Sorteia-se usando a Tabela de Nmeros


Aleatrios um nmero entre 1 e 10,
(x=3), o nmero sorteado refere-se ao 1 o
elemento da amostra, logo os elementos
da amostra sero:
3

13

23

33

43

......

Para determinar qualquer elemento da amostra podemos usar a


frmula do termo geral de uma P.A.

a n a1 ( n 1). r
8.3.3 Amostragem Estratificada
um processo de amostragem usado quando nos depararmos
com
populaes
heterogneas,
na
qual
pode-se
distinguir
subpopulaes mais ou menos homogneas, denominados estratos.
Aps a determinao dos estratos, seleciona-se uma amostra
aleatria de cada uma subpopulao (estrato).
As diversas subamostras retiradas das subpopulaes devem ser
proporcionais aos respectivos nmeros de elementos dos estratos, e
guardarem a proporcionalidade em relao a variabilidade de cada
estrato, obtendo-se uma estratificao tima.
Tipos de variveis que podem ser usadas em estratificao:
idade, classes sociais, sexo, profisso, salrio, procedncia, etc.
8.3.4 Amostragem por Conglomerados (ou Agrupamentos)
Algumas populaes no permitem, ou tornam-se extremamente
difcel que se identifiquem seus elementos, mas podemos identificar
subgrupos da populao. Em tais casos, uma amostra aleatria simples
desses subgrupos (conglomerados) podem ser escolhida, e uma
contagem completa deve ser feita no conglomerado sorteado.
Agregados tpicos
agncias, edifcios, etc.

so: quarteires,

famlias,

organizaes,

8.4 Amostragem "COM" e "SEM" reposio


Seja "N" o nmero de elementos de uma populao, e seja "n" o
nmero de elementos de uma amostra, ento:
73

Se o processo de retirada dos elementos for COM reposio


(pop. infinita (f 5%) ), o nmero de amostras possveis ser:
no de amostras = N n
Se o processo de retirada de elementos for SEM reposio (pop.
finita (f > 5%) ), o nmero de amostras possveis ser:
no
C N,n

de

amostras

N!

n! N - n !

Ex.: Supondo N = 8 e n = 4
com reposio: no de amostras = N n = 84 4096
8!
70
sem reposio: no de amostras = C N ,n n! N - n ! = C8,4
4! 4!
N!

Ex.: Processo de Amostragem Aleatria Simples


(Distribuio Amostral das Mdias)
- (com reposio)
N = { 1, 2, 3, 4}

no de amostras = N n = 4 2 16

n=2

11,
2,1
3,1
4,1

1,2
2,2
3,2
4,2

1,3
2,3
3,3
4,3

1,4
2,4
3,4
4,4

- (sem reposio)
N = { 1, 2, 3, 4}

no de amostras = C 4,2

n=2

4!
6
2 ! 2!

1,2 1,3 1,4


2,3 2,4 3,4
Para ilustrar melhor as estatsticas amostrais usaremos o
processo com reposio.

74

, x 1,0
11
2,1 x 1,5
3,1 x 2,0
4,1 x 2,5

1,2 x 1,5
2,2 x 2,0
3,2 x 2,5
4,2 x 3,0

1,3 x 2,0
2,3 x 2,5
3,3 x 3,0
4,3 x 3,5

75

1,4 x 2,5
2,4 x 3,0
3,4 x 3,5
4,4 x 4,0

8.5 Representaes de uma Distribuio Amostral


- Tabela

xi

P(X = xi )
1/16
2/16
3/16
4/16
3/16
2/16
1/16
16/16

1,0
1,5
2,0
2,5
3,0
3,5
4,0

- Grfico

8.6 Estatsticas Amostrais


- Esperana Matemtica
n

x E x xi P(X = xi )
i 1

40
2,5
16

-Varincia

2
2
ou VAR x E x [ E( x )]

x P X = x

2
onde E x

2
i

i=1

76

8.7 TAMANHO DA AMOSTRA


8.7.1 Introduo
Os pesquisadores de todo o mundo, na realizao de pesquisas
cientficas, em qualquer setor da atividade humana, utilizam as tcnicas
de amostragem no planejamento de seus trabalhos, no s pela
impraticabilidade de poderem observar, numericamente, em sua
totalidade determinada populao em estudo, como devido ao aspecto
econmico dessas investigaes, conduzidos com um menor custo
operacional, dentro de um menor tempo, alm de possibilitar maior
preciso nos respectivos resultados, ao contrrio, do que ocorre com os
trabalhos realizados pelo proceso censitrio (COCHRAN, 1965; CRUZ,
1978).
A tcnica da amostragem, a despeito de sua larga utilizao,
ainda necessita de alguma didtica mais adequada aos pesquisadores
iniciantes.
Na teoria da amostragem, so consideradas duas dimenses:
1a) Dimensionamento da Amostra;
2a) Composio da Amostra.
8.7.2
amostra

Procedimentos

para

determinar

tamanho

da

1o) Analisar o questionrio, ou roteiro da entrevista e escolher


uma varivel que julgue mais importante para o estudo. Se
possvel mais do que uma;
2o) Verificar o nvel de mensurao da varivel: nominal, ordinal
ou intervalar;
3o) Considerar o tamanho da populao: infinita ou finita
4o) Se a varavel escolhida for:
- intervalar e a populao considerada infinita, voc
poder determinar o tamanho da amostra pela frmula:
Z .

77

onde: Z = abscissa da curva normal padro, fixado um nvel de


confiana (1- )
Z = 1,64 (1 - ) = 90%
Z = 1,96 (1 - ) = 95%
Z = 2,0 (1 - ) = 95.5%
Z = 2,57 (1 - ) = 99%
Geralmente usa-se Z = 2
= desvio padro da populao, expresso na unidade varivel,
onde poder ser determinado por:
Especificaes Tcnicas
Resgatar o valor de estudos semelhantes
Fazer conjeturas sobre possveis valores
d = erro amostral, expresso na unidade da varivel. O erro
amostral a mxima diferena que o investigador admite suportar
entre e x , isto : x d .
- intervalar e a populao considerada finita, voc poder
determinar o tamanho da amostra pela frmula:
n

Z2 . 2 . N
d 2 ( N 1) Z2 . 2

onde: Z = abscissa da normal padro


2 = varincia populacional
N = tamanho da populao
d = erro amostral
- nominal ou ordinal, e a populao considerada infinita,
voc poder determinar o tamanho da amostra pela
frmula:
n

Z2 . p . q
d2

78

onde: Z = abscissa da normal padro


p = estimativa da verdadeira proporo de um dos nveis da
varivel escolhida. Por exemplo, se a varivel escolhida for
parte da empresa, p poder ser a estimativa da verdadeira
proporo de grandes empresas do setor que est sendo
estudado. p ser expresso em decimais ( p = 30% p = 0.30).
q 1 p
d = erro amostral, expresso em decimais. O erro amostral neste
caso ser a mxima diferena que o investigador admite
suportar entre e p , isto : p d , em que a verdadeira
proporo (freqncia relativa do evento a ser calculado a
partir da amostra.
- nominal ou ordinal, e a populao considerada finita,
voc poder determinar o tamanho da amostra pela
frmula:
n

Z2 . p . q . N
d 2 ( N 1) Z2 . p . q

onde: Z = abscissa da normal padro


N = tamanho da populao
p = estimativa da proporo
q 1 p
d = erro amostral
Estas frmulas so bsicas para qualquer tipo de composio da
amostra; todavia, existem frmulas especficas segundo o critrio de
composio da amostra.
- Se o investigador escolher mais de uma varivel, poder
acontecer de ter que aplicar mais de uma frmula, assim dever optar
pelo maior valor de "n".

Quando no tivermos condies de prever o possvel valor para p , admita p =


0.50, pois, dessa forma, voc ter o maior tamanho da amostra, admitindo-se
constantes os demais elementos.

79

8.8 Distribuies amostrais de probabilidade


8.8.1 Distribuio amostral das mdias
Se a varivel aleatria "x" segue uma distribuio normal:

x ~ N (x); 2 (x) , onde z

x ( x)
( x)

( x ) (a mdia da distribuio amostral igual a mdia


populacional)
( x)

( x)
(Desvio Padro Amostral)
n

8.8.1.1 Caso COM reposio (pop. infinita)

2 ( x)
x ~ N ( x );
n

8.8.1.2 Caso SEM reposio (pop. finita)


n
devemos usar um
N

Quando a amostra for > 5% da populao


fator de correo.

N-n
2 ( x) N - n
x ~ N ( x );
, onde
o fator de correo

n
N -1
N -1

Ex1.: Uma populao muito grande tem mdia 20,0 e desvio


padro 1,4 . Extrai-se uma amostra de 49 observaes.
Responda:
a) Qual a mdia da distribuio amostral ?
b) Qual o desvio padro da distribuio amostral ?
c) Qual a porcentagem das possveis mdias que diferiram por
mais de 0,2 da mdia populacional ?
Ex2.: Um processo de encher garrafas de coca-cola d em mdia
10% mal cheias com desvio padro de 30%. Extrada uma
amostra de 225 garrafas de uma sequncia de produo de
80

625, qual a probabilidade amostral das garrafas mal cheias


estar entre 9% e 12%.
O exemplo n o 2 pode ser resolvido usando a distribuio amostral das propores,
onde p = proporo populacional, p = mdia da distribuio amostral das propores.
Logo temos:

81

8.8.2 Distribuio amostral das propores


pp

onde

p (1 p )
.
n

N-n
,
N -1

N-n
usado para populao finita.
N -1

Ex1: Uma mquina de recobrir cerejas com chocolate regulada


para produzir um revestimento de (3% em relao ao volume da cereja).
Se o processo segue uma distribuio normal, qual a probabilidade de
extrair uma amostra de 25 cerejas de um lote de 169 e encontrar uma
mdia amostral superior a 3,4%. R = 0,44828.
8.9 Exerccios
1) Uma fabrica de baterias alega que eu artigo de primeira
categoria tem uma vida mdia de 50 meses, e desvio padro
de 4 meses.
a) Que porcentagem de uma amostra de 36 observaes acusaria
vida mdia no intervalo de um ms em torno da mdia ?
b) Qual ser a resposta para uma amostra de 64 observaes?
c) Qual seria o percentual das mdias amostrais inferior a 49,8
meses com n =100?
2) Um varejista compra copos diretamente da fbrica em
grandes lotes. Os copos so embrulhados individualmente.
Periodicamente o varejista inspeciona os lotes para determinar
a proporo dos quebrados ou lascados. Se um grande lote
contm 10% de quebrados (lascados) qual a probabilidade do
varejista obter numa amostra de 100 copos 17% ou mais
defeituosos?
3) Deve-se extrair uma amostra de 36 observaes de uma
mquina de cunhar moedas comemorativas. A espessura
mdia das moedas de 0,2 cm, com desvio padro de 0,01 cm.
a) Que percentagem de mdias amostrais estar no intervalo
0,004 em torno da mdia? R = 0.98316
b) Qual a probabilidade de obter uma mdia amostral que se
afaste por mais de 0,005 cm da mdia do processo ? R =
0.00164
4) Suponha que uma pesquisa recente tenha revelado que 60%
de uma populao de adultos do sexo masculino consistam de
82

no-fumantes. Tomada uma amostra de 10 pessoas de uma


populao muito grande, que percentagem esperamos nos
intervalos abaixo:
a) de 50% a 65%
b) maior que 53%
c)
de
65% a 80%
5) Se a vida mdia de operao de um "flash" 24 horas, com
distribuio normal e desvio padro de 3 horas, qual a
probabilidade de uma amostra de 10 "flashes" retirados de
uma populao de 500 "flashes" apresentar vida mdia que
difira por mais de 30 min. da mdia. R = 0.60306

83

9 Estimao de Parmetros
um processo de induo, na qual usamos dados extrados de
uma amostra para produzir inferncia sobre a populao. Esta
inferncia s ser vlida se a amostra for significativa.
- Tipos de Estimaes de Parmetros
i) Estimao Pontual
ii) Estimao Intervalar
9.1 Estimao Pontual
usada quando a partir da amostra procura-se obter um nico
valor de certo parmetro populacional, ou seja, obter estimativas a
partir dos valores amostrais.
a) Estatsticas
Seja (X1, X2, ..., Xn) uma amostra aleatria e (x 1 ,x2, ..., xn) os
valores tomados pela amostra; ento y = H(x 1 ,x2, ..., xn) uma
estatstica.
Principais estatsticas:
- Mdia Amostral
- Proporo Amostral
- Varincia Amostral
9.2 Estimao Intervalar
Uma outra maneira de se calcular um estimativa de um
parmetro desconhecido, construir um intervalo de confiana para
esse parmetro com uma probabilidade de 1 (nvel de confiana) de
que o intervalo contenha o verdadeiro parmetro. Dessa maneira ser
o nvel de significncia, isto , o erro que se estar cometendo ao
afirmar que o parmetro est entre o limite inferior e o superior
calculado.

84

9.2.1 Intervalo de confiana para a mdia () com a


varincia ( 2 ) conhecida ou desconhecida
e (n > 30 Z)
Seja X ~ N , 2
Como

vimos

anteriormente,

x (mdia amostral)

distribuio normal de mdia e desvio padro


,ou seja:
n

2
X ~ N ;
n

Portanto, z

X
tem distribuio N (0,1)
n

Ento,

P z 2 z z 2 1

x
P z 2
z 2 1
n

P z 2
X z 2
X 1

n
n

P X z 2
X z 2
1 (Pop. Infinita)

n
n

Para caso de populaes finitas usa-se a seguinte frmula:

P X z

N n
X z
N 1

N n
1 (Pop. Finita)
N 1

Obs.: Os nveis de confiana mais usados so:

85

tem

1 90% z 2 1, 64
1 95% z 2 1, 96
1 99% z 2 2,58

1 85% z

1,44

Ex.: Seja X a durao da vida de uma pea de equipamento tal


que = 5 horas. Admita que 100 peas foram ensaiadas fornecendo uma
durao de vida mdia de 500 horas e que se deseja obter um intervalo
de 95% para a verdadeira mdia populacional. R = P (499,02
500,98) = 95%.
Obs.: Podemos dizer que 95% das vezes, o intervalo acima
contm a verdadeira mdia populacional. Isto no o mesmo que
afirmar que 95% a probabilidade do parmetro cair dentro do
intervalo, o que constituir um erro, pois um parmetro
(nmero) e ele est ou no no intervalo.
9.2.2 Intervalo de confiana para a mdia () com a
varincia ( 2 ) conhecida ou desconhecida
e ( n 30)
Neste caso precisa-se calcular a estimativa S (desvio padro
amostral) a partir dos dados, lembrando que:
n

S2

x
i 1

onde n -1 = graus de liberdade

n 1

2
X ~ N ;
n

Portanto, z

/ n

tem distribuio N (0,1)

Vamos considerar a varivel aleatria:

X
S

X
z N (0,1)

S
n / n S S

Esta distribuio conhecida como distribuio


Student, no caso com ( = n -1) graus de liberdade

86

"t"

de

O grfico da funo densidade da varivel "t" simtrico e tem a


forma da normal, porm menos "achatada" sua mdia vale 0 e a

varincia
em que o grau de liberdade ( 2)
2
X
S n
Ento,
t , 2

P t , 2 t t , 2 1
s
s

P X t , 2
X t , 2
1 (Pop. Infinita)

n
n

Para caso de populaes finitas usa-se a seguinte frmula:

S
P X t , / 2
n

Nn
S
X t , / 2
N 1
n

Nn
N 1

1 (Pop. Finita)

Ex.: A seguinte amostra: 9, 8, 12, 7, 9, 6, 11, 6, 10, 9 foi extrada


de uma populao aproximadamente normal. Construir um intervalo de
confiana para com um nvel de 95%.
n

x
i 1

8,7

= 10 -1 = 9

S2

x
i 1

n 1

= 5%

t , 2 t 9 ,2.5% 2,262
R P 7,27 10,13 95%

87

S2

Obs.:Quando n30 e for desconhecido poderemos usar S como


uma boa estimativa de . Esta estimao ser melhor quanto maior for
o tamanho da amostra.
9.2.3 Intervalo de Confiana para Propores
Sendo p o estimador de , onde p segue uma distribuio
normal, logo:
. q
p
~ N p
;
p

(pop. infinita)

p . q N - n
p ~ N p ;

n N -1

p
logo Z
onde
p

(pop. finita)

p.q
n

caracterstica
p X

n nmero de elementos da amostra

P p Z 2 p p Z 2 p 1 (Pop. Infinita)

Para caso de populaes finitas usa-se a seguinte frmula:

Nn
N n
P p Z 2 p
p Z 2 p
1 (Pop. Finita)
N 1
N 1

Ex.: Uma centena de componentes eletrnicos foram ensaiados e


93 deles funcionaram mais que 500 horas. Determine um intervalo de
confina de 95% para a verdadeira proporo populacional sabendo
que os mesmos foram retirados de uma populao de 1000
componentes.
9.2.4 Intervalo de Confiana para Varincia
Como o estimador de 2 S2 pode-se considerar que
distribuio Qui - quadrado, ou seja:
X 2n1 ~ Z

S2
,
2
88

n 1 S2
2

tem

logo o intervalo ser:

2inf 2

2sup 2

1 ;
2

Assim temos:
n 1 S2
n 1 S2 1
2

2
X 2inf
X sup

Ex.: A seguinte amostra: 9, 8, 12, 7, 9, 6, 11, 6, 10, 9 foi extrada


de uma populao aproximadamente normal. Construir um intervalo de
confiana para 2 com um nvel de 95%.
9.2.5 Intervalo de Confiana para a diferena Entre duas
Mdias:
Usualmente comparamos
formando sua diferena:

as

mdias

de

duas

populaes

1 2
Uma estimativa pontual desta diferena correspondente:
X1 X2
a) Varincias Conhecidas

1 2 X 1 X 2 Z . Erro Padro
2

Erro Padro?

89

VAR X1 X 2 1 VAR X1 1 VAR X 2


2

12 22

n1 n 2
logo o erro padro

12 22

n1 n 2

12 22
12 22
P X1 X 2 Z 2

1 2 X1 X2 Z 2

1
n1 n 2
n1 n 2

Obs.: se 1 e 2 so conhecidas e tem um valor em comum, logo:


Erro Padro:

1
1

n1 n 2

Ex.: Seja duas classes muito grande com desvios padres 1 1, 21


e 2 2 ,13 . Extrada uma amostra de 25 alunos da classe 1 obteve-se
uma nota mdia de 7,8, e da classe 2 foi extrada uma amostra de 20
alunos obteve-se uma nota mdia de 6,0. Construir um intervalo de 95%
de confiana para a verdadeira diferena das mdias populacionais. R =
(LI=0,753; LS=2,847)
b) Varincias Desconhecidas
Em geral conhecemos duas varincias populacionais (12 e 22 ). Se
as mesmas so desconhecidas o melhor que podemos fazer estim-las
por meio de varincias amostrais S12 e S22 .
Como as amostras sero pequenas, introduziremos uma fonte de
erro compensada pela distribuio "t":

S 2 S2
S2 S2
P X1 X2 t 2 1 2 1 2 X1 X2 t 2 1 2 onde n1 n 2 2
n1 n 2
n1 n 2

Obs.: Se as varincias populacionais so desconhecidas mas as


estimativas so iguais, poderemos usar para o Erro Padro o seguinte
critrio:

90

Erro Padro: SC

1 1

n1 n2

onde Sc o desvio padro

conjunto
SC

n1 1 S12 n2 1 S22
n1 n 2 2

Ex1.: De uma turma (1) foi extrada uma amostra de 6 alunos


com as seguintes alturas: 150, 152, 153, 160, 161, 163. De uma
segunda turma foi extrada uma amostra de 8 alunos com as seguintes
alturas: 165, 166, 167, 172, 178, 180, 182, 190. Contruir um intervalo
de 95% de confiana para a verdadeira diferena entre as mdias
populacionais.
Ex2.: De uma mquina foi extrada uma amostra de 8 peas, com
os seguintes dimetros: 54, 56, 58, 60, 60, 62, 63, 65. De uma segunda
mquina foi extrada uma amostra de 10 peas, com os seguintes
dimetros: 75, 75, 76, 77, 78, 78, 79, 80, 80, 82. Construir um intervalo
de 99% de confiana para a diferena entre as mdias populacionais,
supondo que as mquinas foram construdas pelo mesmo fabricante.
9.2.6 Intervalo de Confiana para a Diferena entre duas
Propores

p q
p q
p q
p q
P p 1 p 2 Z 2 1 1 2 2 1 2 p 1 p 2 Z 2 1 1 2 2
n1
n2
n1
n2

Ex.: Em uma pesquisa realizada pelo Instituto Gallup constatou


que 500 estudantes entrevistados com menos de 18 anos, 50%
acreditam na possibilidade de se verificar uma modificao na Amrica,
e que dos 100 estudantes com mais de 24 anos, 69% acreditam nessa
modificao. Construir um intervalo de confiana para a diferena entre
as propores destas subpopulaes usando =5%. R=(LI=0,0893,
LS=0,2905)
9.3 Exerccios
1) Ao se realizar uma contagem de eritrcitos em 144 mulheres
encontrou-se em mdia 5,35 milhes e desvio padro 0,4413
milhes de glbulos vermelhos. Determine os limites de
confiana de 99% para a mdia populacional.

91

2) Um conjunto de 12 animais de experincia receberam uma dieta


especial durante 3 semanas e produziram os seguintes aumentos
de peso (g): 30, 22, 32, 26, 24, 40, 34, 36, 32, 33, 28 e 30.
Determine um intervalo de 90% de confiana para a mdia.
R X =30.58, S = 5.09,LI = 27.942, LS = 33.218
3) Construa um intervalo de 95 % de confiana para um dos
seguintes casos:

a)
b)
c)
d)

Mdia
Amostral
16,0
37,5
2,1
0,6

2,0
3,0
0,5
0,1

Tamanho da
Amostra
16
36
25
100

4) Numa tentativa de melhor o esquema de atendimento, um


mdico procurou estimar o tempo mdio que gasta com cada
paciente. Uma amostra aleatria de 49 pacientes, colhida num
perodo de 3 semanas, acusou uma mdia de 30 min., com desvio
padro de 7 min. Construa um intervalo de 95% de confiana
para o verdadeiro tempo mdio de consulta.
5) Solicitou-se a 100 estudantes de um colgio que anotasse suas
despesas com alimentao e bebidas no perodo de uma semana.
H 500 estudantes no colgio. O resultado foi uma despesa de
$40,00 com um desvio padro de $10,00. Construa um intervalo
de 95% de confiana para a verdadeira mdia.
6) Uma amostra aleatria de 100 fregueses da parte da manh de
um supermercado revelou que apenas 10 no incluem leite em
suas compras.
a) qual seria a estimativa percentual dos fregueses que compram
leite pela parte da manh. ( = 5%). R LI = 84.12%, LS = 95.88%
b) construir um intervalo de 90% de confiana para a verdadeira
proporo dos fregueses que no compram leite pela manh. R
LI = 5.08%, LS = 14.92%

7) Uma amostra aleatria de 40 homens trabalhando num grande


projeto de construo revelou que 6 no estavam usando
capacetes protetores. Construa um intervalo de 98% de
confiana para a verdadeira proporo dos que no esto usando
capacetes neste projeto.R P = 0.056, LI = 0.02, LS = 0.28

92

8) De 48 pessoas escolhidas aleatoriamente de uma longa fila de


espera de um cinema, 25% acharam que o filme principal
continha demasiada violncia.
a) qual deveria ser o tamanho da fila, a partir do qual se pudesse
desprezar o fator de correo finita;
b) construa um intervalo de 98% de confiana para a verdadeira
proporo, se h 100 pessoas na fila;
c) construa um intervalo de 98% de confiana para a verdadeira
proporo, se h 500 pessoas na fila.
9) Em uma fbrica, colhida uma amostra (n = 30) de certa pea,
obtiveram-se as seguintes medidas para os dimetros:
10
13
14

11
13
14

11
13
14

11
13
14

12
13
14

12
13
15

12
13
15

12
13
15

13
13
16

13
13
16

a) estimar a mdia e a varincia; R 13,13 e 2,05


b) construir um intervalo de confiana para a mdia, sendo = 5%.
(LI = 12.536 e LS = 13.664)

c) construir um intervalo de 95 % de confiana para a mdia,


supondo que a amostra tenha sido retirada de uma populao de
100 peas, sendo = 5%. (LI = 12.581 e LS = 13.579)
d) Construir um intervalo de confina para a varincia
populacional, sendo = 5%. (LI = 1.3003 e LS = 3.704)
10) Supondo populaes normais, contruir um intervalo de
confiana para a mdia e para a varincia ao nvel de
significncia de 90% para as amostras.
a)

n=
11
b) 12 12 15 15 16 16 17 18 20 22 22 23
n=
12
c) 25 25 27 28 30 33 34 35 36
n=9
11) Sendo X uma populao tal que X ~ N(; 2 ) em que e so
desconhecidos. Uma amostra de tamanho 15 forneceu os
2
seguintes valores X i 8, 7 , e X i 27,3 . Determinar um
intervalo de confiana de 95% para e , supondo:
X

X
n

S
2

2
i

n 1

93

12) Dados os seguintes conjuntos de medias, determinar um


intervalo de 99% de confiana para a varincia populacional e
para a mdia populacional.
0.0105; 0,0193; 0,0152; 0,0229; 0,0244; 0,0190; 0,0208; 0,0253;
0,0276
R

X =O.0206, LI = 0.01467, LS = 0.026653;

S = 0.0053, LI = 0.00001, LS = 0.000167

13) O tempo de reao a uma injeo intravenosa em mdia de


2.1 min., com desvio padro de 0.1 min., para grupos de 20
pacientes. Construa um intervalo de confiana de 90 % para o
tempo mdio para toda a populao dos pacientes submetidos ao
tratamento.
14) Uma firma esta convertendo as mquinas que aluga para uma
verso mais moderna. At agora
foram convertidas 40
mquinas. O tempo mdio de converso foi de 24 horas com
desvio padro de 3 horas. a) Determine um intervalo de
confiana de 99 % para o tempo mdio de converso. b) Para
uma amostra de 60 mquinas, como ficaria o intervalo de
confiana de 99 % para o tempo mdio de converso
15) Seis dentre 48 terminais telefnicos do respostas de ocupado.
Uma firma possui 800 terminais. Construir um intervalo de
confiana de 95 % para a proporo dos terminas da firma que
apresentam sinal de ocupado. R LI = 3.4%, LS = 21.6%
16) Uma amostra de 50 bicicletas de um estoque de 400 bicicletas,
acusou 7 com pneus vazios. a) Estime o nmero de bicicletas
com pneus vazios: b) Construa um intervalo de 99 % confiana
para a populao das bicicletas com pneus vazios.
R a) 56; b) LI = 0.021 LS = 0.258

17) A mdia salarial semanal para uma amostra de n = 30


empregados em uma grande firma X = 180,00 com desvio
padro S = 14,00. Construa um intervalo de confiana de 99 %
para a mdia salarial dos funcionrios.
18) Uma empresa de pesquisa de mercado faz contato com uma
amostra de 100 homens em uma grande comunidade e verifica
que uma proporo de 0.40 na amostra prefere lminas de
barbear fabricadas por seu cliente em vez de qualquer outra
marca. Determinar o intervalo de confiana de 95 % para a

94

proporo de todos os homens na comunidade que preferem a


lmina do cliente.
19) Uma pequena fbrica comprou um lote de 200 pequenas peas
eletrnicas de um saldo de estoque de uma grande firma. Para
uma amostra aleatria de 50 peas, constatou-se que 5 eram
defeituosas. Estimar a proporo de todas as peas que so
defeituosas no carregamento utilizando um intervalo de
confiana de 99 %.
20) Duas amostras de plantas foram cultivadas com dois
fertilizantes diferentes. A primeira amostra oriunda de 200
sementes, acusou altura mdia de 10,9 cm e desvio padro 2,0
cm. A segunda amostra, de 100 sementes, acusou uma altura
mdia de 10,5 cm com desvio padro de 5,0 cm. Construir um
intervalo de confiana entre as alturas mdias das populaes ao
nvel de 95% de confiana.
21) Uma amostra aleatria de 120 trabalhadores de uma grande
fbrica leva em mdia 22,0 min. para executar determinado
servio, com S2 de 4 min2. Em uma segunda fbrica, para
executar a mesma tarefa, uma amostra aleatria de 120
operrios, gasta em mdia 19,0 min com S2 de 10 min2.
Construir um intervalo de 99% de confiana entre as mdias das
populaes.
22) Extraram-se amostras independentes de adultos brancos e
pretos, que acusaram os seguintes tempos (em anos) de
escolaridade.
Branco
Preto

8
9

18
12

10
5

10
10

14
14

12

Construir um intervalo de 95% de confiana para:


a) a mdia da populao branca, e a mdia da populao preta;
b) a diferena entre as mdias entre brancos e pretos
23) Em uma amostra aleatria de cinco pessoas, foi medida a
capacidade torxica antes e aps determinado tratamento,
obtendo-se os dados a seguir. Construir um intervalo de 95% de
confiana para a diferena entre as mdias antes e depois do
tratamento.
Capacidade
Torxica
95

Pessoa
A
B
C
D
E

Antes (X)
2750
2360
2950
2830
2250

Aps (Y)
2850
2380
2930
2860
2320

96

24) Extrada duas amostras de professores homens e mulheres,


obteve-se os seguintes resultados quantos aos salrios em
milhares de dlares: Construir um intervalo de 95% de confiana
para:
Homens
n1 = 25
X1 =
16,0
S12 = 16

Mulhere
s
n2 = 5
X2 =
11,0
S22 = 10

a) a mdia da diferena entre os salrios;


b) a mdia do salrio dos homens;
c) a mdia do salrio das mulheres.
25) Em uma pesquisa efetuada em com 1650 americanos foram
consultados sobre o seguinte tema: "A mulher grvida pode
procurar um mdico e interromper a gravidez, a qualquer
momento durante os trs primeiros meses. a favor ou contra
esta deciso?" Uma semana mais tarde foram consultados 1650
americanos foram consultados sobre o mesmo assunto , exceto
que a pergunta "a favor do aborto, ao invs de "interromper a
gravidez". As respostas foram as seguintes:

Pergunta
"Interromper a
gravidez"
"A favor do aborto"

A favor
46%
41%

Resposta
Contra
Sem opinio
39%
15%
49%

10%

a) Seja 1 a proporo dos votantes a favor do 1 o caso


(interromper) e 2 a proporo dos votantes a favor do 2 o caso
(aborto). Construir um intervalo de 95% de confiana para a
diferena 1 - 2. R = LI = 0.01628, LS = 0.08379
b) Repetir a (a) para os votantes que no tiveram opinio. R = LI =
0.0275, LS = 0.0725

26) Numa pesquisa sobre inteno do comprador brasileiro. 30


famlias de uma amostra aleatria de 150 declararam ser uma
inteno comprar um carro novo dentro de um ano. Uma outra
amostra de 160 famlias 25 declararam a mesma inteno.

97

Construir um intervalo de 99% de confiana para as diferenas


entre as propores.
R = LI = 0.0727, LS = 0.1527

98

10 Teste de Significncia
Trata-se de uma tcnica para se fazer inferncia estatstica. Ou seja, a
partir de um teste de hipteses, realizado com os dados amostrais,
pode-se inferir sobre a populao.
No caso da inferncia atravs de Intervalo de confiana, buscase "cercar" o parmetro populacional desconhecido. Aqui formula-se
uma hiptese quanto ao valor do parmetro populacional, e pelos
elementos amostrais faz-se um teste que indicar a ACEITAO ou
REJEIO da hiptese formulada.
10.1 Principais Conceitos
10.1.1 Hiptese Estatstica
Trata-se de uma suposio quanto ao valor de um parmetro
populacional, ou quanto natureza da distribuio de uma varivel
populacional.
So exemplos de hipteses estatsticas:
a) A altura mdia da populao brasileira 1,65 m, isto : H: =
1,65 m;
b) A varincia populacional dos salrios vale $ 500 2, isto , H: 2
= 5002 ;
c) A proporo de paulistas fumantes 25%, ou seja, H: p = 0.25
d) A distribuio dos pesos dos alunos da nossa faculdade
normal.
10.1.2 Teste de Hiptese
uma regra de deciso para aceitar ou rejeitar uma hipteses
estatstica com base nos elementos amostrais.
10.1.3 Tipos de Hipteses
Designa-se por Ho, chamada hiptese nula, a hipteses
estatstica a ser testada, e por H1 a hiptese alternativa. A hiptese
nula expressa uma igualdade, enquanto que a hiptese alternativa
dada por uma desigualdade ( , < , >).
99

Exemplos:

H 0: 0

H 1: 0

Teste Bicaudal ou Bilateral

H 0: 0

H 1: 0

Teste Unilateral Direito

H 0: 0

H 1: 0

Teste Unilateral Esquerdo

10.1.4 Tipos de erros


H dois tipos de erro ao testar uma hiptese estatstica. Pode-se
rejeitar uma hipteses quando ela , de fato verdadeira, ou aceitar uma
hipteses quando ela , de fato, falsa. A rejeio de uma hiptese
verdadeira chamada "erro tipo I". A aceitao de uma hiptese falsa
constitui um "erro tipo II".
As probabilidades desses dois tipos de erros so designados,
respectivamente, por e .
A probabilidade do erro do tipo I denominada "nvel de
significncia" do teste.
Os possveis erros e acertos de um teste esto sintetizados
abaixo:

Decis
o

Aceitar
Ho
Rejeitar
Ho

Realidade
Ho verdadeira
Ho falsa
Deciso correta (1 Erro Tipo II ()
)

Erro Tipo

I ()

Deciso Correta (1 )

Observe que o erro tipo I s poder acontecer se for rejeitado H o


e o erro tipo II quando for aceito Ho.
100

101

10.2 Teste de significncia


Os testes de Significncia considera somente erros do tipo ,
pois so os mais usados em pesquisas educacionais, scio-econmicas. .
.
O procedimento para realizao dos testes de significncia
resumido nos seguintes passo:
1o) Enunciar as hipteses H0 e H1;
2o) fixar o limite do erro , e identificar a varivel do teste;
3o) com o auxlio das tabelas estatsticas, considerando e a
varivel do teste, determinar as RR (regio de rejeio) e RA
(regio de aceitao) para Ho;
4o) com os elementos amostrais, calcular o valor da varivel do
teste;
o
5 ) concluir pela aceitao ou rejeio do H 0 pela comparao
do valor calculado no 4o passo com RA e RR.
10.2.1 Teste de significncia para a mdia
1. Enunciar as hipteses:
0 (a)

H 1: 0 (b)
(c)
0

H0 : = 0

2. Fixar . Admitindo:
- Se a varincia populacional 2 for conhecida, a varivel teste
ser "Z" (n>30);
- Se a varincia populacional 2 for desconhecida, a varivel
teste ser "t" de Student com = n -1 (n 30).
3. Com o auxlio das tabelas "Z" e "t" determinar as regies RA e
RR;

102

\EMBED PBrush \s \*
formatomesclar

(b)
(a)

103

(c)

4. Calcular o valor da varivel:


Zcal

X 0

t cal

X 0
S
n

onde: X = mdia amostral


0 = valor da hiptese nula
5. Concluso para a situao ( a )
- Se

Z Zcal Z

- Se

Zcal Z ou Z cal Z

ou

t t cal t
2

ou

, no se pode rejeitar Ho.

t cal t ou t cal t
2

, rejeita-se Ho.

OBS.: Para qualquer tipo de teste de significncia


devemos considerar:
- Se a varivel teste (calculada) cair dentro da
regio de aceitao (RA) no se pode rejeitar Ho;
- Se a varivel teste (calculada) cair fora da regio
de aceitao (RA) rejeita-se Ho.
Ex.: Os dois registros dos ltimos anos de um colgio, atestam
para os calouros admitidos uma nota mdia de 115 pontos
(teste vocacional). Para testar a hiptese de que a mdia de
uma nova turma a mesma, tirou-se, ao acaso, uma amostra
de 20 notas, obtendo-se mdia 118 e desvio padro 20.
Admitir = 5%, para efetuar o teste. (R = aceita-se Ho)
10.2.2 Teste de significncia para a proporo
1. Enunciar as hipteses:
p 0 (a)

H 1: p 0 (b)
p (c)
0

H o : = po

2. Fixar . Escolhendo a varivel normal padro "Z";


3. Com o auxlio da tabela "Z" determinar as regies RA e RR;

104

\EMBED PBrush \s \*
formatomesclar

(b)

(c)

(a)
4. Calcular o valor da varivel:

Z cal

f p0

onde

p0 . q0
n

X
n

onde: f = freqncia relativa do evento na amostral


X = caracterstica dentro da amostra
po = valor da hiptese nula
5. Concluso para a situao (a)
- Se

Z Zcal Z

- Se

Zcal Z ou Z cal Z

, no se pode rejeitar Ho.

, rejeita-se Ho.

Ex.: As condies de mortalidade de uma regio so tais que a


proporo de nascidos que sobrevivem at 60 anos de
0,6 . Testar essa hiptese ao nvel de 2%, se em 1000
nascimentos amostrados aleatoriamente, verificou-se 530
sobreviventes at 60 anos. (R = rejeita-se Ho)
10.2.3 Teste de significncia para a varncia
1. Enunciar as hipteses:
2 20 (a)

H 1: 2 20 (b)
2 2 (c)
0

Ho : 2 = 20

2. Fixar . Escolhendo a varivel qui-quadrado com = n -1.

105

3. Com o auxlio da tabela "2" determinar as regies RA e RR;

(b)

(a)
2
2
Para ( a ) temos: inf 1 ;

(c)

2sup 2

Para ( b ) temos: 2sup 2;


Para ( c ) temos: 2inf 12;
4. Calcular o valor da varivel:
2cal

( n 1)S2
20

onde: S2 = varincia amostral


02 = valor da hiptese nula
5. Concluso para a situao (a)
- Se 2inf cal 2sup , no se pode rejeitar Ho.
- Se 2cal 2inf ou 2cal 2sup , rejeita-se Ho.
Ex.: Para testar a hiptese de que a varincia de uma populao
25, tirou-se uma amostra de 25 elementos obtendo-se S 2 =
18,3. Admitindo-se = 5%, efetuar o teste de significncia
unicaudal a esquerda. (R = aceita-se Ho)
10.2.4 Teste de significncia para igualdade de duas
mdias
1o caso) Se as varincias populacionais 2 forem conhecidas e
supostamente iguais, independentes e normais, a
varivel teste ser "Z" (n1 + n 2 > 30) ;
1. Enunciar as hipteses:
106

Ho : 1 = 2 ou 1 - 2 = d

1 2
1 2 d

H 1:

onde d a diferena admitida entre as duas mdias.


2. Fixar . Escolhendo a varivel normal padro "Z";
3. Com o auxlio da tabela "Z" determinar as regies RA e RR;
4. Calcular o valor da varivel:

Zcal

X2 d

12 22

n1 n 2

5. Concluso:
Optar pela aceitao ou rejeio de Ho.
Ex.: Um fabricante de pneus faz dois tipos. Para o tipo A, =
2500 Km, e para o tipo B, = 3000 Km. Um taxi testou 50
pneus do tipo A e 40 pneus do tipo B, obtendo 24000 Km e
26000 Km de durao mdia dos respectivos tipos. Adotando
um risco de 4% e que existe uma diferena admitida de 200
Km entre as marcas, testar a hiptese de que a vida mdia
dos dois tipos a mesma.
(R = rejeita-se Ho)
2o caso) Se as varincias populacionais 2 forem desconhecidas,
independentes e normais, a varivel teste ser "t"
(n1 + n 2 30) com = n1 + n2 -2;
a) As estimativas diferentes
1. Enunciar as hipteses:
Ho : 1 = 2 ou 1 - 2 = d

1 2
1 2 d

H 1:

onde d a diferena admitida entre as duas mdias.

107

2. Fixar . Escolhendo a varivel "t" de Student;


3. Com o auxlio da tabela "t" determinar as regies RA e RR;
4. Calcular o valor da varivel:

t cal

X2 d
S12 S22

n1 n 2

5. Concluses:
Optar pela aceitao ou rejeio de Ho.
Ex.: Dois tipos de pneus foram testados sob as mesmas
condies meteorolgicas. O tipo A fabricado pela fabrica A,
registrou uma mdia de 80.000 km rodados com desvio
padro de 5.000 km. em 6 carros amostradas. O tipo B
fabricado pela fbrica B, registrou uma mdia de 88.000 km
com desvio padro de 6.500 km em 12 carros amostradas.
Adotando = 5% testar a hiptese da igualdade das mdias.
b) As estimativas iguais
1. Enunciar as hipteses:
Ho : 1 = 2 ou 1 - 2 = d

1 2
1 2 d

H 1:

onde d a diferena admitida entre as duas mdias.


2. Fixar . Escolhendo a varivel "t" de Student;
3. Com o auxlio da tabela "t" determinar as regies RA e RR;
4. Calcular o valor da varivel:
t cal

Sc .

X2 d
1
1

n1 n 2

onde SC

5. Concluses:

108

n1 1 S12 n 2 1 S22
n1 n 2 2

Optar pela aceitao ou rejeio de Ho.


Ex.: Dois tipos de tintas foram testados sob as mesmas condies
meteorolgicas. O tipo A registrou uma mdia de 80 min para
secagem com desvio padro de 5 min. em cinco partes
amostradas. O tipo B, uma mdia de 83 min com desvio
padro de 4 min. em 6 partes amostradas. Adotando = 5%
testar a hiptese da igualdade das mdias. (R = aceita-se Ho)
10.2.5 Teste de significncia para igualdade de duas
propores
1. Enunciar as hipteses:
H o : 1 = 2

H 1: 1 2

2. Fixar . Escolhendo a varivel normal padro "Z";


3. Com o auxlio da tabela "Z" determinar as regies RA e RR;
4. Calcular o valor da varivel:
Zcal

p 1 p 2
p 12 . q 12
n

onde p 1

X1
X
X X2
, p 2 2 , p 1 2 1
n1
n2
n1 n 2

5. Concluses:
Optar pela aceitao ou rejeio de Ho.
Ex.: Deseja-se testar se so iguais as propores de homens e
mulheres que lem revista e se lembram do determinado
anncio. So os seguintes os resultados da amostra aleatria
independente de homens e mulheres: Admita = 10%.
Homens
X1 = 70
n1 = 200

Mulheres
X2 = 50
n2 = 200

10.2.6 Teste de significncia para igualdade de duas


varincias
1. Enunciar as hipteses:

109

H 0 : 12 22

H1: 12 22

2. Fixar . Escolhendo a varivel "F" com 1 = n1 - 1 graus de


liberdade no numerador, e 2 = n2 - 1 graus de liberdade no
denominador.
3. Com o auxlio da tabela "F" determinar as regies RA e RR;
\EMBED PBrush \s \*
formatomesclar\EMBED
PBrush \s \* formatomesclar

Fsup

F / 2 1 , 2

Fi nf F1 / 2 1 , 2

1
F / 2 2 , 1

4. Calcular o valor da varivel:


Fcal

S12
S22

5. Concluses:
Optar pela aceitao ou rejeio de Ho.
Ex.: Dois programas de treinamento de funcionrios foram
efetuados. Os 21 funcionrios treinados no programa antigo
apresentaram uma varincia de 146 pontos em sua taxa de
erro. No novo programa, 11 funcionrios apresentaram uma
varincia de 200. Sendo = 10%, pode-se concluir que a
varincia diferente para os dois programas?
10.3 Exerccios
1) O crescimento da indstria da lagosta na Flrida nos ltimos
20 anos tornou esse estado americano o 2 o mais lucrativo
centro industrial de pesca. Espera-se que uma recente medida
tomada pelo governo das Bahamas, que proibiu os pescadores
norte americanos de jogarem suas redes na plataforma
continental desse pas. Produza uma reduo na quantidade
de Kg de lagosta que chega aos Estados Unidos. De acordo
com ndices passados, cada rede traz em mdia 14 Kg de
110

lagosta. Uma amostra de 20 barcos pesqueiros, recolhida aps


a vigncia da nova lei, indicou os seguintes resultados, em Kg
(Use = 5%)
7.89 13.29 17.96 15.6 8.89
15.28 16.87 19.68 18.91 12.47
10.93 9.57 5.53 11.57 10.02
8.57 17.96 10.79 19.59 11.06
Estes dados mostram evidncias suficientes de estar
ocorrendo um decrscimo na quantidade mdia de lagostas
pescadas por barco, que chega aos Estados Unidos, depois do
decreto do governo das Bahamas? Teste considerando = 5%.
(bilateral)
2) Os resduos industriais jogados nos rios, muitas vezes,
absorvem oxignio, reduzindo assim o contedo do oxignio
necessrio respirao dos peixes e outras formas de vida
aqutica. Uma lei estadual exige um mnimo de 5 p.p.m.
(Partes por milho) de oxignio dissolvido, a fim de que o
contedo de oxignio seja suficiente para manter a vida
aqutica. Seis amostras de gua retiradas de um rio, durante a
mar baixa, revelaram os ndices (em partes por milho) de
oxignio dissolvido:
4.9

5.1

4.9

5.5

5.0

4.7

Estes dados so evidncia para afirmar que o contedo de


oxignio menor que 5 partes por milho? Teste considerando
= 5% e = 1%.
3) A Debug Company vende um repelente de insetos que alega
ser eficiente pelo prazo de 400 horas no mnimo. Uma anlise
de 90 itens aleatoriamente inspecionados acusou uma mdia
de eficincia de 380 horas.
a) Teste a afirmativa da companhia, contra a alternativa que a
durao inferior a 400 horas, ao nvel de 1%, seu desvio
padro de 60 horas.
b) Repita o teste, considerando um desvio padro populacional
de 90 horas.
4) Ao final de 90 dias de um dieta alimentar envolvendo 32
pessoas, constatou-se o seguinte ganhos mdio de peso 40 g, e
desvio padro de 1,378g.
111

a) Supondo que o ganho de peso mdio dessas pessoas de 45 g,


teste a hiptese para = 5%, se esse valor o mesmo
(bilateral)
b) Supondo que a varincia dessas pessoas de 1.8 g2, teste a
hiptese para = 5%, se esse valor o mesmo (bilateral).
5) Uma pesquisa feita alega que 15% dos pessoas de uma
determinada regio sofrem de cegueira aos 70 anos. Numa
amostra aleatria de 60 pessoas acima de 70 anos constatouse que 12 pessoas eram cegas. Teste a alegao para = 5%
contra p > 15%.
6) A tabela abaixo mostra a quantidade de pessoas que
obtiveram o melhor efeito perante a aplicao de duas drogas:
Droga A

Droga B

Sexo

muscular

intravenos
a

muscular

Total

Masculino
Feminino
Total

21
20
41

10
12
22

22
25
47

53
57
110

a) Testar a hiptese de que a proporo de homens submetidos a


droga A de 35%, sendo = 3%.
b) Testar a hiptese de que a proporo dos adultos que tiveram
melhor resultado nas aplicaes musculares de 85%, usando
= 2%.
c) Testar a hiptese de que a proporo de mulheres de 50%,
usando = 5%.
d) Testar a hiptese de que a proporo de pessoas submetidos a
droga A de 65%, usando = 4%.
7) Um processo de fabricao de arame de ao d um produto
com resistncia mdia de 200 psi. O desvio padro de 20 psi.
O engenheiro de controle de qualidade deseja elaborar um
teste que indique se houve ou no variao na mdia do
processo, usando uma amostra de 25 arames obteve-se uma
mdia de 285 psi. Use um nvel de significncia de 5%.
Suponha normal a populao das resistncias.
8) A DeBug Company vende um repelente para insetos que alega
ser eficiente pelo prazo de 400 horas no mnimo. Uma anlise
de 9 itens escolhidos aleatoriamente acusou uma mdia de
eficincia de 380 horas. a) Teste a alegao da companhia,
112

contra a alternativa que a durao inferior a 400 horas no


mnimo ao nvel de 1%, e o desvio padro amostral de 60
horas. b) Repitas o item (a) sabendo que o desvio padro
populacional de 90 horas.
9) Um laboratrio de Anlises Clnicas realizou um teste de
impurezas em 9 pores de um determinado composto. Os
valores obtidos foram: 10,32; 10,44; 10;56; 10,.60; 10,63;
10,67; 10,7; 10.73; 10,75 mg. a) estimar a mdia e a varincia
de impurezas entre as pores. b) Testar a hiptese de que a
mdia de impureza de 10.4, usando = 5%. c) Testar a
hiptese de que a varincia um usando = 5%.
10) Uma experincia tem mostrado que 40% dos estudantes de
uma Universidade reprovam em pelo menos 5 disciplinas
cursada na faculdade. Se 40 de 90 estudantes fossem
reprovados em mais de 5 disciplinas, poderamos concluir
quanto a proporo populacional, usando = 1%.
11) Para verificar a eficcia de uma nova droga foram injetados
doses em 72 ratos, obtendo-se a seguinte tabela:
Sexo
Machos
Fmeas

Tamanho da Amostra
41
31

Varincia
43.2
29.5

Testar a igualdade das duas varincias usando = 10%.


12) Sendo
Amostra 1

n1 = 60

Amostra 2

n2 = 35

X 1 = 5.71
X 2 = 4.12

12 = 43
22 = 28

a) Testar a igualdade das duas mdias usando = 4%.


b) Testar a igualdade das duas varincias usando = 5%

113

13) Na tabela abaixo esto registrados os ndices de vendas em 6


supermercados para os produtos concorrentes da marca A e
marca B. Testar a hiptese de que a diferena das mdias no
ndice de vendas entre as marcas zero, usando = 5%.
Supermercad
o
1
2
3
4
5
6

Marca A

Marca B

14
20
2
11
5
12

4
16
28
9
31
10

14) Da populao feminina extraiu-se uma amostra resultando:


Renda (em
$1000)

10 |--- 25

25 |--- 40

40 |--- 55

55 |--- 70

70 |---85

No de
mulheres

12

10

da populao masculina retirou-se uma amostra resultando:


Renda (em
$1000)
No de homens

10 |--- 25

25 |--40

40 |--55

55 |--70

70 |---85

15

12

a) Testar ao nvel de 10% a hiptese de que a diferena entre a


renda mdia dos homens e das mulheres valha $ 5000.
b) Testar ao nvel de 5% a hiptese de que a diferena entre as
varincias valha 0.
15)

Uma empresa de pesquisa de opinio seleciona,


aleatoriamente, 300 eleitores de So Paulo e 400 do Rio de
Janeiro, e pergunta a cada um se votar ou no num
determinado candidato nas prximas eleies. 75 eleitores de
SP e 120 do RJ responderam afirmativo. H diferena entre
as propores de eleitores favorveis ao candidato naqueles
dois estados? use = 5%.

16) Esto em teste dois processos para fechar latas de


comestveis. Numa seqncia de 1000 latas, o processo 1
gera 50 rejeies, enquanto o processo 2 acusa 200
rejeies. Pode ao nvel de 5%, concluir que os dois processos
sejam diferentes?
114

115

10 REGRESSO E CORRELAO
10.1 Introduo
Muitas vezes de interesse estudar-se um elemento em relao
a dois ou mais atributos ou variveis simultaneamente.
Nesses casos presume-se que pelo menos duas observaes so
feitas sobre cada elemento da amostra. A amostra consistir, ento, de
pares de valores, um valor para cada uma das variveis, designadas, X
e Y. Um indivduo i qualquer apresenta o par de valores (Xi ; Yi).
Objetivo visado quando se registra pares de valores (observaes)
em uma amostra, o estudo das relaes entre as variveis X e Y.
Para a anlise de regresso interessam principalmente os casos
em que a variao de um atributo sensivelmente dependente do outro
atributo.
O problema consiste em estabelecer a funo matemtica que
melhor exprime a relao existente entre as duas variveis.
Simbolicamente a relao expressa por uma equao de regresso e
graficamente por uma curva de regresso.
10.2 Definio
Constitui uma tentativa de estabelecer uma equao matemtica
linear que descreva o relacionamento entre duas variveis (uma
dependente e outra independente).
A equao de regresso tem por finalidade ESTIMAR valores de
uma varivel, com base em valores conhecidos da outra.
Ex.: Peso x Idade; Vendas x Lucro; Nota x Horas de Estudo
10.3 Modelo de Regresso
yi x i + i
i valor estimado (varivel dependente);
y
x i varivel independente;

coeficiente de regresso (coeficiente angular);


coeficiente linear;

116

i resduo.

117

10.3.1 Pressuposies
Na regresso, os valores de "y" so estimados com base em
valores dados ou conhecidos de "x", logo a varivel "y" chamada
varivel dependente, e "x" varivel independente.
a) A relao entre X e Y linear (os acrscimos em X produzem
acrscimos proporcionais em Y e a razo de crescimento
constante).
b) Os valores de X so fixados arbitrariamente (X no uma varivel
aleatria).
c) Y uma varivel aleatria que depende entre outras coisas dos
valores de X.
d) i o erro aleatrio, portanto uma varivel aleatria com distribuio
normal, com mdia zero e varincia 2. [ i ~ N (0, 2)]. i representa a
variao de Y que no explicada pela varivel independente X.
e) Os erros so considerados independentes.
Ex.: Vendas (x 1000) X Lucro (x100)
Obs.
Vendas
Lucro

1
201
17

2
225
20

3
305
21

4
380
23

5
560
25

6
600
24

7
685
27

8
735
27

10.3.1 Grfico (Diagrama de Disperso)


Tem como finalidade ajudar na deciso se uma reta descreve
adequadamente ou no o conjunto de dados.
28

26

Lucro

24

22

20

18

16

150

250

350

450

550

650

750

850

Vendas

Pelo grfico podemos observar que a possvel reta de regresso


ter um coeficiente de regresso (coeficiente linear) positivo.
118

10.4 Mtodo para estimao dos parmetros e


As estimativas dos parmetros e dadas por a e b, sero
obtidas a partir de uma amostra de n pares de valores (x i, yi) que
correspondem a n pontos no diagrama de disperso. Exemplo:
O mtodo mais usado para ajustar uma linha reta para um
conjunto de pontos (x1 , y1 ), ..., (x n , y n ) o Mtodo de Mnimos
Quadrados:
O mtodo dos mnimos quadrados consiste em adotar como
estimativa dos parmetros os valores que minimizem a soma dos
quadrados dos desvios.
10.4.1 Caractersticas
1a) A soma dos desvios verticais dos pontos em relao a reta
zero;
2a) A soma dos quadrados desses desvios mnima.
Os valores de "a" e "b" da reta de regresso y a x + b sero:

i=1

i 1

i 1

n xy x y

n x x
i 1
i=1
n

S xy

b ya x

S xx

Para cada par de valores (xi , yi) podemos estabelecer o desvio:


e i y i y i y i (a bx i )

Para facilitar os clculos da reta de regresso, acrescentamos trs


novas colunas na tabela dada.
Obs.
1
2
3
4
5
6
7

Vendas
Xi
201
225
305
380
560
600
685

Lucro
Yi
17
20
21
23
25
24
27

X i2

Yi2

X i .Yi

40401
50625
93025
144400
313600
360000
469225

289
400
441
529
625
576
729

3417
4500
6405
8740
14000
14400
18495

119

735
3691

27
184

i =1

i 1

i 1

n x i yi x i yi

i =1

n x i2

x
i 1

540225
2011501

729
4318

19845
89802

8 89802 3691184
0,0159
2
8 2011501 3691

b y a x = 23 - (0,159)(461,38) = 15,66
0,0159 x + 15,66
y

Sada do Statistica
28

26

24

Lucro

y = 15,66 + 0,0159 x
22

20

18

16

150

250

350

450

550

650

750

850

Vendas

Partindo da reta de regresso podemos afirmar que para uma


venda
de
400
mil
podemos
obter
um
lucro
de
y ( 0. 0159 ) (400.000) + 15.66 = 22 mil .
Sadas do Statistica

Obs.: Para qualquer tipo de equao de regresso devemos ter


muito cuidado para no extrapolar valores para fora do mbito dos
120

dados. O perigo da extrapolao para fora dos dados amostrais, que a


mesma relao possa no mais ser verificada.

121

10.5 Decomposio da varincia Total


A disperso da variao aleatria y pode ser medida atravs da
soma dos quadrados dos desvios em relao a sua mdia y . Essa soma
de quadrados ser denominada Soma de Quadrados Total (SQTotal).
n

SQTotal y i y

i 1

A SQTotal pode ser decomposta da seguinte forma:


n

i 1

i 1

i 1

y i y 2 y i y 2 y i y i 2
Essa relao mostra que a variao dos valores de Y em torno de
n

sua mdia pode ser dividida em duas partes: uma

y
i 1

explicada pela regresso e outra

i 1

y que
2

y i , devido ao fato de que nem


2

todos os pontos esto sobre a reta de regresso, que a parte no


explicada pela regresso ou variao residual.
Assim:
SQ. Total = SQRegresso + SQResduo
2
A estatstica definida por r

SQRegress~
ao
SQTotal

, e denominada

coeficiente de determinao, indica a proporo ou percentagem da


variao de Y que explicada pela regresso.
Note que 0 r2 1.
Frmulas para clculo:
SQTotal =

y
i 1

i =1

2
i

y n y
2

y
i 1

com (n - 1) graus de liberdade.


n
n
n

SQ Regresso = y i y a n x i y i xi yi ,
i 1
i 1
i 1
i =1

122

com 1 grau de liberdade.

123

10.6 Anlise de Varincia da Regresso


A Soma de Quadrados da Regresso (SQRegresso), segue uma
distribuio de 2 (qui-quadrado) com (1) grau de liberdade, enquanto
que a Soma de Quadrados do Resduo (SQResduos) segue a mesma
distribuio, porm com (n - 2) graus de liberdade. Portanto, o
quociente
SQRegress~
a o/1
QMRegress~
ao

,
SQResiduo/n - 2
QMResiduo

segue uma distribuio F de Snedecor com 1 e (n - 2) graus de


liberdade.
Esse fato nos permite empregar a distribuio F de Snedecor
para testar a significncia da regresso, atravs da chamada Anlise de
Varincia, sintetizada no quadro abaixo:
Anlise de Varincia
Causas de
Variao

Regresso
Resduo
Total

G.L
.
1
n2
n1

SQ

QM

SQRegress
o
SQResduo

SQRegress~
ao
1
SQResduo
n-2

SQTotal

---

F
QMRegress~
ao
QMResiduo

-----

onde QM representa Quadrado Mdio e obtido pela diviso da Soma


de Quadrados pelos respectivos graus de liberdade.
Para testar a significncia da regresso, formula-se as seguintes
hipteses:
H0: =0 contra H1: 0, onde representa o coeficiente de
regresso paramtrico.
Se o valor de F, calculado a partir do quadro anterior, superar o
valor terico de F com 1 e (n - 2) graus de liberdade, para o nvel de
significncia , rejeita-se H0 e conclui-se que a regresso significativa.
Se Fcalc. > F [1,(n-2)], rejeita-se H0.

124

Para o exemplo anterior:


Obs.

Vendas
Xi

Lucro
Yi

X i2

Yi2

X i .Yi

1
2
3
4
5
6
7
8

201
225
305
380
560
600
685
735
3691

17
20
21
23
25
24
27
27
184

40401
50625
93025
144400
313600
360000
469225
540225
2011501

289
400
441
529
625
576
729
729
4318

3417
4500
6405
8740
14000
14400
18495
19845
89802

y i 0,0159 x i 15,66

SQRegress~
ao = a n x i yi x i yi
i 1
i 1
i=1

SQRegress~
a o = 0,0159 8 89802 (3691)(184) = 624,42
n

i =1

SQTotal n y
2
i

y
i 1

SQTotal 8(4318) - (184) 2 = 688,00

Causas de
Variao

Regresso
Resduo
Total

G.L
.
1
6
7

SQ

QM

624,42
63,58
688,00

624,42000
10,59587
---

58,93
-----

H0: = 0 e H1: 0
Comparando o Fcalc. = 58,93 com o Ftab. = F0,05 (1,6) = 5,99
Conclui-se que a regresso de y sobre x segundo o modelo
y i 0,0159 x i 15,66 significativa ao nvel de significncia de 5%. Uma
vez estabelecida e testada a equao de regresso, a mesma pode ser
usada para explicar o relacionamento entre as variveis e tambm para
fazer previses dos valores de Y para valores fixados de X.

125

Sadas do Statistica

10.7 Coeficiente de Determinao (r)


o grau em que as predies baseadas na equao de regresso
superam as predies baseadas em y , ou ainda a proporo entre a
varincia explicada pela varincia total.
Varincia Total = soma dos desvios ao quadrado
VT = SQTotal =

y
i 1

2
i

i =1

y n y
2

i 1

Varincia No-explicada = soma de quadrados dos desvios em


relao a reta y
n

VE =

y
i 1

y i

Para facilitar os clculos usaremos:

i =1

i 1

i 1

n xy x y

r2

2
n 2
n x x n y
i 1 i =1

i =1
n

8(89802) - (3691)(184) 2

8(2011501) - (3691) 8(4318) - (184)


2

i 1

COVxy2
S xx .S yy

0.908

O valor de r varia de 0 a 1, logo o fato de r = 0.908 (no


exemplo), indica que aproximadamente 91% da variao do lucro esto
relacionados com a variao das vendas, em outras palavras 9% da
variao dos lucros no so explicados pelas vendas.

126

Sadas do Statistica

10.8 Coeficiente de Correlao (r)


Tem como objetivo encontrar o grau de relao entre duas
variveis, ou seja, um coeficiente de correlao.
Esta a forma mais comum de anlise, envolvendo dados
contnuos, conhecido como "r de Pearson".
10.8.1 Caractersticas do r
- Pode assumir valores positivos (+) como negativos (-),
semelhante ao coeficiente de regresso de uma reta ajustada num
diagrama de disperso;
- A magnitude de r indica quo prximos da "reta" esto os
pontos individuais;
- quando o r se aproxima de +1 indica pouca disperso, e uma
correlao muito forte e positiva;
- quando o r se aproxima de "zero" indica muita disperso, e uma
ausncia de relacionamento;
- quando o r se aproxima de -1 indica pouca disperso, e uma
correlao muito forte e negativa.

v a lo r d e r
-0 ,5

-1

N e g a tiv a N e g a tiv a N e g a tiv a


m o d e ra d a
fra c a
fo rte

+ 0 ,5

+1
P o s it iv a
fra c a

127

P o s it iv a
m o d e rad a

P o s it iv a
fo rte

10.8.2 Medidas de Correlao


10.8.2.1 Tratamento Qualitativo (correlao momento produto)
Relao entre as variveis, mediante a observao do diagrama
de disperso.
10.8.2.2 Tratamento Quantitativo
o estabelecimento das medidas de correlao.
O valor de "r" pode ser enganoso, na realidade, uma estatstica
mais significante o r (coeficiente de determinao), que d o valor
percentual da variao de uma varivel explicativa em relao a outra
varivel.
EMBED Equation

i =1

i 1

i 1

i =1

n xy x y

i =1

i1

2
n x

i1

2
n y

S xy
S xx .S yy

Logo podemos observar que o coeficiente de determinao nos


d uma base intuitiva para a anlise de correlao.
No exemplo temos r = 0.953
Sada do Statistica

128

LUCRO = 15,660 + ,01591 * VENDAS


Correlao: r = ,95295
28

26

Lucro

24

22

20

18

16

150

250

350

450

550
Vendas

129

650

750

850

Regression
95% confid.

10.9 Exerccios
Para os dados abaixo:
a) Construa um diagrama de disperso;
b) Determine a reta de regresso;
c) Faa uma anlise de varincia do modelo;
d) Calcule o Coeficiente de Explicao;
e) Calcule o Coeficiente de Correlao de Pearson;
f) Interprete os resultados obtidos.
X = 1o Exame e Y = 2o Exame
Aluno
Exame 1
Exame 2

1
2
3
4
5
6
7
8
82
84
86
83
88
87
85
83
92
91
90
92
87
86
89
90
R = y 0. 79 x +157.25 ; r = 53.29%; r = -0.73

9
86
92

10
85
90

X = horas de estudo e Y = Nota da Prova


Aluno
Horas
Nota

1
2
2
4
1
3
R = y 0. 98 x + 0.12 ;

3
5
6

4
5
6

5
6
8

6
8
7

7
9
8

8
10
10

r = 82.99%; r = +0.911

X = Seguro (x 1000 ) e Y = Renda (x100)


Indivduo
1
2
Seguro
20
16
Renda
64
61
R = y 1. 50 x + 40.08 ;

3
34
84

4
23
70

5
27
88

6
32
92

7
18
72

8
22
77

r = 74.3%; r = +0.86

X = Peso do Pai (kg) e Y = Peso do Filho (kg)


Indivduo 1
Peso Pai 65
Peso
68
Filho
R = y 0. 48 x

2
63
66

3
67
68

4
64
65

5
68
69

6
62
66

7
70
68

+ 35.48 ; r = 40.58%; r = +0.637

130

8
66
65

9
68
71

10
67
67

131

11 Referncias Bibliogrficas
COSTA NETO, P.L.O.; CYMBALISTA, M. (1994). Probabilidades. So
Paulo: Edgard Blucher.
FONSECA, J.S.; MARTINS, G.A. (1993). Curso de estatstica. 4a ed.
So Paulo: Atlas.
LAPONNI, Juan Carlos (1997). Estatstica usando o Excel. So Paulo:
Lapponi Treinamento e Editora.
MILONE, G.; ANGELINI, F. (1995). Estatstica aplicada. So Paulo:
Atlas.
SNEDECOR, G. W.; COCHRAM, W. G. (1989). Statistical Methods. 8rd
ed. Iowa: Iowa State University Press, 1989.
WONNACOTT, T.H.; WONNACOTT, R.
Statistics. New York. John wiley & Sons;

132

J.

(1990).

Introductory