Ex2. Um condomnio possui 25 apartamentos, sendo que esses apartamentos
possuem reas (m
2
) diferentes. Seguem os valores das reas dos apartamentos: 50,
65, 59, 62, 68, 72, 53, 60, 59, 65, 70, 75, 50, 53, 60, 70, 50, 50, 59, 53, 65, 68, 50, 53,
75. Construa uma tabela de distribuio de freqncias absolutas, acumuladas e
relativas.
x
i
f
i
f
ac
f
r
f
r
% f
r ac
f
r ac
%
50 5 5 0,20 20% 0,20 20%
53 4 9 0,16 16% 0,36 36%
59 3 12 0,12 12% 0,48 48%
60 2 14 0,08 8% 0,56 56%
62 1 15 0,04 4% 0,60 60%
65 3 18 0,12 12% 0,72 72%
68 2 20 0,08 8% 0,80 80%
70 2 22 0,08 8% 0,88 88%
72 1 23 0,04 4% 0,92 92%
75 2 25 0,08 8% 1,00 100%
Total 25
1,00 100%
3.4 Distribuio de freqncia com intervalo de classes
Quando o tamanho da amostra elevado, mais racional efetuar o
agrupamento dos valores em vrios intervalos de classe.
Ex3. O tempo de cura em minutos de um determinado cimento foi de 45, 41, 42,
41, 42 43, 44, 41, 50, 46, 50, 46, 60, 54, 52, 58, 57, 58, 60, 51, construa a tabela de
distribuio de frequncias.
13
Dados
(x
i
)
Frequncia
absoluta
(f
i
)
Freq. absoluta
acumulada
(f
ac
)
Freq. Relativa
(f
r
)%
Freq. Relativa
acumulada
(f
r
)%
41 3 3 15% 15%
42 2 5 10% 25%
43 1 6 5% 30%
44 1 7 5% 35%
45 1 8 5% 40%
46 2 10 10% 50%
50 2 12 10% 60%
51 1 13 5% 65%
52 1 14 5% 70%
54 1 15 5% 75%
57 1 16 5% 80%
58 2 18 10% 90%
60 2 20 10% 100%
Total 20 100%
3.4.1 Elementos de uma distribuio de frequncias com intervalos de classe
Classes Freqncias
41 |------- 45 7
45 |------- 49 3
49 |------- 53 4
53 |------- 57 1
57 |------- 61 5
Total 20
- Classe: so os intervalos de variao da varivel e simbolizada por i e o
nmero total de classes simbolizada por k.
Ex: na tabela anterior k = 5 e 49 |------- 53 so a 3 classe, onde i = 3.
- Limites de classe: so os extremos de cada classe. O menor nmero o limite
inferior de classe (li) e o maior nmero, limite superior de classe ( Li ).
Ex: em 49 |------- 53,... l
3
= 49 e L
3
= 53.
O smbolo |------- representa um intervalo fechado esquerda e aberto direita.
O dado 53 do ROL no pertence classe 3 e sim classe 4 representada por
53 |------- 57.
14
- Amplitude do intervalo de classe: obtida atravs da diferena entre o limite
superior e inferior da classe e simbolizada por hi = Li - li. Ex: na tabela
anterior hi = 53 - 49 = 4. Obs: Na distribuio de freqncias c/ classe o hi
poder ser igual em todas as classes.
- Amplitude total da distribuio: a diferena entre o limite superior da ltima
classe e o limite inferior da primeira classe. AT = L(max) - l(min). Ex: na tabela
anterior AT = 61 - 41= 20.
- Amplitude total da amostra (rol): a diferena entre o valor mximo e o valor
mnimo da amostra (ROL). Onde AA = Xmax - Xmin. Em nosso exemplo AA =
60 - 41 = 19.
Obs: AT sempre ser maior que AA.
- Ponto mdio de classe (
i
): o ponto que divide o intervalo de classe em
duas partes iguais.
Ex: em 49 |------- 53 o ponto mdio x
3
= (53+49)/2 = 51, ou seja x
3
=( l
3
+ L
3
)/2.
3.4.1.1 Etapas: Distribuio de Freqncias c/ classe
1 - Organize os dados brutos em um ROL.
2 - Calcule a amplitude amostral AA No nosso exemplo: AA = 60 - 41 = 19
3 - Calcule o nmero de classes atravs da "Regra de Sturges" K ~ 1 +
3,3*log n. Onde K o nmero de classes e n o nmero total de dados, ou pelo Critrio
da Raiz
Obs: Qualquer regra para determinao do n de classes da tabela no nos
levam a uma deciso final; esta vai depender, na realidade, de um julgamento pessoal,
que deve estar ligado natureza dos dados.
No nosso exemplo: n = 20 dados, ento a regra sugere a adoo de 5 classes.
4 - Decidido o n de classes, calcule ento a amplitude do intervalo de
classe h > AA / k. No nosso exemplo: AA/k = 19/5 = 3,8 . Obs: Como h > AA/k um valor
ligeiramente superior para haver folga na ltima classe. Utilizaremos ento h = 4
15
5 - Temos ento o menor n da amostra, o n de classes e a amplitude do
intervalo. Podemos montar a tabela, com o cuidado para no aparecer classes com
freqncia = 0 (zero).
No nosso exemplo: o menor n da amostra = 41 + h = 45, logo a primeira classe
ser representada por
41 |------- 45. As classes seguintes respeitaro o mesmo procedimento.
A classe seguinte sempre ter como primeiro elemento o limite superior da
classe anterior.
Ex4. Utilizando os dados do exerccio 3 (45, 41, 42, 41, 42 43, 44, 41, 50, 46, 50,
46, 60, 54, 52, 58, 57, 58, 60, 51) Construa a tabela de distribuio de frequncias com
intervalo de classes.
Tempo de cura do cimento X
Classes xi fi fac fr fr% frac frac%
41---45 43 7 7 0,35 35 0,35 35
45---49 47 3 10 0,15 15 0,5 50
49---53 51 4 14 0,2 20 0,7 70
53---57 55 1 15 0,05 5 0,75 75
57---61 59 5 20 0,25 25 1 100
3.5 Grficos
Os principais grficos utilizados na representao de distribuio de freqncias
so:
histograma e polgono de freqncia;
ogiva ou polgono de freqncia acumulada.
3.5.1 Histogramas
um conjunto de retngulos com bases sobre um eixo dividido de acordo com
os tamanhos de classe, centro nos pontos mdio das classes e reas proporcionais s
freqncias.
Utilizando os dados do obtidos no EX4 montamos o histograma abaixo.
16
3.5.2 Polgonos de freqncias
um grfico que se obtm unindo por uma poligonal os pontos correspondentes
s freqncias das diversas classes, centradas nos respectivos pontos mdios (x
i
).
Para obter as intersees do polgono com o eixo, cria-se em cada extremo do
histograma uma classe com freqncia nula.
Utilizando os dados do obtidos no EX4 montamos o polgono de freqncia.
0
1
2
3
4
5
6
7
8
Tempo de cura do cimento X
41 45 49 53 57 61
0
1
2
3
4
5
6
7
8
39 41 43 45 47 49 51 53 55 57 59 61 63
F
r
e
q
u
n
c
i
a
Tempo de cura (min)
F
r
e
q
u
n
c
i
a
Tempo de cura (min)
Tempo de cura do cimento X
17
3.5.3 Polgonos de freqncia acumulada ou ogivas
o grfico representativo de uma distribuio acumulada de freqncias. uma
poligonal ascendente. No eixo horizontal colocam-se as extremidades de classe e no
eixo vertical as freqncias acumuladas.
Note que a freqncia acumulada relacionada com o limite inferior da primeira
classe sempre zero.
Ao contrrio do polgono de freqncia, a ogiva de freqncias acumuladas
utiliza os pontos extremos
Utilizando os dados do obtidos no EX4 montamos o polgono de freqncia
acumulada.
0
5
10
15
20
25
39 41 43 45 47 49 51 53 55 57 59 61 63
F
r
e
q
u
n
c
i
a
Tempo de cura (min)
Tempo de cura do cimento X
18
4 Medidas posio
So as estatsticas que representam uma srie de dados orientando-nos quanto
posio da distribuio em relao ao eixo horizontal do grfico da curva de
freqncia. As medidas de posio mais importantes so:
Medidas de tendncia central
Verifica-se uma tendncia dos dados observados a se agruparem em torno dos
valores centrais.
As medidas de tendncia central mais utilizadas so: mdia aritmtica, moda e
mediana. Outros menos usados so as mdias: geomtrica, harmnica, quadrtica,
cbica e biquadrtica.
Separatrizes
Que englobam: a prpria mediana, os decis, os quartis e os percentis.
4.1 Medidas de tendncia central para dados no agrupados
4.1.1 Mdia Aritmtica Simples
A mdia aritmtica simples ( x ) dos valores x
1
, x
2
, x
3,....
x
n
o quociente entre a
soma desses valores e o seu nmero total (N):
x =
N
x
n
i
i
=1
ou seja: x =
N
x x x
n
...
2 1
+ +
Ex5: Uma loja de materiais de construo vendeu as seguintes quantidades de
caixas de pisos durante certa semana. Calcule a mdia dessas vendas
2. feira 3. feira 4. feira 5. feira 6. feira sbado
22 23 22 27 25 13
x =
6
13 25 27 22 23 22 + + + + +
x =
6
132
x = 22
19
4.1.2 Moda
Moda de um conjunto de valores o valor que aparece o maior nmero de
vezes, ou seja a caracterstica com maior freqncia absoluta.
Na seqncia anterior 28, 37, 37, 37, 40,41, 41,43, 44, 45 a moda ser o nmero
37.
4.1.3 Mediana
o valor que ocupa a posio central de um conjunto de valores, colocados em
ordem crescente ou decrescente de grandeza. Devemos, portanto, considerar duas
situaes: o nmero de valores par ou, o nmero de valores impar.
O nmero de dados impar
M
d
= x
p
onde p
n
=
+1
2
(p = posio) ou
EX7. As nove classes de 1 Ano de engenharia tm respectivamente: 37, 28,
40,41,45,37,37, 41 e 44 alunos. Calcule a mediana.
p
n
=
+1
2
p
2
1 9 +
= = 5
Portanto a mediana ocupar a 5 posio = 40.
28, 37, 37, 37, 40, 41, 41, 44, 45
O nmero de dados par
M
x x
d
p p
=
+
+1
2
onde p
n
=
2
.
Neste caso a mediana a Mdia Aritmtica dos dois termos centrais.
20
Ex8. As dez classes de 1. Ano de engenharia tm respectivamente: 37, 28,
40,41,45,37,37, 41, 43 e 44 alunos. Calcule a mediana.
Ordenando aos dados temos: 28, 37, 37, 37, 40, 41, 41,43, 44, 45
p
n
=
2
= 10/2 = 5
M
d
=
2
) (
1 5 5 +
+ x x
2
41 40
M
d
+
= M
d
= 40,5
4.2 Medidas de tendncia central para dados agrupados
4.2.1 Mdia Aritmtica Ponderada
4.2.1.1 Sem intervalo de classes
A mdia aritmtica Ponderada difere da Mdia Aritmtica Simples, pois alguns
dos valores x
1
, x
2
, x
3,...
, x
n
se repetem como podemos ver no exemplo abaixo.
EX6. A Tabela abaixo representa o nmero de falhas em um determinado
processo em uma indstria qumica.
x
i
f
i
0 2
1 6
2 10
3 12
4 4
34
3 , 2
34
78
.
= = =
i
i i
f
f x
x
4.2.1.2 Com intervalo de classes
Neste caso, convencionamos que todos os valores includos em um determinado
intervalo de classe coincidem com o seu ponto mdio ( i x ), e determinamos a mdia
aritmtica ponderada por meio da frmula:
21
i
i i
f
f x .
ou seja
n
n n
f f f
f x f x f x
x
...
... .
2 1
2 2 1 . 1
+ +
+ +
=
Ex7. O quadro de distribuio de freqncias representa os salrios mensais de
40 empregados de uma firma. Calcule o salrio mdio mensal desses empregados.
Classe em Reais
X10
Ponto Mdio da classe
(
i
x )
Freq.
(f
i
)
[180,200[ 190 4
[200,220[ 210 18
[220,240[ 230 10
[240,260[ 250 5
[260,280[ 270 3
40
810 1750 2300 3780 760 + + + +
= x
40
8900
= x x = 222,50 x = 222,50 x 10 = R$2.225,00
Ex8. Calcular a altura mdia de uma srie de pilares de uma obra, conforme a
tabela abaixo.
Altura (cm) - x
i
Freqncia - f
i
Ponto mdio
i
x
i
. f
i
50 |------------ 54 4 52 208
54 |------------ 58 9 56 504
58 |------------ 62 11 60 660
62 |------------ 66 8 64 512
66 |------------ 70 5 68 340
70 |------------ 74 3 72 216
Total 40 2.440
Aplicando a frmula acima temos: 2.440 / 40.= 61, logo... = 61 cm
3 5 10 18 4
270 . 3 250 . 5 230 . 10 210 . 18 190 . 4
+ + + +
+ + + +
= x
22
4.2.2 Moda
4.2.2.1 Sem intervalo de classes
Neste caso basto fixar o valor da varivel de maior frequncia
Temperaturas C x
i
f
i
0 3
1 9
2 12
3 6
4 5
34
2 C temperatura modal, pois a de maior frequncia.
4.2.2.2 Com intervalo de classes
Neste caso o modo mais simples achar a classe modal e calcular o ponto
mdio dessa classe.
Classe f
i
54 |------------ 58 9
58 |------------ 62 11
62 |------------ 66 8
66 |------------ 70 5
Total 33
A classe Modal 58 |------------ 62, pois a classe de maior frequncia, e o ponto
mdio dessa classe (58+62)/2 60
H tambm um mtodo mais elaborado no qual utiliza a seguinte formula:
23
4.2.3 Mediana
4.2.3.1 Sem intervalo de classes
Impar
Temperaturas C x
i
f
i
f
ac
0 2 2
1 6 8
2 9 17
3 13 30
4 5 35
35
2
1 +
=
n
p impar n
=(35+1)/2 18 termo equivale a 3
Par
Temperaturas C x
i
f
i
f
ac
0 2 2
1 6 8
2 9 17
3 13 30
4 4 34
34
+
=
+
2
1 p p
d
x x
M
p
n
=
2
M
d
=
2
) (
1 17 17 +
+ x x
Nesse caso ento sero a mdia entre os valores da posio 17 e 18, 2 e 3
respectivamente
5 , 2
2
3 2
=
+
4.2.3.2 Com intervalo de classes
Nesse caso devemos seguir os seguintes passos:
1) Determinamos as freqncias acumuladas;
2) Calculamos f
i
/2 ;
3) Marcamos a classe correspondente freqncia acumulada imediatamente
superior f
i
/2 . Tal classe ser a classe mediana;
24
4) Calculamos a Mediana pela seguinte frmula:
onde: l
i
o limite inferior da classe mediana.
F(ant) a freqncia acumulada da classe anterior a classe mediana
h a amplitude do intervalo da classe mediana
f
i
a freqncia do intervalo da classe mediana
classes freqncia = fi Freqncia acumulada
50 |------------ 54 4 4
54 |------------ 58 9 13
58 |------------ 62 11 24
62 |------------ 66 8 32
66 |------------ 70 5 37
70 |------------ 74 3 40
total 40
No caso de
No caso de
Sendo k o nmero de ordem do quartil, do decil ou do percentil
EX12. Calcular os quartis na seguinte srie estatstica
31
EX13. Calcular os quartis na seguinte srie estatstica
EX13. Calcular o oitavo percentil na seguinte srie estatstica abaixo.
K=8
a
=70
e
b
=70
Baseado nestes resultados, diramos que ambos os grupos apresentam a mesma
performance. Mas, observando mais detalhadamente os dados, notamos que as notas
do grupo A variam apenas de 69 a 71, ao passo que as de B variam de 55 a 83, o que
revela que o desempenho de A bem mais uniforme que o de B.
Para avalia quantitativamente o grau de variabilidade ou disperso de um grupo de
valores utilizamos ento as medidas de disperso, onde as principais medidas so: a
amplitude total, a varincia, o desvio padro e o coeficiente de variao de Pearson.
5.1 Amplitude Total
a diferena entre o maior e o menor valor observado
Sem Intervalo Com intervalo de classes
AT = X
max
X
min
AT = L
(Mx)
l
(Mn)
Quanto maior for amplitude, maior ser disperso ou variabilidade dos valores
da varivel
33
5.2 Varincia e desvio padro
A varincia e o desvio padro so medidas que levam em considerao a
totalidade dos valores da varivel em estudo, o que faz delas ndices de variabilidade
bastante estveis e, por isso mesmo, os mais geralmente utilizados.
A varincia baseia-se nos desvios em torno da mdia aritmtica, porm
determinado a mdia aritmtica dos quadrados dos desvios, representamos a varincia
por s
2
.
O desvio padro o valor positivo da raiz quadrada da varincia absoluta.
uma medida estatstica que representa, em mdia, os afastamentos, em valores
absolutos, dos elementos observados em relao a respectiva mdia aritmtica. uma
medida estatstica que dada na unidade da medida utilizada:
Em geral a mdia aritmtica () um numero fracionrio o que torna pouco
prtico o calculo das quantidades de
.
Podemos simplificar os clculos fazendo a seguinte igualdade:
Substituindo na formula do desvio padro temos:
34
5.2.1 Dados no agrupados
EX 15.
EX16.
EX17. Com os seguintes valores 8; 10; 11; 15; 16; 18, calcule o desvio padro:
(X
i
) (X
i
)
2
8 64
10 100
11 121
15 225
16 256
18 324
= 78 =1090
35
5.2.2 Dados agrupados sem intervalo de classes
EX18.
x
i
f
i
x
i
*f
i
(x
i
) f
i
(x
i
)
2
0 2 0 0 2,1 = 2,1 2*4,41= 8,82
1 6 6 1 2,1 = 1,1 6*1,21= 7,26
2 12 24 2 2,1 = 0,1 12*0,01= 0,12
3 7 21 3 2,1= 0,9 7*0,81=5,67
4 3 12 4 2,1 = 1,9 3*3,61=10,83
= 30 = 63 = 32,70
5.2.3 Dados agrupados com intervalo de classes
EX19.
Altura (cm) - x
i
f
i
x
i
*f
i
(x
i
)
f
i
(x
i
)
2
150 |------ 154 4 152 608 152-161 = - 9 4*81
154 |------ 158 9 156 1404 -5 9*25
158 |------ 162 11 160 1760 -1 11*1
162 |------ 166 8 164 1312 3 8*9
166 |------ 170 5 168 840 7 5*49
170 |------ 174 3 172 516 11 3*121
Total 40 6.440 1240
cm
36
5.3 Coeficiente de variao
O desvio padro por si s no nos diz muita coisa. Assim, um desvio padro de
duas unidades pode ser considerado pequeno para uma srie de valores cujo valor
mdio 200; no entanto, se a mdia for igual a 20, o mesmo no pode ser dito. Alm
disso, o fato de o desvio padro ser expresso na mesma unidade dos dados limita o
seu emprego quando desejamos comparar duas ou mais sries de valores,
relativamente sua disperso ou variabilidade, quando expressas em unidades
diferentes. Para contornar essas dificuldades e limitaes, podemos caracterizar a
disperso ou variabilidade dos dados em termos relativos a seu valor mdio, medida
essa denominada coeficiente de variao (CV):
EX.20 Tomemos os resultados das medidas das estaturas e dos pesos de um mesmo
grupo de indivduos:
Temos:
Logo, nesse grupo de indivduos, os pesos apresentam maior grau de disperso
que as estaturas.
Ex.21 Para os dados abaixo calcule a varincia e o desvio padro
a) 1,3,5,9
b) 17,9; 22,5; 13,3; 16,8; 15,4; 14,2
c) 26, 14, 15, 19, 21, 22, 20
d) -10, -6, 2, 3, 7, 9, 10
R: a) 2,96; b) 3,016; c) 2,81; d) 7,04
37
Ex.22 Calcule o desvio padro das distribuies abaixo:
(R: a) 1,51; b) 0,159)
EX.23 Dada a distribuio relativa a 100 lanamentos de 5 moedas simultaneamente
calcule o desvio padro:
(R: 1,13)
EX.24 Calcule o desvio padro da distribuio:
(R: 4,5)
EX.25 Calcule o desvio padro das distribuies de freqncia abaixo:
(R: a) 2,43; b) 8,8 cm; c) R$ 229; d) 9,93 kg).
38
EX26. Sabendo que um conjunto de dados apresenta para mdia aritmtica e para
desvio padro, respectivamente, 18,3 e 1,47, calcule o coeficiente de variao.
(R:8,02%).
EX27. Em uma obra A, foram inspecionadas 150 barras de ferro e mdia foi 7,8 cm e o
desvio padro, 0,80 cm. Em outra obra B, entretanto, a mdia foi de 7,3 cm e o desvio
padro, 0,76. Em qual obra houve uma maior a disperso?
(R: Obra B)
EX28. Medidas as estaturas de 1.017 indivduos, obtivemos x = 162,2 cm e s = 8,01
cm. O peso mdio desses mesmos indivduos 52 kg, com um desvio padro de 2,3
kg. Esses indivduos apresentam maior variabilidade em estatura ou em peso?
(R:estatura)
39
6 Correlao e Regresso
Nos mtodos estatsticos precedentes consideramos sempre a existncia de uma
nica varivel de interesse, porm vrios problemas no trabalho estatstico, todavia,
envolvem muitas variveis. Veremos agora dois mtodos estatsticos para lidar com
este tipo de problema. Faremos nosso estudo com o caso mais simples em que temos
apenas duas variveis de interesse.
6.1 Correlao linear entre duas variveis
Avaliar se existe associao entre duas caractersticas quantitativas objetivo de
muitos estudos em diversas reas. Um ecologista pode estar interessado em saber, por
exemplo, se h associao entre a quantidade de chumbo medida na gua e o volume
de dejetos despejados em determinado rio; um mdico pode querer avaliar se a
presso arterial est relacionada idade das pessoas. Quando se pode demonstrar
que existe associao entre duas variveis quantitativas, isto , quando se constata
que elas variam juntas, diz-se que as variveis esto correlacionadas.
Ex29. Consideremos uma amostra aleatria, formada por dez dos 98 alunos de
uma classe da faculdade A e pelas notas obtidas por eles em Matemtica e Estatstica:
Representando, em um sistema coordenado cartesiano ortogonal, os pares
ordenados (x, y), obtemos uma nuvem de pontos que denominamos diagrama de
40
disperso. Esse diagrama nos fornece uma idia grosseira, porm til, da correlao
existente:
Os pontos obtidos, vistos em conjunto, formam uma elipse em diagonal. Podemos
imaginar que, quanto mais fina for a elipse, mais ela se aproximar de uma reta.
Dizemos, ento, que a correlao de forma elptica tem como "imagem" uma reta,
sendo, por isso, denominada correlao linear. possvel verificar que a cada
correlao est associada como "imagem" uma relao funcional. Por esse motivo, as
relaes funcionais so chamadas relaes perfeitas.
Como a correlao em estudo tem como "imagem" uma reta ascendente, ela
chamada correlao linear positiva.
Assim, uma correlao :
a. linear positiva se os pontos do diagrama tm como "imagem" uma reta
ascendente;
b. linear negativa se os pontos tm como "imagem" uma reta descendente;
41
c. no-linear se os pontos tm como "imagem" uma curva .
Se os pontos apresentam-se dispersos, no oferecendo uma "imagem" definida,
conclumos que no h relao alguma entre as variveis em estudo .
Temos, ento:
6.1.1 Coeficiente de correlao linear
O instrumento empregado para a medida da correlao linear o coeficiente de
correlao. Esse coeficiente deve indicar o grau de intensidade da correlao entre
duas variveis e, ainda, o sentido dessa correlao (positivo ou negativo).
Faremos uso do coeficiente de correlao de Pearson, que dado por:
Onde n o nmero de observaes. Os valores limites de r so -1 e + 1, isto , o
valor de r pertence ao intervalo [-1, +1].
Assim:
se r = + 1, h uma correlao perfeita e positiva entre as variveis;
se r = -1, h uma correlao perfeita e negativa entre as variveis;
se r = 0, ou no h correlao entre as variveis, ou a relao que porventura
exista no linear.
42
Para podermos tirar algumas concluses significativas sobre o comportamento
simultneo das variveis analisadas, necessrio que:
0,6 I r I 1
Se 0,3 I r I 0,6, h uma correlao relativamente fraca entre as variveis.
Se 0 < I r I < 0,3, a correlao muito fraca e, praticamente, nada podemos
concluir sobre a relao entre as variveis em estudo.
EX29. Vamos, ento, calcular o coeficiente de correlao relativo tabela dada.O
modo mais prtico para obtermos r abrir, na tabela, colunas correspondentes aos
valores de x.y., x
2
e y
2
. Assim:
Resultado que indica uma correlao linear positiva altamente significativa entre as
duas variveis.
43
Ex 30. Calcule o coeficiente de correlao para os valores das variveis X
i
e Y
i
abaixo:
A correlao linear entre as variveis X e Y positiva, porm fraca.
EX31. Um grupo de pesquisadores fez uma avaliao do peso aparente de alguns
objetos. Com o peso real e a mdia dos pesos aparentes, dados pelo grupo, obteve-se
a tabela:
Com os dados apresentados calcule o ndice de correlao:
X
i
Y
i
X
i
*Y
i
X
i
2
Y
i
2
18 10 180 324 100
30 23 690 900 529
42 33 1386 1764 1089
62 60 3720 3844 3600
73 91 6643 5329 8281
97 98 9506 9409 9604
120 159 19080 14400 25281
442 474 41205 35970 48484
X
i
Y
i
X
i
*Y
i
X
i
2
Y
i
2
4 12 48 16 144
6 10 60 36 100
8 8 64 64 64
10 12 120 100 144
12 14 168 144 196
40 56 460 360 648
44
6.2 Regresso Linear
Sempre que desejamos estudar determinada varivel em funo de outra,
fazemos uma anlise de regresso.
Podemos dizer que a anlise de regresso tem por objetivo descrever, atravs de
um modelo matemtico, a relao entre duas variveis, partindo de n observaes das
mesmas.
A varivel sobre a qual desejamos fazer uma estimativa recebe o nome de
varivel dependente e a outra recebe o nome de varivel independente.
Assim, supondo X a varivel independente e Y a dependente, vamos procurar
determinar o ajustamento de uma reta relao entre essas variveis, ou seja, vamos
obter uma funo definida por:
Y = aX + b
Onde os parametros a e b podem ser obtidos pelas formula:
Exemplo: Dada a tabela abaixo:
45
Para traarmos a reta no grfico basta determinar dois pontos:
X=0 Y=0,89
X=5 Y=5,19
EX32. Com os dados abaixo faa o ajustamento de uma reta.
X
i
Y
i
X
i
*Y
i
X
i
2
2 30 60 4
4 25 100 16
6 22 132 36
8 18 144 64
10 15 150 100
12 11 132 144
120 159 19080 14400
56 131 858 560
EX33. A tabela abaixo apresenta a produo de uma indstria:
Calcule:
a. o coeficiente de correlao;
b. a reta ajustada;
c. a produo estimada para 1989.
46
X
i
Y
i
X
i
*Y
i
X
i
2
Y
i
2
0 34 0 0 1156
1 36 36 1 1296
2 36 72 4 1296
3 38 114 9 1444
4 41 164 16 1681
5 42 210 25 1764
6 43 258 36 1849
7 44 308 49 1936
8 46 368 64 2116
36 360 1530 204 14538
c)
a)
b)
47
7 Analise combinatria
7.1 Fatorial
Seja n um nmero natural, tal que n>2. Denomina-se fatorial de n e representado
por n! o produto de todos os nmeros naturais de n a 1, ou seja:
- Para n e N e n > 2,
1 2 )... 2 )( 1 ( ! = n n n n
- Para n=1 e n=0 define-se n!=1, isto
1!=1 e 0!=1
Na utilizao da calculadora podemos observar a existncia de uma tecla n!,
para a realizao do clculo fatorial. Vamos analisar alguns exemplos:
a)
120 1 2 3 4 5 ! 5 = =
b)
40320 ! 5 6 7 8 1 2 3 4 5 6 7 8 ! 8 = = =
c)
800 628 3 ! 8 9 10 ! 10 = =
Em probabilidade, muitas vezes devemos calcular expresses como
, e para
calcul-la devemos recorrer a seguinte simplificao:
336 6 7 8
! 5
! 5 6 7 8
! 5
! 8
= =
=
De um modo geral, podemos escrever:
... )! 2 )( 1 ( )! 1 ( ! = = = n n n n n n
48
7.2 Princpio fundamental da contagem PFC
Suponhamos que uma ao seja constituda de duas etapas sucessivas. A
primeira etapa pode ser realizada de p maneiras distintas. Para cada uma dessas
possibilidades, a 2 etapa pode ser realizada de q maneiras distintas. Ento, o nmero
de possibilidades de se efetuar a ao completa dado por p x q.
EX1. No Brasil as placas dos veculos so confeccionadas usando-se 3 letras do
alfabeto e 4 algarismos. Qual o nmero mximo de veculos que poder ser licenciado?
Imaginemos a seguinte situao: Placa ACD 2172.
Como o alfabeto possui 26 letras e nosso sistema numrico possui 10 algarismos
(de 0 a 9), podemos concluir que: para a 1 posio, temos 26 alternativas, e como
pode haver repetio, para a 2, e 3 tambm teremos 26 alternativas. Com relao
aos algarismos, conclumos facilmente que temos 10 alternativas para cada um dos 4
lugares, portanto:
26 . 26 . 26 . 10 . 10 . 10 . 10 = 175.760.000.
EX2. No sistema antigo utilizavam se 2 letras do alfabeto e 4 algarismos. Qual o
nmero mximo de veculos que podia ser licenciado neste sistema?
26 . 26 . 10 . 10 . 10 . 10 = 6.760.000.
Conclumos que a incluso de apenas uma letra faz com que sejam licenciados,
aproximadamente, mais 170.000.000 de veculos.
EX3. Com os algarismos 1, 2, 3, 4, 5 e 6, quantos nmeros de trs algarismos
distintos podemos formar?
1 escolha do algarismo das centenas: so seis possibilidades.
2 escolha do algarismo das dezenas: como no pode haver repetio de
algarismo, devemos ter um algarismo diferente do algarismo escolhido para a centena.
Assim, h cinco possibilidades.
3 escolha do algarismo das unidades: devemos ter um algarismo diferente dos
dois algarismos escolhidos para a centena e para a dezena. Assim, h quatro
possibilidades.
Pelo PFC, o resultado : 6 x 5 x 4 = 120 nmeros
49
EX4. Quantos nmeros de trs algarismos podemos formar com os algarismos 0,
1, 2, 3, 4, 5, 6 e 7 ?
Algarismo das centenas: com exceo do zero, qualquer um dos algarismos
dados pode ser escolhido, havendo, portanto, sete possibilidades.
Algarismo das dezenas e unidades no h restrio alguma
Logo, pelo PFC: 7 x 8 x 8 = 448.
7.3 Arranjos simples
Dado um conjunto com n elementos distintos, chama-se arranjo dos n elementos,
tomados k a k, a qualquer seqncia ordenada de k elementos distintos escolhidos
entre os n existentes.
Ex5. Dado o conjunto A = (1, 2, 3, 4), vamos escrever todos os arranjos desses
quatro elementos tomados dois a dois. A
4,2
(1, 2); (1, 3); (1, 4); (2, 1); (2, 3); (2, 4); (3, 1); (3, 2); (3, 4); (4, 1); (4, 2); (4, 3).
Notamos que (2, 3) (3, 2), isto , a troca na ordem dos elementos de um
possvel agrupamento gera um agrupamento diferente.
EX6. Um cofre possui um disco marcado com os dgitos 0,1,2,...,9. O segredo do
cofre marcado por uma seqncia de 3 dgitos distintos. Se uma pessoa tentar abrir o
cofre, quantas tentativas dever fazer (no mximo) para conseguir abri-lo?
As seqncias sero do tipo xyz. Para a primeira posio teremos 10 alternativas,
para a segunda, 9 e para a terceira, 8. Aplicando a frmula de arranjos pelo PFC,
chegaremos ao mesmo resultado: 10.9.8 = 720. Observe que 720 = A
10,3
7.3.1 Clculo do nmero de arranjos
Seja um conjunto de n elementos distintos. Vamos encontrar uma expresso para
o nmero de arranjos dos n elementos tomados k a k (A
n,k
).
50
EX7. O quadrangular de um torneio de futebol disputado por quatro selees. De
quantas maneiras distintas podemos ter os trs primeiros colocados?
EX8. Usando-se as 26 letras do alfabeto (A,B,C,D,...,Z), quantos arranjos distintos com
3 letras podem ser montados?
EX9. A senha de um carto de banco formada por duas letras distintas seguidas por
uma seqncia de trs algarismos distintos. Quantas senhas poderiam ser
confeccionadas?
1 As letras A
26,2
= 650
2 Os Nmeros A
10,3
= 720
Pelo PFC A
26,2
x A
10,3
= 650 x 720 = 468.000.
7.4 Permutaes simples
De outro modo, podemos entender permutao simples como um caso especial de
arranjo, onde n = k.
EX10. Escrever todos os anagramas da palavra SOL. Um anagrama da palavra SOL
qualquer permutao das letras S, O, L de modo que se forme uma palavra com ou
sem sentido: SOL, SLO, OSL, OLS, LOS, LSO.
51
7.4.1 Permutaes com elementos repetidos
Se entre os n elementos de um conjunto, existem a elementos repetidos, b
elementos repetidos, c elementos repetidos e assim sucessivamente, o nmero total de
permutaes que podemos formar dado por:
EX11. Determine o nmero de anagramas da palavra MATEMTICA Temos 10
elementos, com repeties. A letra M est repetida duas vezes, a letra A trs, a letra T,
duas vezes. Na frmula anterior, teremos:
7.5 Combinaes simples
Dado um conjunto A com n elementos distintos, chama-se combinao dos n
elementos de A, tomados k a k, a qualquer subconjunto formado por k elementos, isto
, temos uma combinao quando os agrupamentos conseguidos permanecem iguais
ao se inverter a posio dos seus elementos.
Perceba que se houver cinco pessoas entre as quais desejamos formar grupos de
trs, o grupo formado por Joo, Pedro e Lus o mesmo grupo formado por Lus,
Pedro e Joo. Temos, ento, uma COMBINAO de cinco elementos em grupos de
trs.
52
EX12. Uma turma formada por 10 alunos. Deseja-se formar uma comisso de
trs alunos para representao discente na universidade. De quantas maneiras
podemos fazer tal escolha?
Neste caso tanto faz a posio dos trs alunos no conjunto ( A, B, C); (B, A, C) ....
desde que os trs sejam os escolhidos
Se fosse importante a ordem deles nos subconjunto usaramos o Arranjo simples
Mas no nos importa a ordem ento utilizaremos a combinao simples.
Ex13. Uma loja de materiais de construo oferece 15 tipos de pisos diferentes
a) De quantas maneiras se pode escolher trs tipos desses pisos?
b) Suponha que certo comprador sempre opte por um piso tipo A. Como podero
ser escolhidos os outros dois pisos?
a) Escolher os pisos {A, B, C} o mesmo que escolher os Pisos {C, B, A}. Assim,
cada possvel escolha uma combinao dos 15 pisos tomados trs a trs
b) Como um dos pisos j foi definido, os outros dois sero escolhidos entre os 14
restantes.
53
7.6 Nmeros Binomiais
Sejam n e p dois nmeros naturais quaisquer e tais que n > p. Denomina-se
nmero binomial, e indica-se por
Onde n,p e N e n > p, e devemos lembrar que n o numerador e p a classe do
nmero binomial
Existem tambm os binomiais complementares, que recebem esta
denominao, quando dois nmeros binomiais apresentam o mesmo numerador, e a
soma de suas classes igual a esse numerador, isto , se n, p, q e N, ento:
So complementares se p+q=n.
Vamos analisar os seguintes exemplos:
Devemos observar como conseqncia dessa propriedade dos nmeros
binominais complementares, a seguinte relao:
Para n, p e N e n>p
{ n p x ou p x
p
n
x
n
= + =
|
|
.
|
\
|
=
|
|
.
|
\
|
54
8 Probabilidade
A Probabilidade pode ser definida como a possibilidade ou chance de que um
evento venha a ocorrer. O estudo das probabilidades se justifica pelo fato de a maioria
dos fenmenos de que trata a Estatstica serem de natureza aleatria ou probabilstica.
Fenmenos onde o resultado final depende do acaso so chamados fenmenos
aleatrios ou experimentos aleatrios.
8.1 Experimentos ou fenmenos aleatrios
So aqueles que, mesmo repetidos vrias vezes sob condies semelhantes,
apresentam resultados imprevisveis.
Assim, da afirmao " provvel que o meu time ganhe a partida de hoje" pode
resultar:
a. que, apesar do favoritismo, ele perca;
b. que, como pensamos, ele ganhe;
c. que empate.
8.2 Espao amostral
A cada experimento correspondem, em geral, vrios resultados possveis. Assim,
ao lanarmos uma moeda, h dois resultados possveis: ocorrer cara ou ocorrer coroa.
J ao lanarmos um dado h seis resultados possveis: 1, 2, 3, 4, 5 ou 6.
Ao conjunto desses resultados possveis damos o nome de espao amostral ou
conjunto universo, representado por S.
Os dois experimentos citados anteriormente tm os seguintes espaos amostrais:
lanamento de uma moeda: S = {Ca, Co};
lanamento de um dado: S = {1, 2, 3, 4, 5, 6}.
Se lanarmos duas vezes a moeda teremos:
S = {(Ca, Ca), (Ca, Co), (Co, Ca), (Co, Co)}.
Cada elemento de S que corresponde a um resultado recebe o nome de ponto
amostral.
55
8.3 Eventos
Chamamos de evento qualquer subconjunto de espao amostral S de um
experimento aleatrio.
Assim, qualquer que seja E, se E C S (E est contido em S), ento E um evento
de S.
Se E = S, E chamado evento certo;
Se E C S e E um conjunto unitrio, E chamado evento elementar. Se
E=conjunto vazio, ento chamado evento impossvel.
Ex1.
No lanamento de um dado, onde S = {1,2,3,4,5,6}, temos:
A = {2,4,6} C S; logo, A um evento de S;
B = {1,2,3,4,5,6} C S; logo, B um evento certo de S;
C = {4} C S; logo, C um evento elementar de S;
D = C S; logo, D um evento impossvel de S.
8.4 Funo Probabilidade
Dado um experimento aleatrio, sendo S o seu espao amostral, vamos admitir
que todos os elementos de S tenham a mesma chance de acontecer, ou seja, que S
um conjunto equiprovvel.
Chamamos de probabilidade de um evento A (A C S) o nmero real P(A), tal que:
n(A) o nmero de elementos de A;
n(S) o nmero de elementos de S.
Ex2:
a) Considerando o lanamento de uma moeda e o evento A "obter cara", temos:
S = {Ca, Co} n(S) = 2
A = {Ca) n(A ) = 1
C
( )
( )
( ) S n
A n
A P =
( )
2
1
= A P
56
O resultado acima nos permite afirmar que, ao lanarmos uma moeda
equilibrada, temos 50% de chance de que aparea cara na face superior.
b) Considerando o lanamento de um dado, vamos calcular:
1 Probabilidade do evento A "obter um nmero par na face superior".
Temos:
S = {1, 2, 3, 4, 5, 6} n(S) = 6
A = {2, 4, 6} n(A) = 3
2 Probabilidade do evento B "obter um nmero menor ou igual a 6 na face superior" .
Temos:
S = {1, 2, 3, 4, 5, 6} n(S) = 6
B = {1, 2,3, 4, 5, 6} n(B) = 6
8.5 Eventos complementares
Sabemos que um evento pode ocorrer ou no. Sendo p a probabilidade de que
ele ocorra (sucesso) e q a probabilidade de que ele no ocorra (fracasso), para um
mesmo evento existe sempre a relao:
p + q = 1 q = 1 p
Assim, se a probabilidade de se realizar o evento
5
1
= p , a probabilidade de que
ele no ocorra
5
4
= q .
8.6 Eventos independentes
Dizemos que dois eventos so independentes quando a realizao ou a no-
realizao de um dos eventos no afeta a probabilidade de realizao do outro e vice-
versa.
Por exemplo, quando lanamos dois dados, o resultado obtido em um deles
independe do resultado obtido no outro.
( )
2
1
6
3
= = A P
( ) 1
6
6
= = A P
57
Se dois eventos so independentes, a probabilidade de que eles se realizem
simultaneamente igual ao produto das probabilidades de realizao dos dois eventos.
p =p
1
* p
2
Ex3: Se lanamos dois dados. A probabilidade de obtermos 1 no primeiro e 5 no
segundo ?
8.7 Eventos mutuamente exclusivos
Dizemos que dois ou mais eventos so mutuamente exclusivos quando a
realizao de um exclui a realizao do(s) outro(s).
Assim, no lanamento de uma moeda, o evento "tirar cara" e o evento "tirar coroa"
so mutuamente exclusivos, j que, ao se realizar um deles, o outro no se realiza.
Se dois eventos so mutuamente exclusivos, a probabilidade de que um ou outro
se realize igual soma das probabilidades de que cada um deles se realize:
p =p
1
+p
2
Ex4: Lanamos um dado. A probabilidade de se tirar o 3 ou 5 :
8.8 Exerccios
1) No lanamento de dois dados, calcule a probabilidade de se obter soma igual a 5.
R: O evento formado pelos elementos (1,4), (2,3), (3,2) e (4,1). Como o nmero de
elementos de S 36, temos:
58
2) De dois baralhos de 52 cartas retiram-se, simultaneamente, uma carta do primeiro
baralho e uma carta do segundo. Qual a probabilidade de a carta do primeiro baralho
ser um rei e a do segundo ser o 5 de paus?
3)
4)
59
5)
6)
a) 14/16 = 7/8
b) 10/16 = 5/8
c)10/16 + 2/16 = 3/4
a) 10/16 * 9/15 = 90/ 240 = 3/8
b) = 7/8
c) 14/16 * 13/15 = 91/120
d) 6/16 * 5/15 = 1/8
60
9 Distribuio Binomial
Uma distribuio de probabilidade binomial resulta de um experimento que
satisfaz os seguintes requisitos:
O experimento deve ser repetido, nas mesmas condies, um nmero finito de
vezes (n);
As tentativas devem ser independentes, ou seja, o resultado de uma no afeta
os resultados das sucessivas;
Cada tentativa deve ter todos os resultados classificados em duas categorias
(sucesso e insucesso);
No decorrer do experimento, a probabilidade p do sucesso e a probabilidade q
(q = 1 p) do insucesso devem permanecer constantes.
Se um experimento satisfaz esses quatro requisitos, a distribuio da varivel
aleatria x chamada de distribuio de probabilidade binomial ou (distribuio
binomial).
Em uma distribuio binomial, as probabilidades podem ser calculadas atravs
da frmula da probabilidade binomial.
Onde: n = nmero de tentativas
k = nmero de sucessos em n tentativas
p = probabilidade de sucesso em qualquer tentativa
q = probabilidade de fracasso em qualquer tentativa (q = 1 p)
61
Ex1. Uma moeda lanada 5 vezes seguidas e independentes. Calcule a
probabilidade de obter 3 caras, nessas 5 provas. Para o exemplo dado temos que:
n= 5
k=3
p =
Ex2. Dois times de futebol, A e B, jogam entre si 6 vezes. Encontre a probabilidade de
o time A ganhar 4 jogos.
n = 6
k = 4
p = 1/3 (Pode ganhar empatar ou perder)
q = 1 1/3 = 2/3