JOELMIR FELICIANO
O que Estatstica ?
?
ESTATSTICA: conjunto de tcnicas que permite,
de forma sistemtica, coletar, organizar, descrever,
analisar e interpretar dados oriundos de estudos
ou experimentos, realizados em qualquer rea do
conhecimento.
Exemplos de Aplicao
Comparao entre tratamentos ou processos:
Tratamento Tipo 1
Tratamento Tipo 2
Produo
Produo
Tipo 1
mais
produtivo
do que o
x11
x12
...
x1n
Tipo 2?
x21
x22
...
x2n
Raciocnio Estatstico
Populao
Dados
Amostragem
Estatstica
Descritiva
Inferncia Estatstica
(Probabilidade)
Tcnicas de Amostragem
JOELMIR FELICIANO
Noes Bsicas
Definio de Populao: Ao grande conjunto de
elementos que contm determinada caracterstica
comum, que temos interesse recebe o nome de
populao.
Populao 1
Populao 2
Noes Bsicas
Quando observamos todos os dados, procedemos ao
Censo.
Exemplo: Examinar todos os brasileiros quanto a
condio de nutrio.
Populao
Qual a proporo de
brasileiros desnutridos?
=?
Noes Bsicas
Quase no se trabalha com populao.
Motivos Principais
Alto custo da pesquisa/experimento (material, pessoal,
logstica, etc);
Resultados demorados;
Razes ticas (experimentos com animais);
Amostra
: Estatstica.
Vantagens da Amostragem.
Tipos de Amostragem
Amostra casual simples: Existncia de um frame. Todos os elementos da populao
devem ter chance igual de escolha. Procedimento baseado no sorteio aleatrio.de
escolha.
Tipos de Amostragem
Amostra Estratificada: Na amostra estratificada os elementos so
provenientes de todos os estratos da populao.
Em cada estrato feito o sorteio aleatrio.
Tipos de Amostragem
Amostra Sistemtica: Na amostra sistemtica os elementos so
escolhidos no por acaso, mas por um sistema.
No primeiro perodo o sorteio aleatrio.
Tipos de Amostragem
Amostra por conglomerado: Amostra feita em vrios estgios.
Maior economia.
Tipos de Variveis
Variveis Qualitativas ou Categricas: Quando os possveis valores assumem
atributos ou qualidades. Ex: sexo, cor, escolaridade, doena, condio do ar, condio
da gua, etc.
Variveis Quantitativas ou de Medidas: Quando seus valores so expressos em
nmeros. Ex: altura, peso, nmero de filhos, pH, concentrao do reagente, etc .
Sexo
Masculino
Feminino
Total
Fonte: E.W.
Freqncia
10
8
18
3,200
3,720
2,800
2,900
2,950
2,480
3,800
2,500
3,550
3,000
4,100
3,200
3,450
3,100
3,150
2,800
2,900
Fonte: IBGE
1,900
3,600
3,200
3,300
2,900
2,500
3,600
2,500
2,300
2,950
3,000
3,750
3,150
3,200
2,500
2,900
3,200
4,100
2,400
2,700
2,450
3,400
2,400
3,120
3,400
3,200
2,700
3,150
2,800
2,700
3,300
3,200
3,200
2,800
4,600
1,720
2,750
4,200
2,100
4,450
2,900
2,920
2,720
2,900
2,000
2,720
2,480
3,900
2,500
2,480
2,450
3,400
3,400
1,570
3,800
2,700
2,900
3,700
2,120
3,150
2,400
3,450
3,120
2,120
2,450
2,700
Classe
Ponto mdio Freqncia
1,5 |--- 2,0
1,750
3
2,0 |--- 2,5
2,250
16
2,5 |--- 3,0
2,750
31
3,0 |--- 3,5
3,250
34
3,5 |--- 4,0
3,750
11
4,0 |--- 4,5
4,250
4
4,5 |--- 5,0
4,75
1
Numa tabela de distribuio de freqncia tambm podem ser apresentados os
pontos mdios de classe. O ponto mdio dado pela soma dos extremos de uma classe,
dividida por 2. Para a classe 1,5 |--- 2,0, o ponto mdio : (1,5+2)/2=1,75.
31%
54%
15%
Gasolina
Alcool
Diesel
Grfico de Barras.
Grfico de barras bastante usado com variveis qualitativas e quantitativas
discretas. Ideal para quando temos vrias classes de categorias.
Figura 1.2: Distribuio das reclamaes via 0800.
25
25
20
13
Freqncia
15
10
8
7
0
Mau atendimento
Troca de mercadoria
Mercadoria com defeito
Reclamaes
Falta de variedade
Histograma
O histograma a representao grfica para variveis quantitativas
contnuas. Este tipo de representao mostra a forma da distribuio
da varivel. de fundamental importncia na aplicao dos conceitos
de inferncia estatstica
Ponto mdio
Espalhamento
dos dados
Diagramas de Disperso
Quando temos dados emparelhados e desejamos verificar de existe uma
associao entre esses dados, usamos como anlise preliminar o diagrama
de disperso.
Figura 1.5- Diagrama de disperso: Temperatura X Rendimento de PQ.
100
90
80
70
Rendimento
60
50
40
30
20
10
0
0
20
40
60
Temperatura
80
100
120
Medidas de Centralidade.
Medidas de Posio.
Medidas de Centralidade
Mdia Aritmtica de um conjunto de valores o
valor obtido somando-se todos eles e dividindo-se o
total pelo nmero de valores.
n
x
i 1
3014,28
7
7
Medidas de Centralidade
Se os dados apresentam observaes extremas, a mdia pode
no ser a medida mais indicada para centralidade, pois sobre
influncia direta de observaes extremas. Por exemplo:
Em uma pesquisa sobre salrio de um Tecnlogo em Qumica
Frmaco Industrial observamos os seguintes valores: $1000,00;
$1200,00; $1800,00; $2500,00; $2700,00 ; $3200,00 e
$15000,00
Medidas de Centralidade
Figura 2.1 : Salrios dos Tecnlogos
16000
14000
12000
10000
8000
6000
4000
2000
0
1
Dados
Mdia
Mediana
Medidas de Centralidade
Como calcular a mediana?
Se o nmeron
de observaes na amostra ou
populao for impar, ento a mediana ser o elemento de
ordem n 1 , ou seja :
Me x n1
x n x n
Me
1
2
n= 6; par.
1
2
x (3) x ( 4)
2
18 29
23.5
2
Medidas Separatrizes
As medidas de posio possibilitam um melhor
entendimento dos dados, focalizando sua posio
relativa em relao ao conjunto como um todo.
Mediana: divide os dados ordenados em duas partes iguais.
Medidas Separatrizes
Calculando o percentil (medida geral)
Ordenar a srie de n observaes em ordem crescente de valores, definimos
como 0% posio de ordem 1 e 100% a observao de ordem n. Portanto
uma observao com ordem x ter uma posio p.
Posio
100%
0%
1
Ordem
Medidas Separatrizes
n 1
x 1
100 0 P 0
n : nmero total de observaes na srie.
x : a ordem de uma determinad a observao .
P : o percentil dessa observao .
x 1
P
*100%
n 1
P
x (n 1) *
1
100
Srie
Ordem
Srie
Ordem
26
1
42
14
27
2
43
15
29
3
43
16
29
4
45
17
30
5
46
18
31
6
47
19
32
7
48
20
32
8
54
21
35
9
58
22
36
10
59
23
37
11
62
24
37
12
64
25
38
13
65
26
P
32
x (n 1) *
1 (26 1) *
1 9
100
100
Descritiva 4
Medidas de disperso.
Medidas de disperso
Problema:
Uma empresa farmacutica realiza um teste com dois
medicamentos para a mesma finalidade em um grupo de 14 pessoas,
sendo que 7 tomaram o medicamento A e as outras 7 o B.O tempo de
reao foi anotado para cada individuo:
Tabela 1: Tempo de reao dos medicamentos.
Med.A
Med.B
15
35
Tempo de Reao
61 48 16 72 17
35 36 34 33 35
Mdia
16
35
37
35
Fonte: E.W.
Medida de Disperso
S utilizando a mdia como medida resumo para um conjunto de
dados, no vamos ter uma boa representao. Necessitamos de outras
medidas para avaliar o grau de variabilidade, ou disperso dos valores em
torno da mdia. As medidas de disperso medem a representatividade da
mdia.
Tempo de Reao dos Medicamentos
80
70
Tempo de Reao
60
50
Med.A
Med.B
Mdia
40
30
20
10
0
1
Pacientes
Medidas de Disperso
M edA : 72 15 57
M edB : 37 33 4
Temos uma idia da disperso.
Problema: Depende dos valores extremos.
Medidas de Disperso
Os desvios de uma srie de dados com relao a mdia so dados
por :
xi x , onde i 1,2,..., n.
Portanto o desvio mdio seria uma boa taxa de disperso
entre os dados. No entanto:
(x
i 1
x) 0
Medidas de Disperso.
Confirmando o resultado.
Med.A
Med.B
xi
( xi x )
15
61
48
16
72
17
16
Soma
-20
26
13
-19
37
-18
-19
0
( xi x )
xi
35
35
36
34
33
35
37
Soma
0
0
1
-1
-2
0
2
0
Medidas de Disperso.
Calculando a varincia amostral para o MedA, temos:
2
2
2
(
15
35
)
(
61
35
)
...
(
16
35
)
3660
2
S
610
7 1
6
2
2
2
(
35
35
)
(
35
35
)
...
(
35
37
)
10
2
S
1.666
7 1
6
Medidas de Disperso.
Algumas concluses relacionadas com a varincia.
O valor da varincia sempre positivo.
Medidas de Disperso.
Para resolver o problema da diferena de escala entre varincia
e os dados, utilizamos o desvio padro. O desvio padro a
raiz quadrada da varincia.
S S2
Grupo 2 : S = 1,29.
Medidas de Disperso.
Coeficiente de variao: Mede a variabilidade em termos
relativos, dividindo o desvio padro pela mdia.
S
CVa 100%
x
Mdia
Mediana Desvio-Padro
CV
Q1
n : n de dados na pesquisa
Q3
Conceitos Bsicos
Exemplos:
Condies climticas do prximo domingo;
Espao Amostral ()
Exemplos:
1.
2.
3.
4.
AC ou A
A C = {2, 4, 6} {1} =
A B = {2, 4, 6} {4, 5, 6} = {2, 4, 5, 6}
Probabilidade
Pergunta: Como atribuir probabilidade aos
elementos do espao amostral?
Definies de probabilidades
P ( A)
n( A)
n ( )
Obter soma 7;
b)
c)
1,1
2,1
3,1
4,1
5,1
6,1
1,2
2,2
3,2
4,2
5,2
6,2
1,3
2,3
3,3
4,3
5,3
6,3
a)
A={(1,6),(5,2),(4,3),(3,4),(2,5),(6,1)} P(A)=n(A)/n()=6/36=1/6
b)
c)
P(C)= 15/36.
fr1
2/5
3/5
5
fr2
6/10
4/10
10
fr3
22/50
28/50
50
fr4
47/100
53/100
100
frA
0,5
0,5
Definio axiomtica
A probabilidade de um evento A define-se com o nmero P(A), tal que satisfaz os
seguintes axiomas:
(i ) 0 P( A) 1, A
(ii ) P () 1
(iii ) Se A1 , , An so eventosmutuamenteexclusivos, ento
n
P A i
i 1
P( A )
i
i 1
Propriedades
1. P() 0
2. Se A ento , P( A) 1 P( Ac )
3. Se A B ento , P( A) P( B)
4. Se A, B ento , P( A B) P( A) P( B) P( A B)
5. Se A, B, C ento ,
P( A B C ) P( A) P( B) P(C ) P( A B) P( B C ) P( A C )
P( A B C )
2354693
P( H )
0,451;
5218071
P ( H c ) 1 P ( H ) 1 0,451 0,549;
3836637
P( B)
0,735
5218071
P ( B c ) 1 P ( B ) 1 0,735 0,265;
1726384
P( H B)
0,331
5218071
P( H B) P( H ) P( B) P( H B)
0,451 0,735 0,331 0,855;
2110253
c
P( H B)
0,404;
5218071
P( H c B) P( H c ) P( B) P( H c B)
0,549 0,739 0,404 0,880.
P( A B)
P( A | B)
, P( B) 0.
P( B)
(1)
Sejam os eventos:
(b)
P (V1 )
P(V2c
10
2
15
3
5
| V1 )
14
Resultados
V1V2
V1V2c
10 9 3
15 14 7
10 5
5
15 14 21
5 10 5
15 14 21
5 4
2
15 14 21
V1c V2
V1c V2c
Total
Probabilidade
P( A B) P( B) P( A | B),
Que conhecida como regra do produto de probabilidades ou probabilidade da
interseo
15 14 21
c
1
c
2
c
1
c
2
c
1
1. P( | B) 0
2. Se A, B , ento : P(Ac | B) 1 P( A | B) ou P( A | B) 1 P(Ac | B)
3. Se A, B, C , ento :
P( A C | B) P( A | B) P(C | B) P( A C | B).
P( A B)
0,40
P( B | A) 1 P( B | A) 1
1
0,20
P( A)
0,50
c
P(AB)=P(A)P(B).
Exemplo 4: Em uma escola 20% dos alunos tem problemas visuais, 8%
problemas auditivos e 4% tem problemas visuais e auditivos. Selecionamos um
aluno desta escola ao acaso:
0,20.
P (V )
0,20
(c) P (V c A) P (V c ) P ( A) P (V c A)
1 P (V ) P ( A) P ( A) P (V c | A) 1 P (V ) P ( A) P ( A)1 P (V | A)
P (V A)
1 P (V ) P ( A) P ( A) 1
P ( A)
0,04
1 0,2 0,08 0,081
0,84
0,08
(i ) A e B c so independentes.
(ii ) A c e B so independentes
(iii) A c e B c so independentes
Exemplo 5: Um atirador acerta 80% de seus disparos e outro (na mesmas
condies de tiro), 70%. Qual a probabilidade de acertar se ambos atiradores
disparam simultaneamente no alvo.? Considere que o alvo foi acertado quando
pelo menos, uma das duas balas tenha feito impacto no alvo.
Teorema de Bayes
Definio [Partio do espao amostral]. Uma coleo de eventos
B1 , , Bk formam uma partio do espao amostral se eles no tm
interseco entre si e sua unio igual ao espao amostral.
Bi B j para i j e
B
i
i 1
P( A) P( B1 ) P( A | B1 ) P( Bk ) P( A | Bk )
P( B ) P( A | B )
i
i 1
P (Bi | A)
P (Bi )P ( A | Bi )
k
P (Bi )P ( A | Bi )
i 1
Soluo:
Sejam os eventos:
P( A | E )
P( A) P( E | A)
0,30 0,10
0,03
0,46
P( A) P( E | A) P( B) P( E | B) 0,30 0,10 0,70 0,05 0,065
Variveis
Aleatrias
Discretas.
Variveis
Aleatrias
Contnuas.
Distribuies
Amostrais.
Regresso
Linear
Prof. Joelmir Feliciano
Objetivo
Explicar uma varivel quantitativa segundo uma outra
varivel quantitativa.
Exemplos
Preo de um imvel segundo a rea construda
Consumo de combustvel segundo o preo do
combustvel e a regio
Valorizao de uma ao segundo a valorizao da
bolsa
Taxa de criminalidade segundo a taxa de desemprego
Tempo de reao em um processo qumico segundo a
taxa de concentrao do reagente.
Algumas definies
a) diagrama de disperso: representao grfica
entre duas variveis quantitativas
b) correlao: quantifica a fora da relao linear entre
duas variveis quantitativas
c) regresso linear: explicita a forma da relao linear
Diagrama de Disperso
Coeficiente de correlao
linear
S xy
S xx S yy
x y
xy
x2
y
y 2
n
Propriedades do coeficiente
de correlao linear
Propriedade
-1 r 1
Classificao da correlao
r = 1, correlao linear positiva e perfeita
r = -1, correlao linear negativa e perfeita
r = 0, inexistncia de correlao linear
x y
xy
n
x2
y2
Y2
20,25
42,25
13,69
16
86,49
178,68
XY
13,5
45,5
7,4
6
111,6
184
25,5 * 28
5
2
2
2
25
,
5
28
208,25
178,68
y
5
5
184
0,9960
Grficos - exemplos da
classificao da correlao
Exemplo para r = 1
Grficos - exemplos da
classificao da correlao
Exemplo para r = -1
Grficos - exemplos da
classificao da correlao
Exemplo para 0 < r < 1
Grficos - exemplos da
classificao da correlao
Exemplo para -1 < r < 0
Grficos - exemplos da
classificao da correlao
Exemplo para r = 0
Grficos - exemplos da
classificao da correlao
Outro exemplo para r = 0
Exerccio.
Considere a relao entre temperatura e rendimento em um processo qumico . Os dados esto
ilustrados abaixo:
Temperatura ( C )
30
35
40
60
70
90
100
Rendimento (%)
35
40
42
70
85
87
91
Diagrama de disperso
Coeficiente de correlao:
r = 0.9591233
Reta ajustada
Definio de a e b
a : intercepto ou coeficiente linear
b : inclinao ou coeficiente angular
Interpretao
Para cada aumento de uma unidade em X,
temos um aumento de b unidades em Y.
S xy
S xx
x y
xy
2
x
a y bx , onde
n
2
x
n
y
n
x
n
x y
xy
n
x2
Y2
20,25
42,25
13,69
16
86,49
178,68
XY
13,5
45,5
7,4
6
111,6
184
25,5 * 28
184
41,2
5
0,5268
2
78,2
25,5
208,25
5
Exerccio.
Considere a relao entre temperatura e rendimento em um processo qumico . Os dados esto
ilustrados abaixo:
Temperatura ( C )
30
35
40
60
70
90
100
Rendimento (%)
35
40
42
70
85
87
91
Exerccio.
b 0.86
a 12.07
Coeficiente de Determinao:
R 0.9591
Reta ajustada
y 12.07 0.87 x
Interpretao: A cada unidade aumentada da temperada, o rendimento
aumenta em mdia em 0.87%.