Anda di halaman 1dari 30

Coleta e Modelagem dos Dados de Entrada

Captulo 2
Pginas 24-52
Este material disponibilizado para uso exclusivo de docentes que adotam o livro Modelagem e Simulao de Eventos Discretos em suas disciplinas. O material pode (e deve) ser editado pelo professor. Pedimos apenas que seja sempre citada a fonte original de consulta.

Prof. Afonso C. Medina Prof. Leonardo Chwif


Verso 0.2 30/09/06
Modelagem e Simulao de Eventos Discretos Chwif e Medina (2010)

Modificado em 2012 Slide 1 de 30

Trs Etapas

Coleta Tratamento Inferncia

Modelagem e Simulao de Eventos Discretos Chwif e Medina (2010)

Slide 2 de 30

Coleta dos Dados


1. 2.

Escolha adequada da varivel de estudo; O tamanho da amostra deve estar entre 100 e 200 observaes. Amostras com menos de 100 observaes podem comprometer a identificao do melhor modelo probabilstico, e amostras com mais de 200 observaes no trazem ganhos significativos ao estudo;

Modelagem e Simulao de Eventos Discretos Chwif e Medina (2010)

Slide 3 de 30

Coleta dos Dados


3.

Coletar e anotar as observaes na mesma ordem em que o fenmeno ocorre para permitir a anlise de correlao; Se existir alguma suspeita de que os dados mudam em funo do horrio ou do dia da coleta, a coleta deve ser refeita em outros horrios e dias. Na modelagem de dados, vale a regra: toda suspeita deve ser comprovada ou descartada estatisticamente.
Slide 4 de 30

4.

Modelagem e Simulao de Eventos Discretos Chwif e Medina (2010)

Exemplo 2.1: Filas em um Supermercado


Um gerente de supermercado est preocupado com as filas formadas nos caixas de pagamento durante um dos turnos de operao. Quais seriam as variveis de estudo para coleta de dados?
(N) O nmero de prateleiras no supermercado ( S ) Os tempos de atendimento nos caixas (N) O nmero de clientes em fila
Dado de sada!

(N) O tempo de permanncia dos clientes no supermercado ( S ) Os tempos entre chegadas sucessivas de clientes nos caixas de pagamento
Modelagem e Simulao de Eventos Discretos Chwif e Medina (2010) Slide 5 de 30

Exemplo 2.1: Coleta de Dados


Intervalo entre chegadas de pessoas nos caixas do supermercado (100 medidas). Tempos em minutos:
11 1 5 2 1 8 7 2 15 1 6 19 2 10 0 6 4 2 3 6 5 3 2 1 5 9 5 11 0 5 1 2 3 9 3 0 18 12 2 0 2 3 6 3 18 2 14 13 6 3 13 27 1 1 6 2 1 28 8 5 0 3 1 9 4 3 7 2 7 17 13 5 1 1 3 2 0 0 3 0 9 7 11 0 22 12 7 0 19 10 19 20 4 3 27 8 16 7 19 3 9 4 1 10 8 1 28 1 1 15 10 5 3 9 3 4 20 3 12 7 1 12 2 3 3 3 1 6 1 43 9 10 6 9 18 5 2 18 5 0 5 8 4 3 0 1 3 12 9 2 20 8 13 4 4 1 2 12 4 8 5 7 4 4 4 11 3 8 12 9 17 728 12 6 4 3 9 2 0 5 1 5 2 5 4 9 4 12 4 11 24 8 12 3 7 1 3 1 3 8
Slide 6 de 30

Modelagem e Simulao de Eventos Discretos Chwif e Medina (2010)

Exemplo 2.1: Medidas de Posio e Disperso


Mdia Mediana Medidas de posio Moda Mnimo Mximo Amplitude Desvio padro 10,44 5 3 0 728 728 51,42 2.643,81 493% 13,80

Medidas de disperso

Varincia da amostra Coeficiente de Variao Coeficiente Assimetria

O valor 728 um outlier?


Modelagem e Simulao de Eventos Discretos Chwif e Medina (2010) Slide 7 de 30

Outliers (Valores Discrepantes)


Erro na coleta de dados. Este tipo de outlier o mais comum, principalmente quando o levantamento de dados feito por meio manual. Eventos raros. Nada impede que situaes totalmente atpicas ocorram na nossa coleta de dados. Alguns exemplos:
Um dia de temperatura negativa no vero da cidade do Rio de Janeiro;
Um tempo de execuo de um operador ser muito curto em relao aos melhores desempenhos obtidos naquela tarefa; Um tempo de viagem de um caminho de entregas na cidade de So Paulo, durante o horrio de rush, muito menor do que fora deste horrio.

Modelagem e Simulao de Eventos Discretos Chwif e Medina (2010)

Slide 8 de 30

Exemplo 2.1: Influncia dos Outliers


Dados com o outlier sem o outlier

Mdia
Mediana Varincia da amostra

10,44
5 2.643,81

6,83
5 43,60

Modelagem e Simulao de Eventos Discretos Chwif e Medina (2010)

Slide 9 de 30

Identificao de Outliers: Box-plot


Valores 20

Q 3+1,5( Q 3- Q 1)

Q3
15

mediana Q1
10

Q 1-1,5( Q 3- Q 1)
5

outlier

0 A B C Sries

Modelagem e Simulao de Eventos Discretos Chwif e Medina (2010)

Slide 10 de 30

Anlise de Correlao
50

Obs e rv a o k +1
40

O diagrama de disperso dos tempos de atendimento do exemplo do supermercado mostra que no h correlao entre as observaes da amostra.

30

20

10

0 0 10 20 30 40

Obs e rv a o k

50

Modelagem e Simulao de Eventos Discretos Chwif e Medina (2010)

Slide 11 de 30

Anlise de Correlao
20

Obs e rv a o k +1
18

Diagrama de disperso de um exemplo hipottico em que existe correlao entre os dados que compem a amostra.

16

14

12

10 10 12 14 16 18

Obs e rv a o k

20

Modelagem e Simulao de Eventos Discretos Chwif e Medina (2010)

Slide 12 de 30

Exemplo 2.1: Construo do Histograma


O histograma utilizado para identificar qual a distribuio a ser ajustada aos dados coletados ou utilizado diretamente dentro do modelo de simulao. 1. Definir o nmero de classes:

K 1 3,3 log10 n
K n

Amplitude 2. Definir o tamanho do intervalo: h K


3. Construir a tabela de freqncias
4. Construir o histograma

Modelagem e Simulao de Eventos Discretos Chwif e Medina (2010)

Slide 13 de 30

Exemplo 2.1: Histograma


Histogr ama h=4 .8
Fr eqncia 120 100 80 60 40 20 0 4.8 14.3 23.9 Bloco 33.4 43

Modelagem e Simulao de Eventos Discretos Chwif e Medina (2010)

Slide 14 de 30

Exemplo 2.1: Inferncia


Qual o melhor modelo probabilstico ou distribuio estatstica para representar a amostra coletada?
Histogr ama h=4 .8
Fr eqncia 120 100 80 60 40 20 0 4.8
f (x ) 1/ =1 =1 f (x ) =1 =0,5

Lognormal?

14.3

23.9 Bloco

33.4

43

f (x )

f (x )

Triangular?
Normal?

Exponencial?
a m b x

Modelagem e Simulao de Eventos Discretos Chwif e Medina (2010)

Slide 15 de 30

Testes de Aderncia (no paramtricos)


Testa a validade (ou no) da hiptese de aderncia (ou hiptese nula) em confronto com a hiptese alternativa:
H0: o modelo adequado para representar a distribuio da populao.

Ha: o modelo no adequado para representar a distribuio da populao.

Se a um dado nvel de significncia (100)% rejeitarmos H0, o modelo testado no adequado para representar a distribuio da populao. O nvel de significncia equivale probabilidade de rejeitarmos a hiptese nula H0, dado que ela est correta. Testes usuais:

Qui-quadrado
Kolmogorov-Smirnov
Modelagem e Simulao de Eventos Discretos Chwif e Medina (2010) Slide 16 de 30

Teste do Qui-quadrado
Limites Inf Sup 0 4.8 4.8 9.6 9.6 14.3 14.3 19.1 19.1 1.0E+10 Exponencial 0.5022 0.2500 0.1244 0.0620 0.0614 Fr eqncias Ter ica (T) Obser vada (O) 96 100 55 50 25 25 13 12 10 12 E Confiana Gr aus de liber dade Valor Ter ico p-value (O-T)^2 / T 0.16 0.55 0.00 0.04 0.40 1 .1 5 5% 3 7 .8 1 0 .7 6

Por tanto,

no ader em ao m odelo r ejeitamos exponencial

a hipt ese de que os dados

Modelagem e Simulao de Eventos Discretos Chwif e Medina (2010)

Slide 17 de 30

P-value
Parmetro usual fornecido pelos softwares de estatstica.
Valor p-value < 0,01 0,01 p-value < 0,05 0,05 p-value < 0,10 0,10 p-value Critrio Evidncia forte contra a hiptese de aderncia

Evidncia moderada contra a hiptese de aderncia


Evidncia potencial contra a hiptese de aderncia

Evidncia fraca ou inexistente contra a hiptese de aderncia

Modelagem e Simulao de Eventos Discretos Chwif e Medina (2010)

Slide 18 de 30

Distribuies discretas: Binomial


f ( x)

Modelagem e Simulao de Eventos Discretos Chwif e Medina (2010)

Slide 19 de 30

Distribuies discretas: Poisson


f (x )

Modelagem e Simulao de Eventos Discretos Chwif e Medina (2010)

Slide 20 de 30

Distribuies contnuas: Beta


f (x )

=1,5 =5
=4 =4

=6 =2

=2 =1

=2 =3

=3 =2

=2 =1

0,5

Modelagem e Simulao de Eventos Discretos Chwif e Medina (2010)

Slide 21 de 30

Distribuies contnuas: Erlang


f (x )

=0,5

=0,5 k= 3

=0,2 k= 10

x
Modelagem e Simulao de Eventos Discretos Chwif e Medina (2010) Slide 22 de 30

Distribuies contnuas: Exponencial


f (x )
1/

x
Modelagem e Simulao de Eventos Discretos Chwif e Medina (2010) Slide 23 de 30

Distribuies contnuas: Gama


f (x ) =0

=1 =2

Modelagem e Simulao de Eventos Discretos Chwif e Medina (2010)

Slide 24 de 30

Distribuies contnuas: Lognormal


=1 =0,5
f (x ) =1 =1

Modelagem e Simulao de Eventos Discretos Chwif e Medina (2010)

Slide 25 de 30

Distribuies contnuas: Normal


f (x )

Modelagem e Simulao de Eventos Discretos Chwif e Medina (2010)

Slide 26 de 30

Distribuies contnuas: Uniforme


f (x )

1/ (b-a )

a
Modelagem e Simulao de Eventos Discretos Chwif e Medina (2010)

Slide 27 de 30

Distribuies contnuas: Triangular


f (x )

Modelagem e Simulao de Eventos Discretos Chwif e Medina (2010)

Slide 28 de 30

Distribuies contnuas: Weibull


f (x ) =0,5 =1 =3 =1

=2 =1 =3 =2

=1 =1

x
Modelagem e Simulao de Eventos Discretos Chwif e Medina (2010) Slide 29 de 30

Modelagem de dados... sem dados!


Distribuio Parmetros Caractersticas

Aplicabilidade Grande variabilidade dos valores Independncia entre um valor e outro Muitos valores baixos e poucos valores altos Utilizada para representar o tempo entre chegadas sucessivas e o tempo entre falhas sucessivas Quando se conhece ou se tem um bom chute sobre a moda (valor que mais ocorre), o menor valor e o maior valor que podem ocorrer

Exponencial

Mdia

Varincia alta Cauda para direita

Triangular

Menor valor, moda e maior valor

Simtrica ou no

Normal

Mdia e desvio padro

Simtrica Forma de sino Variabilidade controlada pelo desviopadro


Quando a probabilidade de ocorrncia de valores acima da mdia a mesma que valores abaixo da mdia Quando o tempo de um processo pode ser considerado a soma de diversos tempos de sub-processos

Uniforme

Maior valor e menor valor

Todos os valores no intervalo possuem a mesma probabilidade de ocorrncia

Quando no se tem nenhuma informao sobre o processo ou apenas os valores limites (simulao do pior caso)

Discreta

Valores e sua probabilidade de ocorrncia

Apenas assume os valores fornecidos pelo analista

Utilizada para a escolha de parmetros das entidades (por exemplo: em uma certa loja, 30% dos clientes realizam suas compras no balco e 70% nas prateleiras) Quando se conhecem apenas valores intermedirios da distribuio ou a porcentagem de ocorrncia de alguns valores discretos

Modelagem e Simulao de Eventos Discretos Chwif e Medina (2010)

Slide 30 de 30