Anda di halaman 1dari 54

Probabilidade e Estatstica

Aula 2 Apresentao de dados em Tabelas e Grficos


Leitura: Levine et al. Captulo 2

Cap 2-1

Objetivos
Nesta parte, vamos aprender: A conhecer as fontes e tipos de dados
A desenvolver tabelas e grficos para conjuntos de

dados
Os princpios de apresentao adequada de grficos

Cap 2-2

Fontes de Dados
A estatstica a cincia de anlise de dados que representam

uma situao onde existe incerteza.


Mas de onde vem os dados normalmente utilizados?
1)

Fontes Primrias: os dados so coletados pelo pesquisador - dados de uma pesquisa poltica - dados coletados por um experimento* Fontes Secundrias: a pessoa faz a anlise de dados coletados por terceiros. - dados do censo (ibge, inep,) - dados de revistas/jornais impressos ou publicados na internet
Cap 1-3

2)

Fontes de Dados
Os dados coletados (ou amostras) devem:
ser representativos Cuidado com amostras em que as pessoas escolhem se respondem ou no (particularmente importante em cincias sociais), podem no representar a populao.

conter informao suficiente Dificilmente podemos extrair muitas informaes de uma amostra pequena (ex: 2 pessoas). Mtodo usado com frequncia a seleo aleatria

de indivduos a incluir na pesquisa (sorteio).


Cap 1-4

Tipos de Variveis
Categricas (qualitativas) variveis cujos valores s

podem ser colocado em categorias, tais como sim e no, partido poltico preferido,
Numricas (quantitativas) variveis cujos valores

representam quantidades, tais como peso, renda, nmero de filhos, nmero de mquinas,

Cap 1-5

Tipos de Variveis
Dados

Categricos
Exemplos:

Numricos

Estado civil Partido politico Cor dos olhos (Categorias definidas)

Discretos
Exemplos:

Contnuos
Exemplos:

Nmero de filhos Defeitos por hora (tens contveis)

Peso Voltagem (Caratersticas mensurveis)


Cap 1-6

Dados e Variveis
Exerccio: O conjunto de dados abaixo descreve o consumo de combustvel (em km/litro) para alguns modelos de seds mdios.
Modelo Montadora Direo N de Cilindros 4 4 4 4 Consumo Estrada (km/l) 11 12.8 10.1 13.8 Consumo Cidade (km/l) 8.2 9.7 7.1 10.4

Marea Focus Mgane Corolla

Fiat Ford Renault Toyota

Hidrulica Hidrulica Eltrica Hidrulica

a) b) c)

Quais so os indivduos (observaes) neste conjunto de dados? Quais variveis so fornecidas? Quais so os tipos destas variveis? Fornea uma amostra de tamanho 2 deste conjunto de dados.
Cap 2-7

Tipos de Grficos e Tabelas


Dados

Categricos

Numricos

Tabela Resumida

Grfico de Pizza

Rol

Disposio Ramo-e-Folha

Grfico de Barras

Diagrama de Pareto

Distribuio de Frequncia Polgono de Percentagem

Histograma

Polgono de Percentagem Acumulada


Cap 2-8

Tipos de Grficos e Tabelas


Dados

Categricos

Numricos

Tabela Resumida

Grfico de Pizza

Rol

Disposio Ramo-e-Folha

Grfico de Barras

Diagrama de Pareto

Distribuio de Frequncia Polgono de Percentagem

Histograma

Polgono de Percentagem Acumulada


Cap 2-9

Organizando Dados Categricos: tabela resumida

Uma tabela resumida ou distribuio de uma varivel nos diz: - os valores assumidos por uma varivel; e - a frequncia (percentual ou absoluta) com que a varivel os assume.
Como voc vai passar as Frequncia festas de final de ano? Absoluta Em casa com a famlia 90 Viajando para visitar a 76 famlia Turismo 10 Colocando o trabalho 10 em dia Outros 14 Total 200 Como voc vai passar as festas de final de ano? Em casa com a famlia Viajando para visitar a famlia Turismo Colocando o trabalho em dia Outros Total Percentual

45% 38%
5% 5% 7% 100%

Organizando Dados Categricos: tabela resumida


Exerccio: 20 alunos selecionados aleatoriamente de uma turma de Probabilidade e Estatstica indicaram a nfase que eles pretendem seguir. As respostas esto listadas abaixo. Construa uma tabela resumida para estes dados.
Comp Comp Amb Neuro Mec Mec Mec Mec Comp Mec Comp Comp Amb Comp Comp Amb Amb Telecom Mec Mec

Cap 2-11

Organizando Dados Categricos: tabela resumida


Soluo:
nfase Ambiental Computao Mecnica Neurocincias Telecomunicaes Frequncia absoluta 4 7 7 1 1 Frequncia relativa

0.2 0.35 0.35 0.05


0.05

Cap 2-12

Organizando Dados Categricos: grfico de barras

Em um grfico de barras, uma barra ilustra cada uma das categorias, cujo comprimento representa a quantidade, a frequncia ou o percentual de valores que se posicionam em uma determinada categoria.
Como voc vai passar as festas de final de ano?

Outras Colocando o trabalho em dia Turismo Viajando para visitar a familia Em casa com a familia 0%

7% 5% 5% 38% 45% 10% 20% 30% 40% 50%

Cap 2-13

Organizando Dados Categricos: o grfico de pizza

O grfico de pizza um crculo dividido em fatias que representam as categorias. O tamanho de cada fatia varia de acordo com a categoria.

Cap 2-14

Dicas
grfico de pizza:

Enfatizar a relevncia de uma categoria em relao ao total. Se as categorias no somam 100%, criar categoria extra para o restante.

Grfico de barras:

Pode comparar qualquer conjunto de quantidades medidas na mesma unidade. Mostrar categorias em ordem decrescente (ou crescente) ajuda a comparao visual entre categorias.
Cap 2-15

Organizando Dados Categricos: o diagrama de Pareto


Um grfico de barras cujas categorias so

apresentadas em ordem decrescente de frequncia

+
Um polgono acumulado representado no mesmo

grfico
Usado para separar:

poucos vitais (poucas categorias muito importantes) de muitos triviais (demais categorias com menor importncia)
Cap 2-16

Organizando Dados Categricos: o diagrama de Pareto


Exemplo: A tabela resumida abaixo lista os diferentes defeitos em um certo produto. Identifique os principais defeitos usando um diagrama de Pareto.
Defeito Pontos negros Avarias Manchas Marcas de pino Arranhes Marcas de moldagem Riscos Marcas de afundamento Marcas de tinta Deformidades Total Freqncia 413 1039 258 834 442 275 413 371 292 1987 6324
Cap 2-17

Organizando Dados Categricos: o diagrama de Pareto


Exemplo: O diagrama de Pareto contm um grfico de barras com alturas decrescentes e um grfico de percentagem acumulada:
Defeito Deformidades Freqncia Percentagem % Acumulada 1987 31% 31%

Avarias Marcas de pino


Pontos negros

1039 834
413

16% 13%
7% 7% 6% 5% 4% 4% 100%

47% 60%
67% 81% 87% 92% 96% 100%

Riscos 413 Marcas de afundamento 371 Marcas de tinta Manchas Marcas de moldagem Total 292 258 275 6324

Cap 2-18

Organizando Dados Categricos: o diagrama de Pareto


Exemplo: O diagrama de Pareto contm um grfico de barras com alturas decrescentes e um grfico de percentagem acumulada:
Defeito Deformidades Avarias Marcas de pino Arranhes Pontos negros Freqncia Percentagem 1987 1039 834 442 413 31% 16% 13% 7% 7%

Riscos
Marcas de afundamento Marcas de tinta Marcas de moldagem Manchas Total

413
371 292 275 258 6324

7%
6% 5% 4% 4% 100%
Cap 2-19

Organizando Dados Categricos: o diagrama de Pareto


Percentagem
35%
Defeito Freqncia Percentagem Pontos negros 413 7% Avarias 1039 16% Manchas 258 4% Marcas de pino 834 13% Arranhes 442 7% Marcas de moldagem 275 4% Riscos 413 7% Marcas de afundamento 371 6% Marcas de tinta 292 5% Deformidades 1987 31% Total 6324 100%

Diagrama de Pareto

% Acumulada
100% 90% 80% 70% 60% 50% 40% 30%

30% 25%

20%
15% 10% 5% 0%

20%
10% 0%

Defeito
Cap 2-20

Organizando Dados Categricos: tabela resumida


Exerccio: 20 alunos selecionados aleatoriamente de uma turma de Probabilidade e Estatstica indicaram a nfase que eles pretendem seguir. Os dados so apresentados na tabela resumida abaixo. Construa um diagrama de Pareto para estes dados.
nfase Ambiental Computao Mecnica Neurocincias Telecomunicaes Freq. 4 7 7 1 1 Percentual 0.2 0.35 0.35 0.05

0.05

Cap 2-21

Tipos de Grficos e Tabelas


Dados

Categricos

Numricos

Tabela Resumida

Grfico de Pizza

Rol

Disposio Ramo-e-Folha

Grfico de Barras

Diagrama de Pareto

Distribuio de Frequncia Polgono de Percentagem

Histograma

Polgono de Percentagem Acumulada


Cap 2-22

Organizando Dados Numricos: Rol

Um rol uma sequncia de dados ordenados de forma crescente ou descrescente. Turma diurna

Pesquisa com idade de estudantes universitrios

16 19 22 18 23

17 19 25 18 28

17 20 27 19 32

18 20 32 19 33

18 21 38 20 39

18 22 42 21 52
Cap 2-23

Turma noturna

Organizando Dados numricos: disposio ramo-e-folha

Uma disposio ramo-e-folha organiza dados em grupos (chamados de ramos ou caules) de tal modo que os valores em cada grupo (as folhas) se ramifiquem para a direita de cada linha.
Ramo
1

Folha
67788899

2 3
4

0012257 28
2

Cap 2-24

Organizando Dados numricos: disposio ramo-e-folha


Para construir um diagrama ramo-e-folha:
1)

separe cada observao (nmero) em:


Um ramo: composto de todos os dgitos menos o final; e Uma folha: composta pelo dgito final.

2)

Escreva os ramos em uma coluna vertical (do menor para o maior) sem pular nenhum nmero Escreva cada folha direita do ramo correspondente.

3)

Cap 2-25

Organizando Dados numricos: disposio ramo-e-folha

Exemplo: Construa um diagrama ramo-e-folha para a idade dos estudandes universitrios da turma diurna: 16, 17, 17, 18, 18, 19, 19, 20, 20, 21, 22, 22, 25, 27, 32, 38, 42 Turma Diurna
Ramo
1

Folha
67788899

2
3 4

0012257
28 2

Cap 2-26

Organizando Dados numricos: disposio ramo-e-folha

Exerccio: Construa um diagrama ramo-e-folha para a idade dos estudandes universitrios da turma noturna e compare com o da turma diurna. 18, 18, 19, 19, 20, 21, 23, 28, 32, 33, 39, 52
Turma Diurna Ramo
1 2 3 4

Turma Noturna Ramo


1 2 3 4 5 2
Cap 2-27

Folha
67788899 0012257 28 2

Folha
8899 0138 23

Tipos de Grficos e Tabelas


E se o nmero de dados na base for muito grande?? Ramo-e-folhas no conveniente...
Dados

Categricos

Numricos

Tabela Resumida

Grfico de Pizza

Rol

Disposio Ramo-e-Folha

Grfico de Barras

Diagrama de Pareto

Distribuio de Frequncia

Histograma

Polgono de Percentagem

Polgono de Percentagem Acumulada

Cap 2-28

Organizando Dados Numricos: distribuio de frequncia

A distribuio de frequncia uma tabela resumida na qual os dados so dispostos em grupos de classe ordenados numericamente. Ateno para selecionar o nmero apropriado de grupos de classe para a tabela: escolher a amplitude adequada para cada grupo de classe e os limites de cada grupo de classe, evitando sobreposies. Para determinar a amplitude de um intervalo de classe:

=
Cap 2-29

Organizando Dados Numricos: distribuio de frequncia


Exemplo: Um fabricante de isolante trmico selecionou aleatoriamente 20 dias no inverno e registrou a temperatura mxima do dia (em F)
24, 35, 17, 21, 24, 37, 26, 46, 58, 30, 32, 13, 12, 38, 41, 43, 44, 27, 53, 27

Para ter uma ideia melhor de como variam as temperaturas mximas, vamos construir uma tabela com distribuio de frequncia dos dados! Que classes vamos usar?
Cap 2-30

Organizando Dados Numricos: distribuio de frequncia


Reorganizar os dados em ordem crescente: 12, 13, 17, 21, 24, 24, 26, 27, 27, 30, 32, 35, 37, 38, 41, 43, 44, 46, 53, 58 Encontrar a amplitude: 58 - 12 = 46 Escolher o nmero de grupos: 5 (geralmente entre 5 e 15) Calcular o intervalo de classe (amplitude): 10 (aprox. 46/5)

Determinar os limites das classes: 10, 20, 30, 40, 50, 60


Contar observaes e designar a classes

Cap 2-31

Organizando Dados Numricos: distribuio de frequncia


Classe Frequncia Frequncia Relativa Percentagem (%)

[10,20) [20,30) [30,40) [40,50) [50,60) Total

3 6 5 4 2 20

0.15 0.30 0.25 0.20 0.10 1.00

15 30 25 20 10 100

Cap 2-32

Organizando Dados Numricos: Histograma


Um grfico com a distribuio de frequncia de dados

chamado de histograma.
Os limites de classe (ou pontos mdios de classes) so

mostrados no eixo horizontal.


O eixo vertical representa a frequncia, frequncia

relativa ou percentagem.
Barras de tamanho apropriado so usadas para representar

o nmero de observaes em cada classe.


Cap 2-33

Organizando Dados Numricos: Histograma


Classe Frequncia Frequncia Relativa

Percentagem 15 30 25 20 10 100

Os retngulos do histograma so "colados" para indicar que a varivel original contnua!

[10, 20) [20, 30) [30, 40) [40, 50) [50, 60] Total

3 6 5 4 2 20

.15 .30 .25 .20 .10 1.00

Histograma: Temperatura Diaria 8


Frequncia

6 4 2
0 5 15 25 35 45 55 Mais More
Temperatura Maxima Diaria (F)

Cap 2-34

Organizando Dados Numricos: Histograma


Quando for analisar um histograma observe: Um padro geral: forma, centro e disperso dos dados Valores atpicos: valor individual que est fora do padro geral. Quantas classes usar? A definio de classes pode alterar bastante o histograma. Ver: applet One variable Statistical Calculator do Moore. Os programas computacionais escolhem automaticamente usando frmula de sturges. Mas, se voc quiser, sempre pode escolher as classes.

Cap 2-35

Organizando Dados Numricos: polgono de percentagem


Um polgono de percentagem formado fazendo-

se com que o ponto mdio de cada classe represente os dados naquela classe e, depois, interligando-se a sequncia de pontos mdios em suas respectivas percentagens de classe.
Um polgono de percentagens acumuladas

(Ogivas) exibe a varivel de interesse ao longo do eixo X e a percentagem acumulada ao longo do eixo Y.
Cap 2-36

Organizando Dados Numricos: polgono de percentagem


Classe Frequncia Frequncia Relativa

Percentagem 15 30 25 20 10 100

[10, 20) [20, 30) [30, 40) [40, 50) [50, 60]

Total

3 6 5 4 2 20

.15 .30 .25 .20 .10 1.00

8
Frequncia

Poligono de Percentagens: Maxima Temperatura Diaria

(Em um polgono de percentagens o eixo vertical mostra a percentagem de todas as observaes por classe)

4
2

0 5 15 25 35 45 55 Temperatura Maxima Diaria (F) More

Cap 2-37

Organizando Dados Numricos: polgono de percentagem acumulada


Classe [10,20) [20,30) [30,40) [40,50) [50,60) Limite inferior 10 20 30 40 50 60 % Menor do que o Limite inferior 0 15 45 70 90
Percentagem Acum ulada

100

Ogiva: Maxima Temperatura Diaria


100 80 60 40 20 0

10

20

30

40

50

60

Temperatura Maxima Diaria (F)

Cap 2-38

Grficos e Tabelas para Duas Variveis


At agora analisamos apenas uma varivel separadamente. E se quisermos analisar a relao entre duas variveis?

Duas Variveis

Categricas

Numricas

Tabela de Contingncia

Grficos de barras paralelas

Grficos de Disperso

Grficos Temporiaas

Cap 2-39

Tabulaes Cruzadas: tabela de contingncia


Uma tabela de contingncia apresenta os resultados de duas

variveis categricas. As respostas combinadas so classificadas de tal modo que as categorias de uma varivel fiquem localizadas nas linhas enquanto as categorias da outra varivel ficam localizadas nas colunas.
Os valores localizados nas interseces de linhas e colunas so

chamados de clulas. Clulas podem conter:


Frequncias absolutas Percentagens Percentagens por linha ou por coluna.

Cap 2-40

Tabulaes Cruzadas: tabela de contingncia


Exemplo: Uma pesquisa foi realizada para determinar a importncia de uma marca para consumidores em comparao a anos anteriores. Os resultados por gnero so apresentados abaixo:
Sexo Importncia da marca Maior Menor ou igual Total Masculino 450 3300 3750 Feminino 300 3450 3750 Total 750 6750 7500

Quais so as variveis? Quais so as categorias de cada varivel?


Cap 2-41

Tabulaes Cruzadas: grfico de barras paralelas

Cap 2-42

Grficos de Disperso
Grficos de Disperso so usados examinar possveis relaes entre duas variveis numricas. Uma varivel medida no eixo vertical e a outra no eixo horizontal.

Cap 2-43

Grfico de Disperso
Volume por dia 23 26 29 Custo por dia 125 140 146

33
38 42

160
167 170

50
55 60

188
195 200

Cap 2-44

Sries Temporais
Um grfico de sries temporais usado para

estudar padres nos valores de uma varivel numrica ao longo do tempo. Cada valor inserido no grfico como um ponto de duas dimenses com o perodo de tempo no eixo X e a varivel de interesse no eixo Y.

Cap 2-45

Exemplo de Sries Temporais


Nmero de pessoas (em milhes) que visitaram um parque de diverses nos EUA de 2000 a 2005. Ano Nmero de pessoas 2000 317 2001 319 2002 324 2003 322 2004 328 2005 335

Represente graficamente a evoluo do nmero de visitantes ao parque de diverses nos anos indicados.

Cap 2-46

Exemplo de Sries Temporais

Cap 2-47

Princpios de Grficos
O grfico no deve distorcer os dados. O grfico no deve conter adornos desnecessrios

(tambm conhecidos como sucata de grficos). A escala do eixo vertical deve sempre comear no zero (ou indicar o corte). Todos os eixos devem ser nomeados. Um grfico deve conter um ttulo. O grfico mais simples possvel deve ser utilizado para um dado conjunto de dados.

Cap 2-48

Erros Grficos: Sucatas


M apresentao

Boa apresentao

Salrio Mnimo
1960: $1.00 1970: $1.60

Salrio Mnimo

2
1980: $3.10

0
1990: $3.80

1960

1970

1980

1990

Cap 2-49

Erros Grficos: Eixo Vertical Comprimido


M apresentao
Vendas Trimestrais
$
200 100 0 T1 T2 50

Boa apresentao
Vendas Trimestrais

25
0

T3

T4

T1

T2

T3

T4

Cap 2-50

Erros Grficos: Eixo vertical no possui zero


M Apresentao
$ 45 42 39 36 J F M A M J Vendas Mensais

45 42 39 36
0

Boa Apresentao
Vendas Mensais

Grfico para vendas no primeiro semestre

Cap 2-51

Resumo
Nesta parte, nos vimos: Como organizar dados categricos usando tabela resumida, grfico de barras, grfico de pizza e o digrama de Pareto.
Como organizar dados numricos usando rol,

diagrama ramo-e-folhas, distribuio de frequncias, histograma, polgono de frequncia e ogiva.


Como examinar tabulaes cruzadas usando tabela

de contigncia e grficos de barras paralelas.

Cap 2-52

Resumo
Nesta parte, nos vimos: Como utilizar grfico de disperso e grfico de sries temporais.
O que fazer e o que no fazer para ter grficos com

boa apresentao.

Cap 2-53

Perguntas recapitulativas
1.

2.
3.

4.

Quais so as vantagens e desvantagens relativas a utilizao de um grfico de barras, um grfico de pizza e um diagrama de Pareto? Compare um grfico de barras para dados categricos e um histograma para dados numricos. Qual a diferena entre um grfico de disperso e um grfico de sries de tempo? Aponte alguns erros clssicos de m utilizao de grficos.

Cap 2-54