Anda di halaman 1dari 43

Aula 2

Estatstica Descritiva
Parte I
Organizao dos dados
Dsitribuio de frequncias

2. Organizao dos dados


Considere a seguinte situao.
Voc desenvolveu um novo antivrus e
instalou em 20 computadores para testar a
sua eficcia.

Aps a instalao do programa voc anotou


o nmero de vrus capturados em cada
computador analisado.

45, 41, 42, 41, 42, 43,


44, 41 , 50, 46, 50, 46, 60,
54, 52, 58, 57, 58, 60,
51

A coleta de dados o incio da anlise


estatstica, pois fornece o material bruto que
se quer estudar.
funo do pesquisador transformar os
dados brutos em um conjunto organizado de
informaes.

Como organizar e apresentar os


dados obtidos no seu
A organizaoexperimento?
e apresentao dos dados
pode
ocorrer,
basicamente,
de
duas
maneiras:

apresentao tabular: uma


apresentao numrica dos dados em
linhas e colunas distribudas de modo
ordenado, segundo regras prticas
fixadas pelo Conselho Nacional de
Estatstica.
apresentao grfica: constitui uma
apresentao
geomtrica
permitindo

3. Tabela de distribuio de
frequncias
Um procedimento inicial para organizar e
agrupar os dados dispersos referentes a
uma varivel atravs de uma : TABELA
DE DISTRIBUIO DE FREQUNCIAS

Tabela de distribuio de
frequncias um instrumento
que resume a informao contida
na amostra, referente a uma dada
varivel, ordenando os valores e
agrupando-os em classes.
A tabela de distribuio de
frequncias pode ser utilizada
para organizar dados referentes a
variveis
quantitativas
ou
qualitativas.

3.1 Tabela de distribuio de


frequncias varivel qualitativa
Para construir uma distribuio de frequncias
dos dados de uma varivel qualitativa basta
contar a quantidade de resultados observados
em cada categoria.
Como exemplo admita uma pesquisa que tem
por objetivo descrever o grau de instruo dos
tcnicos em informatica de sua cidade.

Para tanto,
tcnicos:

pesquisador

perguntou

118

Qual o seu grau de instruo?


As opes de resposta foram: (
) ensino
fundamental
(
) tcnico em
informtica
( ) superior

As respostas obtidas encontram-se resumidas na


tabela de distribuio de frequncias abaixo
Distribuio de freqncia do grau de instruo dos
tcnicos em informtica na cidade de Parnaba.
Freqncia Absoluta Freqncia Relativa
(%)

Ensino
fundamenta
l
110
93,22

Tcnico em
informtica

5,93

3.2 Tabela de distribuio de


frequncias varivel quantitativa
A Tabela de distribuio de frequncias
associada a uma varivel quantitativa
pode ser classificada de duas formas
Tabela de frequncias para dados no
agrupados em classes com intervalos.

Tabela de frequncias para dados


agrupados em classes com intervalos

3.2.1 Tabela de distribuio de


frequncias para dados agrupados SEM
intervalos de classes.
a simples condensao dos dados
conforme as repeties de seu valores.

Retornado ao exemplo de testar a


eficccia de um antivirus, a
organizao dos 20 dados referentes varivel nmero de
vrus capturados pelo programa
- em uma tabela de distribuio de
frequncias
com
dados
no
agrupados em intervalos de classes
segue o seguinte procedimento:

1) ROL: a ordenao dos dados (crescente


ou decrescente).
No exemplo dado anteriormente
45, 41, 42, 41, 42 43, 44, 41 ,50, 46, 50,
46, 60, 54, 52, 58, 57, 58, 60, 51
ROL
Ex : 41, 41, 41, 42, 42 43, 44, 45 ,46, 46,
50, 50, 51, 52, 54, 57, 58, 58, 60, 60

2) Contagem do nmero de ocorrncias ou


frequncia de cada valor observado
Valores observados
41
42
43
44
45
46
50
51
52
54
57
58
60

3
2
1
1
1
2
2
1
1
1
1
2
2

Freqncia

Existem situaes em que organizar os dados


em uma tabela de distribuio de frequncias
para dados no agrupados em intervalos
torna-se invivel, simplesmente porque o
banco de dados composto por um grande
nmero de dados
Isto
muito distintos.
comum
em
variveis
quantitativas contnuas:
Altura
Peso
Temperatura
Assim, para facilitar a anlise dos dados,
convm organiz-los em um tabela de
distribuio de frequncias para dados
agrupados em classes com intervalos.

3.2.2
Tabela
de
distribuio
de
frequncias para dados agrupados EM
intervalos de classes.
a) Elementos de uma distribuio de
frequncias com intervalos de classe:
i) CLASSES
So os intervalos de variao da varivel.
Cada classe simbolizada por i e o nmero
total de classes simbolizado por k.

Ex: na tabela abaixo k = 5 e 49 |------- 53 a


3 classe, onde i = 3

b) Como definir o nmero de classes?


i) REGRA DE STURGES para determinao
do nmero de classes:
Essa regra estabelece que o nmero de
classes igual a:
k = 1 + 3,3 log n
sendo k = nmero de classes e n = n total
de observaes
Exemplo:
a) Se o nmero de observaes for 500:
n = 500
k = 1 + 3,3 log(500) = 1 + 3,3(2,699) =
9,907
k = 9,907 ou arredondando k = 10

ii) Regra do Quadrado:


K = n
K = 500 > 20
Os valores encontrados por meio dos
mtodos sugeridos no so prximos. Qual
a melhor regra?
Na prtica, o pesquisador deve utilizar o
bom senso. As regras apenas auxiliam na
deciso.

Uma regra de bolso diz que as tabelas de


distribuio de freqncias devem ter de 5
a 20 classes, pois abaixo de 5 est se
perdendo informao preciosa diluda nas
classes e acima de 30 o nvel de
detalhamento torna-se exagerado e pouco
eficaz. Alguns autores sugerem que a
distribuio intervalar tenha de 5 at 16
classes .

c) Limites das classes


So os extremos de cada classe. O menor
nmero o limite inferior de classe (l) e o
maior nmero, limite superior de classe(L).
Ex: em 49 |------- 53... l3= 49 e L3= 53.
O smbolo |------- representa um intervalo
fechado esquerda e aberto direita.

O dado 53 do ROL no pertence classe


3 e sim classe 4 representada por 53
|------- 57.

d) Amplitude do intervalo de classe (hi)


a diferena entre o limite superior e o
limite inferior de uma classe simbolizada
por hi = Li - li.
Ex: na tabela anterior hi= 53 - 49 = 4.
Obs: Na distribuio de freqncia c/ classes
hi ser igual em todas as classes.
h > AA/k.
No exemplo: AA/k= 19/5 = 3,8 .
Obs1: Como h > AA/i um valor
ligeiramente superior para haver folga na
ltima classe. Utiliza-se

e) Amplitude total da distribuio


a diferena entre o limite superior da
ltima classe e o limite inferior da
primeira classe.
AT = L(max) - l(min).
Ex: na tabela
AT = 61 - 41= 20.

f) Amplitude total da amostra


a diferena entre o valor mximo e o
valor mnimo da amostra (ROL). Onde AA =
Xmax - Xmin.
Ex: AA = 60 - 41 = 19.
Obs: AT sempre ser maior que AA.

g) Ponto mdio de classe


o ponto que divide o intervalo de classe
em duas partes iguais.
Ex: em 49 |------- 53
o ponto mdio x3 = (53+49)/2 = 51, ou
seja,
x3 = (l3+L3)/2.

4 Mtodo prtico para construo


de uma dist. De frequncias c/
classe
1 - Organize os dados brutos em um ROL.
2 - Calcule a amplitude amostral AA.
No nosso exemplo: AA =60 - 41 =19
3 - Calcule o nmero de classes (k) {k =
n1/2}
4 - Decidido o n de classes calcule a

5 - Temos ento o menor n da amostra, o


n de classes e a amplitude do intervalo.
Podemos montar a tabela, com o cuidado
para no aparecer classes com freqncia =
0 (zero).
No nosso exemplo: o menor dado da
amostra = 41, h = 4
Logo a primeira classe ser representada
por
41 |------- 45.
As classes seguintes respeitaro o mesmo
procedimento.

Definidas as classes da tabela as colunas


seguintes
sero
representadas
pelas
seguintes frequncias:
1.Frequncia
2.Frequncia
3.Frequencia
4.Frequncia

absoluta
relativa
acumulada absoluta
acumulada relativa

5 Tipos de frequncias
Frequncia simples ou absoluta (fi): o
nmero de observaes de um valor
individual (ou de uma classe).
Classes
41
45
49
53
57
Total

45
49
53
57
61

Frequncia
Frequncia
relativa
absoluta (fi)
(fr)
7
3
4
1
5
20

35
15
20
5
25
100

Frequncia
acumulada
(fac)
7
10
14
15
20

Frequncia
acumulada
relativa
(facr)
35
50
70
75
100

A soma das freqncias simples igual


ao nmero total dos dados da
distribuio.

Frequncia relativa (fr): representa a


proporo de observaes de um valor
(ou de uma classe) em relao ao
nmero total de observaes.
Classes
41
45
49
53
57
Total

Frequncia
Frequncia
relativa
absoluta (fi)
(fr)

45
49
53
57
61

Fr = fi/fi *100

7
3
4
1
5
20

35
15
20
5
25
100

Frequncia
acumulada
(fac)
7
10
14
15
20

Frequncia
acumulada
relativa
(facr)
35
50
70
75
100

A soma das freqncias relativas


igual a 1 (100 %).

Frequncia acumulada absoluta (faci):


a soma de todas as frequncias
absolutas abaixo do limite superior de
uma classe considerada.
F4 = f1 + f2 + f3 + f4 = 7 + 3 + 4 + 1 = 15

Classes
41
45
49
53
57
Total

45
49
53
57
61

Frequncia
Frequncia
relativa
absoluta (fi)
(fr)
7
3
4
1
5
20

35
15
20
5
25
100

Frequncia
acumulada
(fac)
7
10
14
15
20

Frequncia
acumulada
relativa
(facr)
35
50
70
75
100

Freqncia acumulada relativa de um


classe (Fri): a freqncia acumulada da
classe, dividida pela freqncia total da
distribuio.
Fri = Fi/Fi *100

Classes
41
45
49
53
57
Total

45
49
53
57
61

Frequncia
Frequncia
relativa
absoluta (fi)
(fr)
7
3
4
1
5
20

35
15
20
5
25
100

Frequncia
acumulada
(fac)
7
10
14
15
20

Frequncia
acumulada
relativa
(facr)
35
50
70
75
100

6 Representao grfica de uma


distribuio de frequncias

Histograma

Polgono de freqncia

Ogiva

Em todos os grficos citados utilizamos o


primeiro quadrante do sistema de eixos
coordenados cartesianos ortogonais.
Na linha horizontal (eixo das abscissas)
colocamos os valores da varivel e na
linha vertical (eixo das ordenadas), as
freqncias.

Histograma
formado por um conjunto de retngulos
justapostos, cujas bases se localizam sobre
o eixo horizontal, de tal modo que seus
pontos mdios coincidam com os pontos
mdios dos intervalos de classe.
A rea de um histograma proporcional
soma das freqncias simples ou absolutas.

Polgono de freqncia
um grfico em linha, sendo as freqncias
marcadas sobre perpendiculares ao eixo
horizontal, levantadas pelos pontos mdios
dos intervalos de classe.
Para realmente obtermos um polgono (linha
fechada), devemos completar a figura,
ligando os extremos da linha obtida aos
pontos mdios da classe anterior primeira
e da posterior ltima, da distribuio.

Ogiva
o grfico usado na representao grfica
da distribuio de freqncias acumuladas
de uma varivel contnua.
Para a construo da ogiva, so usadas as
freqncias acumuladas (absolutas ou
relativas) no eixo vertical e os limites
superiores de classe no eixo horizontal.

Resolva exerccios referentes a esta


unidade.