Anda di halaman 1dari 48

Aula 2 Estatstica Descritiva Parte I Organizao dos dados Dsitribuio de frequncias

1. Introduo

2. Organizao dos dados


Considere a seguinte situao. Voc desenvolveu um experimento em 20 ps de milho cultivados em casa de vegetao, para testar o efeito de um inseticida orgnico sobre pulges.

Aps quatro dias de aplicao do inseticida voc anotou o nmero de pulges mortos em cada planta.

45, 41, 42, 41, 42, 43, 44, 41 , 50, 46, 50, 46, 60, 54, 52, 58, 57, 58, 60, 51

Relembrando a aula passada ...

Qual a unidade de observao?


Qual a varivel em anlise? Qual a natureza da varivel em anlise?

Retornando aula de hoje ...

Ao anotar o nmero de pulges mortos em cada p de milho voc realizou uma coleta de dados. A coleta de dados o incio da anlise estatstica, pois fornece o material bruto que se quer estudar. funo do pesquisador transformar os dados brutos em um conjunto organizado de informaes.

Como organizar e apresentar os dados obtidos no seu experimento?


A organizao e apresentao dos dados pode ocorrer, basicamente, de duas maneiras: apresentao tabular: uma apresentao numrica dos dados em linhas e colunas distribudas de modo ordenado, segundo regras prticas fixadas pelo Conselho Nacional de Estatstica.

apresentao grfica: constitui apresentao geomtrica permitindo viso rpida e clara do fenmeno.

uma uma

3. Tabela de distribuio de frequncias


Um procedimento inicial para organizar e agrupar os dados dispersos referentes a uma varivel atravs de uma : TABELA DE DISTRIBUIO DE FREQUNCIAS

Tabela de distribuio de frequncias um instrumento que resume a informao contida na amostra, referente a uma dada varivel, ordenando os valores e agrupando-os em classes. A tabela de distribuio de frequncias pode ser utilizada para organizar dados referentes a variveis quantitativas ou qualitativas.

3.1 Tabela de distribuio de frequncias varivel qualitativa


Para construir uma distribuio de frequncias dos dados de uma varivel qualitativa basta contar a quantidade de resultados observados em cada categoria. Como exemplo admita uma pesquisa que tem por objetivo descrever como os produtores de mamona realizam a adubao ou trato nutricional do solo antes do plantio dessa oleaginosa.

Para tanto, o pesquisador perguntou a 118 produtores: Que tipo de adubao realiza antes do plantio da mamona? As opes de resposta foram: ( ) sem adubao ( ) adubao qumica ( ) adubao orgnica

As respostas obtidas encontram-se resumidas na tabela de distribuio de frequncias abaixo Distribuio de freqncia dos produtores de mamona em relao ao trato nutricional da terra. Freqncia Absoluta Freqncia Relativa (%) 110 93,22

Sem adubao Orgnica Qumica Total Fonte: Dados da pesquisa.

7 1 118

5,93 0,84 100,00

3.2 Tabela de distribuio de frequncias varivel quantitativa A Tabela de distribuio de frequncias associada a uma varivel quantitativa pode ser classificada de duas formas

Tabela de frequncias para dados no agrupados em classes com intervalos.

Tabela de frequncias para dados agrupados em classes com intervalos

3.2.1 Tabela de distribuio de frequncias para dados agrupados SEM intervalos de classes.

a simples condensao dos dados conforme as repeties de seu valores.

Retornado ao seu experimento com insetida orgnico para combater pulges em ps de milho, a organizao dos 20 dados - referentes varivel nmero de pulges mortos - em uma tabela de distribuio de frequncias com dados no agrupados em intervalos de classes segue o seguinte procedimento:

1) ROL: a ordenao dos dados (crescente ou decrescente).


No exemplo dado anteriormente 45, 41, 42, 41, 42 43, 44, 41 ,50, 46, 50, 46, 60, 54, 52, 58, 57, 58, 60, 51 ROL Ex : 41, 41, 41, 42, 42 43, 44, 45 ,46, 46, 50, 50, 51, 52, 54, 57, 58, 58, 60, 60

2) Contagem do nmero de ocorrncias ou frequncia de cada valor observado


Valores observados Freqncia 41 3 42 2 43 1 44 1 45 1 46 2 50 2 51 1 52 1 54 1 57 1 58 2 60 2

Existem situaes em que organizar os dados em uma tabela de distribuio de frequncias para dados no agrupados em intervalos torna-se invivel, simplesmente porque o banco de dados composto por um grande nmero de dados distintos. Isto muito comum em variveis quantitativas contnuas: Altura Peso Temperatura Assim, para facilitar a anlise dos dados, convm organiz-los em um tabela de distribuio de frequncias para dados agrupados em classes com intervalos.

3.2.2 Tabela de distribuio de frequncias para dados agrupados EM intervalos de classes.

a) Elementos de uma distribuio frequncias com intervalos de classe: i) CLASSES So os intervalos de variao da varivel.

de

Cada classe simbolizada por i e o nmero total de classes simbolizado por k.

Ex: na tabela abaixo k = 5 e 49 |------- 53 a 3 classe, onde i = 3


Intervalos de Classe 41 45 45 49 49 53 53 57 57 61 Total Frequncias 7 3 4 1 5 20

b) Como definir o nmero de classes? i) REGRA DE STURGES para determinao do nmero de classes: Essa regra estabelece que o nmero de classes igual a: k = 1 + 3,3 log n sendo k = nmero de classes e n = n total de observaes Exemplo: a) Se o nmero de observaes for 500: n = 500 k = 1 + 3,3 log(500) = 1 + 3,3(2,699) = 9,907 k = 9,907 ou arredondando k = 10

ii) Regra do Quadrado:


K = n K = 500 > 20 Os valores encontrados por meio dos mtodos sugeridos no so prximos. Qual a melhor regra? Na prtica, o pesquisador deve utilizar o bom senso. As regras apenas auxiliam na deciso.

Uma regra de bolso diz que as tabelas de distribuio de freqncias devem ter de 5 a 20 classes, pois abaixo de 5 est se perdendo informao preciosa diluda nas classes e acima de 30 o nvel de detalhamento torna-se exagerado e pouco eficaz. Alguns autores sugerem que a distribuio intervalar tenha de 5 at 16 classes .

c) Limites das classes


So os extremos de cada classe. O menor nmero o limite inferior de classe (l) e o maior nmero, limite superior de classe(L). Ex: em 49 |------- 53... l3= 49 e L3= 53. O smbolo |------- representa um fechado esquerda e aberto direita. intervalo

O dado 53 do ROL no pertence classe 3 e sim classe 4 representada por 53 |------- 57.

Classes 41 45 45 49 49 53 53 57 57 61 Total

Frequncias 7 3 4 1 5 20

d) Amplitude do intervalo de classe (hi)


a diferena entre o limite superior e o limite inferior de uma classe simbolizada por hi = Li - li. Ex: na tabela anterior hi= 53 - 49 = 4. Obs: Na distribuio de freqncia c/ classes hi ser igual em todas as classes.

e) Amplitude total da distribuio

a diferena entre o limite superior da ltima classe e o limite inferior da primeira classe. AT = L(max) - l(min). Ex: na tabela AT = 61 - 41= 20.
Classes 41 45 45 49 49 53 53 57 57 61 Total Frequncias 7 3 4 1 5 20

f) Amplitude total da amostra


a diferena entre o valor mximo e o valor mnimo da amostra (ROL). Onde AA = Xmax Xmin. Ex: AA = 60 - 41 = 19. Obs: AT sempre ser maior que AA.

g) Ponto mdio de classe o ponto que divide o intervalo de classe em duas partes iguais. Ex: em 49 |------- 53 o ponto mdio x3 = (53+49)/2 = 51, ou seja, x3 = (l3+L3)/2.

4 Mtodo prtico para construo de uma dist. De frequncias c/ classe


1 - Organize os dados brutos em um ROL.
2 - Calcule a amplitude amostral AA. No nosso exemplo: AA =60 - 41 =19

3 - Calcule o nmero de classes (k) {k = n1/2}

4 - Decidido o n de classes calcule a amplitude do intervalo de classe h > AA/k. No exemplo: AA/k= 19/5 = 3,8 . Obs1: Como h > AA/i um valor ligeiramente superior para haver folga na ltima classe. Utiliza-se h=4

Obs2: Relembrando, qualquer regra para determinao do n de classes da tabela no nos leva a uma deciso final; esta vai depender, na realidade de um julgamento pessoal, que deve estar ligado natureza dos dados.

No exemplo: n = 20 dados, ento , em princpio, a regra sugere a adoo de 5 classes.

5 - Temos ento o menor n da amostra, o n de classes e a amplitude do intervalo. Podemos montar a tabela, com o cuidado para no aparecer classes com freqncia = 0 (zero).
No nosso exemplo: o menor dado da amostra = 41, h = 4 Logo a primeira classe ser representada por 41 |------- 45. As classes seguintes respeitaro o mesmo procedimento.

Definidas as classes da tabela as colunas seguintes sero representadas pelas seguintes frequncias:
1. 2. 3. 4. Frequncia absoluta Frequncia relativa Frequencia acumulada absoluta Frequncia acumulada relativa

5 Tipos de frequncias
Frequncia simples ou absoluta (fi): o nmero de observaes de um valor individual (ou de uma classe).
Classes 41 45 45 49 49 53 53 57 57 61 Total Frequncia absoluta (fi) 7 3 4 1 5 20 Frequncia relativa (fr) 35 15 20 5 25 100 Frequncia acumulada (fac) 7 10 14 15 20 Frequncia acumulada relativa (facr) 35 50 70 75 100

A soma das freqncias simples igual ao nmero total dos dados da distribuio.

Frequncia relativa (fr): representa a proporo de observaes de um valor (ou de uma classe) em relao ao nmero total de observaes.
Classes 41 45 45 49 49 53 53 57 57 61 Total Frequncia absoluta (fi) 7 3 4 1 5 20 Frequncia relativa (fr) 35 15 20 5 25 100 Frequncia acumulada (fac) 7 10 14 15 20 Frequncia acumulada relativa (facr) 35 50 70 75 100

Fr = fi/fi *100

A soma das freqncias relativas igual a 1 (100 %).

Frequncia acumulada absoluta (faci): a soma de todas as frequncias absolutas abaixo do limite superior de uma classe considerada. F4 = f1 + f2 + f3 + f4 = 7 + 3 + 4 + 1 = 15

Classes
41 45 45 49 49 53 53 57 57 61 Total

Frequncia absoluta (fi) 7 3 4 1 5 20

Frequncia relativa (fr) 35 15 20 5 25 100

Frequncia acumulada (fac) 7 10 14 15 20

Frequncia acumulada relativa (facr) 35 50 70 75 100

Freqncia acumulada relativa de um classe (Fri): a freqncia acumulada da classe, dividida pela freqncia total da distribuio.
Fri = Fi/Fi *100
Frequncia absoluta (fi) 7 3 4 1 5 20 Frequncia relativa (fr) 35 15 20 5 25 100 Frequncia acumulada (fac) 7 10 14 15 20 Frequncia acumulada relativa (facr) 35 50 70 75 100

Classes 41 45 45 49 49 53 53 57 57 61 Total

Concluindo, uma distribuio de frequencias permite diferentes anlises. No exemplo do nmero de pulges mortos em cada p de milho: total de plantas com o maior nmero de pulges mortos; Quantas plantas esto em determinado intervalo; O percentual de plantas contidas em determinado intervalo;
O

percentual acumulado de plantas at um determinado nmero de pulges mortos.

6 Representao grfica distribuio de frequncias

de

uma

Histograma

Polgono de freqncia

Ogiva

Em todos os grficos citados utilizamos o primeiro quadrante do sistema de eixos coordenados cartesianos ortogonais. Na linha horizontal (eixo das abscissas) colocamos os valores da varivel e na linha vertical (eixo das ordenadas), as freqncias.

Histograma formado por um conjunto de retngulos justapostos, cujas bases se localizam sobre o eixo horizontal, de tal modo que seus pontos mdios coincidam com os pontos mdios dos intervalos de classe. A rea de um histograma proporcional soma das freqncias simples ou absolutas.

8 7 6
Frequncia absoluta

4 3
2 1 0
Nmero de pulges mortos

Polgono de freqncia
um grfico em linha, sendo as freqncias marcadas sobre perpendiculares ao eixo horizontal, levantadas pelos pontos mdios dos intervalos de classe. Para realmente obtermos um polgono (linha fechada), devemos completar a figura, ligando os extremos da linha obtida aos pontos mdios da classe anterior primeira e da posterior ltima, da distribuio.

40
35

Frequncia relativa

30 25 20 15 10 5

Nmero de pulges mortos

Ogiva o grfico usado na representao grfica da distribuio de freqncias acumuladas de uma varivel contnua.

Para a construo da ogiva, so usadas as freqncias acumuladas (absolutas ou relativas) no eixo vertical e os limites superiores de classe no eixo horizontal.

25 Frequncia Acumulada 20 15 10 5 0 43 47 51 55 59

Nmero de pulges mortos

Resolva exerccios referentes a esta unidade.

Anda mungkin juga menyukai