Anda di halaman 1dari 14

Cap tulo 1 Estat stica Descritiva

1.1
1.1.1

Introduo ca
Estat stica
A palavra estat stica deriva do latim statuse tem dois signicados distin-

tos. Frequentemente usado no plural, o termo estat stica designa todo conjunto coerente de dados numricos relativos a um grupo de indiv e duos. Assim, por exemplo, pode-se falar estat sticas de produo industrial (quantidades produzidas, ca custos de produao, preos de venda, etc), de estat c c sticas demogrcas (natalidade, a mortalidade), de estat sticas de desemprego, de acidentes de estrada, etc. Por outro lado, a palavra estat stica designa tambm, o conjunto de mtodos e e que permitem reunir e analisar dados de observao. ca De acordo com Fisher - A Estat stica a matemtica aplicada a dados de e a observao. Ela tem por objetivo os mtodos cient ca e cos para coleta, organizaao, c resumo, apresentaao e anlise de dados, bem como a obtenao de concluses vlidas c a c o a a serem utilizadas nas tomadas de decises. o Assim todo estudo estat stico pode ser decomposto em pelo menos duas fases: i

ii - a reunio ou coleta dos dados estat a sticos; - sua anlise e interpretaao a c A coleta de dados pode ser realizada de duas formas: - por simples observaao dos fenmenos em que se tem interesse; c o - por experimentao, ou seja, provocando-se voluntariamente a apariao de cerca c tos fenmenos controlados. o Quanto ` anlise estat a a stica pode ser decomposta em duas etapas, uma dedutiva ou descritiva e a outra indutiva. A Estat stica Descritiva tem por objetivo resumir e apresentar os dados observados sob a forma de: - tabelas (descriao tabular); c - grcos (descrio grca); a ca a - parmetros e suas estimativas (descriao paramtrica). a c e A Inferncia Estat e stica permite estender ou generalizar dentro de certas condioes as concluses obtidas. Frequentemente, a observao ou a experimentao c o ca ca relativa a apenas uma fraao dos indiv e c duos em que se tem interesse. As concluses o relativas a esta fraao, chamada amostra, devem, ento, ser estendidas tanto quanto c a poss ao conjunto de indiv vel duos que formam a populaao. Esta fase indutiva c comporta evidentemente certos riscos de erro, que podem ser medidos atravs da e teoria das probabilidades. Quando em um estudo trabalha-se com amostras tem-se uma pesquisa por amostragem. Quando se utiliza a populao toda tem-se o censo. ca As diferentes etapas de todo estudo estat stico no so, entretanto, indepena a dentes.

iii

1.1.2

Variveis a
Varivel uma medida ou classicao obtida de cada elemento da populaao a e ca c

ou amostra. A representao de dados torna-se mais fcil atravs da utilizaao de ca a e c variveis. Assim, por exemplo, considerando a caracter a stica(varivel) estado civil, a para cada empregado pode-se associar uma das realizaes, solteiro, casado. Pode-se co atribuir uma letra, digamos X, para representar tal varivel. Outros exemplos de a variveis podem ser: Y: Grau de Instruo, Z: Nmero de Filhos, K: Salrio. J: a ca u a Idade, etc. Os tipos de variveis mais comumente utilizadas na descriao de dados so: a c a discretas Quantitativas cont nuas Variveis a nominais Qualitativas ordinais

a) Variveis quantitativas: representam quantidades. Podem ser de naa tureza discreta ou cont nua. So de natureza discreta as variveis cujos poss a a veis valores formam um conjunto nito ou enumervel de nmeros, e que resultam, frequentemente, de uma a u contagem, como por exemplo nmero de lhos (0, 1, 2, ...), quantidade de falhas por u pea em determinada linha de produao, etc. c c So de natureza cont a nua as variveis que podem assumir qualquer valor em a um intervalo, como por exemplo, estatura e peso de um indiv duo. b)Variveis qualitativas: descrevem categorias, qualidades. Podem ser a de natureza ordinal ou nominal. So de natureza nominal quando no existe nenhum tipo de ordenao nas a a ca poss veis realizaoes, como por exemplo, estado civil. c

iv So de natureza ordinal quando existe uma ordem nos seus resultados, como a por exemplo grau de instruo. ca

1.1.3

Somatrio o
E uma notao bastante utilizada dentro da estat ca stica. Ex: Seja X: Nmero de moradores por residncia de uma amostra de 15 u e

alunos da UFPI Nmero de Moradores u 1 2 3 x1 = 3, x2 = 5,x3 = 7 ento, a amostra total obtida por: a e
3

Frequncia e 3 5 7

P = x1 + x2 + x3 =
i=1

xi = 15

1.1.4

Estat stica Descritiva


Conforme j visto tem por objetivo resumir e apresentar dados observaao a c

(populaao ou amostra), de modo a simplicar sua interpretao atravs de: c ca e - Descrio Tabular; ca - Descrio Grca; ca a - Descrio Paramtrica. ca e

1.1.5

Descrio tabular ca
A representao tabular feita atravs de tabelas. Uma tabela deve apreca e e

sentar a seguinte estrutura: - cabealho c

v - corpo - rodap e O cabealho deve conter o suciente para que sejam respondidas as c questes: o - O qu? (fato) e - Onde? (lugar) - Quando? (poca) e O corpo apresentado por colunas e sub-colunas dentro das quais sero e a registrados os dados. O rodap reservado para as observaoes pertinentes, bem como para a e e c identicaao da fonte dos dados. c Conforme critrio de agrupamento as tabelas podem representar diversas e sries. Assim: e a) Srie Cronolgica ou Temporal (Evolutiva ou Histrica): os dados so e o o a observados segundo a poca de ocorrncia. Por exemplo: e e Tabela 1.1: Populao Brasileira - 1940-1970 ca Ano 1940 1950 1960 1970
Fonte: Anurio Estat a stico 1974.

Populao ca 41.236.315 51.944.397 70.119.071 93.139.037

b) Srie Geogrca ou de Localizao: os dados so observados segundo a e a ca a localidade de ocorrncia. Por exemplo: e

vi Tabela 1.2: Empresas Fiscalizadas em 1973 Regies o Norte Nordeste Sudeste Sul Centro-Oeste
Fonte: Mensrio Estat a stico 259/260.

Empresas scalizadas 7.495 107.783 281.207 53.661 15.776

c) Srie Espec e ca:

os dados so agrupados segundo a modalidade de a

ocorrncia. Por exemplo: e Tabela 1.3: Matr cula no Ensino de Terceiro Grau Brasil - 1975 Areas de Ensino Matr culas Cincias Biolgicas e o Cincias Exatas e Tecnologia e Cincias Agrrias e a Cincias Humanas e Letras Artes Duas ou mais reas a
Fonte: Servio de Estat c stica da Educao e Cultura. ca

32.109 65.949 2.419 148.842 9.883 7.464 16.323

vii d) Distribuio de Frequncias: os dados so agrupados com suas respectivas ca e a frequncias absolutas. e - Para varivel discreta, temos como por exemplo: a Tabela 1.4: Nmeros de Acidente por Dia na Rodovia X em Janeiro de 1977. u
Nmero de acidentes por dia u 0 1 2 3 4 5
Fonte: DNER.

Nmero de dias u 10 7 4 5 3 2

- Para varivel cont a nuo, temos como por exemplo: Tabela 1.5: Altura dos Alunos da Classe em Maro de 1977. c Alturas (m) 1,50 1,60 1,70 1,80 1,60 1,70 1,80 1,90 Nmero de alunos u 5 15 17 3

Fonte: Secretaria da Escola.

1.1.6

Descrio Grca ca a

A descrio grca, dentre outras, pode ser feita de trs formas: ca a e a) Grco de colunas a

viii
Nmero de polinizadores observados

Nmero de visitas

10

15

20

25

30

08:0010:00

10:0012:00

12:0014:00

14:0016:00

Horrio

Figura 1.1: Nmero de polinizadores observados. u Observao: ca Podem ser obtidos grcos semelhantes considerando-se a

frequncia relativa, frequncia acumulada e frequncia relativa acumulada. e e e b) Grco de linhas a


Nmero de polinizadores observados

Nmero de visitas

0
08:0010:00

10

15

20

25

30

10:0012:00 Horrio

12:0014:00

14:0016:00

Figura 1.2: Nmero de polinizadores observados. u

ix Observao: ca Podem ser obtidos grcos semelhantes considerando-se a

frequncia relativa, frequncia acumulada e frequncia relativa acumulada. e e e c) Grco de Setores Circulares a E a representao grca, em um c ca a rculo, por meio de setores. E utilizado, principalmente, quando se pretende uma visualizaao em relaao ao total. Para conc c stru -lo, divide-se o c rculo em setores, cujas reas sero proporcionais `s frequncias. a a a e Essa diviso pode ser feita por regra de trs. Por exemplo: a e 82 visitas - 360o 17 visitas - x1 82 visitas - 360o 28 visitas - x2 Observao: Grco semelhante pode ser obtido usando-se as frequncias ca a e relativas.
Nmero de polinizadores observados

x1 = 74o 3748

x2 = 122o 5848, x3 = 79o 0112, x4 = 83o 2436

10:0012:00 08:0010:00

14:0016:00 12:0014:00

Figura 1.3: Nmero de polinizadores observados. u

1.1.7

Representao da Amostra ca

Exemplo inicial: Solicitar a trinta alunos de ps-graduao que digam a sua idade. o ca a) Tabela Primitiva ou Tabela de Dados Brutos Tabela inicial dos dados, geralmente sem qualquer critrio que permita ine formaoes estat c sticas. No exemplo inicial: 24-23-22-28-35-21-23-33-34-24-21-25-36-26-22-30-32-25-26-33-34-21-31-2531-26-25-35-33-31 b) Rol E o arranjo dos dados brutos em ordem geralmente crescente (ou decrescente). 21-21-21-22-22-23-23-24-25-25-25-25-26-26-26-28-30-31-31-31-32-33-33-3334-34-34-35-35-36 Apesar de pouco informativa apresenta algumas vantagens sobre a tabela primitiva: - limite inferior: l - limite superior: L ou LS - amplitude total: A=Ll ou A = LS LI ou LI

Apresenta desvantagens quando o conjunto de dados grande. e c) Amplitude Total (AT ) E a diferena entre o maior e o menor valor observados. No exemplo, c AT =36-21=15. d) Frequcia Absoluta (Fi ) e E o nmero de vezes que o elemento aparece na amostra, ou o nmero de u u elementos pertencentes a uma classe. No exemplo, F(21) = 3.

xi Outras Frequncias: e - Frequncia Relativa (Fr ): a porcentagem daquele valor na amostra, ou e e seja, a Fr de uma valor dado por e
Fi . n

- Frequncia Absoluta Acumulada (Fac ): a soma das frequncias absolutas e e e dos valores inferiores ou iguais ao valor dado. - Frequncia Relativa Acumulada (Frac ): a soma das frequncias relativas e e e dos valores inferiores ou iguais ao valor dado. e) Distribuio de Frequncia ca e E o arranjo dos valores e suas respectivas frequncias. Assim, no exemplo: e

Xi 21 22 23 24 25 26 28 30 31 32 33 34 35 36 Seja agora o exemplo abaixo:

Fi 3 2 2 1 4 3 1 1 3 1 3 3 2 1 30

X: Peso de colmos de cana-de-aucar (em g) c

xii 14,11 16,12 14,77 13,61 15,26 14,17 19,70 19,56 19,36 16,07 17,78 14,85 16,39 19,18 22,10 13,54 17,59 17,76 17,46 12,00 15,55 19,21 15,94 14,62 18,05 17,09 16,08 14,78 19,12 10,20 17,26 14,14 20,48 20,90 16,51 20,35 15,06 20,04 17,11 20,39 13,34 20,67 16,78 14,06 15,63 20,08 17,60 13,59 19,38 14,30

Note que ao contrrio das variveis discretas, as cont a a nuas apresentam muitos valores diferentes. Desse modo, uma tabela de frequncias teria muitas line has e seria, portanto, pouco explicativa. Para contornar esse problema, usa-se para descrever as variveis cont a nuas, tabelas de classes ou tabelas de intervalos. Faz-se, ento, a partio do rol em intervalos de amplitude geralmente iguais a ca denominadas classes. f ) N mero de Classes (K) u O nmero ideal de classes de uma tabela depende muitas vezes, mais do u bom senso do pesquisador do que de regras r gidas pr-estabelecidas. No h uma e a a frmula exata. Boas aproximaoes podem ser obtidas por: o c (i) k 5 se N 25 N se N > 25 (ii) Sturges k 1 + 3, 22logN

g) Amplitude da Classe (h) A amplitude de cada classe obtida por: n = e No exemplo dado, pode-se fazer: K = 50 7 h=
22,1010,20 7 AT K

= 1, 7

A tabela de frequncias dada por: e e

xiii Peso 10,0 12,0 14,0 16,0 18,0 20,0 22,0 12,0 14,0 16,0 18,0 20,0 22,0 24,0 mi 11,0 13,0 15,0 17,0 19,0 21,0 23,0 fi 1 5 14 14 8 7 1 ai 1 6 20 34 42 49 50 Fr 0,02 0,10 0,28 0,28 0,16 0,14 0,02 Fr ac 0,02 0,12 0,40 0,68 0,84 0,98 1,00

Observao: ca

mi - ponto mdio e

Fi - nmero de alunos u

Fa c - frequncia absoluta acumulada e

Fr - frequncia relativa simples e

Fr ac - frequencia relativa acumulada

h) Histograma: a representao grca de uma distribuiao de frequncia e ca a c e por meio de retngulos justapostos onde cada retngulo tem como base a amplitude a a e como altura a freqncia da classe que descreve. ue

i) Pol gono de frequncias: a representao grca de uma distribuio e e ca a ca por meio de uma linha poligonal fechada que une os pontos (mi , Fi ).

xiv

Frequncias

0
0

10

20

30

40

Pesos de colmos de canadeacar

Figura 1.4: Histograma e Pol gono de Frequncias de dados de pesos de colmo de e cana-de-aucar c

Anda mungkin juga menyukai