Anda di halaman 1dari 6

Estatstica, Mtodos estatsticos e Estatstica Aplicada APOSTILA TERICA 2 Cursos: 2012 Aluno: DISTRIBUIO DE FREQUNCIA As distribuies de freqncias constituem-se

num caso particular das sries estatsticas, nas quais todos os elementos so fixos (o fato, o local e a poca). Agora os dados referentes ao fenmeno so apresentados atravs de gradaes, onde feita a correspondncia entre categorias ou valores possveis e as freqncias respectivas isto , os dados so colocados em classes pr-estabelecidas, registrando freqncia. A tabela de distribuio de freqncias como o nome indica, conter os valores da varivel e suas respectivas contagens, as quais so denominadas freqncias absolutas ou simplesmente, freqncias. No caso de variveis qualitativas ou quantitativas discretas, a tabela de freqncia consiste em listar os valores possveis da varivel, numricos ou no, e fazer a contagem na tabela de dados brutos do nmero de suas ocorrncias. A freqncia do valor i ser representada por f
i

Professora Andra Lacerda

a freqncia total por f t e a freqncia relativa por fi =

fi .100%. Para ft

variveis cujos valores possuem ordenao natural (qualitativas ordinais e quantitativas em geral), faz sentido incluirmos tambm uma coluna contendo as freqncias acumuladas f ac, obtidas pela soma das freqncias de todos os valores da varivel, menores ou iguais ao valor considerado. No caso das variveis quantitativas contnuas, que podem assumir infinitos valores diferentes, invivel construir a tabela de freqncia nos mesmos moldes do caso anterior, pois obteramos praticamente os valores originais da tabela de dados brutos. Para resolver este problema, determinamos classes ou faixas de valores e contamos o nmero de ocorrncias em cada faixa. Exemplo: No caso da varivel peso de adultos, poderamos adotar as seguintes faixas: 30 | 40 kg, 40 | 50 kg, 50 | 60, 60 | 70, e assim por diante. Apesar de no adotarmos nenhuma regra formal para estabelecer as faixas, procuraremos utilizar, em geral, de 5 a 8 faixas com mesma amplitude. Eventualmente, faixas de tamanho desigual podem ser convenientes para representar valores nas extremidades da tabela. A definio de alguns conceitos ser importante para o uso da linguagem apropriada ao elaborarmos e analisarmos as distribuies de freqncias. a)Dados Brutos - o conjunto dos dados numricos obtidos aps a coleta dos dados. b) Rol - o arranjo dos dados brutos em uma determinada ordem crescente ou decrescente. c) Classe cada um dos intervalos em que os dados so agrupados. d) Limites de classes so os valores extremos de cada classe. li = limite inferior de uma classe; Li = limite superior de uma classe. e) Amplitude a diferena entre o maior valor e o menor valor de certo conjunto de dados. Pode ser referida ao total de dados ou a uma das classes em particular. Amplitude Total ou range (At) calculada pela seguinte expresso: At = Max. (rol) Min.(rol). Amplitude das classes (h) a relao entre a amplitude total e o nmero de classes, conforme mostra a expresso

Mx(rol ) Mn.(rol ) , onde n o nmero de intervalos de classe. n

f) Ponto mdio de classe (xi) - calculado pela seguinte expresso: L li xi i 2

g) Freqncia absoluta (fi) - freqncia absoluta de uma classe de ordem i, o nmero de dados que pertencem a essa classe. h) Freqncia relativa (Fi) - freqncia relativa de uma classe de ordem i, o quociente da freqncia absoluta dessa classe (fi), pelo total multiplicado por 100%, ou seja,

Fi

fi .100% Total

Obs: a soma de todas as freqncias absolutas igual ao total. i) Freqncia acumulada (fia) - freqncia acumulada de uma classe de ordem i, a soma das freqncias at a classe de ordem i. j) Freqncia relativa acumulada (Fia) - freqncia relativa acumulada de uma classe de ordem i, a soma das freqncias relativas at a classe de ordem i. Essas tabelas de Distribuio de Freqncia podem ser classificadas em: Distribuio de Freqncia Pontual (Var. Discreta) Distribuio de Freqncia Intervalar (Var. Contnua) Distribuio de Freqncia Pontual uma srie de dados agrupados na qual o nmero de observaes est relacionado com um ponto real. Tambm chamada de Distribuio de Freqncias de Dados Tabulados No-Agrupados em Classes uma tabela onde os valores da varivel aparecem individualmente. Esse tipo de distribuio utilizado geralmente para representar uma varivel discreta, com pouca variedade de valores. Exemplo: Notas do Aluno "X" na Disciplina de Estatstica 2008 Alunos 2 3 2 3 5 15

Nota 6.3 8.4 5.3 9.5 6.5 Total

Obs: Este tipo de tabela no aconselhvel quando estamos trabalhando com variveis que apresentam uma grande quantidade de valores distintos, uma vez que a tabela poder ficar muito extensa, dificultando, alm de sua elaborao, as anlises e concluses dos dados pesquisados. Note que a soma das freqncias absolutas simples sempre igual ao nmero total de valores observados. Distribuio de Freqncia Intervalar um mtodo de tabulao dos dados em classes, categorias ou intervalos, onde teremos uma melhor visualizao e aproveitamento dos dados. Exemplo: Notas do curso de Cincia da Computao na disciplina de Programao I de uma dada Faculdade Notas N de Estudantes 5 |-- 6 18 6 |-- 7 15 7 |-- 8 12 8 |-- 9 03 9 |--10 02 A Distribuio de Freqncias de Dados Agrupados em Classes usada muitas vezes com o objetivo de resumir os dados originais em uma distribuio de freqncias, utilizaremos os dados agrupados em classes e no mais individualmente. Classe pode ser definida como sendo os subintervalos da Amplitude Total de uma varivel (grupo de valores). Quando a varivel (objeto de estudo) for contnua geralmente ser conveniente agrupar os valores observados em classes. Se, por outro lado, a varivel for discreta e o nmero de valores representativos dessa varivel

for muito grande, recomenda-se o agrupamento dos dados em classes. Nesse ltimo caso, o procedimento visa a evitar certos inconvenientes, como: 1. Grande extenso da tabela, dificultando, tanto quanto os dados brutos, a leitura e a interpretao dos resultados apurados. 2. O aparecimento de diversos valores da varivel com freqncia nula. 3. Impossibilidade ou dificuldade de visualizao do comportamento do fenmeno como um todo, bem como de sua variao. Este tipo de tabela informa, de imediato, a tendncia de a srie se concentrar em torno de um valor central, alm de proporcionar uma viso panormica do comportamento da varivel, o que seria impossvel de se fazer a partir da lista dos dados brutos. Ex: Tabela 2: Idade dos alunos do curso de medicina veterinria da UFBA, no ano de 1993.

O smbolo | indica a incluso do limite inferior do intervalo naquela classe. O smbolo | indica a incluso do limite superior do intervalo naquela classe. O smbolo || indica a incluso dos limites inferior e superior do intervalo naquela classe. O smbolo indica a excluso dos limites inferior e superior do intervalo naquela classe. Para construo de tabelas de freqncia para dados agrupados em classe vejamos os seguintes conceitos : 1. Definio do nmero de classes - representado por k. importante que a distribuio conte com um nmero adequado de classes. Se esse nmero for escasso, os dados originais ficaro to comprimidos que pouca informao poder ser extrada desta tabela. Se, por outro lado, forem utilizadas muitas classes, haver algumas com freqncia nula ou muito pequena, apresentando uma distribuio irregular e prejudicial interpretao do fenmeno. Para determinar o nmero de classes h diversos mtodos. Ns aprenderemos duas solues: (a) k = 5, para n 25 e k =

n , para n > 25.

(b) Frmula de Sturges: K = 1+3, 3 log n, onde n o tamanho da amostra Exemplo: Se n = 49 teramos: pelo primeiro mtodo: k = 7 pelo segundo mtodo: k = 1+3, 3 log 49 ==> k = 6, 58 ==> k 7 Mesmo tendo outros critrios de determinao do nmero de classes, o que se deve ter em mente que a escolha depender sobretudo da natureza dos dados e da unidade de medida em que eles se encontram, e no somente de regras muitas vezes arbitrrias e pouco flexveis. Para facilitar a anlise conveniente que se mantenham os intervalos de classe sempre constantes. 2. Limites de Classe - Os limites de classe so seus valores extremos. No exemplo anterior de distribuio de freqncia, o valor 21 denominado limite inferior da primeira classe, enquanto o valor 24 denominado limite superior da primeira classe. ORGANIZAO DE UMA DISTRIBUIO DE FREQUNCIA: Para organizar um conjunto de dados quantitativos em distribuio de freqncias, aconselha-se seguir a seguinte orientao: 1 Organizar o rol colocar os dados em ordem crescente ou ordem decrescente. o 2 Calcular (ou adotar) o nmero conveniente de classes o nmero de classe deve ser escolhido pelo pesquisador, em geral, convm estabelecer de 5 a 15 classes. Existem algumas frmulas para estabelecer quantas classes devem ser construdas. Nos usaremos, n N onde N a quantidade total de observaes.
o

3 Calcular (ou adotar) a amplitude do intervalo de classes conveniente - a amplitude do intervalo de classes deve ser o mesmo para todas as classes.

h
o

Mx(rol ) Mn.(rol ) onde n o nmero de intervalos de classe. n

4 Obter os limites das classes Usualmente as classes so intervalos abertos direita. Os limites so obtidos fazendo-se. a Limite inferior da 1 classe igual ao mnimo do rol, isto , l1 = Min.(rol) Encontram-se os limites das classes, adicionando-se sucessivamente a amplitude do intervalo de classes aos limites a da 1 classe. o 5 Obter as f i - contar o nmero de elementos do rol, que pertencem a cada classe. 6 Apresentar a distribuio construir uma tabela com ttulo, subttulo, ... Medidas de Posio As medidas de posio so divididas em dois grandes grupos: medidas de tendncia central e separatrizes - so valores tpicos ou representativos de um conjunto de dados. medidas de disperso - medem o grau de disperso dos dados, ou seja, o quanto eles se afastam em torno da mdia. Cada uma delas se divide da seguinte forma:
o

Medidas de Tendncia Central


Mdias ( X ) A media um dos vrios indicadores de tendncia central que se usa para indicar o ponto na escala de medidas no qual a populao (ou amostra) est centrada. , portanto um valor que indica o centro dos valores de uma coleo de dados (populao ou amostra) A mdia o termo mdio dos dados na populao (ou amostra). Numericamente, igual a soma das observaes dividida pela sua freqncia. interessante notar que a mdia o nico valor que, se substituir todos os dados na populao (ou amostra), produzir a mesma soma dos dados originais, e por conseguinte a mesma mdia. Mdia Aritmtica Para dados brutos:

Para dados agrupados em freqncias:

Para dados agrupados em classes:

Moda (Mo)

o valor mais freqente de uma srie de dados. (a) Para dado bruto:

Obs.: Para dados agrupados em classe, existem vrias frmulas de clculo da Moda. Trs, no entanto, so as mais utilizadas. c.1) Moda Bruta : Ponto Mdio da Classe Modal c.2) Moda de Pearson : Mo = 3.Md 2.X c.3) Moda de Czuber :

Mediana (Md )

o valor que divide o conjunto de dados ordenados em duas metades, com metade dos valores acima da mediana e a metade dos valores abaixo dela. Quando o nmero de observaes (n) mpar, a mediana o valor que ocupa a

posio central. Quando n for par, h duas posies centrais no conjunto, ento a mediana a mdia aritmtica dos dois valores que ocupam as posies centrais. Antes de calcular a mediana, devemos calcular a Posio da Mediana dada por:

(a) Para dado bruto:

(b) Para dados agrupados em freqncia:

Passos para o clculo da Mediana para dados agrupados em freqncia: (1) Achar n (2) Calcular Fi (3) Calcular PMd (4) Procurar PMd em Fi (5) Calcular Md, se for o caso (c) Para dados agrupados em classe:

Passos para o clculo da Mediana para intervalos de classe: (1) Achar n (2) Calcular Fi onde: (3) Calcular P(Md) li = limite inferior da classe mediana; (4) Determinar a Classe Mediana n = nmero total de observaes; (5) Aplicar a seguinte frmula: Fia.ant = freqncia acumulada da classe anterior da mediana

h = amplitude da classe mediana f iMd = freqncia simples da classe mediana.