Anda di halaman 1dari 46

ESTATSTICA DESCRITIVA

o conjunto de mtodos para organizao, apresentao e descrio de dados representativos do comportamento de uma varivel, onde se utilizam tabelas, grficos e medidas que resumem a distribuio desta varivel.

VARIVEL
As variveis so caractersticas que podem ser observadas ou medidas em cada elemento pesquisado (seja por censo ou amostragem, levantamento ou experimento), sob as mesmas condies. Para cada varivel, para cada elemento pesquisado, em um dado momento, h um e apenas um resultado possvel.

CLASSIFICAO DAS VARIVEIS

Fonte: Marcelo Menezes Reis em http://www.inf.ufsc.br/~marcelo/INE5121.htm

POPULAO
A coleo de todas as medidas oriundas de uma varivel chamada de POPULAO. As medidas utilizadas para descrever ou caracterizar estatisticamente uma populao so chamadas de PARMETROS, representados por letras gregas ( , )

AMOSTRA
Como em geral as populaes so muito grandes, se faz necessrio o uso de amostras para represent-las. Estas so formadas por uma frao da populao em estudo. As estimativas dos parmetros calculados a partir das amostras so chamadas genericamente de ESTATSTICAS e so representadas por letras latinas (x, s ...)

O conjunto de dados que descreve o comportamento de uma varivel pode ser estudado e representado na forma de distribuio de freqncias
DADOS BRUTOS 17,9 17,9 20,0 18,0 17,9 18,9 17,6 18,5 18,8 17,7 23,0 19,4 23,4 22,6 20,2 22,1 25,0 22,0 24,0 20,2 16,1 16,2 16,8 16,7 16,2 17,2 15,7 15,7 24,7 28,0 18,1 19,8 26,3 18,4 21,0 20,1 18,2 17,5 18,6 17,1 18,0 20,5 18,5 19,2 18,5 20,9 23,5 19,2 25,0 21,1
Intervalo Freqncia

15 17 19 21 23 25 27

17 19 21 23 25 27 29

7 19 11 5 6 1 1

DISTRIBUIO NORMAL
CURVA DE GAUSS OU DE LAPLACE a distribuio terica de probabilidade de variveis contnuas mais utilizada

IMPORTNCIA
1. 2. Inmeros fenmenos contnuos podem ser representados atravs dela Vrios mtodos estatsticos se ajustam melhor a esta distribuio que as demais. Pode-se utiliz-la, por exemplo, para calcular a probabilidade de ocorrncia de uma srie de eventos naturais Ela a base para a inferncia estatstica clssica

3.

FUNO DENSIDADE DE PROBABILIDADE

1 Yi = e 2

( X i )2

2 2

DISTRIBUIO NORMAL TERICA

PROPRIEDADES

Independentemente dos valores da mdia e do desvio padro, a rea total entre a curva e o eixo das abscissas igual a 1, permitindo identificar probabilidades de eventos

Valores de medidas de tendncia central idnticos

MDIA MODA MEDIANA

MEDIDAS DE TENDNCIA CENTRAL


As medidas da tendncia central so parmetros que permitem que se tenha uma primeira idia, um resumo, de como se distribuem os dados de um experimento.

Existem trs medidas bsicas que refletem a tendncia central de uma distribuio de freqncias: Mdia Moda Mediana

MDIA
a soma de todos os resultados dividida pelo nmero total de casos.

x=

xi
i =1

Clculo da Mdia em valores agrupados em classes

x ifi x= i =1 N ou x = x i pi
i =1 N

Um dos problemas da utilizao da mdia que, por levar em conta TODOS os valores do conjunto, ela pode ser distorcida por valores discrepantes (outliers) que nele existam. importante ento interpretar corretamente o valor da mdia.

Fonte: Marcelo Menezes Reis em http://www.inf.ufsc.br/~marcelo/INE5121.html

MODA
o evento ou categoria de eventos que ocorre com maior freqncia, indicando o valor ou categoria mais provvel.

Exemplo: 2 4 7 12 23 8 11 4 12 22 7 12 9 10

7 6 5 4 3 2 1 0 12 13 14

Moda

15

16

17

18

Mais

Esses valores no precisam ser exatamente iguais

Classe modal

Li= 7

Classe de freqncia 0-1 1-2 2-3 3-4 4-5 5-6 6-7 7-8 8-9 9 -10

Freqncia Absoluta 0 1 1 2 2 3 d1 =4-2=2 2 4 3 d2=4-3=1 2

m0

d1 h = Li + d1 + d 2

m0

2 = 7+ 1 = 7 , 66 2 +1

MEDIANA
o valor da varivel a partir do qual metade dos casos se encontra acima dele e metade se encontra abaixo. Se o n de observaes for impar, a mediana ser o valor central da distribuio; se o n for par, a mediana ser a mdia dos dois valores centrais. Pouco afetada por eventuais valores discrepantes existentes no conjunto (que costumam distorcer substancialmente o valor da mdia).

Exemplo
Mantendo o mesmo exemplo anterior, mas com as notas ordenadas: 1,0 2,0 3,0 3,0 4,0 4,0 5,0 5,0 5,0 5,0 6,0 6,5 7,0 7,0 7,0 7,5 8,0 8,0 9,5 9,5 O dcimo valor da varivel : 5,0 O dcimo primeiro valor : 6,0 A mediana um valor situado entre 5,0 e 6,0

Clculo da Mediana em valores agrupados em classes


md
ONDE: md= mediana Li= limite inferior da classe da mediana ( a classe cuja freq. acumulada supera pela 1a. vez n/2) Fa= freqncia acumulada das classes anteriores da mediana fmd= freqncia absoluta simples da mediana hmd= amplitude da classe da mediana

n Fa = Li + 2 h md f md

Exemplo
Classe de freqncia 0-1 1-2 2-3 3-4 4-5 5-6 6-7 7-8 8-9 9 -10 Freqncia Absoluta 0 1 1 2 2 fmd 3 2 4 3 2 Freqncia Acumulada 0 1 2 Fa 4 6 9 11 15 18 20

Classe da mediana
n Fa 2 h md = Li + f md

md

Li= 6

hmd= 7-6 = 1

md

20 9 2 =6+ 1 = 6 ,5 2

Fonte: Marcelo Menezes Reis em http://www.inf.ufsc.br/~marcelo/INE5121.html

MEDIDAS DE DISPERSO
So medidas da disperso de um conjunto de dados em torno da mdia, ou seja, da maior ou menor variabilidade dos resultados obtidos. Elas permitem identificar at que ponto os resultados se concentram ou no ao redor da tendncia central de um conjunto de observaes.

Existem vrias medidas para avaliar a disperso de um conjunto de dados. As principais so: 1. 2. 3. 4. Amplitude ou Intervalo Varincia Desvio Padro Coeficiente de Variao

Amplitude
a diferena entre o maior e o menor valor que foi observado para a varivel, servindo para caracterizar a abrangncia do estudo.

Varincia
a soma dos quadrados dos desvios de cada ponto em torno da mdia aritmtica. Caracteriza a disperso dos pontos de uma amostra potencializando as diferenas.

= ( xi xm ) i =1
2

s = ( xi xm )
2 i =1

N
Varincia Populacional ou

n 1
Varincia Amostral

Exemplo:
Calcular a varincia amostral do conjunto 1, 2, 3, 4, 5 n=5 xm = 3

s2 = (3-1)2 + (3-2)2 + (3-3)2 + (3-4)2 + (3-5)2 + (3-1)2 5-1 s2 = 4 + 1 + 0 + 1 + 4 = 2,5 4

OBS: a unidade da varincia igual a unidade de medida das observaes elevada ao quadrado.

Desvio Padro
O desvio padro a raiz quadrada da varincia.
Desvio-padro =

( Xi Xm) 2 n 1

No exemplo anterior equivale a s = 1,58

A unidade do desvio padro igual a unidade de medida das observaes.

Coeficiente de Variao
uma medida de disperso relativa que indica a variabilidade da amostra em relao mdia. Resultado do desvio padro dividido pela mdia, transformado em percentual.

s CV = .100 xm
No exemplo anterior equivale a CV = 53,3%

Permite comparar a disperso de diferentes distribuies (com diferentes mdias e desvios padres).

DISTRIBUIO NORMAL EXPERIMENTAL

PROPRIEDADES DA CURVA

SIMTRICA
0.4 0.3 0.2 p 0.1 0 -5 -3 -1 1 3 5 y

ASSIMTRICA POSITIVA

Xm > Md

ASSIMTRICA A DIREITA

Quando a diferena entre a mdia e a mediana positiva (mediana < mdia)

ASSIMTRICA NEGATIVA

ASSIMTRICA A ESQUERDA

Xm < Md

Quando a diferena entre a mdia e a mediana negativa (mediana > mdia)

MESOCURTICA LEPTOCURTICA

PLATICURTICA

VALORES DE MEDIDAS DE TENDNCIA CENTRAL IDNTICOS

Trs curvas normal com a mesma MDIA mas com diferentes DESVIOS PADRO
=5
= 10 = 16
= 50

Trs curvas normal com o mesmo DESVIO PADRO mas com diferentes MDIAS
=5 =5 =5

= 20

= 30

= 40

Fonte: Alex Pires Nuner em pagina da disciplina AQI3149 Estatstica (CCA)

TESTES DE HIPOTESES
No tratamento estatstico de um conjunto de dados deve-se distinguir diferenas amostrais decorrentes do acaso (variabilidade natural) daquelas diferenas induzidas por fatores externos.

TESTES DE HIPOTESES
HIPTESE DE NULIDADE, denominada Ho expressa o conceito de no diferena (igualdade). Essa a hiptese que efetivamente testada Se chega-se a concluso de que Ho deve ser rejeitada, devemos aceitar ento a HIPTESE ALTERNATIVA ( H1 )

Tipos de Erros
Tipo I = a Ho rejeitada quando ela deveria ser aceita Tipo II = a Ho aceita quando ela deveria ser rejeitada

Uma das formas de se testar a hiptese de uma pesquisa aplicando-se um teste de significncia ao conjunto de dados disponveis. Estes testes auxiliam na verificao da existncia de evidncias estatisticamente significativas para se aceitar ou rejeitar as hipteses previamente estabelecidas (H0 e H1)

Nvel de Significncia (alpha)


Corresponde ao valor de risco aceito para a probabilidade de ocorrer um erro tipo I (concluir que as amostras so diferentes quando na verdade elas so iguais). Em pesquisa cientfica, normalmente adota-se um nvel de significncia a = 0,05 ou 5%. Isto quer dizer que estatisticamente existe apenas 5 chances em 100 de se rejeitar erroneamente a Ho.

Existem vrios testes que se aplicam a este procedimento e a escolha funo dos dados existentes (dados quantitativos ou categorizados; dados pareados ou independentes)

TESTES BICAUDAIS Utilizam as duas caudas da distribuio


A rea sombreada /2 A rea sombreada /2

= 3.16 Regio de Rejeio Rejei Regio de No Rejeio Rejei Regio de Rejeio Rejei

C1

Esses dois valores so chamados Valores Crticos Cr

C2

TESTES UNICAUDAIS Utilizam apenas uma das caudas da distribuio

A rea ombreada = 12 Regio de Rejeio Rejei C Valor Crtico Cr Valor Crtico Cr Regio de No Rejeio Rejei
X

A rea sombreada = 12 Regio de No Rejeio Rejei Regio de Rejeio Rejei C


X