Anda di halaman 1dari 24

Relembrando conceitos de

estatstica bsica
Prof. Dr. Alberto Franke
alberto.franke@ufsc.br

Prof. Franke, 2014

Anlise de dados

A anlise dos dados uma necessidade transversal em


qualquer domnio cientfico.

A massificao dos processos analticos de dados est


intimamente relacionada com o advento da computao
(aquisio, armazenamento e processamento de dados).

O refinamento e multiplicidade de tcnicas tambm esto


associados s crescentes facilidades de acesso e operao
de softwares estatsticos.

Prof. Franke, 2014

Alguns conceitos
Relao entre amostra e populao

Fonte: ANDRIOTTI. Fundamentos de estatstica e geoestatstica. So Leopoldo, Unisinos, 2009.

Prof. Franke, 2014

Alguns conceitos

Diz-se que estatstica qualquer caracterstica descritiva dos elementos de uma


amostra (letras latinas).

Diz-se que parmetro uma caracterstica descritiva dos elementos de uma


populao (letras gregas).

Se uma estatstica usada para avaliar ou estimar o valor de algum parmetro,


chamada de estimador.

Variveis so caractersticas mensurveis em cada indivduo que faz parte da


populao, mantidas as mesmas condies.

A qualidade de uma estimativa depende basicamente da representatividade da


amostra.

O que representatividade de uma amostra?


4

Prof. Franke, 2014

Alguns conceitos
Tipos de amostragem
a) Amostragem casual (aleatria) simples

Cada observao tem a mesma chance de ser escolhida.


Reposio
amostragem estatisticamente independente
Sem reposio
amostragem estatisticamente dependente
Exemplo: alunos

b) Amostragem sistemtica

Amostras so coletadas por sorteio segundo um plano prdeterminado

c) Amostragem por agrupamentos

A populao agrupada e os grupos so escolhidos aleatoriamente quando todos os indivduos do grupo so considerados
5

Prof. Franke, 2014

Alguns conceitos
Tipos de amostragem
d) Amostragem estratificada

Utilizada quando h grande variabilidade na populao que dividida em


subpopulao, e cada uma delas submetida a uma amostragem casual simples

e) Amostragem hierrquica

Um sistema de referncias construdo no sentido de unidades de amostragem


maiores para menores por meio de sucessivas amostragens causais.
6

Prof. Franke, 2014

Fonte:
https://moodle.ufsc.br/pluginfile.php/1039945/mod_resou
7
rce/content/1/AULA%201%20Introducao.pdf

Prof. Franke, 2014

Alguns conceitos
Relao entre amostragem e inferncia

Fonte: ANDRIOTTI. Fundamentos de estatstica e geoestatstica. So Leopoldo, Unisinos, 2009.

Prof. Franke, 2014

Medidas de tendncia
Existem trs medidas bsicas que refletem a tendncia central de uma
distribuio de frequncias:

Mdia (aritmtica, ponderada, geomtrica, harmnica)


Moda
Mediana

1.1 - Mdia Aritmtica

a soma de todos os casos dividida por seu nmero total.

onde:

= mdia aritmtica para amostra e para populao

= representa cada uma das observaes disponveis na amostra


n = nmero de amostras.
Obs.: a mdia afeta por valores extremos
9

Prof. Franke, 2014

Fonte:
https://moodle.ufsc.br/pluginfile.php/1039945/mod_resou
rce/content/1/AULA%201%20Introducao.pdf

10

Prof. Franke, 2014

Medidas de tendncia

1.2 - Mdia aritmtica ponderada:

A forma de calcular de uma mdia ponderada multiplicar cada valor pelo seu
respectivo peso, somar todas as parcelas e dividir o resultado dessa soma pelo total
dos pesos atribudos.

1.3 - Media Harmnica

Retrata a harmonia entre os dados

1.4 - Media Harmnica

obtida pela raiz n do produto dos n valores disponveis

utilizada em administrao e economia, para determinar taxas de crescimento


em certo perodo

11

Prof. Franke, 2014

Medidas de tendncia

Exemplo: Clculo da mdia em valores agrupados em classes

12

Prof. Franke, 2014

Medidas de tendncia

1.5 - Mediana

Divide um determinado conjunto de dados em duas partes iguais, de modo


que metade dos dados ter valores inferiores, e metade valores superiores
mediana.
Se o nmero de observaes for impar, a mediana ser o valor central da
distribuio; se o nmero for par, a mediana ser a mdia dos dois valores
centrais.
Tem a vantagem de no ser afetada pelos valores extremos.
Por ser insensvel presena de valores aberrantes, a mediana considerada
um estimador robusto.

1.6 Moda

13

o valor que ocorre com mais frequncia em uma amostra


A = {2, 4, 7, 12, 23, 8, 11, 4, 12, 22, 7, 12, 9, 10}

Prof. Franke, 2014

Medidas de Disperso (variao)

As medidas de disperso referem-se a maior ou menor variabilidade de um


conjunto de dados em torno da mdia.

Permite identificar at que ponto os resultados se concentram ao redor da


tendncia central de um conjunto de observaes.

Existem vrias medidas para avaliar a disperso de um conjunto de dados:

14

1. Amplitude
2.Varincia
3. Desvio Padro
4. Coeficiente de Variao
5. Assimetria
6. Curtose
7. Erro padro da mdia

Prof. Franke, 2014

Medidas de Disperso (variao)

1. Amplitude

a diferena entre o maior e menor valor presente nos dados amostrais


O seu conhecimento importante quando se faz a representao grfica dos dados,
pois esta s deve conter valores entre o mximo e mnimo observado.

2.Varincia

a soma dos quadrados dos desvios de cada ponto em torno da mdia aritmtica.

Onde:

15

varincia da populao
varincia da amostra
A varincia S uma estimativa de um valor exato, porm desconhecido, que , o
qual seria obtido por meio de infinitas repeties do experimento.

Prof. Franke, 2014

Medidas de Disperso (variao)

3. Desvio Padro

O desvio padro a raiz quadrada da varincia.

Exemplo

4. Coeficiente de Variao

o desvio padro em percentagem da mdia

Indica a variabilidade da amostra em relao mdia.


Importante quando se compara a disperso de variveis com diferentes unidades.
Valores elevados, superiores a 1, representam amostras com grande heterogeneidade.

Exemplo

16

Prof. Franke, 2014

Medidas de Disperso (variao)

5. Assimetria

6. Curtose

Indica o grau de desvio de uma curva no sentido horizontal, podendo esse desvio ser
positivo, com excesso de valores altos, ou negativo, com predomnio de valores
baixos em relao a uma curva da dist. normal.

o grau de achatamento de uma curva em relao a uma curva representativa da


distribuio normal

7. Erro padro da mdia

D uma ideia da preciso da estimativa da mdia

A estimativa para a mdia se torna mais precisa (intervalo menor) com o aumento da
quantidade de observaes (n).
Exemplo

17

Prof. Franke, 2014

Medidas de Disperso (variao)

8. Intervalo de confiana para mdia

um intervalo em que haja probabilidade do verdadeiro valor desconhecido do


parmetro estar contido.

Limites do intervalo de confiana = (estimativa erro)

[xm toSx ]

Onde: toSx= erro

18

to = valor tabelado (distrib Student) em funo dos graus de liberdade


(GL) e nvel de significncia() pr-estabelecido
xm = mdia da amostra (estimativa)
Sx = erro padro da mdia

O que Graus de liberdade e nvel de significncia?

Prof. Franke, 2014

Medidas de Disperso (variao)

O que Graus de liberdade e nvel de significncia?


Graus de Liberdade (g.l)

o nmero de determinaes independentes(tamanho da amostra) menos o


nmero de parmetros estatsticos a serem avaliados na populao.
Ex.: Varincia

(n-1): quando estamos avaliando elementos da amostra


(k-1): quando estamos avaliando grupos

Nvel de significncia ()

o limite que se toma como base para afirmar que um certo desvio decorrente ao
acaso ou no.
Deve ser estabelecido antes do experimento ser realizado e corresponde ao risco
que se corre de rejeitar uma hiptese verdadeira ou aceitar uma hiptese falsa

A significncia de um resultado tambm denominado de valor-p (p-value)

Exemplos 10 e 11

19

Prof. Franke, 2014

Tabela da distribuio t (Student)

20

Prof. Franke, 2014

Tamanho mnimo de uma amostra

1. Baseado no erro amostral tolervel

Onde: n = tamanho mnimo de uma amostra


E = erro amostral tolervel

Exemplo 12

2. Baseado no tamanho da populao

Onde: nc = tamanho mnimo da amostra corrigido em funo da populao


N = tamanho da populao

Exemplo 13

21

Prof. Franke, 2014

Tamanho mnimo de uma amostra

3. Baseado no nvel de confiabilidade desejado

Quantas observaes so necessrias para 90% de confiabilidade?

Onde: n = tamanho mnimo de uma amostra


e = erro amostral tolerado
= desvio-padro da populao
z = valor correspondente ao nvel de confiabilidade desejado (distribuio
normal padronizada z)

Obs.: Deve-se notar que n (tamanho da amostra) depende do grau de confiana


desejado, da disperso dos dados e do erro tolervel, mas no do tamanho da
populao.

Exemplo 14

22

Prof. Franke, 2014

Valor de z
corresponde a
probabilidade
de 90% de
confiabilidade,
teste bicaudal

23

Prof. Franke, 2014

24

Prof. Franke, 2014

Anda mungkin juga menyukai