Anda di halaman 1dari 49

UNIDADE I

Estatística

Profa. Ana Carolina Bueno


Estatística

 Interpretar processos em que há variabilidade.

 “Estatística” indica qualquer coleção de dados quantitativos, ou ainda, ramo da


Matemática que trata da coleta, da análise, da interpretação e da apresentação
de massa de dados numéricos.

 “Estatística” é um conjunto de métodos e processos quantitativos que serve para


estudar e medir os fenômenos coletivos.
Áreas da Estatística

 Estatística descritiva: descreve e analisa determinada população, utilizando


métodos numéricos e gráficos, para se determinarem padrões, em um conjunto de
dados, e assim apresentar a informação.

 Estatística inferencial: conjunto de métodos para a tomada de decisões nas


situações em que há incerteza, variações ou outras generalizações acerca de um
conjunto maior de dados.
Amostragem

 População: conjunto formado por todos os elementos que têm em comum a


característica que estamos estudando.
 Amostra: é uma parcela da população, mas uma parcela coerente com esta, ou
seja, que segue todas as características dessa população.
 Amostragem: é uma técnica usada para coletar amostras que vão garantir o
acaso na escolha.
 Inferência Amostragem
Análises
estimativas
População Amostra -xs2
- I.C. 95%
-Testes
Inferência
Fonte: http://www.ufscar.br/jcfogo/EACH/Arquivos/Material_Aula_2.pdf
Classificação das variáveis

 A característica da população ou da amostra que estamos estudando pode ser


expressa de acordo com uma variável, que pode assumir diferentes valores.

Qualitativos
(religião, sexo, estado civil)

Dados - variáveis

Quantitativos (valores
numéricos)

Fonte: Autoria Própria


Classificação das variáveis

 Você pratica música? Sim ou não.


 Com que intensidade você pratica música?
Nenhuma, pequena, média ou grande.
Nominal
Qualitativos
Ordinal
Variáveis

Quantitativos

Fonte: Autoria Própria


Classificação das variáveis

 Quantos filhos você tem? 1, 2, 3, ...


 Qual o seu salário? Entre 1 e 3 salários ou entre 4 e 6 salários.

Qualitativos

Dados Discretos

Quantitativos
Contínuos
Fonte: Autoria Própria
Classificação das variáveis

Idade
Estado Grau de No de Salário
(anos –
civil instrução filhos (X. mín.)
meses)

Solteiro Ens. Fund. 0 4,00 23 03

Casado Ens. Fund. 1 4,56 32 10


Fonte: Autoria Própria
Ens.
Casado 3 19,40 48 11
Superior

Solteiro Ens. Médio 0 10,53 25 08

Solteiro Ens. Médio 0 16,22 31 05


Tipos de amostragem

 Amostragem não probabilística: são amostragens em que há uma


escolha deliberada dos elementos da amostra. Depende dos critérios e
julgamento do pesquisador.

 Amostragem probabilística: são amostragens em que a seleção é aleatória, de


tal forma que cada elemento da população tem uma probabilidade conhecida de
fazer parte da amostra. São métodos rigorosamente científicos.

 Técnicas de amostragem probabilística:


Amostragem aleatória simples

 Todos os elementos da população têm a mesma probabilidade de pertencerem à


amostra. SORTEIO.
 Exemplo: Obter uma amostra representativa, de 10%, de uma população de 200
alunos de uma escola.
1º) Numerar os alunos de 1 a 200;
2º) Escrever os números (1 a 200) em pedaços de papel e colocá-los em uma urna;
3º) Retirar 20 pedaços de papel, um a um, da urna, formando a amostra da
população.
Sorteio

Amostra
População Fonte: Autoria Própria
Amostragem aleatória estratificada – população heterogênea

 Quando a população se divide em subpopulações homogêneas ou estratos. A


variável em estudo pode ter comportamentos diferentes de um estrato para outro,
porém apresentar comportamento homogêneo dentro de cada estrato.
 A definição dos estratos pode ser de acordo com sexo, idade, renda, grau de
instrução etc.
 Ex.: Selecionar uma amostra com números de homens e mulheres proporcionais
aos números de homens e mulheres existentes na população, por classe social.

Amostra
População Fonte: Autoria Própria
Amostragem sistemática

 Quando os elementos da população se apresentam ordenados de acordo com


algum critério. Um exemplo seria a retirada de elementos de uma amostra,
periodicamente, a partir de listas telefônicas.

População Amostra

Fonte: Autoria Própria


Amostragem – margem de erro

 Grau de homogeneidade da população.

 Tamanho da amostra tomada.

 Grau de confiabilidade com o qual queremos trabalhar.


Interatividade

São dados os seguintes experimentos:


I. Lançar uma moeda cinco vezes e observar o número de caras.
II. Numa linha de produção, observar dez itens, tomados ao acaso, e verificar
quantos estão defeituosos.
III. Verificar o tempo que internautas ficam em sites de reportagem.
IV. Em uma realização de projeto, verificar a porcentagem do término do projeto
após 6 meses.
Quais dos itens acima terão eventos classificados como variáveis aleatórias
discretas? a) III.
b) I, II.
c) I, IV.
d) II, IV.
e) I, II, III, IV.
Processos estatísticos

 Definir objeto de estudo, populações e amostras envolvidas.

 Planejar o processo de resolução.

 Coletar os dados amostrais.

 Tabular e representar os dados colhidos (organizar os dados).

 Apresentar os dados (cálculo dos parâmetros estatísticos).

 Análise e interpretação dos dados (indução de


parâmetros amostrais em parâmetros
populacionais ou vice-versa).
Coleta de dados – tratamento inicial dos dados

A tabela mostra uma pesquisa sobre o número de filhos por funcionário de uma certa
empresa:
 Dados brutos 0 2 1 2 3 5 2 0 2 1
2 0 0 1 1 2 3 3 1 2

0 0 0 0 1 1 1 1 1 2
 Rol
2 2 2 2 2 2 3 3 3 5

Fonte: Autoria Própria


Distribuição de frequências

 Organiza os dados de acordo com as ocorrências dos diferentes resultados


observados.
 Apresentada em Tabela ou Gráfico.
 Tabela: apresenta de forma resumida um conjunto de dados.
 Tabelas de frequência (ou frequência simples).
 Tabelas de frequência relativas.
 Tabelas de frequência acumuladas.
Construindo a tabela de frequência – Ex.: número de filhos

 Relaciona categorias (ou classes) de valores, juntamente com contagens (ou


frequências) do número de valores que se enquadram em cada categoria.

 Frequência: trata-se do número de vezes em que determinado valor (ou faixa de


valores) se repete na amostra.
Tabela de frequência – Ex.: número de filhos

No de filhos Frequência

0 4
1 5
2 7
Fonte: Autoria Própria
3 3
4 0
5 1

Total 20
Tipos de frequências

 Frequência simples (fi): é o número de vezes em que determinado valor aparece,


contado diretamente.
 Frequência total (ft), que corresponderá, evidentemente, ao número total de
elementos da amostra (N).

 Frequência relativa (fr): é a frequência simples dividida pela frequência total.

 Frequências acumuladas (fa) acima de (ou decrescentes)


correspondem à quantidade total de elementos que
existem na amostra acima de dado valor.
Tabela de frequências – Ex.: número de filhos

No de
fi fr fa
filhos

0 4

1 5
2 7
Fonte: Autoria Própria
3 3

4 0

5 1
Total 20
Número de filhos
Frequência simples ou absoluta (fi),
relativa (fr) e acumulada (fa)
No de
fi fr fa
filhos

0 4 (4/20) * 100 = 20% 4

1 5 (5/20) * 100 = 25% 9

2 7 (7/20) * 100 = 35% 16


Fonte: Autoria Própria
3 3 (3/20) * 100 = 15% 19

4 0 (0/20) * 100 = 0% 19

5 1 (1/20) * 100 = 5% 20

Total 20 100% 20
Número de filhos
Gráfico de colunas

Fonte: Autoria Própria


Interatividade

A tabela se refere ao número de defeitos encontrados em placas de circuito


integrado.
I. O tamanho da amostra é de 10 placas.
II. 55 placas possuem nenhum ou 1 defeito.
III. Aproximadamente 7% das placas apresentam 3 defeitos.
Assinale a alternativa com as afirmações corretas.
a) I. Número de Frequência
defeitos
b) II.
0 30
c) III. 1 25
d) I e II. 2 10
e) II e III. 3 5
Fonte: Autoria Própria 4 2
Distribuição de frequência – dados agrupados em classes

 Esse formato é o indicado quando trabalhamos com variáveis quantitativas


contínuas. Neste caso, os valores são agrupados por classes, o que reduz a
quantidade de informações trabalhadas, mas provoca, consequentemente, uma
perda de precisão.
Dados brutos – Exemplo: faixa etária de crianças

 Dificulta estabelecer em torno de qual valor tendem a se concentrar as idades das


crianças, ou ainda as que se encontram acima ou abaixo de determinada idade.
Dados brutos:
6 10 9 14 7 4

8 11 12 5 9 13

Fonte: Autoria Própria 9 10 8 6 7 14

11 6 12 11 15 13

12 11 4 10 7 13

10 9 8 12 13 7
Organizar os dados em rol – Exemplo: faixa etária de crianças

4 6 8 10 11 13

4 7 8 10 12 13

4 7 8 10 12 13

5 7 9 10 12 14

6 7 9 11 12 14

6 8 9 11 13 15
Fonte: Autoria Própria
Faixa etária de crianças
Tabelas de frequência sem classe e com classe

 Decidir o número de Idade Frequência Idade Frequência


classes da tabela de 4 3
frequência. 5 1 4  6 4
 Regra de Sturges: i 6 3
= 1 + 3,3*log N = 6 8 7
7 4
1 + 3,3*log 36 = 6,14 8 4 810 7
 Regra do quadrado Fonte: 9 3
𝑁 = 36 = 6
Autoria 10 4 1012 7
Própria
11 3
1214 8
12 4
13 4 1416 3
14 2
15 1 Total 36
Faixa etária de crianças
Tabelas de frequência com classe

 Determinar a amplitude de classe, dividindo a Idade Frequência


amplitude pelo número de classes.
 Amplitude de variação total: 4  6 4
At = Lmin – Lmáx = 15 – 4 = 11
6 8 7
 Intervalo de classe:
h = At/n 810 7
11 / 6 = 1,83 (arredondar o resultado para mais)
1012 7
1214 8
1416 3
Fonte: Autoria Própria
Total 36
Faixa etária de crianças
Tabelas de frequência com classe

 Limites de classe: limite inferior e superior


 Amplitude de um intervalo de classe
 hi = Ls – Li Idade Frequência
4 6 8 10 11 13 4  6
4 7 8 10 12 13
6 8
4 7 8 10 12 13
810
5 7 9 10 12 14
1012
6 7 9 11 12 14
1214
6 8 9 11 13 15
1416
Total
Fonte: Autoria Própria
Faixa etária de crianças
Ponto médio de uma classe

 Ponto médio de uma classe (xi)


Xi = (Ii + Li)/2 x1 = (4+6)/2 = 5

Idade xi Frequência

4  6 4

6 8 7
Fonte: Autoria Própria
8 10 7

10 12 7

12 14 8

14 16 3
Faixa etária de crianças
Frequências simples, relativa e acumulada

Idade xi Fi Fr Fa

4  6 5 4 (4/36)*100 = 11% 4

6 8 7 7 19% 11

8 10 9 7 19% 18
Fonte: Autoria Própria 10 12 11 7 19% 25

12 14 13 8 22% 33

14 16 15 3 8% 36

Total 36 98% ~ 100% 36


Interatividade

 A tabela se refere ao peso de 36 funcionários da empresa XK.


I. A tabela possui 10 classes. Peso (kg) fi
II. A amplitude do intervalo de classe é igual a 5. 51  55 3
III. O ponto médio da terceira classe é 63 kg. 56  60 1
IV. A frequência relativa da oitava classe é 16,7%. 61  65 4
66  70 3
 Assinale a alternativa com as afirmações corretas. 71  75 5
a) I e II. 76  80 4
b) I e III.
81  85 4
c) II e IV.
86  90 6
d) I, II e III.
Fonte: Autoria
91  95 2
e) I, III e IV. Própria 96  100 4
Mais um exemplo: estatura
Construção da tabela de frequência com classes

Suponhamos termos feito uma coleta de dados relativos às estaturas de quarenta


alunos, que compõem uma amostra dos alunos de uma faculdade, resultando na
seguinte tabela de valores:

TABELA – Dados Brutos


ESTATURAS DE 40 ALUNOS DA FACULDADE A
166 160 161 150 162 160 165 167 164 160
162 168 161 163 156 173 160 155 164 168
155 152 163 160 155 155 169 151 170 164
154 161 156 172 153 157 156 158 158 161
Estatura
Construção da tabela de frequência com classes

TABELA – Rol
ESTATURAS DE 40 ALUNOS DA FACULDADE A
150 154 155 157 160 161 162 164 166 169
151 155 156 158 160 161 162 164 167 170
152 155 156 158 160 161 163 164 168 172
153 155 156 160 160 161 163 165 168 173

 ROL
 Decidir o número de classes da tabela de frequência.
 Regra de Sturges: i = 1 + 3,3*log n = 6,27
 Regra do Quadrado:
Estatura
Construção da tabela de frequência

150 154 155 157 160 161 162 164 166 169
151 155 156 158 160 161 162 164 167 170
152 155 156 158 160 161 163 164 168 172
153 155 156 160 160 161 163 165 168 173
 Determinar a amplitude de classe, dividindo a amplitude pelo número de classes.
 Amplitude de variação: 173 – 150 = 23 cm.
 23 / 6 = 3,83 (arredondar o resultado para mais) Fonte: Autoria Própria

Classes Estatura Frequência

1 150  154 4

2 154  158 9
3 158  162 11
Estatura
Construção da tabela de frequência
Estatura xi fi fr fa
150  154 152 4 0,10 ou 10% 4

154  158 156 9 0,225 ou 22,5% 13

158  162 160 11 0,275 ou 27,5% 24

Fonte: Autoria Própria 162 166 164 8 0,20 ou 20% 32


166  170 168 5 0,125 ou 12,5% 37

170  174 172 3 0,075 ou 7,5% 40


Total 40 1 ou 100% 40
Distribuição de frequências

 Gráficos: são usados para visualizar facilmente a natureza da distribuição


dos dados.
 Um gráfico é uma figura constituída a partir de uma tabela, pois é quase sempre
possível locar um dado tabulado num gráfico.
 Colunas
 Barras
 Linhas
 Setores
 Dispersão
 Histograma
 Polígono de frequência
Estatura
Histograma e polígono de frequência
Estatura Xi Fi

146  150 148

150  154 152 4

154  158 156 9

158  162 160 11


Fonte: Autoria Própria 162  166 164 8
166  170 168 5
170  174 172 3

174  178 176

Total 40
Estatura – Histograma

Estatura de 40 alunos
12

10

Número de alunos
8

0
148. 152. 156. 160. 164. 168. 172. 176.
estatura
Fonte: Autoria Própria
Estatura – Polígono de frequência

Estatura de 40 alunos
12

Número de alunos
10
8
6
4
2
0
148. 152. 156. 160. 164. 168. 172. 176.
Estatura
Fonte: Autoria Própria
Gráfico em colunas

Fonte: Autoria Própria


Gráfico em barras

Fonte: Autoria Própria


Gráfico em linhas

70%
60%
50%
40%
30%
20%
10%
0%
Orkut Twitter Facebook Flickr

Rede Social
Fonte: Autoria Própria
Gráfico em setores

 Total __________360º
 Parte___________ xº
2001
2002
2003
2004
2005
2006
2007
2008

Fonte: Autoria Própria


Diagrama de dispersão

3,5

TAXA DE CRESCIMENTO
DEMOGRÁFICO (%)
3
2,5
2
1,5
1
0,5
0
0 10 20 30 40
TAXA DE ANALFABETISMO (%)
Fonte: Autoria Própria
Diagramas de ogiva

 São gráficos frequentemente destinados a representar as frequências acumuladas,


apesar de nada impedir que representem frequências simples ou
frequências relativas.
45

Quantidade de alunos
40
35
30
25
20
15
10
5
0
0 1 2 3 4 5 6 7 8 9
Quantidade de dependências
Fonte: Livro-texto
Interatividade

Uma pesquisa foi realizada em um acampamento sobre a faixa etária das crianças
participantes. Analise o gráfico e assinale a alternativa incorreta.
a) O conjunto de dados possui 6 classes e a amplitude de cada classe é 2.
b) O limite inferior da 1a classe é 5 e o limite superior é 7.
c) Os valores 5, 7, 9, 11, 13 e 15 são os pontos médios de cada classe.
8
d) O tamanho da amostra é de 36 crianças. 7
e) O polígono de frequência é construído 6
a partir dos pontos médios de cada classe. 5

Fred
4
3
2
1
0
5 7 9 11 13 15
Fonte: Autoria Própria Idade
ATÉ A PRÓXIMA!

Anda mungkin juga menyukai