Anda di halaman 1dari 27

Estatística Aplicada à Administração

Prof. Dalton de Sousa

dalton.sousa@gmail.com

Arquivo 1
1. INTRODUÇÃO

Profissionais das mais diversas áreas de atuação se deparam com o problema de


analisar e entender conjuntos de dados relevante aos seus trabalhos.

Nesse caso, os dados precisam ser trabalhados para se transformarem em informações,


para serem comparados com outros resultados ou mesmo para julgar sua adequação
com alguma teoria.

Basicamente, quando se procede a uma análise de dados, busca-se alguma forma de


regularidade ou padrão ou, ainda, modelo presente nas observações.
1. INTRODUÇÃO

A palavra estatística provém do latim status, que significa estado.

A primitiva utilização da estatística envolvia compilação de dados e gráficos que


descreviam vários aspectos de um estado ou país. Em 1662, John Graunt publicou
informes estatísticos sobre nascimentos e mortes.

Seu trabalho foi secundado por estudos de mortalidade e taxas de morbidade, tamanho
de populações, rendas e taxas de desemprego.

As famílias, os governos e as empresas se apóiam largamente em dados estatísticos


para as tomadas de decisões.
1.1. Conceituação

A estatística é uma coleção de métodos para planejar experimentos, obter dados e


organizá-los, resumi-los, analisá-los, interpretá-los e deles extrair conclusões.

1.2. Definições

A estatística abrange muito mais do que o simples traçado de gráficos e o cálculo de


médias. Através dela, em seu uso correto, pode-se tirar conclusões gerais e significativas
que vão além dos dados originais.
1.2. Definições

Uma população é uma coleção completa de todos os elementos (valores, pessoas,


medidas etc.) a serem estudados.

Um censo é uma coleção de dados relativos a todos os elementos de uma população.

Uma amostra é uma subcoleção de elementos extraídos de uma população.

Estreitamente relacionados aos conceitos de população e amostra estão os conceitos de


parâmetro e estatística.

Um Parâmetro é uma medida numérica que descreve uma característica de uma


população.

Uma Estatística é uma medida numérica que descreve uma característica de uma amostra.
1.2. Definições

Ex.: Em uma pesquisa, feita com 1015 pessoas escolhidas aleatoriamente, 269 (26,5%)
possuíam computador.
A cifra 26,5% se baseia em uma amostra, e não em toda a população, por isso, trata-se de
uma estatística (e não um parâmetro).

Já outra pesquisa, feita com os 27 governadores de todos os estados brasileiros e o distrito


federal, mostrou que 25 (92,6%) deles possuem computadores.
A cifra 92,6% é um parâmetro porque se baseia em toda população de governadores.
1.3. A Natureza dos Dados

Primeira classificação dos dados

Certos conjuntos de dados (ex.: alturas) consistem em números, enquanto outros são
não-numéricos (ex.: sexo).
Nesses casos, são adotadas as expressões dados quantitativos e dados qualitativos
na distinção desses dois grupos.

Os dados quantitativos consistem em números que representam contagens ou medidas.

Já os dados qualitativos (ou dados categóricos, ou atributos) podem ser separados em


diferentes categorias que se distinguem por alguma característica não-numérica.
1.3. A Natureza dos Dados

Exemplo:
A tabela 1 registra a quantidade de alcatrão em diferentes marcas de cigarros. Tais
valores representam dados quantitativos, mas as diversas marcas constituem dados
qualitativos.
1.3. A Natureza dos Dados

Segunda classificação dos dados (somente quantitativos)

Os dados quantitativos podem ser diferenciados em discretos e contínuos.


Os dados discretos resultam de um conjunto finito de valores possíveis, ou de um
conjunto enumerável desses valores (ou seja, o número de valores possíveis é 0, ou 1, ou
2 etc.).
Os dados contínuos (numéricos) resultam de um número infinito de valores possíveis
que podem ser associados a pontos em uma escala contínua de tal maneira que não haja
lacunas ou interrupções.
Quando os dados representam contagens, são discretos; quando representam
mensurações, são contínuos. O número de ovos que as galinhas põem são dados
discretos, porque representa uma contagem; já a quantidade de leite que as vacas
produzem constituem em dados contínuos, porque representa mensurações que podem
tomar qualquer valor em um intervalo contínuo.
1.3. A Natureza dos Dados

Terceira classificação dos dados

Os dados podem ser classificados de outra maneira, em quatro níveis: nominal, ordinal,
intervalar e de razão.

O nível nominal é caracterizado por dados que consistem apenas em nomes, rótulos ou
categorias. Os dados não podem ser dispostos segundo um esquema ordenado (como de
baixo para cima).

Ex.: Respostas em pesquisas do tipo “Sim”, “Não”, “Indeciso”; o Sexo dos estudantes de
uma turma de estatística etc. Mesmo se os “nomes” forem rotulados por códigos
numéricos, os dados permanecem no nível nominal e não podemos realizar cálculos deles
isoladamente.
1.3. A Natureza dos Dados

O nível ordinal de mensuração envolve dados que podem ser dispostos em alguma
ordem, mas as diferenças entre os valores dos dados não podem ser determinadas, ou
não têm sentido.

Ex.: Avaliação da qualidade de serviços em uma escala como segue:


“muito bom”, “bom”, “regular”, “ruim”, “muito ruim”

Não podemos determinar uma diferença quantitativa entre muito bom e regular, por
exemplo.
1.3. A Natureza dos Dados

O nível intervalar é análogo ao nível ordinal, com a propriedade adicional de que


podemos determinar diferenças significativas entre os dados. Porém, não há um ponto de
partida zero inerente, ou natural (onde não haja qualquer quantidade presente).
Ex.: As temperaturas 98,2ºF e 98,6ºF. Os valores se apresentam ordenados e podemos
determinar diferenças entre eles (em geral chamadas distância entre os dois valores).
Entretanto, não há um ponto de partida natural. O valor 0ºF pode parecer um ponto de
partida, mas é inteiramente arbitrário, e não representa “ausência de calor”. Outro erro
seria dizer que 50ºF é duas vezes mais quente do que 25ºF.

Outro exemplo:
a) Os anos 1000, 2000, 1776 e 1944 (o tempo não começou no ano zero e, assim 0 é
arbitrário, e não um ponto de partida zero natural).
1.3. A Natureza dos Dados

O nível razão de mensuração é o nível de intervalo modificado de forma a incluir o ponto


de partida zero inerente (onde zero significa nenhuma quantidade presente).
Para valores nesse nível, tanto as diferenças como as razões têm significado.

Exemplos:
a) Pesos de artigos de material plástico descartados pelas residências (0 Kg indica que
nenhum plástico foi descartado e 10 Kg representam duas vezes 5 Kg);
b) Duração (em minutos) de filmes;
c) Distâncias (em km) percorridas por carros em um teste de consumo de combustível.

Os valores de cada um desses conjuntos de dados podem ser dispostos em ordem, suas
diferenças podem ser calculadas, e existe um ponto de partida zero inerente. O ponto de
partida torna as razões significativas.
1.3. A Natureza dos Dados
1.4. Usos da estatística

Praticamente todo campo de estudo se beneficia da utilização de métodos estatísticos.

Os fabricantes fornecem melhores produtos a custos menores através de técnicas de


controle de qualidade.

Controlam-se doenças com auxílio de análises que antecipam epidemias.

Espécies ameaçadas são protegidas por regulamentos e leis que reagem a estimativas
estatísticas de modificação do tamanho das populações.

Visando reduzir os casos fatais, os legisladores têm melhor justificativa para leis como as
que regem a poluição atmosférica, inspeções de automóveis, utilização de cinto de
segurança e air bag, e dirigir em estado de embriaguez.

Esses são apenas poucos exemplos dos inúmeros usos da estatística.


1.5. Abusos da estatística

Frases célebres sobre o abuso no uso da estatística ilustram bem tal problema:

“os números não mentem; mas mentirosos forjam números” – Benjamin Disraeli;

“se torturarmos os dados por bastante tempo, eles acabarão por admitir qualquer coisa”.

O historiador Andrew Lang afirmou que algumas pessoas usam a estatística “como um
bêbado utiliza um poste de iluminação – para servir de apoio e não para iluminar”.

O mau uso da estatística pode ocorrer por ignorância ou descuido, mas, também, pelo uso
intencional de dados que atendem a interesses pessoais e ocultação de outros
desfavoráveis.

Alguns dos problemas mais comuns de mau uso da estatística são apresentados a seguir:
1.5. Abusos da estatística

Pequenas Amostras: amostras pequenas não são necessariamente ruins ou inúteis,


mas, a interpretação e extrapolação de seus resultados de forma irrestrita sim.
Por exemplo, as afirmações de apenas 10 dentistas sobre determinado creme dental,
sendo 7 deles favoráveis, não devem servir de base para uma afirmação generalizada
como “o creme dental xyz é recomendado por 7 em cada 10 dentistas”.
Mesmo que a amostra seja grande, ela deve ser não-tendenciosa e representativa da
população de onde provém. Às vezes uma amostra pode parecer realmente grande (como
uma pesquisa com “2000 adultos americanos escolhidos aleatoriamente”), mas se são
formuladas conclusões acerca de subgrupos, como republicanos católicos do sexo
masculino, tais conclusões podem estar baseadas em amostra muita pequena.

Números Precisos: a cifra R$37.576,36 de salário anual médio pode parecer mais
precisa do que a cifra R$37.600,00. Entretanto, casas decimais em excesso não são
garantia de estatística precisa.

Estimativas por Suposição: Número de pessoas em um grande evento aberto na


Avenida Paulista. Geralmente, os números apresentados são suposições (palpites) e não
se tratam de estatísticas sérias e confiáveis.
1.5. Abusos da estatística

Porcentagens Distorcidas: Em uma página de uma revista, a Continental Airlines


anunciou melhores serviços, no tocante ao extravio de bagagens. O anúncio dizia “se trata
de uma área em que já melhoramos 100% nos últimos seis meses”. Então, não ocorrem
mais extravios???

Cifras Parciais: “90% dos carros vendidos nos EUA pela montadora nos últimos 10 anos
ainda estão rodando”. O fabricante só não esclareceu que tais 90% de carros foram
vendidos nos últimos 3 anos.

Distorções Deliberadas: ocorre quando se forja resultados benéficos a alguém.


1.5. Abusos da estatística

Gráficos Enganosos: a verdadeira natureza dos dados está alterada no gráfico da


direita, distorcendo a real diferença entre os dados.
1.5. Abusos da estatística

Perguntas Tendenciosas: as perguntas em uma pesquisa podem ser formuladas de modo


a sugerirem uma resposta, alterando sobremaneira os resultados.
Ex.: 1) “O Presidente deve ter o poder de veto para eliminar desperdícios” – 97% respondeu “Sim”.
2) “O Presidente deve ter o poder de veto, ou não?” – 57% respondeu “Sim”.

Pressão do Pesquisador: Em uma pesquisa telefônica, 94% dos respondentes disseram


que lavam suas mãos após usar o banheiro, mas a observação em lugares tais como a
Estação Penn, em Nova York e Golden Gate Park em São Francisco mostraram que o
percentual efetivo foi de 68%.

Más Amostras: outra fonte de estatística enganosa são os métodos inadequados de coleta
de dados. Nesse caso, destaca-se o problema de pesquisa auto-selecionada, que é
aquela em que os próprios entrevistados decidem se serão incluídos.

Não resposta: a não-resposta ocorre quando alguém se recusa a responder ou não está
disponível.
1.5. Abusos da estatística

Alerta!
Dados coletados de forma descuidada podem ser tão inúteis que nenhum processamento
estatístico consegue salvá-los.
Cuidados!

Pontos importantes para o planejamento de um estudo capaz de produzir resultados


válidos:

1. Identificar com precisão a questão a ser respondida e definir com clareza a população
de interesse;
2. Estabelecer um plano para coleta de dados;
3. Coletar os dados;
4. Analisar os dados e tirar conclusões, além de identificar possíveis fontes de erros.
Os estudos que requerem métodos estatísticos decorrem tipicamente de duas fontes
comuns: estudos observacionais e experimentos.

Num estudo observacional, verificam-se e medem-se características específicas, mas não


tentamos manipular ou modificar os elementos a serem estudados.

Em experimento, aplica-se determinado tratamento e passa-se então a observar seus


efeitos sobre os elementos a serem pesquisados.
1.6. Amostragem – Cinco métodos mais comuns

Amostra Aleatória
Em uma amostra aleatória, os elementos da população são escolhidos de tal forma que
cada um deles tenha igual chance de figurar na amostra.

As amostras aleatórias podem ser escolhidas por diversos métodos, inclusive a utilização
de tabelas de números aleatórios.

Uma amostragem descuidada pode facilmente resultar numa amostra tendenciosa, com
características muito diferentes das da população que a originou.

Em contrapartida, a amostragem aleatória é cuidadosamente planejada para evitar qualquer


tendenciosidade.
1.6. Amostragem – Cinco métodos mais comuns

Amostragem Estratificada
Com a amostragem estratificada, subdividimos a população em, no mínimo, duas
subpopulações (ou estratos) que compartilham das mesmas características (ex.: sexo) e,
em seguida, extraímos uma amostra de cada estrato.

Em uma determinada pesquisa, poderíamos utilizar o sexo (gênero) como base para a
criação de dois estratos. Após obter uma relação dos homens e uma relação das mulheres,
aplicamos um método conveniente (como a amostragem aleatória) para escolher
determinado número de elementos de cada relação.

Quando os diversos estratos têm tamanhos amostrais que refletem a população global,
temos o que se chama amostragem proporcional. No caso de alguns estratos não serem
representados na proporção adequada, então os resultados poderão ser ajustados ou
ponderados convenientemente.

Para um tamanho fixo de amostra, se escolhermos aleatoriamente elementos de diferentes


estratos, temos chance de obter resultados mais consistentes (e menos variáveis) do que
com a simples escolha de uma amostra aleatória de toda a população.
1.6. Amostragem – Cinco métodos mais comuns

Amostragem Sistemática
Na amostragem sistemática, escolhemos um ponto de partida e selecionados cada késimo
elemento (como por exemplo, cada 50.º elemento da população).
Amostragem por Conglomerados
Na amostragem por conglomerados, começamos dividindo a área da população em seções
(ou conglomerados); em seguida escolhemos algumas dessas seções e, finalmente,
tomamos todos os elementos das seções escolhidas.
Amostragem de Conveniência
Na amostragem de conveniência, simplesmente utilizamos resultados que já estão
disponíveis.
1.6.1. Erros Amostrais e Não-Amostrais

Um erro amostral é a diferença entre um resultado amostral e o verdadeiro resultado


populacional; tais erros resultam de flutuações amostrais aleatórias.

Ocorre um erro não-amostral quando os dados amostrais são coletados, registrados ou


analisados incorretamente.

Esse problema resulta de um erro que não seja uma simples flutuação amostral
aleatória, como a escolha de uma amostra não-aleatória e tendenciosa, a utilização de
um instrumento de mensuração defeituoso, uma questão formulada de modo
tendencioso, um grande número de recusas de resposta ou a cópia incorreta de dados
amostrais.