POPULAO E AMOSTRA
__________________________________________________________________
Captulo 1
RECENSEAMENTO E SONDAGEM
POPULAO E AMOSTRA
__________________________________________________________________
Em Portugal a primeira operao que se conhece deste gnero foi levada a cabo por D.
Joo III em 1527 e ficou conhecida pelo "numerando dos vizinhos", tendo permitido
estalelecer uma estimativa da populao portuguesa. Este apuramento estatstico,
constitui um motivo de orgulho para os portugueses visto que foi um dos primeiros
estudos deste gnero conhecido na Europa.
O INE, Instituto Nacional de Estatstica, tem a seu cargo fazer recenseamentos da populao portuguesa, o ltimo dos quais, o XIII Recenseamento Geral da Populao, foi
reali-zado em 1991. Neste recenseamento ficaram a conhecer-se variadas caractersticas do nosso povo como por exemplo: a situao civil, a habitacional, a populao
emigrante, etc. Os dados relativos aos censos so extremamente importantes pois tm
influncia directa na deciso em assuntos de interesse nacional e local, tal como seja na
educao, emprego, sade, transportes, recursos naturais, etc, etc. Comparando
resultados de recenseamentos sucessivos pode-se extrapolar e predizer padres futuros
da populao. Podemos obter informao sobre, por exemplo, a estrutura da idade da
populao e crescimento populacional, fundamental para o planeamento na construo
de novas escolas, alojamento para idosos, etc.
A realizao de um recenseamento geral da populao, alm de implicar gastos muito
elevados, extremamente difcil de conduzir. H problemas associados com a recolha
adequada da informao, seu armanezamento, tratamento, posterior divulgao, etc.
de referir que esta prtica se pode estender a outras situaes, tais como, s habitaes
(recenseamento da habitao), s indstrias (recenseamento industrial), Agricultura
(recenseamento agrcola), etc. importante que fique claro que a palavra recenseamento est associada anlise de todos os elementos da populao em causa e que
tem por objectivo no s a enumerao dos seus elementos, como tambm o estudo de
caractersticas importantes . No contudo vivel nem desejvel, principalmente quando o nmero dos elementos da populao muito elevado, inquirir todos os elementos
da populao sempre que se quer estudar uma ou mais caractersticas particulares dessa populao. Assim surge o conceito de sondagem, que se pode tentar definir como:
Sondagem - Estudo cientfico de uma parte de uma populao com o objectivo de estudar atitudes, hbitos e preferncias da populao relativamente
a acontecimentos, circunstncias e assuntos de interesse comum.
__________________________________________________________________
A realizao de sondagens uma actividade da segunda metade do sc XX. Embora antes de 1930 j se tenham realizado sondagens, estas eram feitas de um modo muito
pouco cientfico. Foi necessrio um desenvolvimento adequado de mtodos e tcnicas
estatsticas para que as sondagens pudessem ser realizadas e os resultados analisados
cientificamente.
S em 1973 que, pela 1 vez , apareceu publicado nos orgos de comunicao social o
resultado de uma sondagem realizada em Portugal, nomeadamente, "63% dos
Portugueses nunca votaram" (Paula Vicente et al, 1996). Embora as sondagens se
tenham popularizado devido a questes polticas, elas no so apenas um importante
instrumento poltico; acima de tudo constituem um instrumento de importncia vital em
estudos de natureza, quer econmica, quer social . Assim, se nos meios polticos as sondagens so usadas para obter informao acerca das atitudes dos eleitores, de modo a
planear campanhas, etc, elas so importantes tambm em estudos de mercado, para
testar as preferncias dos consumidores, descobrir o que mais os atrai nos produtos
existentes ou a comercializar, tendo como objectivo o de satisfazer os clientes e aumentar as vendas. Tambm na rea das cincias sociais as sondagens so importantes para,
por exemplo, estudar as condies de vida de certas camadas da populao.
fundamental referir que, contrariamente ao recenseamento, as sondagens inquirem ou
analisam apenas uma parte da populao em estudo, isto , restringem-se a uma
amostra dessa populao, mas com o objectivo de extrapolar para todos os elementos
da populao os resultados observados na amostra.
Uma sondagem realiza-se em vrias fases: escolha da amostra, obteno da
informao, anlise dos dados e relatrio final. Para que os resultados de uma
sondagem sejam vlidos h necessidade de essa amostra ser representativa da
populao. O processo de recolha da amostra, a amostragem, tem de ser efectuada com
os cuidados adequados. Quando so usadas tcnicas apropriadas e a amostra
suficientemente grande, os resultados obtidos encontram-se em geral perto dos
resultados que se obteriam, se fosse estudada toda a populao.
H certos livros de texto do ensino secundrio que identificam amostragem com
sondagem. Isto no correcto. Com efeito, a amostragem diz respeito ao procedimento
__________________________________________________________________
__________________________________________________________________
Quer se trate de uma sondagem ou no, a maior parte das situaes em que
necessrio utilizar tcnicas estatsticas envolve a necessidade de tirar concluses gerais
acerca de um grande conjunto de indivduos, baseando-nos num nmero restrito desses
indviduos. Surge assim a necessidade de definir os conceitos de Populao e Amostra,
conceitos estes j utilizados anteriormente.
Populao - coleco de unidades individuais, que podem ser pessoas, animais, resultados experimentais, com uma ou mais caractersticas em comum, que se pretendem analisar.
Exemplo 1 - Relativamente populao constituda pelos alunos da Escola Secundria
Prof. Herculano de Carvalho, em Lisboa, poderamos estar interessados em estudar as
seguintes caractersticas populacionais:
- altura (em cm) dos alunos;
- notas obtidas na disciplina de Portugus, no 1 perodo;
- nmero de irmos de cada aluno;
- tempo que cada aluno demora a chegar escola;
- idade dos alunos;
- cor dos olhos.
Exemplo 2 - Uma populao que pode ter interesse estudar a constituda pelas
temperaturas (em C) , todos os dias s 9 horas, na praia da Costa de Caparica.
Ao estudar uma populao, normalmente o que se pretende estudar algumas
caractersticas numricas a que chamamos parmetros.
Exemplo 3 - Ao estudar a populao constituda por todos os potenciais eleitores para
as legislativas, dois parmetros que podem ter interesse so:
- idade mdia dos potenciais eleitores que esto decididos a votar;
- percentagem de eleitores que esto decididos a votar.
Para conhecer aqueles parmetros, teria de se perguntar a cada eleitor a sua idade,
assim como a sua inteno no que diz respeito a votar ou no. Esta tarefa seria
impraticvel, nomeadamente por questes de tempo e de dinheiro.
__________________________________________________________________
Outras razes, alm das apontadas anteriormente, que podem levar a que no se possa
observar exaustivamente todos os elementos de uma populao, prendem-se com o
facto de algumas populaes terem dimenso infinita - populao constituda pelas
temperaturas em todos os pontos de uma cidade, ou a prpria observao levar
destruio da populao! Por exemplo, o departamento de controlo de qualidade de uma
fbrica de baterias de carros, em que o teste para verificar se a bateria est em perfeitas
condies obriga ao desmantelamento da bateria, no pode verificar todas as baterias,
pois destruiria toda a populao!
As consideraes anteriores levam-nos a concluir que, de um modo geral, no podemos
determinar exactamente os parmetros desconhecidos da populao a estudar.
Podemos sim estim-los utilizando estatsticas, que so quantidades calculadas a partir
da observao de uma amostra recolhida da populao.
Amostra - subconjunto da populao, que se observa com o objectivo de
tirar concluses para a populao de onde foi recolhida.
Tendo em considerao o objectivo com que se recolhe a amostra, o de retirar
concluses para a populao, esta fase do processo estatstico, a da recolha da
amostra, muito importante, pois a amostra deve ser to representativa quanto possvel
da populao.
Resumindo, importante chamar a ateno que, em toda a situao estatstica
envolvendo populao e amostra, a caracterstica numrica que se est a estudar
aparece sob duas formas: como caracterstica populacional ou parmetro e como
caracterstica amostral ou estatstica. No caso do exemplo 3, caracterstica
populacional "percentagem de eleitores que esto decididos a votar" corresponde a
caracterstica amostral " percentagem dos 1000 eleitores (entretanto recolheu-se uma
amostra de dimenso 1000), que interrogados disseram estar decididos a votar". Estas
quantidades so conceptualmente distintas, pois enquanto a caracterstica populacional
pode ser considerada um valor exacto, embora desconhecido, a caracterstica amostral
conhecida, embora contendo um certo erro, mas que todavia pode ser considerada uma
estimativa til da caracterstica populacional respectiva, se efectivamente a amostra
utilizada for representativa da populao subjacente.
__________________________________________________________________
__________________________________________________________________
Este princpio pode ser exemplificado com uma populao de dimenso pequena, como
no exemplo seguinte.
Exemplo 4 - Consideremos a populao constituda pelos 18 alunos de uma turma do
10 ano de uma determinada Escola Secundria, em que a caracterstica de interesse a
estudar a altura mdia desses alunos. Uma maneira possvel de recolher desta
populao uma amostra aleatria, seria escrever cada um dos indicadores dos
elementos da populao num quadrado de papel, inserir todos esses bocados de papel
numa caixa e depois seleccionar tantos quantos a dimenso da amostra desejada.
Este exemplo pode ser aproveitado pelo Professor, que pedir a cada aluno que retire da
caixa 4 papis, registe os nmeros dos alunos seleccionados e os coloque de novo na
caixa, antes do prximo aluno fazer a recolha da sua amostra. Chamar-se- aqui a
ateno que a recolha est a ser feita sem reposio, pois quando se retira um papel
(elemento da populao), ele no reposto enquanto a amostra no estiver completa
(com a dimenso desejada). Qualquer conjunto de nmeros recolhidos desta forma dar
origem a uma amostra aleatria, constituda pelas alturas dos alunos seleccionados. Cada aluno dispor assim de uma amostra de dimenso 4, que lhe vai permitir calcular uma
mdia, que ser uma estimativa do parmetro a estudar - valor mdio da altura dos
alunos da turma. Obter-se-o tantas estimativas, quantas as amostras retiradas.
Chamar-se- ento a ateno para o facto de nesta altura no se poder dizer qual das
estimativas "melhor", isto , qual delas uma melhor aproximao do parmetro a
estimar, j que esse parmetro desconhecido (obviamente que nesta populao to
pequena seria possvel estudar exaustivamente todos os seus elementos, no sendo
necessrio recolher nenhuma amostra - este exemplo s serve para exemplificar uma
situao)!
O processo que acabamos de descrever um processo que nos permite obter amostras
aleatrias simples.
Nesta altura poder-se- explorar a utilizao da calculadora, para obter uma amostra
aleatria.
123
rand + 1 ,
do
randInt(1,123)
ponto
de
vista
prtico
com
funo
de
uma
vez
fazendo
simplesmente
Contudo, novamente temos de ter o cuidado de verificar se no h nmeros repetidos (e o mais provvel que
haja). Se isso acontecer, vai ser preciso sortear mais alguns
nmeros.
Nota: Um outro processo relacionado com a recolha de uma amostra, abordado atravs do exemplo seguinte. Embora seja abordada uma noo que no faz parte do
programa, pensamos que importante, porque relata uma situao que surge com
frequncia nas aplicaes.
Exemplo 5 - Suponhamos que numa escola secundria se pretende averiguar, aps o 1
perodo, a percentagem de alunos do 10 ano, com nota negativa a Matemtica. Sabe-se
que as turmas no so todas uniformes no aproveitamento, pois que a sua constituio
obedeceu partida a procedimentos no aleatrios. Assim, para seleccionar uma amostra representativa da populao a estudar, deve-se ter o seguinte cuidado: comea-se
por verificar quantas turmas e quantos alunos de cada turma constituem a populao.
Para fixar ideias, admitamos que a populao a estudar constituda por 3 turmas A, B e
C, com 25, 30 e 18 alunos respectivamente e que se pretende recolher uma amostra de
dimenso 15. Calculando-se a percentagem de alunos de cada turma que compem a
populao, entra-se com esses valores para calcular quantos alunos se deve recolher
em cada turma para constituirem a amostra:
Turma
N elementos
25
25/73 = .34
.34 x 15 5
30
30/73 = .41
.41 x 15 6
18
18/73 = .25
.25 x 15 4
Total
73
15
o de dimenso 1000 uma amostra de dimenso 100 for suficiente para o estudo de determinada caracterstica, no se exige necessariamente uma amostra de dimenso 200
para estudar a mesma caracterstica de uma populao anloga, mas de dimenso
2000. Finalmente chama-se a ateno para o facto de que se o processo de amostragem originar uma amostra enviesada, aumentar a dimenso no resolve nada, antes
pelo contrrio!
uma amostra pode ser representativa de uma populao quando se pretende estudar
uma sua caracterstica e o deixe de ser ao estudar outra caracterstica. Por exemplo, se
se pretende estudar a caracterstica "cor dos olhos" de uma populao, pode-se recolher
uma amostra constituda apenas por mdicos. Esta amostra no servir, no entanto,
para estudar a caracterstica "conhecimentos de biologia", dessa mesma populao j
que os mdicos tm conhecimentos de Biologia diferentes dos da generalidade da
populao. Os conceitos populao, amostra e caracterstica (caractersticas) a estudar
no se podem assim dissociar.
b) Pedir aos alunos que recolham informao nos jornais sobre notcias que envolvam
recenseamentos e sondagens, aproveitando para as comentar. Por exemplo:
Sondagem
10%
no sabem
quem
o Presidente
da Repblica
Ficha Tcnica
DEZ por cento dos portugueses no sabem quem o Sondagem efectuada entre os dias 6 e 31 de JaneiPresidente da Repblica e 9 por cento desconhecem ro. O universo constitudo pela populao de
a identidade do primeiro-ministro. Uma sondagem de Portugal Continental, com idades entre os 18 e os 74
2000 inquiridos EX-PRESSO/Euroexpanso revela anos. A amostra de 1964 indivduos, entrevistados
ainda ndices mais desoladores para o presidente da directamente, nas suas residncias, seleccionados
Assembleia da Repblica (s identificado por 39 por atravs do mtodo de quotas resultantes da
cento dos inquiridos), para os lderes partidrios interseco das variveis sexo, idade e grau de
(desconhecidos de mais de metade do universo) e instruo, e distribudos do seguinte modo: Litoral
para os chefes dos grupos parlamentares (igno-rados Norte (474), Grande Porto (212) , Interior Norte (272),
pela quase totalidade da amostra). Os dados da Litoral Centro (298), Grande Lisboa (449) e Interior
sondagem mostram ainda que os portugueses no Sul (259). Os resultados foram ponderados com
distinguem entre Antnio Guterres/ primeiro-ministro e base nas variveis regio/sexo/idade. A sondagem
Antnio Guterres/secretrio-geral do PS: 91 por cento da responsabilidade da Euroexpanso e a anlise de
sabem que ele o chefe de Governo, mas 52 por resultados feita pelo EXPRESSO.
cento ignoram que ele o lder dos socialistas (ver
pg. 7).
- Existiam 18 034 famlias com crianas com menos de 15 anos, vivendo apenas com um
ou os dois avs.
8 616 crianas viviam em alojamentos descritos como "barracas", especialmente junto
s grandes cidades.
No
S im
No
S im
S im
Procede-se reduo dos dados, resumindo a informao sobre quantos sim's se obtiveram, chegando-se concluso que nas 1000 respostas, 635 foram afirmativas. Ento
dizemos que a percentagem de eleitores que pensam votar no candidato, de entre os inquiridos, de 63.5%. A funo da Estatstica Descritiva acabou aqui! (Se toda a Populao tivesse sido inquirida, este estudo descritivo dar-nos-ia a informao necessria para
o fim em vista).
Poderemos agora inferir que 63.5% dos eleitores da cidade do Porto pensam votar no
Senhor X? A resposta a esta pergunta nem sim, nem no, mas talvez. agora que
temos necessidade de utilizar o conceito de Probabilidade, para quantificar a incerteza
associada inferncia. Assim, existem processos de inferncia estatstica que, do
resultado obtido a partir da amostra, nos permitiro concluir que o intervalo [60.5%,
66.5%] contm o valor exacto para a percentagem de eleitores da cidade que pensam
votar no Senhor X, com uma confiana de 95%.
Nota - A confiana de 95% deve ser entendida no seguinte sentido: se se recolherem
100 amostras, cada uma de dimenso 1000, ento poderemos construir 100 intervalos;
destes 100 intervalos esperamos que 95 contenham o verdadeiro valor da percentagem
(desconhecida) de eleitores da cidade do Porto, que pensam votar no candidato.
Nesta altura o Professor poder recordar aos alunos a forma como as previses so
dadas, em noite de eleies, sob a forma de intervalos. Poder referir que por vezes a
guerra de audincias faz com que estas previses tenham pouco sentido, por
apresentarem intervalos com uma to grande amplitude que a sua preciso, como
estimativas das percentagens pretendidas, muito pequena. Esta situao prende-se
com o facto de as amostras utilizadas para a construo dos intervalos terem uma
dimenso muito reduzida, havendo assim muito pouca informao disponvel. No
entanto, medida que a noite vai avanando, os intervalos vo diminuindo de amplitude,
estando esta diminuio da amplitude relacionada com a dimenso da amostra que
entretanto vai aumentando, at finalmente estarem todos os votos contados. Nesta
altura, os intervalos reduzem-se a pontos, que so as percentagens pretendidas.
Poder-se- tambm chamar a ateno para que a compreenso do processo estatstico
nos permitir compreender melhor notcias que, com muita frequncia, se lem nos
jornais ou ouvem na televiso. Por vezes alguns estudos sobre os mesmos assuntos,
apresentam resultados que chegam a ser contraditrios! Isto acontece nomeadamente
no estudo de certos aspectos do comportamento humano, utilizando testes psicolgicos,
ou no estudo de certas doenas utilizando cobaias. Muitas das inferncias feitas so
imperfeitas, a maior parte das vezes por terem como base dados imperfeitos.
O seguinte esquema pretende resumir as diferentes etapas que normalmente so
seguidas num procedimento estatstico:
Populao
Amostra
Caractersticas
populacionais
Estatstica
Indutiva
Estatstica
Descritiva
Estudo da amostra:
-
tabelas
grficos
medidas
Caractersticas
amostrais