Anda di halaman 1dari 10

EXERCÍCIOS DE ESTATÍSTICA DESCRITIVA

1. Os dados do quadro seguinte referem-se ao resultado de um teste de germinação


realizado num dado lote de cereal do qual se recolheram 80 amostras, cada uma
constituı́da por 100 grãos, que foram postos a germinar em condições estandard-
izadas de temperatura e humidade. O no¯ de grãos que germinaram ao fim de 14
dias por amostra está registado no referido quadro.

86 95 92 89 92 92 91 88 88 94
90 88 89 90 86 88 93 92 92 87
91 94 92 94 91 92 88 94 93 91
91 91 92 90 89 86 89 90 90 89
84 89 88 93 92 95 86 93 91 90
91 89 89 95 92 94 94 90 86 93
86 94 90 87 93 91 90 92 93 94
92 92 94 93 93 92 93 93 88 91

a) Construa uma tabela de frequências observadas, relativas e acumuladas para


o no¯ de germinações.
b) Qual a proporção de amostras com um no¯ de germinações superior a 90?
c) Construa o diagrama de barras correspondente.

2. Considere o quadro seguinte com os dados da altitude das principais serras do


Continente. Represente graficamente os dados. Teça comentários sobre a dis-
tribuição das altitudes das serras. ( Fonte: Instituto Geográfico e Cadastral
e Centro de Estudos Geográficos; dados reproduzidos no Anuário Estatı́stico,
I.N.E., Lisboa, 1980):

Designação Altitude (m) Designação Altitude (m)


Peneda 1416 Gardunha 1227
Soajo 1415 Leomil 1008
Gerês 1507 Lapa 953
Barroso 1208 Marofa 973
Larouco 1525 Malcata 1075
Cabreira 1261 Grândola 325
Alvão 1283 Cercal 372
Marão 1415 Espinhaço de Cão 297
Padrela 1146 Monchique 902
Coroa 1273 Caldeirão 577
Montezinho 1438 Mendro 412
Nogueira 1318 Ossa 653
Bornes 1200 S.Mamede 1025
Mogadouro 993 Adiça 522
Montemuro 1382 Sicó 553
Arada 1116 Aire 679
Caramulo 1071 Candeeiros 613
Buçaco 549 Montejunto 664
Lousã 1204 Sintra 528
Açor 1340 Arrábida 501
Estrela 1991 Monte Figo 411
Alvelos 1084

37
3. Construir uma tabela de frequências e representar graficamente os dados do
seguinte quadro, relativos a rendimentos de trigo (kg ha−1 ) em Portugal entre
1951 e 1985, agrupando os dados em classes de amplitude constante e em classes
de amplitude variável. Calcule medidas de localização e dispersão.

Ano Rendimento Ano Rendimento Ano Rendimento


1951 866 1963 800 1974 1176
1952 823 1964 689 1975 1304
1953 916 1965 975 1976 1292
1954 1006 1966 609 1977 874
1955 636 1967 1285 1978 736
1956 717 1968 1461 1979 883
1957 983 1969 981 1980 1221
1958 1000 1970 1128 1981 928
1959 742 1971 1571 1982 1200
1960 675 1972 1254 1983 987
1961 653 1973 1250 1984 1589
1962 886 1985 1435

4. Considere os dados do quadro seguinte, relativos a produções e preços de vinho,


no Continente, entre 1949 e 1961.

Ano Produção Preços


103 hl esc l−1
1949 6037 2.05
1950 6458 2.62
1951 6981 2.57
1952 4233 3.38
1953 8789 2.02
1954 8959 1.68
1955 8289 1.78
1956 7910 1.99
1957 6775 3.02
1958 6088 3.23
1959 6381 2.98
1960 8600 2.74
1961 4805 3.38

Para os valores da coluna “preços”:

a) Construa uma tabela de frequências.


b) Construa dois histogramas, considerando as seguintes classes de amplitude
constante:
{[1, 2[, [2, 3[, [3, 4[} e {[1.5, 2[, [2, 2.5[, [2.5, 3[, [3, 3.5[}. Comente.
c) Calcule medidas de localização e dispersão e construa o diagrama de extremos
e quartis.

5. Perante os seguintes valores de distribuição de frequências, calcule e indique quais


as medidas de localização mais adequadas a cada um dos casos. Justifique.

Classe de número de número de número de nı́veis de número de


rendimento famı́lias filhos casais classificação alunos
0-500 50 0 4 A 10
500-1000 20 1 6 B 20
1000-2000 20 2 5 C 15
+ de 2000 10 3 3 D 5

38
6. Se z1 = x1 + y1 , z2 = x2 + y2 , ... , zn = xn + yn , prove que:

z = x + y.

7. De um total de N números, a fracção p (0 < p < 1) é constituida por números 1


e a fracção q = 1 − p é constituı́da por 0.

a) Calcule a média do conjunto dos N números.



b) Supondo N grande, prove que o desvio padrão é aproximadamente pq.

8. Os valores da precipitação (em mm) registada na Estação Meteorológica de Lis-


boa, nos 31 dias de Janeiro de 1948, foram os seguintes (dados do INMG):

Dia Precip. Dia Precip. Dia Precip.


1 0.0 11 3.8 21 0.9
2 0.0 12 0.3 22 0.3
3 0.0 13 0.0 23 18.2
4 0.0 14 0.0 24 4.0
5 4.7 15 0.5 25 4.6
6 0.6 16 7.0 26 22.0
7 17.2 17 0.0 27 15.6
8 1.4 18 0.0 28 0.0
9 11.2 19 3.3 29 3.4
10 1.0 20 7.6 30 0.0
31 0.0

a) Calcule a precipitação média diária em Lisboa, em Janeiro de 1948.


b) Calcule a precipitação mediana diária em Lisboa, em Janeiro de 1948.
c) Compare os valores obtidos da média e da mediana e comente, tendo em
atenção que ambos são indicadores de localização.
d) Construa um histograma para os dados da precipitação e comente-o.

9. Considere o seguinte quadro referentes às quantidades e montantes (a preços cor-


rentes) das importações globais de produtos agrı́colas do Continente (Estatı́sticas
Agrı́colas do INE de 1973):

ano quantidade (1000 t.) montante (milhões de esc.)


1969 2023 8939
1970 2045 9544
1971 2215 10826
1972 2731 13795
1973 3013 18344
1974 3564 28680
1975 3069 26685

Calcule um indicador de dispersão para cada conjunto de dados. Discuta a ade-


quação de cada um destes indicadores para a caracterização da variabilidade das
importações globais nos anos considerados.

39
10. A média e variância de uma primeira série de 15 observações são respectivamente:
x1 = 30 s21 = 25, e a média e variância de uma segunda série de 20 observações
são: x2 = 40 s22 = 36.
Qual a média e a variância do conjunto das 35 observações?

11. Numa série de n = 25 medições obteve-se x = 56 m e s = 2 m.


Depois de obtidos estes resultados descobriu-se que tinha sido cometido um
engano numa das medições, que foi registada com o valor 64m.
Determine a média e o desvio padrão, admitindo que a medição incorrecta é
omitida.

12. Numa experiência medem-se fluxos de calor de meia em meia hora, das 7h às
18h (inclusivé), durante três dias consecutivos. Os resultados obtidos (em W
m−2 ) são indicados na tabela em baixo. Ao lado da tabela estão os diagramas de
extremos-e-quartos dos três dias, sem qualquer ordem aparente.

DIA 1 DIA 2 DIA 3


-27 -24 -85
-32 -38 -74
-31 -61 -49
-53 -54 -31
-67 -59 -18
-48 -65 -32
-38 -67 -33
-47 -74 -57
-41 -120 -34
-41 -150 -59
-63 -171 -48
-114 -50 -92
-100 -98 -138
-100 -175 -74
-175 -184 -103
-208 -178 -196
-228 -228 -194
-208 -295 -259
-208 -320 -255
-196 -359 -284
-236 -401 -324
-210 -422 -294
-216 -405 -372

a) Associe cada diagrama ao respectivo dia. Justifique.


b) Sem fazer contas, diga se a média correspondente ao 1o¯diagrama será inferior
ou superior a -100. Justifique.
c) Considere agora o conjunto das observações nos 3 dias. Construa uma tabela
de frequências para dados agrupados em classes de amplitude 50.
d) Use a tabela da alı́nea anterior para calcular valores aproximados da média e
da mediana das observações nos três dias. Comente os resultados.

40
13. Construa o diagrama extremos e quartis para os rendimentos de trigo em Portugal
nos anos 1951-1985 (quadro do exercı́cio 3).

14. Dados relativos à área arvense das grandes empresas agrı́colas patronais nos con-
celhos do distrito de Setúbal apontam para a seguinte situação, em 1952-53:

CONCELHOS 100+ − 200 200+ − 500 500+ − 1000 1000+ − 2500 2500+ − 5000
hectares hectares hectares hectares hectares
Alcácer do Sal 18 29 24 14 3
Montijo 6 1 1 3 1
S. do Cacém 58 29 14 6 1
Grândola 32 24 5 1 1
Setúbal 0 1 1 0 0
Palmela 0 0 0 1 0
Sines 11 4 0 0 0
Sesimbra 0 0 1 0 0
Alcochete 0 1 0 0 0
Adaptado de:Estruturas agrı́colas em Portugal Continental , Vol.I, J. Silva Martins , P RELO, 1973.

a) Calcule as distribuições de frequências absolutas marginais e interprete-as.


b) Calcule aproximadamente a área arvense média e a área arvense mediana das
grandes empresas agrı́colas patronais no concelho de Alcácer do Sal.
c) Indique, justificando, qual dos seguintes histogramas é adequado à repre-
sentação dos dados relativos ao concelho de Alcácer do Sal:

I II III

15. Construa uma nuvem de pontos para o conjunto de pares de dados ({xi , yi })
relativos a:

a) x - produção ; y - preço (quadro do exercı́cio 4)


b) x - ano ; y - produção (quadro do exercı́cio 4)
c) x - ano ; y - rendimento (quadro do exercı́cio 3)
d) x - quantidade ; y - montante (quadro de exercı́cio 9)

41
Para cada quadro, sugira um valor plausı́vel para o coeficiente de correlação das
duas variáveis em causa. Seguidamente calcule os valores desses coeficientes e
compare-os com as suas sugestões.

16. Indique qual dos valores abaixo indicados se aproxima mais do coeficiente de cor-
relação dos dados descritos nas seguintes nuvens de pontos:

a) 0 b) 0.8 c) -0.5 d)2.0

I II III

IV V VI

17. Determine a recta de regressão de “preços” sobre “produção” nos dados do quadro
do exercı́cio 4. Interprete o significado económico dos parâmetros da recta de
regressão obtida.

18. Considere o quadro do exercı́cio 3. A covariância da variável “Rendimento” com


a variável “Ano” é 1507.853. É sugerido que se trata dum valor elevado, pelo que
se justificaria o ajustamento duma recta de regressão de rendimentos sobre anos.
Comente esta afirmação, justificando a sua opinião.

19. A recta de regressão duma variável y sobre uma variável x é:

y = −0.643 + 2.69x

Sabe-se também que a covariância das duas variáveis é 18.9, que a variância de
y é 52.9 e que a média de x é 6.

42
a) Determine o coeficiente de correlação r das duas variáveis. Comente.
b) Determine y.

20. Pensa-se que existe uma relação entre o total de alimento ingerido e o peso
corporal de aves. Para estudar essa relação foi realizada uma experiência num
dado aviário tendo sido obtidos os seguintes resultados:

Ave Peso(x)(kg) Alimento ingerido (y)(kg)


1 4.6 87.1
2 5.1 93.1
P
3 4.8 89.8 x = 49.8
P
4 4.4 91.4 y = 935.6
P 2
5 5.9 99.5 x = 249.54
P 2
6 4.7 92.1 y = 87670.34
P
7 5.1 95.5 xy = 4671.1
8 5.2 99.3
9 4.9 93.4
10 5.1 94.4

a) Calcule os elementos necessários para desenhar o diagrama de extremos e


quartis da variável ‘peso da ave’ (x) e represente esse diagrama.
b) Parece-lhe adequada a existência de uma relação linear entre x e y? Porquê?
c) Independentemente da resposta dada na alı́nea anterior, determine a recta
de regressão da quantidade de alimento ingerido sobre o peso, indicando a
precisão dessa recta.
d) Qual o valor que se prevê para a quantidade de alimento ingerida por uma
ave pesando 5.0 kg?
e) É proposto usar esta regressão para tentar predizer a quantidade de alimento
ingerida por uma ave pesando 3.1 kg. Comente a validade de tal predição.
f) Sabe-se que os dados originais foram obtidos em libras (1kg = 2.205lb).
Suponha que lhe era pedido para escrever a regressão linear entre x e y
nas unidades originais (libras); deduza a relação existente entre os coefi-
cientes da nova recta e os da recta que obteve na alı́nea c). Haverá alteração
na precisão da recta de regressão?

21. A medição directa do calor especı́fico de ramos de macieira é difı́cil de efectuar.


Um investigador propõe predizer o calor especı́fico de ramos individuais a partir
de medições muito mais simples de efectuar da percentagem de água no ramo,
em vez de medir directamente o calor especı́fico.
Para isso recolheu observações da percentagem de água (x) e do calor especı́fico
(y) de 21 ramos. Os valores obtidos são os seguintes :

43
x y x y x y
49 46 53 57 62 119
58 90 50 44 63 131
59 104 57 100 52 53
51 65 53 89 51 70
56 85 60 96 65 131
61 113 52 69 52 66
56 96 58 111 54 69
a) Desenhe o diagrama de extremos e quartis para os valores do calor especı́fico
observados. Comente a distribuição dos dados.
b) Parece-lhe adequada a existência de uma relação linear entre x e y? Porquê?
Independentemente da sua resposta ajuste aos dados a recta de regressão
dos mı́nimos quadrados.
c) Qual o valor que se prevê para o calor especı́fico quando a percentagem de
água é de 60? Justifique.
d) Sabe-se que, para facilitar os cálculos , os valores originais obtidos para o calor

especı́fico dos ramos (y ) foram transformados de acordo com a expressão

y = 1000 y − 600, sendo os valores de y os registados na tabela dada acima.

Suponha que lhe era pedido para escrever a regressão linear entre x e y ;
deduza a relação existente entre os coeficientes da nova recta e os da recta
que obteve em b). Haverá alteração na precisão da regressão?

22. Para estudar a variação dos comprimentos da raı́z de Agropyron cristatum L., em
função da idade das plantas, fizeram-se as seguintes observações, em que, para
cada data, se mediram as raı́zes de 8 plantas:

Data da medição No¯ de dias Comprimento médio


da raı́z
5 de Abril 0 5
12 de Abril 7 10
18 de Abril 13 12
25 de Abril 20 29
2 de Maio 27 36
9 de Maio 34 83
6 de Junho 62 1002

a) Faça um esboço do diagrama de dispersão (nuvem de pontos) do comprimento


médio da raı́z e do número de dias. Indique qual lhe parece ser a relação
existente entre aquelas variáveis.
b) Ajuste aos dados um modelo linear e esboce o gráfico dos resı́duos. Comente.

23. O Gabinete de Planeamento Regional de certa região do nosso paı́s procurou


definir um indicador que lhe permitisse analisar a intensidade de cultivo dos
campos.

44
Para tal recolheu informação das últimas duas décadas, tendo conseguido estab-
elecer que as vendas de adubo quı́mico ( em milhares de toneladas) têm vindo a
registar a seguinte evolução:

Anos 1970 1972 1974 1976 1978 1980 1982 1984 1986
Vendas 8600 6800 5400 4300 3500 2850 2300 1700 1480

a) Desenhe o diagrama de extremos e quartos para as vendas de adubo quı́mico.


b) Determine a equação da recta de regressão das vendas de adubo quı́mico nas
décadas referidas. Diga qual a precisão da recta determinada.
c) Indique um valor esperado para o consumo do adubo quı́mico em 1975.

24. Um conjunto de n=23 dados bidimensionais {(xi , yi )}23


i=1 tem centro de gravidade
(x, y) = (12.5,-116.826087). Foi ajustada a recta de regressão de y sobre x. O
resı́duo associado ao ponto (9.50,-48.0) é ei =3.93

a) Qual é a equação da recta de regressão?


b) Sabendo que a soma dos quadrados devidos à regressão é SQR = 124742.0703
e que a variância de y é s2y =6071.882798, calcule (justificando as suas re-
spostas):
i) s2x
ii) covxy
iii) o coeficiente de determinação
iv) a soma dos quadrados dos resı́duos, SQE
v) o coeficiente de correlação.

25. Suponha que fazia um ajustamento linear com n observações bidimensionais


{(xi , yi )}ni=1 tendo determinado certos valores os coeficientes da recta de regressão
y = a + bx. Pretende-se agora fazer um novo ajustamento com mais uma ob-
servação. Caracterize a nova recta de regressão, admitindo que o novo valor
observado para x é igual à média dos n valores anteriormente observados para a
mesma variável.

45
26. Considere os quatro conjuntos de dados seguintes (dados de Anscombe, 1973):

x1 y1 x2 y2 x3 y3 x4 y4
10 8.04 10 9.14 10 7.46 8 6.58
8 6.95 8 8.14 8 6.77 8 5.76
13 7.58 13 8.74 13 12.74 8 7.71
9 8.81 9 8.77 9 7.11 8 8.84
11 8.33 11 9.26 11 7.81 8 8.47
14 9.96 14 8.10 14 8.84 8 7.04
6 7.24 6 6.13 6 6.08 8 5.25
4 4.26 4 3.10 4 5.39 19 12.5
12 10.84 12 9.13 12 8.15 8 5.56
7 4.82 7 7.26 7 6.42 8 7.91
5 5.68 5 4.74 5 5.73 8 6.89

a) Calcule as médias de cada uma das oito variáveis. Comente.


b) Calcule as variâncias de cada uma das oito variáveis. Comente.
c) Calcule os coeficientes de correlação entre as variáveis x e as variáveis y de
cada um dos quatro pares de variáveis. Comente.
d) Calcule as rectas de regressão de y sobre x para cada um dos quatro pares de
variáveis (xi ,yi ), (i=1,...,4).
e) Construa as quatro nuvens de pontos correspondentes aos pares de variáveis
utilizados nas duas alı́neas anteriores. Comente, à luz dos resultados das
alı́neas anteriores.

−400 −300 −200 −100

46

Anda mungkin juga menyukai