1 INTRODUCCION
Resoluci
on de algunos ejemplos y ejercicios
del tema 1.
1.1
Ejemplos
Ejemplo 1 Se han medido el grup sanguneo de 40 individuos y se han observado las siguientes frecuencias absolutas para cada categora: 12 para x1 = A,
11 para x2 = B, 8 para x3 = AB y 9 para x4 = O.
a) De que tipo es la variable estudiada? Construir la tabla de frecuencias
correspondiente.
b) Que porcentaje de individuos son del grupo A?
c) Que porcentaje de individuos no son del grupo O?
d) Cu
antos individuos no son del grupo B?
Respuestas: a) Categ
orica nominal.
grupo
A
B
AB
O
Total
ni
12
11
8
9
40
fi
0.3
0.275
0.2
0.225
1
ni
62
108
319
412
901
ni
62
108
319
412
901
fi
0.07
0.12
0.35
0.46
1
Ni
62
170
489
901
Fi
0.07
0.19
0.54
1
b) El 35%, c) 170 y representan el 19%, d) 319 + 412 = 731 o bien 901 170 =
731, que representan el 35 + 46 = 81% (o bien 100 19 = 81%).
Ejemplo 3 Se quiere estudiar la eficacia de un nuevo insecticida para plantas
de interior. Se seleccionan 50 plantas y se cuenta el n
umero de hojas que han
sido atacadas despues de haber tratado la planta con el nuevo producto. Los
resultados son:
Hojas atacadas
0
1
2
3
4
5
6
8
10
ni
6
10
12
8
5
4
3
1
1
ni
6
10
12
8
5
4
3
1
1
fi
0,12
0,20
0,24
0,16
0,10
0,08
0,06
0,02
0,02
Ni
6
16
28
36
41
45
48
49
50
Fi
0,12
0,32
0,56
0,72
0,82
0,90
0,96
0,98
1
asientos vacos
03
47
8 11
12 16
ni
9
5
4
2
xi
2
6
10
14
ni
9
5
4
2
20
fi
0,45
0,25
0,20
0,10
1
Ni
9
14
18
20
Fi
0,45
0,70
0,90
1,00
pol
gono de frecuencias
12
diagrama de barras
10
8
6
4
2
10
B
0,275
0,225
0,2
O
AB
1.5
0.5
12
16
344
24577
345
27
2
1
2
x=
43050000
1X
xi ni =
= 827884.62,
n i=1
52
26 24
= 550000,
34 24
ni
6
10
12
8
5
4
3
1
1
50
Ni
6
16
28
36
41
45
48
49
50
xi ni
0
10
24
24
20
20
18
8
10
134
x2i ni
0
10
48
72
80
100
108
64
100
582
134
= 2.68,
50
M e = 2,
M o = 2.
on
Observemos que M e < x, por tanto, esto debe advertirnos que la distribuci
tiene asimetra positiva. Vease el diagrama de barras de la figura 1.
Medidas de posici
on:
Q1 = 1,
P35 = 2,
Q3 = 4,
P80 = 4,
P95 = 6.
Medidas de dispersi
on:
s2n =
582
2.682 = 4.46,
50
R = 10 0 = 10,
sn =
4.46 = 2.11,
RI = 4 1 = 3.
Ejemplo 11 C
alculo de algunas caractersticas numericas con los datos del
ejemplo 4.
intervalo
[0, 4)
[4, 8)
[8, 12)
[12, 16)
Total
xi
2
6
10
14
ni
9
5
4
2
20
Ni
9
14
18
20
ni /Li
9/4
5/4
4/4
2/4
xi ni
18
30
40
28
116
x2i ni
36
180
400
392
1008
5/4
Intervalo modal: [0, 4), por tanto la moda es M o = 0 + (4 0) 0+5/4
= 4.
on
Observemos que M e < x, por tanto, esto debe advertirnos que la distribuci
tiene asimetra positiva. Vease el histograma de la figura 3.
Medidas de posici
on:
Q1 = 0 +
4(5 0)
= 2.22,
90
4(6 0)
= 2.67,
90
Medidas de dispersi
on:
P30 = 0+
s2n =
P57 = 4+
Q3 = 8 +
4(15 14)
= 9,
18 14
4(11.4 9)
= 5.92
14 9
1008
5.82 = 16.76,
20
R = 16 0 = 16,
sn =
P80 = 8+
4(16 14)
= 10.
18 14
16.76 = 4.09,
RI = 9 2.22 = 6.78.
Pregunta: De las variables del ejemplo 10 y del ejemplo 11, cual presenta
mayor dispersion?
Repuesta: Si llamamos X =num. de hojas atacadas e Y =num. de asientos
vacos en un vuelo BCN-MAD, para ver que variable tiene mayor dispersion
debemos utilizar una medida adimensional, como el coeficiente de variacion de
Pearson, puesto que directamente ambas variables no son comparables. Es decir,
sera del todo incorrecto comparar directamente s2n (X) con s2n (Y ) al estar X e
Y medidas en unidades distintas.
CV (X) =
2.11
= 0.787,
2.68
CV (Y ) =
4.09
= 0.705.
5.8
7.6
3.2
32.7
15.9
2.9
5.1
9.1
5.9
4.6
5.3
1.7
6.7
4.1
20.1
3.2
3.4
3.9
2.3
5.8
40.5
Llamamos X a los datos sin transformar e Y = log(X) a los datos transformados. La tabla 1 contiene estos datos ordenados.
Tabla 1: Datos del ejemplo 12.
pas
1
2
3
4
5
6
7
8
9
10
11
12
x
1.7
2.2
2.3
2.9
3.2
3.2
3.4
3.9
4.1
4.6
5.1
5.3
y = log(x)
0.53
0.79
0.83
1.06
1.16
1.16
1.22
1.36
1.41
1.53
1.63
1.67
pas
13
14
15
16
17
18
19
20
21
22
23
24
x
5.5
5.8
5.9
6.7
7.4
7.6
9.1
15.9
16.3
20.1
32.7
40.5
y = log(x)
1.70
1.76
1.77
1.90
2.00
2.03
2.21
2.77
2.79
3.00
3.49
3.70
Figura 4: Histograma de frecuencias absolutas con los datos del ejemplo 12.
18
15
12
10
6
4
2
0
8.2
16.4
24.6
32.8
41
0.8
1.6
2.4
Y = log(X)
3.2
1as y 2as
barreras
exteriores
medidas numericas
x
Q1
M e = Q2
Q3
RI = Q3 Q1
Q1 1.5 RI
Q3 + 1.5 RI
Q3 + 3 RI
mnimo()
maximo()
X
8.975
3.2
5.4
7.6
4.4
-3.4
14.2
20.8
1.7
9.1
Y = log(X)
1.812
1.16
1.685
2.03
0.87
-0.145
3.335
4.64
0.53
3.00
(*) el mnimo y el m
aximo de los datos antes de las primeras barreras exteriores.
10
bb
20
30
40
b b
50
Y = log(X)
1.2
Ejercicios
Num. provincias
3
8
13
10
7
8
1
0
2
a) Constuir una tabla estadstica con las marcas de clase, las frecuencias
absolutas y las frecuencias relativas.
b) Cu
antas provincias tienen menos de 500 000 habitantes? Que porcentaje representan?
c) Cu
antas provincias tienen entre 800 000 y 1 300 000 habitantes?
d) Construir el histograma de frecuencias absolutas.
Respuestas: a) La tabla de frecuencias con una columna adicional que ser
a
u
til para la construcci
on del histograma es la siguiente:
intervalos
[0, 100000)
[100000, 250000)
[250000, 500000)
[500000, 750000)
[750000, 1000000)
[1000000, 2000000)
[2000000, 3000000)
[3000000, 4000000)
[4000000, 6000000)
xi
50000
175000
375000
600000
875000
1500000
2500000
3500000
5000000
ni
3
8
13
10
7
8
1
0
2
fi
0.058
0.154
0.250
0.192
0.135
0.154
0.019
0
0.038
Ni
3
11
24
34
41
49
50
50
52
Fi
0.058
0.212
0.462
0.654
0.789
0.943
0.962
0.962
1
ni /Li
3 105
5.3 105
5.2 105
4 105
2.8 105
0.8 105
0.1 105
0
0.1 105
800000
1300000
750000
h
106
2 106
10
Por tanto, el n
umero de provincias que tienen entre 800000 y 1300000 habitantes
es aproximadamente
1300000 1000000
1000000 800000
7+
8
1000000 750000
2000000 1000000
= 0.8 7 + 0.3 8 = 8 provincias.
d) La figura 6 contiene el histograma de frecuencias absolutas.
Figura 6: Histograma de frecuencias absolutas. Datos del ejercicio 2.
5 105
4 105
3 105
2 105
105
millones de habitantes
ni
14
10
15
26
20
15
Ni
14
24
39
65
85
100
x(50) + x(51)
3+3
=
= 3.
2
2
3n
= 75 Q3 = 4.
4