Anda di halaman 1dari 10

A LA ESTADISTICA. GRUPO 71 LADE.

1 INTRODUCCION

Resoluci
on de algunos ejemplos y ejercicios
del tema 1.

1.1

Ejemplos

Ejemplo 1 Se han medido el grup sanguneo de 40 individuos y se han observado las siguientes frecuencias absolutas para cada categora: 12 para x1 = A,
11 para x2 = B, 8 para x3 = AB y 9 para x4 = O.
a) De que tipo es la variable estudiada? Construir la tabla de frecuencias
correspondiente.
b) Que porcentaje de individuos son del grupo A?
c) Que porcentaje de individuos no son del grupo O?
d) Cu
antos individuos no son del grupo B?
Respuestas: a) Categ
orica nominal.
grupo
A
B
AB
O
Total

ni
12
11
8
9
40

fi
0.3
0.275
0.2
0.225
1

b) El 30%, c) el 100 22.5 = 77.5%, d) 40 11 = 29 o bien 12 + 8 + 9 = 29.


Ejemplo 2 La siguiente tabla muestra la clasificaci
on de 901 individuos seg
un
la variable satisfaccion en el trabajo
xi
muy insatisfecho
moderamademte insatisfecho
moderadamente satisfecho
muy satisfecho
Total

ni
62
108
319
412
901

a) De que tipo es la variable de estudio? Calcular la tabla de frecuencias


correspondiente.
b) Que porcentaje de individuos est
an moderadamente satisfechos?
c) Cu
antos individuos est
an a lo sumo moderadamente insatisfechos? Que
porcentaje representan?
d) Cu
antos individuos est
an por lo menos moderadamente satisfechos? Que
porcentaje representan?
Respuestas: a) Categ
orica ordinal,
xi
muy insatisfecho
moderamademte insatisfecho
moderadamente satisfecho
muy satisfecho
Total

ni
62
108
319
412
901

fi
0.07
0.12
0.35
0.46
1

Ni
62
170
489
901

Fi
0.07
0.19
0.54
1

A LA ESTADISTICA. GRUPO 71 LADE.


1 INTRODUCCION

b) El 35%, c) 170 y representan el 19%, d) 319 + 412 = 731 o bien 901 170 =
731, que representan el 35 + 46 = 81% (o bien 100 19 = 81%).
Ejemplo 3 Se quiere estudiar la eficacia de un nuevo insecticida para plantas
de interior. Se seleccionan 50 plantas y se cuenta el n
umero de hojas que han
sido atacadas despues de haber tratado la planta con el nuevo producto. Los
resultados son:
Hojas atacadas
0
1
2
3
4
5
6
8
10

ni
6
10
12
8
5
4
3
1
1

a) De que tipo es la variable de estudio? Construir la tabla de frecuencias


correspondiente.
b) Que porcentaje de plantas tienen s
olo 3 hojas atacadas?
c) Cu
antas plantas tienen como m
aximo 3 hojas atacadas?
d) Cu
antas plantas tienen como mnimo 6 hojas atacadas?
e) Que porcentaje de plantas tienen entre 3 y 5 hojas atacadas?
f ) Que porcentaje de plantas tienen al menos 8 hojas atacadas?
g) Que porcentaje de plantas tienen a lo sumo 2 hojas atacadas?
Respuestas: a) Cuantitativa discreta,
Hojas atacadas
0
1
2
3
4
5
6
8
10

ni
6
10
12
8
5
4
3
1
1

fi
0,12
0,20
0,24
0,16
0,10
0,08
0,06
0,02
0,02

Ni
6
16
28
36
41
45
48
49
50

Fi
0,12
0,32
0,56
0,72
0,82
0,90
0,96
0,98
1

b) el 16%, c) 36, d) 3 + 1 + 1 = 5 o bien 50 45 = 5, e) el 16 + 10 + 8 = 34%


o bien (8 + 5 + 4)/50 100 = 34%, f ) el 2 + 2 = 4% o bien 100 96 = 4%, g) el
56%.
Ejemplo 4 En veinte vuelos de Barcelona a Madrid se han contado el n
umero
de asientos vacos en cada vuelo. Se han agrupado los datos en intervalos de
longitud 4.

A LA ESTADISTICA. GRUPO 71 LADE.


1 INTRODUCCION

asientos vacos
03
47
8 11
12 16

ni
9
5
4
2

a) De que tipo es la variable estudiada? Construir la tabla de frecuencias


correspondiente.
b) En cu
antos vuelos hay menos de 8 asientos vacos? Que porcentaje
representan?
c) En cu
antos vuelos hay como mnimo 10 asientos vacos? Que porcentaje
representan?
Respuestas: a) Cuantitativa discreta,
intervalos
[0, 4)
[4, 8)
[8, 12)
[12, 16]
Total

xi
2
6
10
14

ni
9
5
4
2
20

fi
0,45
0,25
0,20
0,10
1

Ni
9
14
18
20

Fi
0,45
0,70
0,90
1,00

b) En 14 vuelos, y representan el 70% de los vuelos, c) Aproximadamente en


2 + 4 (12 10)/(12 8) = 4 vuelos, que representan el 4/20 100 = 20% de los
vuelos.
Algunas representaciones gr
aficas.
Figura 1: Diagrama de barras y polgono de frecuencias. Datos del ejemplo 3.

pol
gono de frecuencias

12

diagrama de barras
10
8
6
4
2

10

A LA ESTADISTICA. GRUPO 71 LADE.


1 INTRODUCCION

Figura 2: Diagrama de sectores. Datos del ejemplo 1.


A
0,3

B
0,275

0,225
0,2

O
AB

Figura 3: Histograma y polgono de frecuencias. Datos del ejemplo 4.


2.5
pol
gono de frecuencias
histograma

1.5

0.5

12

16

Ejemplo 5 Los datos siguientes corresponden a ciertas longitudes (en cm).


Construir un diagrama de tallo y hojas.
11.357, 12.542, 11.384, 12.431, 14.212, 15.213, 13.300, 11.300, 17.206, 12.710,
13.455, 16.143, 12.162, 12.721, 13.420, 14.698.
Respuesta: Datos redondeados y expresados en mm:
114, 125, 114, 124, 142, 152, 133, 113, 172, 127, 135, 161, 122, 127, 134, 147.
Diagrama de tallo y hojas (datos en mm):
11
12
13
14
15
16
17

344
24577
345
27
2
1
2

A LA ESTADISTICA. GRUPO 71 LADE.


1 INTRODUCCION

Ejemplo 7 Calcular la mediana de los conjuntos de datos siguientes:


a) 18, 18, 19, 17, 23, 20, 21, 18
b) 20, 21, 18, 19, 18, 17, 18
Respuestas: a) Ordenados los datos en orden creciente, 17, 18, 18, 18, 19, 20, 21, 23,
el valor de la mediana es M e = (18 + 19)/2 = 18.5.
b) Ordenados los datos en orden creciente, 17, 18, 18, 18, 19, 20, 21, el valor de
la mediana es M e = 18.
Ejemplo 8 Con los datos del ejercicio 2 (habitantes de las provincias espa
nolas)
calcular la media aritmetica y la mediana.
Respuestas: Utilizando la tabla de frecuencias calculada en el apartado b) del
ejercicio 2 (vease la Secci
on 1.2), tenemos que
k

x=

43050000
1X
xi ni =
= 827884.62,
n i=1
52

que significa que, en promedio, hay 827884.62 habitantes por provincia.


Para el c
alculo de la mediana, buscamos primero el intervalo mediano. Puesto
que n/2 = 26, el intervalo mediano es [500000, 750000). Aplicando la f
ormula
de la mediana:
M e = 500000 + 250000

26 24
= 550000,
34 24

esto significa que el 50% de las provincias espa


nolas tienen menos de 550000
habitantes.
Ejemplo 10 C
alculo de algunas caractersticas numericas con los datos del
ejemplo 3.
hojas atacadas
0
1
2
3
4
5
6
8
10
Total

ni
6
10
12
8
5
4
3
1
1
50

Ni
6
16
28
36
41
45
48
49
50

xi ni
0
10
24
24
20
20
18
8
10
134

x2i ni
0
10
48
72
80
100
108
64
100
582

Medidas de tendencia central:


x=

134
= 2.68,
50

M e = 2,

M o = 2.

on
Observemos que M e < x, por tanto, esto debe advertirnos que la distribuci
tiene asimetra positiva. Vease el diagrama de barras de la figura 1.

A LA ESTADISTICA. GRUPO 71 LADE.


1 INTRODUCCION

Medidas de posici
on:
Q1 = 1,
P35 = 2,

Q3 = 4,

P80 = 4,

P95 = 6.

Medidas de dispersi
on:
s2n =

582
2.682 = 4.46,
50
R = 10 0 = 10,

sn =

4.46 = 2.11,

RI = 4 1 = 3.

Ejemplo 11 C
alculo de algunas caractersticas numericas con los datos del
ejemplo 4.
intervalo
[0, 4)
[4, 8)
[8, 12)
[12, 16)
Total

xi
2
6
10
14

ni
9
5
4
2
20

Ni
9
14
18
20

ni /Li
9/4
5/4
4/4
2/4

xi ni
18
30
40
28
116

x2i ni
36
180
400
392
1008

Medidas de tendencia central: x = 116


20 = 5.8,
Intervalo mediano: [4, 8), por tanto la mediana es M e = 4 + (8 4) 109
149 = 4.8,

5/4
Intervalo modal: [0, 4), por tanto la moda es M o = 0 + (4 0) 0+5/4
= 4.
on
Observemos que M e < x, por tanto, esto debe advertirnos que la distribuci
tiene asimetra positiva. Vease el histograma de la figura 3.
Medidas de posici
on:

Q1 = 0 +

4(5 0)
= 2.22,
90

4(6 0)
= 2.67,
90
Medidas de dispersi
on:
P30 = 0+

s2n =

P57 = 4+

Q3 = 8 +

4(15 14)
= 9,
18 14

4(11.4 9)
= 5.92
14 9

1008
5.82 = 16.76,
20

R = 16 0 = 16,

sn =

P80 = 8+

4(16 14)
= 10.
18 14

16.76 = 4.09,

RI = 9 2.22 = 6.78.

Pregunta: De las variables del ejemplo 10 y del ejemplo 11, cual presenta
mayor dispersion?
Repuesta: Si llamamos X =num. de hojas atacadas e Y =num. de asientos
vacos en un vuelo BCN-MAD, para ver que variable tiene mayor dispersion
debemos utilizar una medida adimensional, como el coeficiente de variacion de
Pearson, puesto que directamente ambas variables no son comparables. Es decir,
sera del todo incorrecto comparar directamente s2n (X) con s2n (Y ) al estar X e
Y medidas en unidades distintas.
CV (X) =

2.11
= 0.787,
2.68

CV (Y ) =

4.09
= 0.705.
5.8

Puesto que CV (X) > CV (Y ), X presenta mas dispersion.

A LA ESTADISTICA. GRUPO 71 LADE.


1 INTRODUCCION

Ejemplo 12 Se consideran los siguientes datos, correspondientes a la tasa de


incrementos de precios al consumo, en 1985, para 24 pases de la OCDE:
2.2
7.4
5.5
16.3

7.6
3.2
32.7
15.9

2.9
5.1
9.1
5.9

4.6
5.3
1.7
6.7

4.1
20.1
3.2
3.4

3.9
2.3
5.8
40.5

Llamamos X a los datos sin transformar e Y = log(X) a los datos transformados. La tabla 1 contiene estos datos ordenados.
Tabla 1: Datos del ejemplo 12.
pas
1
2
3
4
5
6
7
8
9
10
11
12

x
1.7
2.2
2.3
2.9
3.2
3.2
3.4
3.9
4.1
4.6
5.1
5.3

y = log(x)
0.53
0.79
0.83
1.06
1.16
1.16
1.22
1.36
1.41
1.53
1.63
1.67

pas
13
14
15
16
17
18
19
20
21
22
23
24

x
5.5
5.8
5.9
6.7
7.4
7.6
9.1
15.9
16.3
20.1
32.7
40.5

y = log(x)
1.70
1.76
1.77
1.90
2.00
2.03
2.21
2.77
2.79
3.00
3.49
3.70

Si se dibujan los histogramas de frecuencias (vease la figura 4), se observa que


la variable X presenta una fuerte asimetra positiva: la mayor parte de los
pases tienen valores por debajo de 10 y, unos pocos, un valor mucho mayor. En
cambio, el histograma de la variable Y muestra una distribuci
on m
as simetrica.

Figura 4: Histograma de frecuencias absolutas con los datos del ejemplo 12.
18
15
12
10

6
4

2
0

8.2

16.4

24.6

32.8

41

0.8

1.6

2.4

Y = log(X)

3.2

A LA ESTADISTICA. GRUPO 71 LADE.


1 INTRODUCCION

Si se dibujan los diagramas de caja (vease la figura 5), para la variable X se


obtienen numerosos atpicos, mientras que para la variable Y los atpicos desaparecen. Las medidas numericas necesarias para dibujar los diagramas de caja
se encuentran en la tabla 2.
Tabla 2: Medidas numericas con los datos del ejemplo 12.
media
cuartiles

1as y 2as
barreras
exteriores

medidas numericas
x
Q1
M e = Q2
Q3
RI = Q3 Q1
Q1 1.5 RI
Q3 + 1.5 RI
Q3 + 3 RI
mnimo()
maximo()

X
8.975
3.2
5.4
7.6
4.4
-3.4
14.2
20.8
1.7
9.1

Y = log(X)
1.812
1.16
1.685
2.03
0.87
-0.145
3.335
4.64
0.53
3.00

(*) el mnimo y el m
aximo de los datos antes de las primeras barreras exteriores.

Figura 5: Diagramas de caja con los datos del ejemplo 12.

10

bb

20

30

40

b b

50

Y = log(X)

A LA ESTADISTICA. GRUPO 71 LADE.


1 INTRODUCCION

1.2

Ejercicios

Ejercicio 2 Clasificadas las provincias espa


nolas por su n
umero de habitantes
en 2001, se obtuvieron los siguientes datos:
Num. habitantes
de 1 a 100 000
de 100 000 a 250 000
de 250 000 a 500 000
de 500 000 a 750 000
de 750 000 a 1 000 000
de 1 000 000 a 2 000 000
de 2 000 000 a 3 000 000
de 3 000 000 a 4 000 000
de 4 000 000 a 6 000 000

Num. provincias
3
8
13
10
7
8
1
0
2

a) Constuir una tabla estadstica con las marcas de clase, las frecuencias
absolutas y las frecuencias relativas.
b) Cu
antas provincias tienen menos de 500 000 habitantes? Que porcentaje representan?
c) Cu
antas provincias tienen entre 800 000 y 1 300 000 habitantes?
d) Construir el histograma de frecuencias absolutas.
Respuestas: a) La tabla de frecuencias con una columna adicional que ser
a
u
til para la construcci
on del histograma es la siguiente:
intervalos
[0, 100000)
[100000, 250000)
[250000, 500000)
[500000, 750000)
[750000, 1000000)
[1000000, 2000000)
[2000000, 3000000)
[3000000, 4000000)
[4000000, 6000000)

xi
50000
175000
375000
600000
875000
1500000
2500000
3500000
5000000

ni
3
8
13
10
7
8
1
0
2

fi
0.058
0.154
0.250
0.192
0.135
0.154
0.019
0
0.038

Ni
3
11
24
34
41
49
50
50
52

Fi
0.058
0.212
0.462
0.654
0.789
0.943
0.962
0.962
1

ni /Li
3 105
5.3 105
5.2 105
4 105
2.8 105
0.8 105
0.1 105
0
0.1 105

b) 24 provincias, que representan el 46.2%.


c) El inetrvalo [800000, 1300000] est
a situado encima de dos intervalos de clase:

800000

1300000

750000

h
106

2 106

A LA ESTADISTICA. GRUPO 71 LADE.


1 INTRODUCCION

10

Por tanto, el n
umero de provincias que tienen entre 800000 y 1300000 habitantes
es aproximadamente
1300000 1000000
1000000 800000
7+
8
1000000 750000
2000000 1000000
= 0.8 7 + 0.3 8 = 8 provincias.
d) La figura 6 contiene el histograma de frecuencias absolutas.
Figura 6: Histograma de frecuencias absolutas. Datos del ejercicio 2.

5 105

4 105

3 105

2 105

105

millones de habitantes

Ejercicio 6 Dada la siguiente distribuci


on en el n
umero de hijos de cien familias, calcular sus cuartiles.
xi
0
1
2
3
4
5

ni
14
10
15
26
20
15

Ni
14
24
39
65
85
100

Empezamos calculando la mediana M e = Q2 : puesto que n = 100, que es par,


la mediana ser
a la media aritmetica de los dos valores centrales:
Me =

x(50) + x(51)
3+3
=
= 3.
2
2

Para calcular Q1 y Q3 debemos buscar los valores n/4 y 3 n/4 en la columna de


las frecuencias acumuladas. Puesto que n = 100, tenemos que
n
= 25 Q1 = 2,
4

3n
= 75 Q3 = 4.
4

Anda mungkin juga menyukai