MODALIDAD A DISTANCIA
MODULO DE ELEMENTOS DE ESTADSTICA Y NOCIONES DE
PROBABILIDADES
Elabor:
Economista: JOHN ENRIQUE LUNA RENGIFO
Quibd Choc
Mayo de 2009
CONTENIDO
TEMA
Pagina
PRIMERA PARTE
Historia
importancia
conceptos
UNIDAD NUMERO UNO:
1. El mtodo estadstico.
1.1. Etapas del mtodo estadstico.
1.1.1. Planteamiento del problema.
1.1.2. Fijacin de los objetivos.
1.1.3. Las hiptesis.
1.1.4. Unidad de observacin y de medida.
1.1.5. Determinacin de la poblacin y de la muestra.
1.1.6. Recoleccin de la informacin.
1.1.7. Critica, clasificacin y ordenacin de la informacin.
1.1.8. Tabulacin de la informacin.
1.1.9. Presentacin de la informacin.
1.1.10. Anlisis de la informacin.
1.1.11. Publicacin de los resultados.
1.2. Tcnicas de recoleccin de la informacin.
1.2.1. Medicin.
-La observacin.
-La entrevista.
-La encuesta.
-Auto evaluacin.
SEGUNDA PARTE
UNIDAD NUMERO CINCO
5. Introduccin a las probabilidades.
5.1 Introduccin.
5.2. Escala de probabilidades.
5.3. Espacio muestral de un experimento.
5.4. Tcnicas de conteo.
5.4.1.Permutaciones y combinaciones.
- Auto evaluacin.
UNIDAD NUMERO SEIS:
6. Distribuciones de muestreo aleatorio.
6.1. Marco muestral.
6.2. Encuesta preliminar o piloto.
6.3 La muestra.
6.4. Metodos de muestreo aleatorio.
6.5. Tamao de la muestra.
6.5.1. Calculo del tamao de la muestra.
- Auto evaluacin.
UNIDAD NUMRO SIETE.
7. Prueba de hiptesis.
7.1. La hiptesis.
MODULO DE ESTADISTICA PARA TRABAJO SOCIAL DISTANCIA
ELABORO: JOHN LUNA RENGIFO
ESTADSTICA
GENERALIDADES.
HISTORIA.
IMPORTANCIA.
La estadstica se comporta como una ciencia auxiliar a todas las
ciencias, ms si se tiene en cuenta que diariamente desde la
posicin u oficio a que estemos dedicados nos vemos en la
necesidad de tomar decisiones bajo incertidumbre.
Para qu la Estadstica: los conceptos y las tcnicas de la
estadstica se utilizan para la planeacin, el control, la direccin e
interpretacin de resultados de una actividad.
Al resumir algunos de los aspectos que indican la importancia de la
estadstica podramos mencionar:
a. Permite conocer la realidad de una observacin o fenmeno.
CONCEPTOS
Por lo anterior, es normal encontrar diferentes conceptos sobre
estadstica segn el autor, o la idea a representar.
Uno de los ms elementales dice, que la estadstica es la
agrupacin de datos ordenados en forma sistemtica en cuadros
o grficos.
Conjunto de tcnicas que a partir de la observacin de diferentes
fenmenos, posibilitan hacer conclusiones.
Segn el interes, que nos ocupe en su uso, asi debemos
aprovechar alguna de las siguientes subdivisiones:
a. ESTADSTICA DESCRIPTIVA. Describe cuantitativamente
b. ESTADSTICA
INFERENCIAL.
Se
ocupa
de
dar
mtodo
estadstico
es
utilizado
frecuentemente
en
las
Presentacin de la informacin.
Anlisis de la informacin.
Publicacin de los resultados.
la
vamos
considerar
como
infinita
INFORMACIN.
Una vez se ha recopilado toda la informacin, debe ser sometida a
una depuracin que permita detectar falsedades, por ello, esta
etapa es conveniente entregarla a una persona que tenga
conocimiento de la poblacin.
registros.
Que las observaciones sean sometidas a validacin y control.
Por lo tanto, debe responder a:
1. Que se deber observar.
2. Cual es la relacin entre el observador y lo observado.
3. Cuales observaciones deben ser observadas.
4. Cuales procedimientos se tendrn en cuenta que garanticen la
) Aceptable (
) Malo (
Tres (
) mas de tres (
).
AUTOEVALUACION.
1. Para que sirve la informacin estadstica? ___________________
_______________________________________________________
_______________________________________________________
_______________________________________________________
_______________________________________________________
2.
Enuncie
las
etapas
del
mtodo
estadstico.
______________________________________________________
______________________________________________________
______________________________________________________
______________________________________________________
______________________________________________________
______________________________________________________
______________________________________________________
3. Para que se utiliza el mtodo estadstico. __________________
______________________________________________________
______________________________________________________
______________________________________________________
______________________________________________________
______________________________________________________
4. Que es una hiptesis? _________________________________
______________________________________________________
______________________________________________________
______________________________________________________
______________________________________________________
MODULO DE ESTADISTICA PARA TRABAJO SOCIAL DISTANCIA
ELABORO: JOHN LUNA RENGIFO
= Tamao de la muestra
= tamao de la poblacin
Xi
Yi
fa
= frecuencias absolutas.
fr
= frecuencia relativa.
X1 = 80
X2 = 84
X.......
X3 = 80
X4 = 110
X65 = 109
TABLA N 1
80
84
80
90
92
80
102 100 96
84
90
100 125 80
90
88
102 110 80
106 96
110 80
82
84
90
102 84
90
90
90
92
102 109 80
88
122 110 92
90
109 88
100 90
84
88
98
125 82
109
CI
CONTEO
80
IIII II
82
II
84
IIII I
88
IIII
90
IIII IIII
92
III
96
IIII
98
100
IIII
102
IIII
106
II
109
IIII
110
IIII
122
III
125
IIII
REPETICIN
TABLA N 2
DISTRIBUCIN DE FRECUENCIAS
Yi
80
82
84
88
90
92
96
98
100
102
106
109
110
122
125
fa
7
2
6
4
9
3
4
1
5
5
2
5
5
3
4
65
fr
0.108
0.031
0.092
0.062
0.138
0.046
0.062
0.015
0.077
0.077
0.031
0.077
0.077
0.046
0.062
1.00
FA
7
9
15
19
28
31
35
36
41
46
48
53
58
61
65
-
FR
0.108
0.139
0.231
0.293
0.431
0.477
0.539
0.554
0.631
0.708
0.739
0.816
0.893
0.939
1.00
-
muestra (n).
3. Las frecuencias relativas (fr), son siempre valores
fraccionarios entre 0 y 1.
4. La suma de las frecuencias relativas (fr),es siempre igual a
1.
5. El ltimo valor de las frecuencias absolutas acumuladas
es siempre igual a 1.
1. Determinar
los
valores
mnimo
mximo
de
las
observaciones.
2. Establecer la diferencia entre ambas, la cual llamaremos
Tabla N 3
ESTATURA EN CENTMETRO DE UN GRUPO DE CINCUENTA
ESTUDIANTES
155
162
153
158
161
153
154
155
156
157
160
162
169
152
155
154
158
155
153
154
152
155
152
153
154
155
162
168
163
166
165
160
168
169
153
154
153
160
157
154
169
154
158
166
158
157
162
156
158
162
Estatura
CONTEO
155
IIIIII
162
153
IIII
IIIIII
REPETICIN
6
5
6
158
IIII
161
154
IIIIIII
156
II
157
III
160
III
169
III
152
III
168
II
163
166
II
165
17/7;
luego C = 3.4
Aprox. =4,
6f. Este numero se le resta al limite inferior, asi entonces 152 5.5
=146,5; el faltante para este caso es, 0,5;cifra que le sumaremos al
limite superior, el cual queda 169+5.5 = 174,5.
7g. Procedemos entonces a la construccin de los intervalos,
determinacin
frecuencias.
Con el ejemplo anterior, podemos construir una tabla de
distribucin de esas frecuencias quedando como sigue:
Tabla N 4
DISTRIBUCIN DE FRECUENCIAS DE LA ESTATURA EN
CENTMETROS DE UN GRUPO DE 50 ESTUDIANTES
Yi-1 - yi
146.5 150.5
150.6 154.5
154.6 158.5
158.6 162.5
162.6 - 166.5
166.6 - 170.5
170.6 - 174.5
Yi
148.5
152.5
156.5
160.5
159.5
168.5
172.5
-
fa
0
16
16
9
4
5
0
50
fr
0
0.32
0.32
0.18
0.08
0.10
0
1.00
FA
0
16
32
41
45
50
50
-
FR
0.0
0.32
0.64
0.82
0.90
1.00
1.00
-
Tabla N 5
MATRICULAS EN LOS PROGRAMAS A DISTANCIA DE LA
UTCH
2001 - 2006
Aos
Variacin
porcentual
2001
9.0
2002
15.0
2003
10.0
2004
16.0
2005
22.5
2006
27.0
La representacin grafica de la anterior informacin mediante el
grafico de lneas ser de la siguiente manera.
Grfica N 1
VARIACIN POCENTUAL DE MATRICULAS DE
ESDTUDIANTES DE LA MODALIDAD A DISTANCIA EN LA
UTCH 2001 - 2006
30
25
20
15
10
0
2001
2002
2003
2004
2005
2006
distancia:
presencial
:
2001
2002
2003
2004
2005
2006
frecuencia
1
3
5
7
2
1
Grafico N 3
NUMERO DE HIJOS(AS) DE LOS(AS) PARTICIPANTES DE UN
CURSO DE ESTADSTICA
10
8
6
F
R
E
C
U
E
N
C
I
A
S
4
2
0
MODULO DE ESTADISTICA PARA TRABAJO SOCIAL DISTANCIA
ELABORO: JOHN LUNA RENGIFO
5y/o, mas
de hijos
Podemos relacionar ahora, laNumero
preferencia
entre el bsquetbol, el
ftbol, la natacin y el voleibol, entre un grupo de hombres y
mujeres, con el resultado siguiente:
Tabla N 7
PREFERENCIA POR ALGUNOS DEPORTES SEGN EL SEXO
DEPORTE /
SEXO
HOMBRES
MUJERES
Bsquetbol
31.6
13
68.4
19
100.0
Ftbol
15
78.9
21.1
19
100.0
Natacin
11
57.9
42.1
19
100.0
voleibol
42.1
11
57.9
19
100.0
TOTAL
Grafico N 4
PREFERENCIA POR ALGUNOS DEPORTES SEGN EL SEXO
100
90
Hombres
Mujeres
80
Total
70
60
50
40
30
20
10
0
Bsquetbol
Ftbol
Natacin
Voleibol
Tabla N 8
ESTADO CIVIL DE LOS ASISTENTES A UN CURSO DE
STADSTICA
ESTADO CIVIL
CASADOS
SOLTEROS
UNION LIBRE
NUMERO
5
8
6
PORCENTAJE
26.3
42.1
31.6
Unin libre
31.6%
Solteros (as)
42.1%)
Casados(as)
26.3%
Casados(as)
146
150
154
2
4
10
12
14
16
18
20
F r e
c u e n
a s
c i
158
162
166
170
174
AUTOEVALUACION.
1. Para
que
sirve
la
distribucin
de
frecuencias.
____________
_______________________________________________
_______________________________________________
_______________________________________________
______
2. Enuncie
las
propiedades
de
las
frecuencias.
_______________________________________________
_______________________________________________
_______________________________________________
_______________________________________________
_______________________________________________
_______________________________________________
_______________________________________________
_______________________________________________
_______________________________________________
_______________________________________________
____________________
3. Como se determina la amplitud de un intervalo?.
_______________________________________________
_______________________________________________
_______________________________________________
______
4. Que
es
el
rango
o
recorrido?.
_________________________
_______________________________________________
_______________________________________________
_______________________________________________
______
_______________________________________________
________
10. En que tipo de variable se aconseja la grafica de
pastel._______________________________________________________
_____________________________________________________________
_____________________________________________________________
________
conjunto de
datos, el
cual
Tabla N 9
DIAS DE PESCA
TOTAL kilos
Lunes
75
Martes
42
Mircoles
Jueves
42
Viernes
37
Sbado
42
Domingo
Lunes
75
Martes
42
Mircoles
30
Jueves
29
Viernes
29
Sbado
38
X = Xi/n
Las observaciones, es decir, lo obtenido en cada da de pesca, se
representan:
X1 = 75
X2 = 42
X3 = 0
X5 = 37
X6 = 42
X7 = 0
X9 = 42
X10 = 30
X4 = 42
X11 = 29
X8 = 75
X 12 = 29
X13 = 38
X=
75+42+0+42+37+42+0+75+42+30+29+29+38
13
luego
= 481
13
= 37
Tabla N 10
KILOS DE SIERRA CAPTURADOS POR UN
PESCADOR
Cantidad Klg.
0
29
30
37
38
42
75
X =
Frecuencia (fa)
2
2
1
1
1
4
2
13
Yifa
n
X = 0(2)+29(2)+30(1)+37(1)+38(1)+42(4)+75(2)
__________________________________________ =
13
0+58+30+37+38+168+150
=
481
13
13
luego X = 37
MEDIA ARITMTICA
Xi
Zi
75
42
37
37
38
5
0
42
37
42
0
75
42
30
29
29
38
37
37
37
37
37
37
37
37
37
37
37
-37
5
0
5
-37
38
5
-7
-8
-8
1
_____
0
Suma
fi
2
2
1
1
1
4
2
13
yifa
0
58
30
37
38
168
150
481
ZI
-37
-8
-7
0
1
5
38
Zi fa
-74
-16
-7
0
1
20
76
0
Comprobacin:
Muestra
submuestra 2
Xi
fi Xi fi
0 2 0
29 2 58
30 1 30
37 1 37
38 1 38
42 4 168
75 2 150
481
submuestra 1.
Xi
37
38
42
75
Xi
0
29
30
fi Xi fi
2 0
2 58
1 30
5 88
fi
1
1
4
2
8
Xi fi
37
38
168
150
393
Xt = 37
49.1
X1 =17.6
X2 =
Xt = 17.6(5) + 49.1(8)
5+8
Xt = 88+392.8
Xt
= 37
13
Sea la constante K = 3
Variable sola
Xi fi Xi fi
kXi
0 2 0
0
29 2 58
87
30 1 30
90
37 1 37
111
38 1 38
MODULO
PARA TRABAJO SOCIAL DISTANCIA 114
42 4DE ESTADISTICA
168
ELABORO: JOHN LUNA RENGIFO
126
75 2 150
225
13 481
variable por K
fi
2
2
1
1
1
4
2
13
kXi fi
0
174
90
111
114
504
450
1443
X = 481
13
= 37x3 =111
X = 1443
13
= 111
fi
2
2
1
1
1
4
2
13
X i fi
0
58
30
37
38
168
150
481
variable + K
K+Xi
3
32
33
40
41
45
78
fi
2
2
1
1
1
4
2
13
kXi fi
6
64
33
40
41
180
156
520
X = 520/13 = 40
75
42
0
42
37
37
37
37
37
37
38
5
-37
5
0
Z2
1444
25
1369
25
0
Parametro
Desv.
P Respecto
a p
30
30
30
30
30
45
12
-30
12
7
Parametro
T2
Desv.
Respect
o a T
50
50
50
50
50
25
-8
-50
-8
-13
625
64
2500
64
169
P2
2025
144
900
144
49
42
0
75
42
30
29
29
38
37
37
37
37
37
37
37
37
5
-37
38
5
-7
-8
-8
1
25
1369
1444
25
49
64
64
1
5904
30
30
30
30
30
30
30
30
12
-30
45
12
0
-1
-1
8
144
900
2025
144
0
1
1
64
6541
50
50
50
50
50
50
50
50
-8
-50
25
-8
-20
-21
-21
-12
64
2500
625
64
400
441
441
144
8101
42
50
58
66
72
80
10,
4,
8,
14,
6,
9.
Yi
fa
Yifa
36
288
42
50
58
12
10
4
504
500
232
66
72
8
14
528
1008
80
86
6
9
71
480
774
4314
= 4314/71 = 60.8
42
50
58
66
72
80
10,
4,
8,
14,
6,
9.
El procedimiento es el siguiente:
Denotamos a Zi como las desviaciones respecto a un origen de
trabajo.
Teniendo en cuenta que el numero de datos (observaciones es par,
se toma uno de los dos valores centrales; cuando es impar se toma
MODULO DE ESTADISTICA PARA TRABAJO SOCIAL DISTANCIA
ELABORO: JOHN LUNA RENGIFO
Tabla N 14
INFORMACIN PARA EL CLCULO DE LA MEDIA
ARITMTICA
Yi
36
42
50
58
66
72
80
86
Sum.
fa
8
12
10
4
8
14
6
9
71
Zi
-22
-16
-8
0
8
14
22
28
-
Zifa
-176
-192
-80
0
64
196
132
252
196
X2 = 2;
X3 = 10;
X7 = 15.
10
12
15
20; luego,
Me = 10
X2 = 16;
X3 = 6;
X4 = 10;
Me
10
16
Me = 10+14/2 = 24/2
14
X5 = 18
X6 = 14
18
= 12.
Me =
n/2 FA (i-1)
LI + __________________ C; donde:
fa
Tabla N 15
DISTRIBUCIONES DE FRECUENCIA DE LOS CI DE 50
ESTUDIANTES
Yi-1 - yi
146.5 150.5
150.6 154.5
154.6 158.5
158.6 162.5
162.6 - 166.5
166.6 - 170.5
170.6 - 174.5
Sumatoria
Ya
148.5
152.5
156.5
160.5
159.5
168.5
172.5
-
fa
0
16
16
9
4
5
0
50
fr
0
0.32
0.32
0.18
0.08
0.10
0
1.00
FA
0
16
32
41
45
50
50
FR
0.0
0.32
0.64
0.82
0.90
1.00
1.00
50/2 32
Me = 158.6 + __________________ 4; = 155.49
9
Lo anterior indica que el 50% obtuvo menos de 155.49 puntos y
que el 50% obtuvo ms de 155.49 puntos.
3.3 MODA. (MO)
MODULO DE ESTADISTICA PARA TRABAJO SOCIAL DISTANCIA
ELABORO: JOHN LUNA RENGIFO
distribucin
bimodal,
ya
que
se
presentan
dos
Tabla N 16
DISTRIBUCIONES DE FRECUENCIA DE LOS CI DE 50
ESTUDIANTES
Yi-1 - yi
146.5 150.5
150.6 154.5
154.6 158.5
158.6 162.5
162.6 - 166.5
166.6 - 170.5
170.6 - 174.5
Sumatoria
Yi
148.5
152.5
156.5
160.5
159.5
168.5
172.5
-
fa
0
16
16
9
4
5
0
50
fr
0
0.32
0.32
0.18
0.08
0.10
0
1.00
FA
0
16
32
41
45
50
50
FR
0.0
0.32
0.64
0.82
0.90
1.00
1.00
REPRESENTACIN GRAFICA.
Q1
0%
25%
Q2
50%
Q3
75%
100%
Qk =
kn/4 FA (i-1)
LI + __________________ C; donde:
fa
FA
(i-1)
contiene el cuartil.
Fa = frecuencia del intervalo que contiene el cuartil.
C = amplitud de los intervalos.
Tabla N 17
DISTRIBUCIONES DE FRECUENCIA DE LOS CI DE 50
ESTUDIANTES
Yi-1 - yi
146.5 150.5
150.6 154.5
154.6 158.5
158.6 162.5
162.6 - 166.5
166.6 - 170.5
170.6 - 174.5
Sumatoria
Yi
148.5
152.5
156.5
160.5
159.5
168.5
172.5
-
fa
0
16
16
9
4
5
0
50
fr
0
0.32
0.32
0.18
0.08
0.10
0
1.00
CALCULO MATEMTICO.
Primer cuartil:
Q1 = 154.5 +
1(50)/4 16
x 4 = 153.6
16
FA
0
16
32
41
45
50
50
FR
0.0
0.32
0.64
0.82
0.90
1.00
1.00
Q1
Q2
Q3
Tercer cuartil:
Q1 = 162.5 + 3(50)/4 41
x 4 = 159
3.4.2
QUINTILES.
Llamados
tambin
quintillas,
dividen
la
REPRESENTACIN GRAFICA.
MODULO DE ESTADISTICA PARA TRABAJO SOCIAL DISTANCIA
ELABORO: JOHN LUNA RENGIFO
Q1
0%
20%
Q2
40%
Q3
Q4
60%
Q5
80%
100%
CALCULO MATEMTICO:
El calculo matemtico se realiza con la formula anterior, cambiando
el parmetro que divide a kn; para el caso anterior fue cuatro
(4), ahora ser cinco (5).
Tabla N 18
DISTRIBUCIONES DE FRECUENCIA DE LOS CI DE 50
ESTUDIANTES
Yi-1 - yi
Yc
fa
fr
FA
FR
146.5 150.5
148.5
0
0
0
0.0
150.6 154.5
152.5
16
0.32 16
0.32
154.6 158.5
156.5
16
0.32 32
0.64
Q1
158.6 162.5
160.5
9
0.18 41
0.82
Q2
162.6 - 166.5
159.5
4
0.08 45
0.90
Q3
166.6 - 170.5
168.5
5
0.10 50
1.00
170.6 - 174.5
172.5
0
0
50
1.00
Sumatoria
50
1.00
Qk
= LI + kn/r FA (i-1) xC
fa
Donde:
LI = limite inferior del intervalo que contiene el percentil. k = orden
del percentil.
FA
(i-1 =
frecuencia acumulada
contiene el percentil.
n = numero de observaciones.
C = amplitud de los intervalos.
r = numero de partes en que se divide la informacin.
fi = frecuencia del intervalo que contiene el percentil.
AUTOEVALUACION.
1. Haga un listado de los promedios que usted conoce________
_________________________________________________
_________________________________________________
_________________________________________________
2. Que son las desviaciones. ___________________________
_________________________________________________
_________________________________________________
_________________________________________________
_________________________________________________
3. Si la media de 75 artculos es de 52.6 galones, y la de 25
artculos es de 48.4 galones, encuentre la media de los 100
artculos.
4. La suma de las desviaciones es igual a cero cuando se toman
con respecto a la media aritmtica? ________
5. Un grupo de valores puede tener mas de una media
aritmtica? ___
6. Para calcular las marcas de clase, se suma el lmite inferior al
suprior y se divide por dos? ______
7. enuncie y explique una de las propiedades de la media
aritmtica._________________________________________
_________________________________________________
MODULO DE ESTADISTICA PARA TRABAJO SOCIAL DISTANCIA
ELABORO: JOHN LUNA RENGIFO
_________________________________________________
_________________________________________________
8. D un ejemplo de observacin multimodal.______________
_________________________________________________
_________________________________________________
_________________________________________________
9. Que son los cuartiles: _______________________________
_________________________________________________
_________________________________________________
_________________________________________________
10. Que relacin existe entre la mediana y el segundo cuartil
___________________________________________________
___________________________________________________
___________________________________________________
38.
70,
96,
48
R = 96 28 = 68
R = 68
4.2 DESVIACIN MEDIA (DM). Sirve para medir la distancia
absoluta promedio entre cada uno de los datos (observaciones) y el
CALCULO
DM =
Xi X fa
n
Xi = diferentes valores de la variable X.
fa = numero de veces que se repite la observacin Xi
X = media aritmtica de la informacin.
n = tamao de la muestra.
m = numero de agrupamientos o intervalos.
Sea el ejemplo consignado en la tabla nmero 18, datos de los
cuales ya se conoce que la media aritmtica e igual 60.76
Tabla N 19
CALCULO DE LA DESVIACIN MEDIA
Xi
36
42
fa
8
12
Xi - X
24.76
18.76
Xi X fa
198.08
225.12
50
58
66
72
80
86
10
4
8
14
6
9
71
10.76
2.76
5.24
11.24
19.24
25.24
107.60
11.04
41.92
157.36
115.44
227.16
Xi2 n X2
S2 =
S2
;
n
= Xi2
n
X2
Ejemplos:
Sean las observaciones sin agrupar: X1 = 8,
X4 = 9,
X5 = 14,
X6 = 10,
X2 = 6, X3 = 11,
X7 = 5
Donde, X = 8+6+11+9+14+10+5
7
= 63/7 = 9
= 623 567
7
= 8
623/7 81 = 89 81 = 8
S=
S2
luego, S =
8 ;
S = 2.8
CV = S/X. 100
Tomando la informacin del ejemplo anterior, cuando se calcul la
varianza, podemos ahora determinar le coeficiente de variabilidad
CV
CV = 2.8/9X100
CV = 31.1%
S2 =
( Yi - Y )2 fa, o tambin,
S = Y2 f a - Y2
de donde: Y = 37
Yi
fa
Yi - Y
(y y )2
(Yi Y)2fa
Yi fa
Y2
Y2fa
0
29
30
37
38
2
2
1
1
1
-37
-8
-7
0
1
1369
64
49
0
1
2738
128
49
0
1
0
58
30
37
38
0
841
900
1369
1444
0
1682
900
1369
1444
42
75
4
2
13
Ahora
5
38
podemos
25
1444
aplicar
las
100
2888
5904
168
150
481
1764
5625
7056
11250
23701
formulas
correspondientes,
encontramos que:
a) S2 = 5904/13 = 454.2
b) S2 = 23701/13 372
igualmente, S =
ahora, CV = 21.3/37X100
S = 21.3
CV = 57.6%
AUTOEVALUACION.
1. Enuncie las principales medidas de tendencia central.
_________________________________________________
_________________________________________________
_________________________________________________
_________________________________________________
_________________________________________________
2. Que concepto tiene usted de la media aritmtica.
_________________________________________________
_________________________________________________
_________________________________________________
_________________________________________________
3. Enuncie tres propiedades de la media aritmtica.
_________________________________________________
_________________________________________________
_________________________________________________
_________________________________________________
_________________________________________________
_________________________________________________
_________________________________________________
4. Explique un concepto de mediana.______________________
_________________________________________________
_________________________________________________
_________________________________________________
5. Que concepto dara usted sobre la moda.________________
_________________________________________________
_________________________________________________
6. Que son los cuartiles.________________________________
_________________________________________________
_________________________________________________
7. Que son las mediadas de dispersin. ___________________
MODULO DE ESTADISTICA PARA TRABAJO SOCIAL DISTANCIA
ELABORO: JOHN LUNA RENGIFO
_________________________________________________
_________________________________________________
8. Que utilidad tiene la desviacin media. __________________
_________________________________________________
_________________________________________________
_________________________________________________
9. Como se define la varianza. __________________________
_________________________________________________
_________________________________________________
_________________________________________________
10. Que utilidad tiene en estadstica el coeficiente de
variabilidad. _________________________________________
___________________________________________________
___________________________________________________
___________________________________________________
SEGUNDA PARTE
(Estadstica II)
5.1 INTRODUCCIN.
Si nosotros furamos chinos, propondra dejar de lado esta unidad,
pues ellos consideran que las probabilidades son exclusivamente
de Dios.
El concepto de probabilidad se pude interpretar sin necesidad de
definirlo, pero teniendo en cuenta que nos sirve con mucha claridad
para expresar el grado de creencia sobre la ocurrencia de un
suceso. Las probabilidades guardan relacin con la teora de los
conjuntos, de mucha importancia en la estadstica inferencial.
Un concepto generalizado sobre probabilidad dice que: es la
medida del grado de confianza que se tiene de que ocurra el
acontecimiento en el prximo ensayo.
certeza absoluta
Hecho verosmil
0,5
Hecho inverosmil
Imposibilidad absoluta
0
p,
U = c, s
U =
, ,
c
s
c diagrama del rbol
MODULO DE ESTADISTICA PARA TRABAJO SOCIAL DISTANCIA
ELABORO: JOHN LUNA RENGIFO
U =
1,
2,
3,
4, 5,
U = , , , , ,
Casos posibles
U HHH
1/8,
HHM
1/8,
HMH
1/8,
HMM
1/8,
MHH
1/8,
1/8,
MHM
1/8,
MMH
1/8
MMM
H
H
H
M
M
M
H
M
U =
Luego P = 1/8
5.4 TCNICAS DE CONTEO.
Las tcnicas de conteo son de utilidad cuando en la prctica se
hace casi imposible contar fsicamente el numero de ocurrencias de
MODULO DE ESTADISTICA PARA TRABAJO SOCIAL DISTANCIA
ELABORO: JOHN LUNA RENGIFO
CAOR
CROA
CRAO
COAR
CORA
ACOR
ACRO
AROC
ARCO
AORC
AOCR
RACO
ROCA
RCAO
ROAC
RAOC
RCOA
OCRA
ORCA
OACR
OARC
OCAR
ORAC
Pn = n!
P5 = 5!
5X4X3X2X1 = 120
Las combinaciones, (
6x5x4x3x2x1 =720
C4 =
12
n!
r! ( n r )!
12!
=
4! ( 12 4 )!
12!
4! X 8!
12X11X10X9X8!
= 11880/24 = 495
4X3X2X1X8!
2. cuantos comits diferentes se pueden organizar de un grupo
de 8 personas, si el comit lo conforman solamente cinco?.
C5 =
8!
5! ( 8 5)!
C5 =
8X7X6X5!
5! X 3X2X1
= 56
AUTOEVALUACION.
1. De cuantas maneras puede formarse un comit de 5
personas teniendo un total de nueve?
2. Que es un espacio muestral? _________________________
_________________________________________________
_________________________________________________
_________________________________________________
3. Que es un experimento? _____________________________
_________________________________________________
_________________________________________________
_________________________________________________
4. Que diferencia hay entre permutaciones y combinaciones?
_________________________________________________
_________________________________________________
_________________________________________________
_________________________________________________
5. La probabilidad de la ocurrencia de un evento debe ser mayor
o iguala cero y menor que uno? _____
6. De cuantas maneras puede formar una familia de 5 hijos, si
desea que dos sean nias y tres nios?
7. Determine el valor de : 7!; 8!; 5!; 3! Por 4!;
5! Mas 6!
son
importantes
las
tcnicas
de
conteo?
_________________________________________________
_________________________________________________
_________________________________________________
_________________________________________________
_________________________________________________
10. Describa el espacio muestral del lanzamiento de dos dados:
azar o probabilstica.
aleatorio
estratificado.
Garantiza
la
FINITA
Z2 N S2
INFINITA
Z2S2
NE2 + Z2S2
E2
PQ
EN PROPORCIONES
+ PQ
Z2PQ
E2
Z
Siendo:
MODULO DE ESTADISTICA PARA TRABAJO SOCIAL DISTANCIA
ELABORO: JOHN LUNA RENGIFO
N = tamao de la poblacin.
E
S2 = varianza.
P
= probabilidad de xito
Q = probabilidad de fracaso
Z = nivel de confianza
El resultado de la aplicacin de la formula en el calculo de la
muestra siempre se aconseja se aproxime al entero superior por
pequea que sea la fraccin decimal.
Ejemplos:
1. Que tamao debe tener una muestra para estimar el 3% de
mujeres que ya han tenido hijos y que van peridicamente a
consulta ginecolgica, en una poblacin de 5.000 mujeres,
con una seguridad del 95%?.
SOLUCION:
n = ?
E2 = 0,03
N = 5.000
Z = 0,95
P = 0,5
Q = 0,5
PxQ
n =
1,96
E/Z 2 + PQ/N
0,5x0,5
n =
;
0,03/1,96 +0,5x0,5/5.000
2
0,25
n=
0,0002 + 0,0001
n = 834 mujeres
SOLUCION:
n=?
P = 0,72
Q = 0,28
E = 0,12
Z = 1,96
Z2 P Q
n=
E2
0,7745
; n=
0,12
0,0144
n = 54 personas
En
SOLUCION.
MODULO DE ESTADISTICA PARA TRABAJO SOCIAL DISTANCIA
ELABORO: JOHN LUNA RENGIFO
N = 10.000
E = +/- 5.000
Z = 0,95
S = 30.000
n=?
Z2 N S2
n =
NE2 + Z2 S2
1,96
;
2,5x10 +3,4574x109
3,4574x1013
n =
11
2,5346x1011
n = 137 personas
SOLUCION.
MODULO DE ESTADISTICA PARA TRABAJO SOCIAL DISTANCIA
ELABORO: JOHN LUNA RENGIFO
E = +/- 5.000
Riesgo = 0,045, luego:
Z = 95.5
2,0
S = 28.000
n=?
Z2 S2
n=
E2
3136000000
n=
5.000
25000000
n = 126 familias
AUTOEVALUACION
estas
suposiciones
se
denominan
hiptesis
estadsticas.
7.1 LA HIPTESIS.
Las hiptesis deben ser formuladas en forma clara, correcta y
lgica, antes de la obtencin de los datos muestrales.
TABLA DE ERROR
DECISIONES
VERDADERA
FALSA
ACEPTAR
DECISIN
CORRECTA
ERROR TIPO
II
RECHAZAR
ERROR TIPO
I
DECISIN
CORRECTA
este
nivel
de
significacin
se
debe
determinar
previamente.
Con frecuencia se utiliza el 5%, no obstante se puede utilizar
otro nivel 1%, 10%, 2% 4% - dependiendo del tipo de
investigacin que se este realizando.
Ejemplos:
1. El rector de un colegio manifiesta que el valor promedio de las
matriculas en su institucin es de $ 80.000; en estudios
anteriores, se tom una pequea muestra de 36 alumnos de ese
plantel encontrndose que el promedio del pago por matriculas
es de $ 81.500, con una varianza de $ 36.000, al nivel de
significacin del 5% se puede creer lo que dice el rector?
Solucin: segn los pasos planteados;
1. Hiptesis: Ho:
= 80.000
HA : diferente de 80.000
3. nivel de significacin = 0,05
4. S2 = 36.000, luego
S = 6.000
5. Estadstico de prueba:
Z
= X
S/ n
7.
Z = 81.500 80.000
= 1.5
6.000/6
X2 =
F o - Fe
Fe
2
n AD BC
X
=
m1 m2 m3 m4
donde:
X2
cuadrado.
FO = frecuencias observadas o reales.
Fe = frecuencias esperadas o tericas.
n = nmero de observaciones.
m = las sumas verticales y horizontales de las frecuencias de la
tabla de contingencia.
Ejemplos:
1. A cuatrocientas personas de ambos sexos se les dio a probar
margarina y mantequilla, y se les pidi que expresaran su
preferencia.
Al nivel del 5% se puede afirmar que se diferencian
significativamente las preferencias de los hombres y de las
mujeres?; los resultados se consignan en la siguiente tabla.
TABLA DE CONTINGENCIA
SEXO
HOMBRES
MUJERES
MARGARINA MANTEQUILLA
86
74
144
96
Solucin:
HO: Existe diferencia significativa de las preferencias entre
hombres y mujeres, por uno de los dos productos.
HA: No existe diferencia significativa de las preferencias entre
hombres y mujeres, por uno de los dos productos
SEXO
MARGARINA MANTEQUILLA
TOTAL
HOMBRES
86
74
160
MUJERES
144
96
240
TOTAL
230
170
400
F2 = 160/400 X 170 = 68
PRIMERA FORMULA:
X2 = (86 92)2 +
92
MARGARINA MANTEQUILLA
TOTAL
HOMBRES
86
74
160
m1
MUJERES
144
96
240
m2
TOTAL
230
m3
170
m4
400
1.501.440.000
1.501.440.000
X2 = 230.400 = 1,53
150.144
obviamente, que la decisin es la misma.
1. En tres municipios del Choc; Baha Solano, Nuqu e Istmina, se
seleccionaron 240, 200 y 160 personas respectivamente. Se les
pregunt que tipo de programa de televisin preferan: novelas,
musicales, ciencia ficcin o comedias; las respuestas son las de
la siguiente tabla.
TIPO DE
TABLA DE CONTINGENCIA
BAHIA
PROGRAMA
SOLANO
NUQUI
ISTMINA
TOTAL
NOVELAS
70
40
40
150
MUSICA
100
80
60
240
FICCIN
40
50
30
120
COMEDIAS
30
30
30
90
TOTAL
240
200
160
600
Al nivel del 5%, probar la hiptesis de que las preferencias por tipo
de programa son las mismas en las tres ciudades.
Solucin:
HO : Las preferencias por tipo de programas son iguales en los tres
municipios.
HA: No son iguales las preferencias por tipo de programas en todos
lo municipios.
Tabla de contingencia ( 3 X 4 )
TIPO DE
BAHIA
PROGRAMA
SOLANO
NUQUI
ISTMINA
TOTAL
NOVELAS
70
(60)
40
(50) 40
( 40)
150
MUSICA
100
(96)
80
(80) 60
(64)
240
FICCIN
40
(48)
50
(40) 30
(32)
120
COMEDIAS 30
(36)
30
(30)
(24 )
90
TOTAL
240
30
200
160
600
50
40
(80 80 )2
+ (60 64 )2
+ (40 48 )2
80
64
48
96
+ ( 50 40 )2 + ( 30 32)2
40
32
(30 36 )2 + ( 30 30 )2 + (30 24 )2
36
30
24
X2 = 10.55
X2(0.05) = 5,99 menor que X2 = 10.55
Cae en zona de rechazo, luego no son iguales las preferencias
en todos los municipios.
AUTOEVALUACION.
1. Que es una hiptesis estadstica? ______________________
_________________________________________________
_________________________________________________
MODULO DE ESTADISTICA PARA TRABAJO SOCIAL DISTANCIA
ELABORO: JOHN LUNA RENGIFO
Prof. Luis
Prof.
TOTAL
Carlos
APROBADOS
SUSPENDIDOS
TOTAL
50
5
47
14
61
153
8
64
180
GRADO DE LIBERTAD
LIGERO MODERADA
ALTA
TOTAL
30
37
150
19
56
50
16
63
125
10
38
52
223
500
estudiantes elegidos aleatoriamente se someten a un test
puede
decirse
entonces
con
certeza
que
los
Bebedores
40
60
80
10
190
Abstemios
20
40
40
60
160
de regresin.
Para nuestro caso solamente nos ocuparemos de la funcin lineal,
y nos apoyaremos en los clculos ya vistos, como son, la media
aritmtica, la varianza y la desviacin estndar
8.1 REGRESIN LINEAL SIMPLE.
Y = BX + A
Donde:
<
B=O
X
O
X
O
X
El coeficiente de posicin ( A ), indica la ubicacin de la recta en el
plano de coordenadas, con respecto al origen, teniendo en cuenta
tambin su valor respecto a cero.
>
A < O
A =O
PROCEDIMIENTO
PARA
EL
CLCULO
DE
LOS
COEFICIENTES.
Como quiera que en la ecuacin de la recta tenemos dos
incgnitas, es decir, B y A, se requiere para su solucin de dos
ecuaciones normales, partiendo de la propia ecuacin de la lnea
recta, y obtenemos:
1): Y = B X + nA
2):
YX = B X2 + AX
EDAD EN AOS
EDAD EN AOS
DE LAS MUJERES DE LOS HOMBRES
( Xi)
(Yi)
28
25
20
22
Pareja
1
2
3
4
5
Xi
25
20
18
27
16
106
18
20
27
30
16
18
Yi
28
22
20
30
18
118
Xi 2
625
400
324
729
256
2334
Adems, n = 5
MODULO DE ESTADISTICA PARA TRABAJO SOCIAL DISTANCIA
ELABORO: JOHN LUNA RENGIFO
Yi 2
784
484
400
900
324
2892
Xi Yi
700
440
360
810
288
2598
B = 1.11
118 117.72 = 5 A
A = 0,28/5
asi entonces
A = 0,06
GRAFICA DE LA ECUACIN
Y = 1.11X + 0.06
Cuando X vale: 2, Y vale 2.3
Cuando X vale: 4, Y vale 4.5
MODULO DE ESTADISTICA PARA TRABAJO SOCIAL DISTANCIA
ELABORO: JOHN LUNA RENGIFO
X
Y
2
2.3
4
4.5
Y
5
Y =1.11X + 0.06
4
3
2
1
X
0
1
AUTOEVALUACION
1. De dos ejemplos de distribuciones bivariantes.
2. De un ejemplo de interdependencia
3. Grafique en un plano de coordenadas las siguientes
funciones Y = -1,5X + 2 ; Y = 2,3X -1,5 ; Y = -1,8X 2,5
MODULO DE ESTADISTICA PARA TRABAJO SOCIAL DISTANCIA
ELABORO: JOHN LUNA RENGIFO
fueron
y estimar la productividad
It o =
Xt
x 100, donde:
Xo
It0 = ndice de valor, precio o cantidad a calcular.
Xt = valor, precio, cantidad, del periodo que se investiga.
Xo = valor, precio, cantidad del periodo tomado como base.
Ejemplo: en el ao de 1997 el numero de matriculados en la UTCH,
en los programas a distancia fueron 1658 personas; en el 2006
fueron 3059; el ndice simple ser:
VARIABLE
NDICE
VARIACIN
BASE
VARIACIN
( y)
BASE FIJA
VARIABLE
1999
32
100.0
100.0
2000
38
118.8
18.8
118.8
18.8
2001
36
112.5
12.5
94.7
-5.3
2002
40
125.0
25.0
111.1
11.1
2003
48
150.0
50.0
120.0
20.0
2004
60
187.5
87.5
125.0
25.0
2005
72
225.0
125.0
120.0
20.0
SALARIO EN
N DE
IPC
MILLONES DE $ OBREROS 1990=100
276
225
140
328
286
152
378
342
156
465
372
162
598
450
168
636
528
170
712
702
178
Se pide calcular:
Salario
real
1999 =
100
1999
2000
2001
2002
2003
2004
2005
276.00
302.11
339.23
401.87
498.33
523.76
560.01
276
328
378
465
598
636
712
225
286
342
372
450
528
702
100.00
108.57
111.43
115.71
120.00
121.43
127.14
Salario
Nominal
percapita
ndice
Salari
o
real
ndice
Salario
Nominal
Percapit
a
Salario
real
pearca
pita
ndice
Salario
real
percapita
AUTOEVALUACION.
1. Que concepto tiene usted de tasa.
2. Si una poblacin que tiene 5478 habitantes en la actualidad y
que crece del 2.4 % anual cuantos habitantes se esperan
para el prximo ao (haga caso omiso de la tasa de
mortalidad).
10. TERMINOLOGIA:
ALEATORIEDAD. Este concepto est referido a la seleccin de
una o varias unidades de un conjunto de manera tal que todas
tengan la misma posibilidad de ser seleccionada.
ASIGNACIN IGUAL. Se refiere al hecho de tener tamaos
muestrales igualas en cada estrato.
MODULO DE ESTADISTICA PARA TRABAJO SOCIAL DISTANCIA
ELABORO: JOHN LUNA RENGIFO
Caractersticas
de
un
individuo
en
una
y Muestreo Ecoe
Ediciones 9 Edicin.
MURRAY. Spiegel. Estadstica. Mc Graw Hill.
GUARIN. Salazar Norberto. Estadstica aplicada. Edic. Alfabeta
Papelera.
Adonay Moreno Garzn, en Serie aprender a investigar
Judith Greene y