ESTADISTICA
APLICADA
1
ESTADISTICA APLICADA JOSE LUIS GAVE CH.
ESTADISTICA APLICADA
Se termin de imprimir en Mayo del 2012
----------------------------------------------------------------------------
JG SIGNOS
Editores
---------------------------------------------------------------------------
2
ESTADISTICA APLICADA JOSE LUIS GAVE CH.
==================
A QUIENES SE ESFUERZAN POR
TRANSFORMAR Y CAMBIAR
LAS VIEJAS ESTRUCTURAS
==================
=============
CON APRECIO PARA:
GAYDY Y BEDY
=============
3
ESTADISTICA APLICADA JOSE LUIS GAVE CH.
INTRODUCCION
4
ESTADISTICA APLICADA JOSE LUIS GAVE CH.
Contenido
Pag.
1. Sumatorias
1.1. Propiedades de las sumatorias
1.2. Aplicacin
2. Definicin e importancia de la Estadstica
2.1. Definicin
2.2. Importancia
3.Estadstica descriptiva e inferencial.
3.1. Descriptiva
3.2. Inferencial
4. Anlisis estadstico
5. Datos y variables estadsticas
5.1. Datos estadsticos cualitativos:
5.2. Datos estadsticos cuantitativos
6. Representacin de datos
6.1. Mtodos de representacin de datos cuantitativos
7. Distribucin de frecuencias
7.1 Frecuencia
7.2. Frecuencia Acumulada
7.3. Frecuencia Relativa
7.4. Frecuencia Acumulada Relativa
7.5. Cuadro de distribucin de frecuencias
7.6. Frecuencia relativa acumulada mayor que
7.7. Propiedades de las frecuencias
7.8. Distribucin de frecuencia contino
8. Reglas tiles usadas para determinar el numero de clase
9. Amplitud intervlica
10. Grficos de una Distribucin de Frecuencias
11. Medidas descriptivas
11.1. Medidas de dispersin
11.2. Medidas de tendencia central
12. Variable aleatoria
12.1. Induccin de la probabilidad a variables aleatorias
13. significara que la probabilidad
14. Medidas descriptivas
14.1. Medidas de posicin o tendencia
14.2. Medidas de dispersin
15. Representacin grafica
16. Probabilida
17. Definicin axiomtica de probabilidad
18. Sucesos independientes
19. Teorema de Bayes
20. Correlacin y modelos de regresin lineal
21. Funcin lineal
5
ESTADISTICA APLICADA JOSE LUIS GAVE CH.
6
ESTADISTICA APLICADA JOSE LUIS GAVE CH.
MANUAL DE ESTADISTICA
1. Sumatorias.
La sumatoria se emplea para representar infinitos sumandos:
,
se puede representar como:
Y el promedio aritmtico:
Como:
Donde:
S: magnitud resultante de la suma.
T: cantidad de valores a sumar.
k: ndice de la suma, que vara entre h y h+t
7
ESTADISTICA APLICADA JOSE LUIS GAVE CH.
Considerando la amplitud que reviste el anlisis de las series, este tema no ser
abordado en este trabajo.
1.1. Propiedades de las sumatorias
La suma del producto de una constante por una variable, es igual a K veces la
sumatoria de una variable.
Propiedad #1:
Propiedad #2:
8
ESTADISTICA APLICADA JOSE LUIS GAVE CH.
Propiedad #3:
Propiedad #4:
Propiedad #5:
Propiedad #6:
Propiedad #7:
Propiedad #8:
Propiedad #9:
Propiedad #10:
Propiedad #11:
1.2. Aplicacin.
1.2.1. Considerando simetra en el recorrido del ndice de la suma
Una condicin que trata de utilizarse siempre que sea posible, ya que simplifica los
clculos en los modelos de fenmenos o procesos, es la simetra, la que en trminos
de las sumatorias esta caracterstica se corresponde con la variacin del ndice de la
suma en el intervalo como se indica a continuacin:
Propiedad #1:
Demostracin:
9
ESTADISTICA APLICADA JOSE LUIS GAVE CH.
Propiedad #2:
Demostracin:
Propiedad #3:
Propiedad #4:
Propiedad #5:
10
ESTADISTICA APLICADA JOSE LUIS GAVE CH.
11
ESTADISTICA APLICADA JOSE LUIS GAVE CH.
2.1. Definicin
2.2. Importancia.
12
ESTADISTICA APLICADA JOSE LUIS GAVE CH.
4. Anlisis estadstico
Dato estadstico: es toda informacin que puede relacionar y comparar para inferir
conclusiones.
Un ejemplo de dato estadstico son las edades de los alumnos del V Ciclo de la
E.A.P.M..
Un dato aislado no es un dato estadstico y se presenta en forma aislada.
Variables estadsticas: es toda caracterstica que vara de un elemento a otro de la
poblacin.
13
ESTADISTICA APLICADA JOSE LUIS GAVE CH.
Cuando los valores que toman estn comprendidos en un intervalo. Estn dados
generalmente por nmeros decimales
Ejms.
La talla de los estudiantes del V Ciclo de la Escuela de Minas.
El tiempo logrado en una carrera de ciclismo.
El peso en toneladas de los lingotes de acero del alto horno
6. Representacin de datos
14
ESTADISTICA APLICADA JOSE LUIS GAVE CH.
Los datos para que sean tiles se deben organizar de manera que faciliten su
anlisis, se puedan seleccionar tendencias, describir relaciones, determinar causas y
efectos y permitan llegar a conclusiones lgicas y tomar decisiones bien
fundamentadas; por, la finalidad de stos mtodos es permitir ver rpidamente todas
las caractersticas posibles de los datos que se han recolectado.
Diagrama de Puntos. Muestra la frecuencia con que aparece cada uno de los
valores
Diagrama de Tallo y Hoja. Es til para realizar una exploracin preliminar del
conjunto, genera una imagen adecuada de ellos sin perder informacin.
7. Distribucin de frecuencias
Una distribucin de frecuencia queda definida por el recorrido de las variables y los
valores asignados a cada punto dentro del recorrido de la variable.
yi ni Ni hi Hi
10.5 5 5 0,059 0,059
10.3 8 13 0,094 0,153
9.8 16 29 0,188 0,341
9.2 5 34 0,059 0,400
8.3 5 39 0,059 0,459
7.5 10 49 0,118 0,576
6.8 15 64 0,176 0,753
5.5 13 77 0,153 0,906
3.5 8 85 0,094 1,000
total 1,000
15
ESTADISTICA APLICADA JOSE LUIS GAVE CH.
Yi = Porcentaje de slice
ni = Frecuencia
7.2. Frecuencia Acumulada: Indica cuantos casos hay por debajo o arriba de un
determinado valor o lmite de clase.
Proceso
1.- Se determina el lmite inferior y superior del conjunto de datos.
Li = 0 , Ls = 8
4) Del valor de YI :
16
ESTADISTICA APLICADA JOSE LUIS GAVE CH.
Para el ejemplo:
1
N1 = nj = n1 = 15
J=1
2
N2 = nj = n1 + n2 = 15 + 10 = 25
J=1
3
N3 = nj = n 1 + n2 + n3 = 15 + 10 + 14 = 39
J=1
4
N4 = nj = n1 + n2 + n3 + n4 = 15 +10+14+8 = 47
J=1
5
N5 = nj = n1 + n2 + n3 + n4 + n5= 15 +10+14+8 + 5= 52
J=1
6
N6 = nj = n1 + n2 + n3 + n4 + n5 +n6= 15 +10+14+8 + 5+4 = 56
J=1
7
N7 = nj = n1 + n2 + n3 + n4 + n5 + n6+ n7= 15 +10+14+8 + 5+4+ 3 = 59
J=1
8
N8 = nj = n1 + n2 n3 + n4 + n5 +n6+ n7+ n8= 15 +10+14+8 + 5+4+ 3 + 1 = 60
J=1
8
N3 * = nj = n3+ n4 + n5..n8 = 14 + 8 + 5 + 4 + 3 + 1 = 60
17
ESTADISTICA APLICADA JOSE LUIS GAVE CH.
J=3
8
N4* = nj = n4 + n5 + n6..n8 = 8 + 5 + 4 + 3 + 1 = 21
J=4
8
N5* = nj = n5 + n6+ n7 + n8 = 5 + 4 + 3 + 1 = 21
J=5
8
N6* = nj = n6+ n7 + n8 = + 4 + 3 + 1 = 08
J=6
8
N7* = nj = n7 + n8 = 3 + 1 = 04
J=7
8
N8 * = n8 = 01
J=8
Hi = Frecuencia absoluta de yi hi = ni
nmero total de observaciones n
Para el ejemplo
H1 = 15 / 60 = 0.25 H 5 = 05 / 60 = 0.08
H2 = 10 / 60 = 0.17 H 6 = 04 / 60 = 0.07
i
Hi = hj = h1 = 0.25
J=1
2
H2 = hj = h 1 + h2 = 0.25 + 0.17 = 0.42
J=1
3
H3 = hj = h1 + h2 + h3 = 0.25 + 0.17 + 0.23 = 0.65
J=1
4
H4 = hj = h1 + h2 + h3 + h4 = 0.25 + 0.17 + 0.23 + ,0.13 = 0.78
J=1
18
ESTADISTICA APLICADA JOSE LUIS GAVE CH.
5
H5 = hj = h1 + h2 + h3 + h4 + h5 = 0.25 + 0.17 + 0.23 + ,0.13 + 0.08 = 0.86
J=1
6
H6 = hj = h1 + h2++ h6 = 0.25 + 0.17 + 0.23 + ,0.13 + 0.08 +0.07 = 0.93
J=1
7
H7 = hj = h1 + h2++ h7 = 0.25 + 0.17 + 0.23 + ,0.13 + 0.08 +0.07+ 0.05 = 0.98
J=1
8
H8= hj = h1 + h2++ h8= 0.25 + 0.17 + 0.23 + ,0.13 + 0.08 +0.07 + 0.02 = 1.00
J=1
7.6. Frecuencia relativa acumulada mayor que ( Hi )
Es la frecuencia relativa total de las observaciones mayores o iguales a y i
denotamos por Hi o HI
m
Hi = hj = h1 + h2++ hm
J=1
Para el ejemplo:
8
H1 = hj = h1 + h2++ h8 = 1.00
J=1
8
H2 = hj = h2 + h3++ h8 = 0.17 + 0.23 + 0.13 + 0.08 + 0.07 + 0.05 + 0.02 = 0.75
J=2
8
H3 = hj = h3 + h4++ h8 = 0.23 + 0.13 + 0.08 + 0.07 + 0.05 + 0.02 = 0.56
J=3
8
H4 = hj = h4 + h5++ h8 = 0.13 + 0.08 + 0.07 + 0.05 + 0.02 = 0.35
J=4
8
H5 = hj = h5 + h6+ h7+ h8 = 0.08 + 0.07 + 0.05 + 0.02 = 0.22
J=5
8
H6 = hj = h6+ h7+ h8 = 0.07 + 0.05 + 0.02 = 0.14
J=6
8
H7 = hj = h7+ h8 = 0.05 + 0.02 = 0.07
J=7
8
H8 = hj = h8 = 0.02
J=8
19
ESTADISTICA APLICADA JOSE LUIS GAVE CH.
20
ESTADISTICA APLICADA JOSE LUIS GAVE CH.
Ejemplo 2
Los siguientes datos muestran la duracin en kilmetros de 35 llantas:
36 42 38 36 42
39 40 37 39 36
42 39 41 40 39
38 37 39 40 38
38 36 40 39 37
37 41 38 36 41
41 39 41 37 39
Se pide:
a) Construir un cuadro de distribucin de frecuencias
b) Interpretar: n3, N4, H2 x 100, H5 x 100
Solucin
Cuadro de distribucin de frecuencias:
Yi Tarjas ni Ni N i hi Hi H i hi x 100 Hi x 100 Hi x 100
36 5
37 5
38 5
39 8
40 4
41 5
42 3
35
Interpretacin:
N3 = 5 , Significa que 5 llantas han tenido un recorrido de 38 x 10 3 Kms.
N4 23, Significa que 23 llantas han tenido un recorrido de 36 x 10 3 a 39 x 103 Kms.
h2 x 100 Significa que el 15 % de llantas han tenido un recorrido de 37 x 10 3 Kms.
H5 x 100 Significa que el 78% han tenido un recorrido de 36 x 103 Kms. a 40 x 10 3
Kms.
Ejemplo 3
Los datos siguientes estn referidos a la demanda diaria de camiones para
transporte de mineral, durante un periodo de 40 das.
1 4 3 5 2
5 1 2 0 4
4 6 0 1 5
1 4 4 2 8
3 2 4 3 1
5 3 5 1 4
21
ESTADISTICA APLICADA JOSE LUIS GAVE CH.
1 4 2 4 2
2 6 1 5 6
Se pide:
a) Construir un cuadro de distribucin de frecuencias
b) Interpretar: n2, n8,
N6,
h3 x 100,
H5 x 100
Solucin
Cuadro de distribucin de frecuencias:
Yi Tarjas ni Ni N i hi Hi H i hi x 100 Hi x 100 Hi x 100
0 2 02 0.05 0.05 05 05
1 8 10 0.20 0.25 20 25
2 7 17 0.17 0.42 17 42
3 4 21 0.10 0.52 10 52
4 9 30 0.22 0.74 22 74
5 6 36 0.15 0.84 15 89
6 3 39 0.07 0.96 07 96
7 0 39 0.00. 0.96 00 96
8 1 40 0.02 0.98 02 98
40 0.098 98
Interpretacin:
n2 = 8 . Significa que durante 8 das se alquil 1 camin por da, para el transporte
de mineral.
n8 = 0 . Significa que en ningn da se alquil 7 camiones para el transporte de
mineral
h3 x 100 = 17 . Significa que el 17% de los das se alquilaron 2 camiones para el
transporte de mineral.
H5 x 100 = 74 , Significa que el 74% de das se alquilaron de 0 a 4 camiones para el
transporte de mineral.
Ejm 4
En la tabla de frecuencias que se presenta a continuacuin faltan algunos datos.
Compltalas:
yi ni Ni hi Hi
5 5
6 9
7 29
8 32 0.64
9 0.30
10
Solucin
1) Por la prop. 08 N1 = n1 n1 = 5
2) Por la prop. 12 : N2 = N1 + n2 n2 = N2 - N1
N2 = 9 - 5 = 4
N3 = 29 - 9 = 20
22
ESTADISTICA APLICADA JOSE LUIS GAVE CH.
N4 = 32 - 29 = 3
4) H5 = H4 + h3 H5 = 0.64 + 0.30
H5 = 0.94
5) Por la def. de frecuencia relativa acumulada menor que:
N5 = 0.94 N5 = 47
50
6) Por propiedad:
n4 + n5 = N5
32 + n5 = 47
n5 = 15
7) n6 = 50 - (5 + 4 + 20 + 3 + 15)
n6 = 3
8) N6 = N5 + n6
N6 = 47 + 3 N6 = 50
9) h1 = 5 h1 =0.1
50
h2 = 4 h2 =0.08
50
h3 = 20 h3 = 0.40
50
h4 = 3 h4 =0.06
50
10) H1 = hi = 0.1
H2 = 0.1 + 0.08 = 0.18
H3 = 0.18 + 0.40 = 0.58
H6 = 0.94 + 0.06 = 1.00
Por consiguiente:
La tabla pedida ser:
yi ni hi Ni Hi
5 5 0.10 5 0.10
6 4 0.08 9 0.18
7 20 0.40 29 0.58
8 3 0.06 32 0.64
9 15 0.30 47 0.94
10 3 0.06 50 1.00
50
23
ESTADISTICA APLICADA JOSE LUIS GAVE CH.
Definicin
Cuando los datos son de tipo contino. Cuando son demasiado numerosos es
conveniente agruparlos en sub conjuntos llamados intervalos de clase
Los intervalos de clase pueden ser :
Cerrados:
Cuando el conjunto de datos continuos incluye los lmites superior e inferiores, se
denota por:
[yI - 1 ; yI ]
Donde:
yI - 1 : Es el lmite inferior del intervalo
yI =Es el lmite superior del intervalo
Abierto
Cuando los datos que encierran no incluye los lmites inferior ni superior.
Se denota por : (yI - 1 ; yI )
Semi Abierto o Semi Cerrado
Cuando el conjunto de datos que contiene incluye solamente uno de sus lmites
Abierto por la derecha
Cuando los datos que encierra noincluye al lmite superior.
Se representa por : [yI - 1 ; yI )
Rango o Recorrido
Es el conjunto de observaciones que incluye el lmite inferior y el lmite superior.
-----------I--------------------------I-------- R
li ls
24
ESTADISTICA APLICADA JOSE LUIS GAVE CH.
a) Definir los extremos de los intervalos de clase con, una cifra decimal mas que las
que contenga las observaciones.
b) Considerar los intervalos de clase como intervalos de nmeros reales abiertos por
la izquierda y cerrados por la derecha o viceversa, es decir considerar el intervalo:
( ] o[ )
n es el nmero de observaciones.
9. Amplitud intervlica
Definida as al tamao del intervalo o a la distancia entre el lmite inferior y superior
del intervalo. Se denota por C.
Donde C = ls - li
M
Los grficos son tiles porque ponen en relieve y aclaran las tendencias que no se
captan fcilmente en la tabla, ayudan a estimar valores con una simple ojeada y
brinda una verificacin grfica de la veracidad de las soluciones.
a) Histograma:
Esta formado por rectngulos cuya base es la amplitud del intervalo y tiene la
caracterstica que la superficie que corresponde a las barras es representativa de la
cantidad de casos o frecuencia de cada tramo de valores, puede construirse con
clases que tienen el mismo tamao o diferente ( intervalo variable). La utilizacin de
los intervalos de amplitud variable se recomienda cuando en alguno de los intervalos
, de amplitud constante, se presente la frecuencia cero o la frecuencia de alguno o
algunos de los intervalos sea mucho mayor que la de los dems, logrando as que
las observaciones se hallen mejor repartidas dentro del intervalo.
b) Polgono de Frecuencias
25
ESTADISTICA APLICADA JOSE LUIS GAVE CH.
Se puede obtener uniendo cada punto medio (marca de clase) de los rectngulos del
histograma con lneas rectas, teniendo cuidado de agregar al inicio y al final marcas
de clase adicionales, con el objeto de asegurar la igualdad del reas.
c) Curvas de frecuencia
Las medidas de tendencia central son medidas de posicin que dan una
descripcin compacta de cmo estn centrados los datos y una visualizacin ms
clara del nivel que alcanza la variable, pueden servir de base para medir o evaluar
valores extremos o raros y brinda mayor facilidad para efectuar comparaciones.
Media aritmtica
26
ESTADISTICA APLICADA JOSE LUIS GAVE CH.
X = xi . fi
Caractersticas de la Media:
1. En su clculo estn todos los valores del conjunto de datos por lo que cada uno
afecta la media.
4. Aunque es confiable porque refleja todos los valores del conjunto de datos puede
ser afectada por los valores extremos, y de esa forma llegar a ser una medida
menos representativa, por lo que si la distribucin es asimtrica, la media aritmtica
no constituye un valor tpico.
LA MODA
Para datos agrupados se define como Clase Modal el intervalo que tiene ms
frecuencia.
La moda puede no existir o no ser nica, las distribuciones que presentan dos o ms
mximos relativos se designan de modo general como bimodales o multimodales.
Caractersticas de la Moda.
2. No est afectada por los valores extremos pero para datos continuos es dudoso
su clculo.
LA MEDIANA
Datos agrupados:
X = Li + N/2 fd
fc
N = N total de datos
28
ESTADISTICA APLICADA JOSE LUIS GAVE CH.
fc 9
Caractersticas de la mediana
3. Cuando la localizacin del elemento central puede ser determinada y los lmites
de clase mediana son conocidos, la mediana para la distribucin de frecuencias
puede ser calculada por interpolacin, no importando que sta contenga intervalos
abiertos, cerrados, iguales o diferentes.
29
ESTADISTICA APLICADA JOSE LUIS GAVE CH.
En sta, para cada uno de los valores de xi se asigna un factor wi de peso, que
depende de la importancia que el investigador desee darle.
Xp = S ( xi wi) / S wi
Media geomtrica
til cuando la variable cambia a lo largo del tiempo, esto es, en el calculo del
promedio de tasas, razones, proporciones geomtricas y relaciones de variables. Se
utiliza en Matemticas Financieras y Finanzas para promediar nmeros ndices,
tasas de cambio, etc.
M = n e (x 1 * x 2 * x 3 *.....*x n )
Se ve afectada por todos los nmeros y valores extremos pero en menor grado que
la Media Aritmtica, su valor siempre es menor que el de sta.
Media armnica
1 / MH = [ S 1 / xi ] / n
Media cuadrtica
MC = 2 e S [ xi 2 ] / n
Los cuantiles
30
ESTADISTICA APLICADA JOSE LUIS GAVE CH.
d) Coeficiente de variacin:
31
ESTADISTICA APLICADA JOSE LUIS GAVE CH.
Las v.a permiten definir la probabilidad como una funcin numrica (de variable real)
en lugar de como una funcin de conjunto .
Ejemplo Tiramos una moneda 3 veces. Representamos cara por c y sello por z.
= {ccc, ccz, czc, zcc, czz, zcz, zzc, zzz}
La probabilidad de cada suceso elemental es 1/8. Por ejemplo p(ccc)=1/8, ya que la
probabilidad de sacar cara en una tirada es .
Definimos la v.a. X: nmero de caras, que puede tomar los valores {0, 1, 2, 3}. Se
buscan todos los puntos muestrales que dan lugar a cada valor de la variable y a
ese valor se le asigna la probabilidad del suceso correspondiente.
x Sucesos px
0 {sss} 1/8
3 {ccc} 1/8
x f(x)
1 0,22
2 0,27
3 0,30
4 0,21
32
ESTADISTICA APLICADA JOSE LUIS GAVE CH.
Para las variables aleatorias de inters hay tablas, y programas de ordenador, donde
buscar esos valores.
Distribucin acumulativa
Para el ejemplo 3
x f(x) F(x)
0 1/8 1/8
1 3/8 4/8
2 3/8 7/8
3 1/8 8/8
y para el ejemplo 4
x f(x) F(x)
1 0,22 0,22
2 0,27 0,49
3 0,30 0,79
4 0,21 1
33
ESTADISTICA APLICADA JOSE LUIS GAVE CH.
si X es una v.a. cualquier funcin de ella, h(x), es tambin una v.a., en consecuencia
tambin se define este parmetro para una funcin de v.a.
Ejemplo 5: Se tira un dado. Se define como v.a. el nmero que sale Cul es su
media?
La variable X puede tomar los valores 1, 2, ..., 6 y para todos ellos f(x) = 1/6. En
consecuencia la media es
X h(x)
1 100
2 100
3 500
4 0
5 0
6 0
34
ESTADISTICA APLICADA JOSE LUIS GAVE CH.
apuesta costara menos de eso el juego sera ventajoso para el jugador (as se
enriqueci Voltaire), si costara ms, para la banca. (llamar a sto honestidad del
juego le cost el puesto de ministro a Laplace).
Varianza:
1) Un juego consiste en tirar dos dados. Si la suma de sus caras es mayor o igual a
10 se ganan 300 soles, si est comprendida entre 7 y 9 se ganan 100 soles. y para
cualquier otro resultado no se gana nada. Cul debera ser el precio de la apuesta
para que la ganancia esperada de la banca sea de 50 soles?
Solucin
El espacio muestral para el problema es = {(1,1), (1,2), (1,3), ..., (6,6)} con 36
puntos muestrales. Todos los sucesos elementales tiene la misma probabilidad 1/36.
Se define la v.a. X: suma de las dos caras. Esta variable puede tomar los valores 2,
3, 4, ....,12. La tabla con la fdp inducida es
x Sucesos f(x)
2 {(1,1)} 1/36
35
ESTADISTICA APLICADA JOSE LUIS GAVE CH.
12 {(6,6)} 1/36
2 0
3 0
4 0
5 0
6 0
7 100
8 100
9 100
10 300
11 300
12 300
x 0 1 2 3 4 5
36
ESTADISTICA APLICADA JOSE LUIS GAVE CH.
a. Encontrar f(5)
b. Construir F(x)
c. Encontrar p(X=2)
d. Encontrar p(X<2)
e. Encontrar p(X>3)
f. Calcular la media y la varianza
Solucin
a. Aplicando la formula
.
Para que se cumpla esta condicin es necesario que f(5)=0,09
b.
x 0 1 2 3 4 5
Solucin
a. Representando por a que un paciente tenga alivio y por n que no lo tenga, el
espacio muestral para el problema es = {aaaa, naaa, anaa, aana, aaan, ..., nnnn},
Si es cierta la afirmacin del fabricante p(a)=0,9 y p(n)=0,1
La v.a. X: nmero de pacientes que tienen alivio puede tomar los valores 0, 1, 2, 3, 4.
La tabla con la fdp inducida es
x Sucesos f(x)
0 {nnnn} 0,14
4 {aaaa} 0,94
38
ESTADISTICA APLICADA JOSE LUIS GAVE CH.
Solucin
a. La grfica de la fdp es
La condicin equivalente a
varianza
39
ESTADISTICA APLICADA JOSE LUIS GAVE CH.
Moda muestral: El valor que ms se repite (puede no existir y si existe puede no ser
nica).
Mediana muestral: Ordenando los Xi, el valor que est en el medio
Ejemplo 1
Los siguientes datos estn referidos al nmero de estudiantes del sexo masculino
por seccin de una muestra aleatoria de 50 secciones de la Facultad de Ingeniera
de la U.N.C.P.
16 10 23 30 35 37 40 44 10 17
24 30 35 37 40 45 11 17 25 31
36 38 43 46 12 15 18 19 20 20
40
ESTADISTICA APLICADA JOSE LUIS GAVE CH.
26 31 36 27 32 27 33 28 28 33
29 29 34 38 35 39 35 35 46 46
Se pide hallar:
1) Un cuadro de distribucin de frecuencias.
2) Interpretar:
n1 ; n5
N1 , N5
N1 ; N5
h1 ; h5
H1 ; H5
h1 x 100 ; h5 x 100
H 1 x 100 ; H5 x 100
H1 x 100 ; H5 x 100
Solucin
1) Para la elaboracin del cuadro de distribucin de frecuencias consideraremos:
Estimacin del nmero de intervalos Por la regla de Sturges:
K = 1 + 3.3 log 50
K =6.60 k puede tomar K = 6 o k = 7
Para el problema consideraremos k = 6
Y2 = 16 + 22 = 19 Y5 = 34 + 40 = 37
2 2
Y3 = 22 + 28 = 25 Y6 = 40 + 46 = 43
2 2
Conteo
Por el sistema de tarjas se encuentra el nmero de datos para cada intervalo.
Considerando para el ejemplo un intervalo: abierto por la derecha y cerrado por la
izquierda . El lmite superior no pertenece al intervalo
Frecuencia acumulada menor que (Ni )
i
Nj = n1+ n2 + n3 .ni = nj
J=1
i
Nj = n1+ n2 + n3 .ni = nj
41
ESTADISTICA APLICADA JOSE LUIS GAVE CH.
J=1
Para el ejemplo:
N1 = 5
N2 = 5 + 8 = 13
N3 = 13 + 5 =18
N4 = 18 + 12 = 30
N5 = 30 + 12 = 42
N6 = 42 + 8 = 50
N2 = n2 + n3 + n4 + .+ n6 8+5+12+12+8 = 45
N3 = n3 + n4+ n5 + n6 5 +12 + 12 + 8 = 37
N4 = n4 + n5 + n6 12 + 12 + 8 = 32
N5 = n5 + n6 12 + 8 = 20
N6 = n6 + 08
h2 = 8 = 0.16 h5 = 12 = 0.24
50 50
h3 = 5 = 0.10 h6 = 8 = 0.16
50 50
42
ESTADISTICA APLICADA JOSE LUIS GAVE CH.
i
Hi= h1 + h2 + h3 + hm ; = Hi = hj
J =1
Para el ejemplo:
H1= h1 = 0.10
H2= h1 + h2 = 0.10 + 0.16 = 0.26
H3= h1 + h2 + h3 = 0.10 + 0.16 + 0.10 = 0.36
H4= h1 + h2 + h3 + h4 = 0.10 + 0.16 + 0.10 + 0.24 = 00.60
H5= h1 + h2 + h3 + h4 + h5 = 0.10 + 0.16 + 0.10 + 0.24 + 0.24 = 0.84
H6= h1 + h2 + h3 + h4 + h5 + h6 = 0.10 + 0.16 + 0.10 + 0.24 + 0.24 + 0.16 = 1.00
Frecuencia relativa acumulada mayor o igual que (H i )
m
Hi = hI + hi +1 + hi +2.+ hm ; Hi = hj
J =1
Para el ejemplo:
H1 = h1 + h2 + h3.+ h6 = 0.16 + 0.16 + 0.10 + 0.24 + 0.24 + 0.16 = 1.00
H6 = h6 = 0.16
43
ESTADISTICA APLICADA JOSE LUIS GAVE CH.
Interpretacin:
n1 = 5 ; Significa que en la muestra existen 5 secciones que tienen 10 estudiantes
del sexo masculino por seccin, o mas pero menos de 15 estudiantes del sexo
masculino por seccin en la Facultad de Ingeniera. De la U.N. C. P.
n5 = 12 ; Significa que en la muestra existen 12 secciones que tienen 28 estudiantes
del sexo masculino por seccin, o mas pero menos de 16 estudiantes del sexo
masculino por seccin en la Facultad de Ingeniera de la U.N.C.P.
N1 = 5, Significa que, 5 es el nmero de secciones que tienen menos de 16
estudiantes del sexo masculino por seccin, en la facultad de ingeniera de la
U.N.C.P.
N5 = 42; Significa que, 42 es el nmero de secciones que tienen menos de 40
estudiantes del sexo masculino por seccin, en la facultad de ingeniera de la
U.N.C.P.
N1 = 50; Significa que, 50 es el nmero de secciones que tiene por lo menos 10
estudiantes del sexo masculino por seccin, en la Facultad de Ingenierade la
U.N.C.P.
N5 = 20; Significa que, 20 es el nmero de secciones que tiene por lo menos 34 o
mas pero, menos de 16 estudiantes del sexo masculino por seccin, en la Facultad
de Ingenierade la U.N.C.P.
h1 = 0.10; es la proporcin del nmero de secciones que tiene menos de 16
estudiantes del sexo masculino por seccin en la Facultad de Ingeniera.de la
U.N.C.P.
h5 = 0.24; es la proporcin del nmero de secciones que tiene menos de 34
estudiantes o mas pero, menos de 40 estudiantes del sexo masculino en la Facultad
de Ingeniera. De la U.N.C.P.
H1 = 0.10, es la proporcin del nmero de secciones que tiene menos de 16
estudiantes del sexo masculino por seccin en la Facultad de Ciencias de Ingeniera
de la U.N.C.P.
H5 = 0.84, es la proporcin del nmero de secciones que tiene menos de 40
estudiantes del sexo masculino por seccin en la Facultad de Ciencias de Ingeniera
de la U.N.C.P.
44
ESTADISTICA APLICADA JOSE LUIS GAVE CH.
Ejemplo 2
Los siguientes datos se refieren al nmero de granos de slice (Si) en muestras de
100 grs de fierro (Fe)
1.13 0.92 0.36 0.87 1.00 0.97
0.80 0.94 0.68 0.92 0.92 0.79
0.85 0.72 0.73 0.81 0.61 1.20
0.60 1.17 0.82 0.97 0.81 0.68
0.97 0.87 0.74 0.48 0.71 1.00
Se pide :
1) Construir un cuadro de distribucin de frecuencias, con una amplitud intervlica C
= 7 , e intervalo semi abierto :[ ; )
2) Interpretar:
Y3 ; y 5
n2 ; n6
N4 , N5
N4 ; N5
h4 ; h5
45
ESTADISTICA APLICADA JOSE LUIS GAVE CH.
H4 ; H5
H5 ;H6
h3 x 100 ; h5 x 100
H5 x 100 ; H6 x 100
H5 x 100 ; H6 x 100
Solucin
1) Previamente consideraremos:
Determinamos el limite superior e inferior del conjunto de datos:
Li = 0.36 ; l s = 1.20
Para una amplitud intervlica igual a 7 se tiene:
C = l s - LI C= 1.20 - 0.36
7 7
C = 0.12
En el cuadro se colocan los intervalos de la siguiente manera:
lI ; (lI + C)
Es decir:
0.36 ; 0.36 + 0.12
0.48 ; 0.48 + 0.12
0.60 ; 0.60 + 0.12
0.72 ; 0.72 + 0.12
0.84 ; 0.84 + 0.12
0.96 ; 0.96 + 0.12
1.08 ; 1.08 + 0.12
46
ESTADISTICA APLICADA JOSE LUIS GAVE CH.
i
Nj = n1+ n2 + n3 .ni = nj
J=1
Para el ejemplo:
N1 = 1
N2 = 1 + 1 = 02
N3 = 02 + 05 =07
N4 = 07 + 08 = 15
N5 = 15 + 07 = 22
N6 = 22 + 05 = 27
N7 = 27 + 03 = 30
N2 = n2 + n3 + n4 + .+ n7 1 + 5 + 8 + 7 + 5 +3 = 29
N3 = n3 + n4+ n5 + n6 + n7 5+8+7+5+3 = 28
N4 = n4 + n5 + n6 + n7 8+7+5+3 = 23
N5 = n5 + n6 + n7 7+5+3 = 15
N6 = n6 + n7 5+3 = 8
N7 = n7 = 03
47
ESTADISTICA APLICADA JOSE LUIS GAVE CH.
h2 = 1 = 0.03 h6 = 5 = 0.17
30 30
h3 = 5 = 0.0.17 h7 = 3 = 0.10
30 30
h4 = 8 = 0.0.27
30
i
Hi= h1 + h2 + h3 + hm ; = Hi = hj
J =1
Para el ejemplo:
H1= h1 = 0.03
H2= h1 + h2 = 0.03 + 0.03 = 0.06
m
Hi = hI + hi +1 + hi +2.+ hm ; Hi = hj
J =1
48
ESTADISTICA APLICADA JOSE LUIS GAVE CH.
Para el ejemplo:
H1 = h1 + h2 + h3.+ h7 = 0.03 + 0.03 + 0.17 + 0.27 + 0.23 + 0.17 + 0.10 =
1.00
H7 = h7 = 0.10
Interpretacin:
y3 = 0.66 ; en 5 muestras de Fe se ha encontrado un promedio de 0.66 grs. de Si.
Y5 = 0.90 ; en 7 muestras de Fe se ha encontrado un promedio de 0.90 grs. de Si.
49
ESTADISTICA APLICADA JOSE LUIS GAVE CH.
h4 = 0.27, es la proporcin del nmero de muestras que tiene menos de 0.84 grs. de
Si.
h5 = 0.23, es la proporcin del nmero de muestras que tiene menos de 0.96 grs. de
Si.
h3 x 100 = 17% de las muestras de Fe tienen 0.60 grs. de Si. O mas pero menos de
0.72 grs. de Si.
Tambin se puede decir:
El 17 % de las muestras de Fe contiene de 0.60 a 0.71 grs. de Si.
h5 x 100 = 23% de las muestras de Fe tienen 0.84 grs. de Si. O mas pero menos de
0.96 grs. de Si.
Tambin se puede decir:
El 17 % de las muestras de Fe contiene de 0.84 a 0.95 grs. de Si.
50
ESTADISTICA APLICADA JOSE LUIS GAVE CH.
H5x 100 = 50 % de las muestras de Fe tiene por lo menos 0.84 grs. de Si.
H6x 100 = 27 % de las muestras de Fe tiene por lo menos 0.96 grs. de Si.
Para el estudiante:
Los siguientes datos se refieren a los tiempos utilizados por 60 detonadores de
explosivos medidos en segundos.
64.00 73.00 64.75 65.25 67.00 67.0
63.50 63.00 64.50 63.50 63.75 68.50
61.75 63.00 62.75 69.00 59.00 65.50
65.25 68.00 63.00 68.00 65.50 62.25
63.75 63.25 66.00 61.50 61.00 64.00
62.75 65.00 68.00 60.75 61.25 63.50
65.75 65.00 65.00 65.00 62.25 64.50
68.50 66.50 66.00 64.00 65.25 60.00
63.00 67.00 64.50 67.50 65.50 63.75
65.00 63.00 61.50 66.25 61.50 64.75
Se pide:
1) Construir un cuadro e distribucin de frecuencias para un intervalo de la forma: (
]
2) Interpretar:
Y3 . y5
n1 ; n5
N1 , N5
N1 ; N5
h1 ; h5
H1 ; H5
h 1 x 100 ; h5 x 100
H1 x 100 ; H5 x 100
H1 x 100 ; H5 x 100
Solucin
1) Para la elaboracin del cuadro de distribucin de frecuencias consideraremos:
Estimacin del nmero de intervalos Por la regla de Sturges:
K = 1 + 3.3 log 60
K =6.86 k puede tomar: K = 6 o k = 7
Para el problema consideraremos k = 7
Clculo de la amplitud intervlica
C = ls - li C = 73.00 - 59.00 C = 2
K 7
51
ESTADISTICA APLICADA JOSE LUIS GAVE CH.
2 2
Y2 = . + . = Y5 = . + . =
2 2
Y3 = . + . = Y6 = . + . =
2 2
Y7 = . + . =
2
Conteo
Por el sistema de tarjas se encuentra el nmero de datos para cada intervalo.
Considerando para el ejemplo un intervalo: abierto por la izquierda y cerrado por la
derecha. El limite inferior pertenece al intervalo
Frecuencia acumuladamenor que (Ni )
i
Nj = n1+ n2 + n3 .ni = nj
J=1
i
Nj = n1+ n2 + n3 .ni = nj
J=1
Para el ejemplo:
N1 =
N2 =
N3 =
N4 =
N5 =
N6 =
N7 =
N2 = n2 + n3 + n4 + .+ n7
N3 = n3 + n4+ n5 + n6
N4 = n4 + n5 + n6 +n7
52
ESTADISTICA APLICADA JOSE LUIS GAVE CH.
N5 = n5 + n6 + n7
N6 = n6 + n7
N7 = n7 +
h2 = . . = h5 =. . =
60 60
h3 = . . = h6 = . . =
60 60
h7 = . . =
60
i
Hi= h1 + h2 + h3 + hm ; = Hi = hj
J =1
Para el ejemplo:
H1= h1 =
H2= h1 + h2 =
H3= h1 + h2 + h3 =
H4= h1 + h2 + h3 + h4 =
H5= h1 + h2 + h3 + h4 + h5 =
H6= h1 + h2 + h3 + h4 + h5 + h6 =
H7= h1 + h2 + h3 + h4 + h5 + h6 + h7 =
m
Hi = hI + hi +1 + hi +2.+ hm ; Hi = hj
53
ESTADISTICA APLICADA JOSE LUIS GAVE CH.
J =1
Para el ejemplo:
H1 = h1 + h2 + h3.+ h7 =
H2 = h2 + h3 + h4.+ h7 =
H3 = h3 + h4 + h5+ h6 + h7 =
H4 = h4 + h5+ h6 + h7 =
H5 = h5+ h6 + h7 =
H6 = h6 + h7 =
H7 = h7 =
65.00 - 67.00
67.00 -
69.00 -
2) Interpretacin:
y3 =
y5 =
n1 =
n5 =
N1 =
N5 =
54
ESTADISTICA APLICADA JOSE LUIS GAVE CH.
N1 =
N5 =
h1 =
h5 =
H1 =
H5 =
H1 =
H5 =
h1 x 100 =
h5 x 100 =
H1 x 100 =
H5 x 100 =
H3x 100 =
H5x 100 =
A) Grfico de Bastones
Consiste en trazar un par de ejes coordenados haciendo coincidir con la variable.
55
ESTADISTICA APLICADA JOSE LUIS GAVE CH.
56
ESTADISTICA APLICADA JOSE LUIS GAVE CH.
C) Grfico de Barras
Se traza un par de ejes coordenados haciendo coincidir el eje horizontal con la
variable en estudio, y el eje vertical con cualquiera de las frecuencias .
Se traza rectngulos de ancho arbitrario y de altura igual a la frecuencia.
Estos rectngulos son iguales y separados entre si.
Este tipo de grficos es apropiado para una distribucin de tipo discreto.
Ejemplo
d) Polgono de Frecuencias
Existen dos tipos de polgonos de frecuencias:
a) Sobre la bases de un histograma, se marca en la parte superior de los
rectngulos los puntos medios y se trazan lneas poligonales uniendo todos los
puntos medios .
La grfica poligonal total se une al eje horizontal a una distancia de C/2.
Ejemplo
57
ESTADISTICA APLICADA JOSE LUIS GAVE CH.
e) Gragfico Ojiva
A diferencia de los graficos anteriores solo se reemplaza la frecuencia simple por la
frecuencia acumulada.
Ejm.
58
ESTADISTICA APLICADA JOSE LUIS GAVE CH.
Se representan
los intervalos
de clase en el
eje de abcisas
(eje horizontal)
y las
frecuencias,
absolutas o
relativas, en el
de ordenadas
(eje vertical).
59
ESTADISTICA APLICADA JOSE LUIS GAVE CH.
A veces es
ms til
representar las
frecuencias
acumuladas.
O representar
simultneament
e los
histogramas de
una variable en
dos situaciones
distintas.
Otra forma
muy frecuente,
de representar
dos
histogramas
de la misma
variable en
dos
situaciones
distintas.
60
ESTADISTICA APLICADA JOSE LUIS GAVE CH.
Otra ms
En las
variables
cuantitativas o
en las
cualitativas
ordinales se
pueden
representar
polgonos de
frecuencia en
lugar de
histogramas,
cuando se
representa la
frecuencia
acumulativa,
se denomina
ojiva.
EJERCICIOS RESUELTOS
SOLUCIN DE LOS EJERCICIOS PROPUESTOS DE RUFINO MOYA
1.- Por que las frecuencias relativas son ms importantes que las absolutas?
Explique.
Respuesta:
61
ESTADISTICA APLICADA JOSE LUIS GAVE CH.
Debido a que las frecuencias relativas (hi) nos indican los valores proporcionales, de
las que se puede inferir el porcentaje; mientras que las frecuencias absolutas (ni)
nos indican valores particulares de la poblacin.
2.- Cuando se constituye una distribucin de frecuencia, el nmero de clases que se
una depende de:
a.- Nmero de datos.
b.- Intervalo de los datos reunidos.
c.- Tamao de la poblacin
d.- Todas las anteriores.
e.- a y b pero no c
m est siempre en funcin de n, luego la respuesta es (a)
97-39
c= ----- = 8.285714285
7
Para c = 9
39 97
I-------I------------I--------I -------- =
36.5 97 a
a = 2.5
Xmin = 39 - 2.5 = 36.5
62
ESTADISTICA APLICADA JOSE LUIS GAVE CH.
97-39+2
-------- = 5
13
a = 3.5 Xmin = 35.5, Xmin = 100.5
63
ESTADISTICA APLICADA JOSE LUIS GAVE CH.
5.- La compaa VELOZ, una empresa situada en Arequipa, muestreo sus registros
de embarque durante cierto da, obteniendo los siguientes resultados.
TIEMPO TRANSCURRIDO DESDE LA RECEPCION DE LA ORDEN HASTA LA
ENTREGA (EN DIAS)
4 12 8 14 11 6 7 13 13 11
20 5 9 10 15 24 7 29 6 11
Construya una distribucin de frecuencias para los datos anteriores, una distribucin
de frecuencia relativa. Use intervalos de 6 das.
Xmin = 4 ; Xmax = 29 ; Intervalo de 6 das
64
ESTADISTICA APLICADA JOSE LUIS GAVE CH.
20 1.00 100
a.- Que afirmacin puede hacer sobre la eficacia del procesamiento de pedidos a
partir de la distribucin de frecuencia?
Que la compaa VELOZ en un lapso de 4 a 15 das cumple con el 80% de entrega.
b.- Si la compaa quiere asegurarse de que la mitad de sus entregas se realicen en
10 o menos das Puede Ud. determinar mediante la distribucin de frecuencia si la
compaa ha alcanzado su meta?
La compaa VELOZ no alcanz su meta, porque al cabo de los 10 das slo
cumpli con el 35% de la entrega.
6.- Las marcas de clase de una distribucin de frecuencias con intervalos de igual
amplitud son 46, 55, 64, 73, 82, 91. Halle:
a.- El intervalo de clase
b.- El rango
c.- Los limites de clase
d.- Los limites reales de clase
41.5 - 50.5 46
50.5 - 59.5 55
59.5 - 68.5 64
68.5 - 77.5 73
65
ESTADISTICA APLICADA JOSE LUIS GAVE CH.
77.5 - 86.5 82
86.5 - 95.5 91
Y2 = 41.5 + 9 = 50.5
Y6 =Xmax = 95.5
41 95
I------------I-----------I----------I
41.5 95.5
[yI-1 - yI) yi
41 - 50 54.75
50 - 59 54.5
59 - 68 63.5
68 - 77 72.5
77 - 86 81.5
86 - 95 90.5
m=6
c = 95 - 41
6
c=9
[yI-1 - yI) yi ni hi Hi
10 0.30
0.45
66
ESTADISTICA APLICADA JOSE LUIS GAVE CH.
22 0.175
120
H4 = H 3 + h 4 ====> H4 = 1.00
n1
h1 = -------- ====> n1 = 0.30(120)
n
n1 = 36
n2 = 18 ......
Yo + 3c + Yo + 4c
22 = -------------------- ====> 22 = 2Yo + 7c ....(2)
2
de (1) y (2) c = 4
Yo = Y1 - 2 =====> Yo = 8; Y1 = 12
67
ESTADISTICA APLICADA JOSE LUIS GAVE CH.
50
N1 = ni ===> Ni = 4
n2 = N2 - N1 ===> n2 = 16
N3 = N2 + n3 ===> N3 = 45
n4 = n-(n1 + n2 + n3)==> n4 = 5
n4 = N3 + n4 ===> N4 = 50
Para c = 62 ====> Xmin = - 43 Luego consideramos para c = 6
Yi + Y2 Y0 + CY0 + 2c
50 = Y2 = ------------ = --------------------
2 2
2Y0 + 3C
= -------------
2
2Y0 + 3(6)
50 = ------------- ====> Y0 = 41
2
Xmin = 41 ; Xmax = 65
68
ESTADISTICA APLICADA JOSE LUIS GAVE CH.
9.- En cada uno de los siguientes casos, determine si son consistentes o no los
datos.
a.- m = numero de clase = 6
h1 = 0.2 , h4 = 0.2 , H2 = 0.6 , H3 + H4 = 1.9
H1 = h 1 ==> H1 = 0.2
h2 = H2 - H1 ==> h2 = 0.4
[ ) ni Hi
0.2
0.6
0.2
Clculo de H3 y H4
H3 + H4 = 1.9 .....(1)
H3 + h4 = H4 ==> H3 - H4 = -0.2 .....(2)
de (1) y (2)
H3 = 0.85 ; H4 = 1.05
Respuesta : Es inconsistente porque H4 > 1.0
b.- H4 = 0.30 , n = 10 , h3 = 0.31
Ni % Hi % Ni % Hi %
4 4 4
a 4+a
69
ESTADISTICA APLICADA JOSE LUIS GAVE CH.
12 16 16 + 2
15 15
e.- H5 = 0.36 , N4 = 30 , h5 = 6 , n = 50
Respuesta : es inconsistente porque h5 > 1
10. Suponga que la siguiente tabla de distribucin representa los salarios diarios de
los trabajadores de construccin civil de Lima.
Salario diario en S/. Frecuencia hi Hi % Hi Hi %
8 a12 360 0.12 12 0.12 12
12 a 16 420 0.14 14 0.26 26
16 a 20 510 0.17 17 0.43 43
20 a24 660 0.22 22 0.65 65
24 a 28 570 0.19 19 0.84 84
28 a 32 480 0.16 16 1.00 100
I-------------I------I------------I
24 28 30 32
b
16 b
------------- = ----------- ==> b = 8%
32 - 28 32 - 30
420 a
------------- = ------------- ==> a = 105 trabajadores.
16 - 12 16 - 15
570 b
----------- = ---------------- ==> b = 427.5 = 428 trabajadores.
28 - 24 27 - 24
11. Los siguientes datos indican el nmero de minutos que ocuparon sus asientes 50
clientes de un cafetera.
73 65 82 70 45 50 70 54 32 75
75 67 65 60 75 87 83 40 72 64
58 75 89 70 73 55 61 78 89 93
43 51 59 38 65 71 75 85 65 85
49 47 55 60 76 75 69 35 45 63
32 93
I----------------I---------I
31 94
CUADRO DE DISTRIBUCION DE FRECUENCIAS
Xmin = 31; Xmax = 94; m = 7 ; c = 9
[yI-1 - yI) yi ni hi Ni Hi Ni Hi hi% 100 Hi% 100 hi%100
71
ESTADISTICA APLICADA JOSE LUIS GAVE CH.
3 5 16
------------------------------------------------------------I----------------------------------------------
31 35 40 49 52 58
I-------------------------I I----------I
a b
3 a
------ = ------- ===> a = 1.666 = a =2
40 -31 40 - 35
16 b
------ = ------- ===> b = 5.33 = b = 5
58 -49 52 - 49
.. 11 . 15 . . 4 . 6 .
I---------------------------------------------------------------------------------------------------I
58 60 67 76 84 94
. .
a
11 a
72
ESTADISTICA APLICADA JOSE LUIS GAVE CH.
12 b
----------- = --------------- ===> a = 9.333 = 9
94 -85 92 - 85
12. Condorito, que es un jefe de prcticas muy divertido, pierde los exmenes de
estadstica. Pero recuerda que las 120 notas tenan una distribucin simtrica con 7
intervalos de clase de amplitud constante. Adems en sus archivos encuentra la
siguiente informacin:
hi = 5% ; h3 = 15% ; H3* = 85% ; Y4 = 72 ;
7
Yi = 400
i=3
Donde: Yi = marca de clase
Hi*= Frecuencia relativa acumulada mayor o igual que
a.- Reconstruya la tabla de distribucin de frecuencia.
H1 = hi ===> Hi = 0.05
Hi*= 1.00
H2*= Hi* -h1 ===> H2*= 0,95
h2 = H2* - H3* ===> h2=0.10
H4*= H3*+ h3 ===> H4*= 0.70
[) yi hi Hi
0.05
73
ESTADISTICA APLICADA JOSE LUIS GAVE CH.
0.15 0.85
72
Total 120
7
Yi = 400 ; Y4 = 72
i=3
Y3 = 72 - c , Y5 = 72 + c , Y6 = 72 +2c , Y7 = 72 +3c ,
72 - c + 72 + 72 + c + 72 + 2c + 72 + 3c= 400 ===> c = 8
b.- Si para aprobar el examen se necesita obtener por lo menos 70 ptos. Cuntos
desaprobaron dicho examen?
74
ESTADISTICA APLICADA JOSE LUIS GAVE CH.
I--------------I
.a
48 a
------------ = -------------------- ===> a = 36
76 -68 76 - 68
Aprobaron = 36 + 18 + 12 + 6 = 72 alumnos
40 35 38 40 41 37 41 40 38 20
33 27 25 28 44 22 20 29 36 25
------------------------------------------------------------------------------
a.- Construya una distribucin de frecuencias con 5 clases.
20 44
I------------------I-------------------I--------------------I-
19.5 44.5
44 + 20 + 2
----------------------- =5
4
a = 0.5
75
ESTADISTICA APLICADA JOSE LUIS GAVE CH.
b.- Si el 80% de los pesos estn por arriba de 30 kg, se recomendar su cultivo en el
valle. A la vista de los resultados se, recomendar su cultivos?
5% 25% 30%
I---------------------------------I I--------------------I I--------------------I
29.5 30 34.5 39.5 44.5
I-----------------I
a
5 a
----------------- = ----------------- ===> a = 4.5 = 5
34.5 - 29.5 34.5 - 30
Solucin:
80
H2* = ----- ===> H2* = 0.80
100
20
H4* = ----- ===> H4* = 0.20
100
100Hi*% = 100
100hi% = 100 - 80 = 20
ni = 60 (0.2) = 12
n2 = 18 - 12 = 6
[y i-1 - yi ) Yi 100Hi %
100 - 210
210 - 390 18 80
390 - 490
490 - 590
590 - 590 20
Total - 60
6
h2 = ---- = h2 = 0.1 ====> 100h2% = 10
76
ESTADISTICA APLICADA JOSE LUIS GAVE CH.
60
. 30 . . 12 .
I-----------------------------------------------------------------------I
390 450 490 590
I----------------------I
a
. 30 .
490 - 390
a
--------- = a = 12
490 - 450
a = 12
Personas que ganan ms de 450 soles mensuales = 12 + 12 = 24 personas
c.- Que porcentaje de trabajadores tiene un sueldo de 300 o m s pero menos de 500
soles mensuales.
10% . . 50% . . 20% .
10 a
77
ESTADISTICA APLICADA JOSE LUIS GAVE CH.
--------------- = ---------------- = a = 5%
390 - 210 390 - 300
20 b
---------------- = ---------------- = b = 2%
590 - 490 500 - 490
= 57%
d.- Estime el valor bajo el cual se encuentra los haberes de las dos terceras partes
de todos los trabajadores.
. 12 . . 6 . . 30 .
30 22
---------------- = ------------------ = X = 463.33
490 - 390 X - 390
Rpta: El valor de las 2/5 partes de los trabajadores es S/. 463 mensual
15. En los ltimos 30 das se tomaron los siguiente datos que representan la
duracin en aos de 3 bombas.
2.0 3.0 0.3 3.3 1.3 0.4 0.2 6.0 5.5 6.5
0.2 2.3 1.5 4.0 5.9 1.8 4.7 0.7 4.5 0.3
1.5 0.5 2.5 5.0 1.0 6.0 5.6 6.0 1.2 0.2
78
ESTADISTICA APLICADA JOSE LUIS GAVE CH.
c.- Estime el valor bajo el cual se encuentra la tercera parte de todas las
observaciones.
1
--- (30) = 10 observaciones
3
I---------------------------------------------------------I
0 1 X 2
I-----------I I-------I I---------------------------------I
8 10 6
6 10
--------- = -----------
2-1 X-1
X = 0.66
El valor bajo el cual se encuentra 1/3 de las observaciones = 1 + 0.66
= 1.66
1.09 1.92 2.31 1.79 2.28 1.74 1.47 1.97 0.85 1.24
79
ESTADISTICA APLICADA JOSE LUIS GAVE CH.
1.58 2.03 1.70 2.17 2.55 2.11 1.86 1.90 1.68 1.51
1.64 0.72 1.69 1.85 1.82 1.79 2.46 1.88 2.08 1.67
1.37 1.93 1.40 1.64 2.09 1.75 1.63 2.37 1.75 1.69
a.- Construya un diagrama de hojas y tallos para los datos, en la que los tallos sean
los dgitos que se encuentran a la izquierda del punto decimal, repetida cada uno de
ellos cinco veces, de manera que las hojas de doble dgito 00 a 19 estn, asociados
con los tallos codificados con la letra b; y as sucesivamente. De sta manera. un
numero como 1.29 tiene un valor de tallo de 16 y una hoja con equivalencia.
SOLUCION:
80
ESTADISTICA APLICADA JOSE LUIS GAVE CH.
EJERCICIOS
1. Identifique: Poblacin muestra, unidad elemental, variable (s) , tipo de variable(s)
y de un ejemplo de observacin para cada uno de las variable (s)del siguiente
enunciado:
Con la finalidad de lanzar al mercado limeo un nuevo producto lcteo, la empresa
MAYORASA S.A. encarga al dpto. de marketing realizar un estudio acerca del
consumo en Lima Metropolitana,. Con este fin se ha tomado al azar 35 hogares del
distrito de Comas, 40 hogares del distrito de Maranga y 15 hogares en el distrito de
Lince. Se va a consultar sobre la marca de leche que usa, que porcentaje de su
ingreso mensual dedica para el consumo de leche y el nmero de veces que
adquiere a la semana el producto lcteo.
Respuesta
Poblacin
Todos los hogares de Lima metropolitana.
Muestra
90 hogares (35 hogares de Comas, 40 hogares de maranga, 15 hogares de Lince)
Unidad elemental
Un hogar de Lima metropolitana.
Variables:
N Variables Tipo Observacin
01 La marca de la leche que usa V. Cualitativa nominal Laive
02 % de ingreso que dedica al V. Cualitativa 45%
consumo de leche Continua
03 Nmero de veces que adquiere el V. Cuantitativa 5
producto Lcteo discreta
81
ESTADISTICA APLICADA JOSE LUIS GAVE CH.
Respuesta
Poblacin
Todas las familias de Lima metropolitana.
Muestra
100 familias de Lima metropolitana
Variable
Tipo de leche que consumen las familias
Tipo de Variable
Variable continua nominal
Observacin
Leche fluida.
Respuesta
Poblacin
Todas las unidades de transporte de Lima metropolitana.
Muestra
351 unidades de transporte
Unidadelental
Una unidad de transporte
Variable
Nmero de pasajeros.
Tipo de variable
Variable cuantitativa discreta.
Observacin
32 pasajeros de la unidadde transporte.
82
ESTADISTICA APLICADA JOSE LUIS GAVE CH.
Respuesta
Poblacin:
Todos los pacientes del Hospital
Muestra
20 pacientes del hospital
Unidad elemntal
Un paciente
Variable
Tipo de enfermedad
Tipo de variable
Variable cuantitativa Nominal
Valor estadstico
35 % padecen de enfermedades gastro intestinales.
Observacin
Enfermedad respiratoria
Respuesta
Poblacin.
Todos los estudiantes usuarios de la biblioteca
Muestra
55 estudiantes usuarios de la biblioteca.
Unidad elemental
Un estudiante usuario
Variables
N Variable Tipo de variable Valor estadstico Observacin
01 Tiempo de lectura en la sala V. Cuantitativa continua No hay 45 minutos
02 Preferencia por un tipo de V. Cuantitativa nominal No hay Literat. peruana
lectura
Respuesta.
83
ESTADISTICA APLICADA JOSE LUIS GAVE CH.
Poblacin
Todos los propietarios de viviendas del distrito de Pueblo Libre.
Muestra
300 propietarios de viviendas.
Unidad elemental
Un propietario por vivienda.
Variables:
N Variable Tipo de Variable Valor estadstico Observacin
1 Nmero de pisos por Cuantitativa discreta 1.5 ------
propiedad
2 Ingreso mensual por Cuantitativa continua $. 325.50 -------
propietario
3 Opinin acerca del impuesto Cualitativa nominal 59 % -------
predial
g) Estado Civil
Tipo de variable Unidad Observacin
84
ESTADISTICA APLICADA JOSE LUIS GAVE CH.
elemental
g Cuantitativa nominal Una persona soltera.
Respuesta
Poblacin: Todos los que transitan por la quinta Av. Canad de 5 p.m. a 8 p.m.
Muestra: 80 fumadores que transitaron por la quinta cuadra de la Av. Canad de 5
p.m. a 8 p.m.
Unidad elemental: 1 fumador que transit por la quinta cuadra de la Av. Canad de 5
p.m. a 8 p.m.
85
ESTADISTICA APLICADA JOSE LUIS GAVE CH.
7) En cada uno de los siguientes casos identifique: poblacin, tipo de variable, parmetro o
valor estadstico y proporcione dos ejemplos de observacin.
ii)Se llam por telfono a 123 hogares del distrito de Surco y se pregunt por el programa
informativo de preferencia. El 50 % respondi Primera Plana.
iii) Del 30% de empleados ms antiguos de una empresa se seleccion al 10% de ellos,
encontrndose que en promedio tiene 4. hijos.
iv) Se eligen al azar tres aerolineas que hacen buelo a Houston encontrandose que en
promedio el tiempo de vuelo es de 6 horas
Respuesta
N Tipo de variable Observacin
i V. cualitativa nominal Contra. A favor
ii V. Cuantitativa nominal 24 Horas. ATV
iii V. cuantitativa discreta 4.0
iv V. cuantitativa continua 3h. 20m. 7 seg. , 4 h 8 m. 15 seg.
Respuestas:
Poblacin: 4897 Estudiantes de la UNMSM.
Variables:
1.- Desea contar con algn seguro estudiantil
2..- Cul es su ingreso familiar?
Respuesta
Tipo de variable
86
ESTADISTICA APLICADA JOSE LUIS GAVE CH.
Respuesta
Muestra: 31 personas de la ciudad de Lima
Variables
N Variables Observacin
01 Orden de preferencia del consumidor Inca Cola
02 Nmero de unidades de gaseosa consumida 10 unidades
03 Formas de presentacin del producto Botella no retornable.
87
ESTADISTICA APLICADA JOSE LUIS GAVE CH.
b) Hay situaciones en que se puede calcular: si todos los resultados del experimento
son igualmente probables, entonces la probabilidad se define (definicin clsica o de
Laplace) como el cociente entre el nmero de casos favorables y el nmero de
casos totales.
88
ESTADISTICA APLICADA JOSE LUIS GAVE CH.
i) p(A) 0 A P()
iii) p() = 1
Obsrvese que es necesario asignar un nmero a todos los sucesos, no slo a los
sucesos elementales, pero si se ha asignado la probabilidad a los sucesos
elementales, a travs de la propiedad ii) se puede asignar a todos los dems.
Ejemplo:
A = {obeso} B = {hipertenso}
A B = {hipertenso y obeso}
A B = {obeso o hipertenso}
Probabilidad condicionada
Como la probabilidad est ligada a nuestra ignorancia sobre los resultados de la
experiencia, el hecho de que ocurra un suceso, puede cambiar la probabilidad de los
dems. El proceso de realizar la historia clnica, explorar y realizar pruebas
89
ESTADISTICA APLICADA JOSE LUIS GAVE CH.
Ejemplo
Se sabe que el 50% de la poblacin fuma y que el 10% fuma y es hipertensa. Cul
es la probabilidad de que un fumador sea hipertenso?
A = {ser hipertenso} B = {ser fumador}
A B = {ser hipertenso y fumador}
p(A|B) = 0,10/0,50 = 0,20
Obsrvese que los coeficientes falso-positivo y falso-negativo de las pruebas
diagnsticas son probabilidades condicionadas.
La frmula anterior se puede poner p(A B) = p(B) p(A|B) = p(A) p(B|A)
llamada regla de la multiplicacin, que se puede generalizar a ms sucesos
p(A1 A2 A3) = p((A1 A2) A3) = p(A1 A2) p(A3|A1 A2) = p(A1) p(A2|A1) p(A3|A1
A2)
En general p(A1 A2 A3 ...) = p(A1) p(A2|A1) p(A3|A1 A2) ...
llamado principio de las probabilidades compuestas y especialmente til para
aquellas situaciones en que las probabilidades condicionadas son ms fciles de
obtener que las probabilidades de las intersecciones.
Ejemplo
Se sabe por estudios previos que el 0,1% de la poblacin tiene problemas
vasculares. Un estudio sobre individuos con problemas vasculares revela que el
20% de ellos son placas de ateroma. Si el 10% de los individuos con placas de
ateroma estn expuestos a muerte sbita por desprendimiento de trombos qu
probabilidad tiene un individuo cualquiera de estar expuesto a muerte sbita por
desprendimiento de trombos de una placa de ateroma?
A1 = {problemas vasculares}; A2 = {placas de ateroma}; A3 = {expuesto a muerte
sbita por ....}
p(A1) = 0,001; p(A2|A1) = 0,20; p(A3|A1 A2) = 0,1
p(A1 A2 A3) = 0,001 x 0,20 x 0,1 = 0,000002
Ejemplo :
90
ESTADISTICA APLICADA JOSE LUIS GAVE CH.
Una urna contiene 10 bolas, de las cuales 3 son rojas, 5 verdes y 2 azules. Se
extraen al azar 3 bolas. Calcular la probabilidad de que la primera sea azul, y las
otras dos verdes.
Definimos A1 = {la 1 bola es azul}; A2 = {la 2 bola es verde}; A3 = {la 3 bola es
verde}
p(A1) = 2/10 aplicando la definicin clsica de probabilidad, puesto que hay 10 bolas
y 2 son verdes.
p(A2|A1) = 5/9; si la primera bola extrada es azul, en la urna quedan 9 bolas, 5 de
ellas verdes.
p(A3|A1 A2) = 4/8; si la primera bola extrada es azul y la segunda verde en la urna
quedan 8 bolas, 4 de ellas verdes.
p(A1 A2 A3) = 2/10 x 5/9 x 4/8 = 1/18
Ejemplo:
Para un hijo de una mujer portadora de Duchenne, el sexo y la enfermedad son
independientes?
Segn vimos en el Ejemplo 3 el espacio muestral es = {xX, xY, XX, XY}
Definimos los sucesos A = {varn} = {xY, XY}; B = {enfermo} = {xY}
A B = {xY}
por lo tanto p(A) = 0,5; p(B) = 0,25; p(A B) = 0,25 p(A) p(B) NO son
independientes.
91
ESTADISTICA APLICADA JOSE LUIS GAVE CH.
Ejemplo :
La prevalencia de infarto cardaco para hipertensos es del 0,3% y para no
hipertensos del 0,1%. Si la prevalencia de hipertensin en una cierta poblacin es
del 25% Cul es la prevalencia del infarto en esa poblacin?
A1 = {ser hipertenso} A2 = {no serlo} estos sucesos constituyen una particin
B = {padecer infarto}
datos: p(B|A1) = 0,003; p(B|A2) = 0,001; p(A1) = 0,25
92
ESTADISTICA APLICADA JOSE LUIS GAVE CH.
Solucin
en el caso continuo:
93
ESTADISTICA APLICADA JOSE LUIS GAVE CH.
en el caso continuo:
Del mismo modo que en el caso unidimensional estas funciones estn sometidas a
las condiciones:
discreta
continua
Caso discreto
Caso continuo
En el ejemplo anterior:
X1
X1 0 1 f2(X2)
0 0,4 0,1 0,5
94
ESTADISTICA APLICADA JOSE LUIS GAVE CH.
Obsrvese que como esto es una fdp, la suma de sus valores debe ser 1.
0,8 es la probabilidad de que un individuo no sea hipertenso dado que no tiene un
consumo excesivo de sal.
95
ESTADISTICA APLICADA JOSE LUIS GAVE CH.
1: pendiente (cambio de Y al
aumentar X en 1)
96
ESTADISTICA APLICADA JOSE LUIS GAVE CH.
Ejemplo 3 : Para el diseo del ejemplo 2 una muestra produce los siguientes datos:
X (sal) Y (Presin)
1,8 100
2,2 98
3,5 110
4,0 110
4,3 112
5,0 120
La salida de un paquete estadstico es:
97
ESTADISTICA APLICADA JOSE LUIS GAVE CH.
H0 : 1 = 0
H1 :1 0
segn iii)
se rechaza H0.
Para hacer estimacin por intervalos de la fuerza de la asociacin o el efecto
98
ESTADISTICA APLICADA JOSE LUIS GAVE CH.
99
ESTADISTICA APLICADA JOSE LUIS GAVE CH.
100
ESTADISTICA APLICADA JOSE LUIS GAVE CH.
se define como
Qu mide r?
Se puede demostrar una relacin algebraica entre r y el anlisis de la varianza de la
regresin de tal modo que su cuadrado (coeficiente de determinacin) es la
proporcin de variacin de la variable Y debida a la regresin. En este sentido, r2
mide el poder explicatorio del modelo lineal.
Qu no mide r?
no mide la magnitud de la pendiente (fuerza de la asociacin)
102
ESTADISTICA APLICADA JOSE LUIS GAVE CH.
en nuestro caso mayor que 4,92. Como no lo es, no rechazamos H 0. Hay que
calcular la probabilidad de encontrar
103
ESTADISTICA APLICADA JOSE LUIS GAVE CH.
si 1 fuera 5. Calculamos
0: media de Y cuando todas las Xi son cero (cuando no tiene sentido Xi=0, p.e.
edad, se interpreta como la media de Y que no depende de las Xi).
i: cambio en la media de Y cuando Xi aumenta una unidad permaneciendo
constantes las dems.
Las asunciones del modelo son una generalizacin de las de RLS y dado el
resultado de RLS no vamos a distinguir entre modelo I y II.
La estimacin de los coeficientes tambin se hace por mnimos cuadrados o mxima
verosimilitud y se obtienen los mismos resultados. Estos resultados, usando
notacin matricial, son (incluyen como caso particular la RLS):
es decir la matriz de datos con una primera columna de 1s. Estos coeficientes se
distribuyen como una normal multivariante cuya matriz de medias son los
verdaderos coeficientes y matriz de varianzas-covarianzas
104
ESTADISTICA APLICADA JOSE LUIS GAVE CH.
un buen estimador de 2 es
Ejemplo 5
Dada una muestra hipottica de 20 pacientes en los que se ha recogido los
siguientes datos: nivel de colesterol en plasma sanguneo (en mg/100 ml), edad (en
aos), consumo de grasas saturadas (en gr/semana) y nivel de ejercicio
(cuantificado como 0: ningn ejercicio, 1: ejercicio moderado y 2: ejercicio intenso),
realizar el ajuste a un modelo lineal entre el nivel de colesterol y las dems variables.
Tabla de datos
Paciente Colesterol Edad Grasas Ejerci.
1 350 80 35 0
2 190 30 40 2
3 263 42 15 1
4 320 50 20 0
5 280 45 35 0
6 198 35 50 1
7 232 18 70 1
8 320 32 40 0
9 303 49 45 0
10 220 35 35 0
11 405 50 50 0
12 190 20 15 2
105
ESTADISTICA APLICADA JOSE LUIS GAVE CH.
13 230 40 20 1
14 227 30 35 0
15 440 30 80 1
16 318 23 40 2
17 212 35 40 1
18 340 18 80 0
19 195 22 15 0
20 223 41 34 0
La salida del programa de ordenador es
106
ESTADISTICA APLICADA JOSE LUIS GAVE CH.
y se aade una nueva variable X*, con el primer modelo se tiene una SSR(Y,X1,...,Xk)
y con el nuevo otra SSR(Y,X1,...,Xk,X*), la diferencia entre ambas ser lo que ha
mejorado la suma de cuadrados por aadir la variable X* y tendr 1 grado de
libertad.
SSR(Y,X*|X1,...,Xk) = SSR(Y,X1,...,Xk,X*) - SSR(Y,X1,...,Xk) = SSE(Y,X1,...,Xk) -
SSE(Y,X1,...,Xk,X*)
y el cociente
se distribuye como una Fp,n-(k+p+1) en la hiptesis nula de que las nuevas p variables
X1*, ..., Xp* no mejoren el modelo con respecto a las k variables originales y permite
contrastar dicha hiptesis.
Ejemplo 6
Con los datos del ejemplo 5, realizar el contraste de la F parcial para aadir la
variable ejercicio a un modelo que slo contenga la edad y las grasas consumidas.
107
ESTADISTICA APLICADA JOSE LUIS GAVE CH.
108
ESTADISTICA APLICADA JOSE LUIS GAVE CH.
y por lo tanto
Y = 0 - 1 - 2 - 3 = Y|A para los residentes en A
Y = 0 + 1 = Y|B para los residentes en B
Y = 0 + 2 = Y|C para los residentes en C
Y = 0 + 3 = Y|D para los residentes en D
si se suman las 4 ecuaciones:
0 = ( Y|A + Y|B + Y|C + Y|D)/4 por lo tanto
0 es la media de Y en los cuatro lugares de residencia
1 la diferencia de los residentes en B con respecto a la media
2 la diferencia de los residentes en C con respecto a la media y
3 la diferencia de los residentes en D con respecto a la media y, evidentemente, -
1 - 2 - 3 la diferencia de los residentes en A con respecto a la media. De modo
que a diferencia del esquema anterior, se usa como nivel de referencia la media en
todas las categoras en lugar de una de ellas.
109
ESTADISTICA APLICADA JOSE LUIS GAVE CH.
22 16,4 0
23 13,5 2
24 13,7 1
Los resultados de un modelo entre presin arterial y status de fumador tal y como
est codificado en la tabla son:
111
ESTADISTICA APLICADA JOSE LUIS GAVE CH.
20 15.0 0 0 0
21 12.6 2 0 1
22 16.4 0 0 0
23 13.5 2 0 1
24 13.7 1 1 0
y el modelo entre PRE_AR y FUMA y EX_FUMA
Para contrastar si la presin arterial depende del status de fumador, deber usarse
el contraste basado en la F (p=0,018) y por lo tanto al nivel de significacin habitual
=0,05 se rechaza la hiptesis nula de no dependencia. A pesar de que el
coeficiente para EX_FUMA no es significativamente distinto de 0 (p=0,220), se
mantiene en el modelo porque FUMA no tiene sentido por s sola.
Obsrvese que usando las variables indicadoras se ha encontrado una dependencia
que antes no se haba puesto de manifiesto, debido a la falta de linealidad para los
cdigos usados.
La estimacin puntual de la presin arterial media de los no-fumadores ( 0 en el
modelo) es 14,789 con un error estndar estimado de 1,07 y, como t 0,025(21) = 2,08, su
intervalo de confianza al 95% es 14,789 2,08x1,07 = (12,563 17,014).
La estimacin del aumento medio de la presin arterial en los fumadores ( 1) es
5,068 que es significativamente distinto de cero (p=0,005) y la estimacin del
aumento medio de la presin arterial en los ex-fumadores ( 2) es 1,974 pero no es
significativamente distinto de cero (p=0,220).
Para realizar la estimacin por intervalos de la presin media en fumadores ( 0+ 1)
y ex-fumadores (0 + 2) se necesita estimar sus respectivas varianzas
112
ESTADISTICA APLICADA JOSE LUIS GAVE CH.
113
ESTADISTICA APLICADA JOSE LUIS GAVE CH.
115
ESTADISTICA APLICADA JOSE LUIS GAVE CH.
116
ESTADISTICA APLICADA JOSE LUIS GAVE CH.
del caf para los consumidores de tabaco y otro efecto para los no consumidores de
tabaco.
Vamos a estimar el efecto del tabaco.
La presin arterial media en la muestra es 16,86 y la estimacin de la presin arterial
de los no-fumadores y no consumidores de caf ( 0 ) es 13,8.
Segn vimos antes la estimacin del efecto del tabaco (cambio en la presin arterial
media por ser fumador) es para los no consumidores de caf 1 y para los
consumidores de caf1 + 3. La varianza estimada de esta ltima estimacin es
117
ESTADISTICA APLICADA JOSE LUIS GAVE CH.
ESTADISTICA
APLICADA
PRACTICA
118
ESTADISTICA APLICADA JOSE LUIS GAVE CH.
7. Dato Estadstico: Son nmeros o medidas que han sido recopilados como
resultado de observaciones, que pueden ser comparados, analizados e
interpretados. Un nmero aislado que no puede compararse o que no muestra
relacin significativa con otros nmeros no es un dato estadstico.
119
ESTADISTICA APLICADA JOSE LUIS GAVE CH.
120
ESTADISTICA APLICADA JOSE LUIS GAVE CH.
Ejercicios:
Para cada una de las siguientes variables indique el tipo de variable correspondiente:
121
ESTADISTICA APLICADA JOSE LUIS GAVE CH.
Ejercicio
Los siguientes datos corresponden a los resultados de anlisis de metales pesados
de muestras procedentes de agua de rio
122
ESTADISTICA APLICADA JOSE LUIS GAVE CH.
123
ESTADISTICA APLICADA JOSE LUIS GAVE CH.
Continuar y aceptar
124
ESTADISTICA APLICADA JOSE LUIS GAVE CH.
RIO RIO
HUAYTARA: HUAYTARA: RIO RIO
ACEITES Y SOLIDOS HUAYTARA: HUAYTARA:
GRASA TOTALES COBRE CROMO
(mg/L) (mg/L) (mg/L Cu) (mg/L Cr)
N Vlidos 3 3 3 3
Perdidos 0 0 0 0
Media 295,00000 ,00767 ,00167
Mediana 344,00000 ,00800 ,00100
Moda 179,000(a) ,006(a) ,001
Asimetra -1,670 -,935 1,732
Error tp. de asimetra 1,225 1,225 1,225
Suma 885,000 ,023 ,005
Percentiles 25 179,00000 ,00600 ,00100
50 344,00000 ,00800 ,00100
75 362,00000 ,00900 ,00300
125
ESTADISTICA APLICADA JOSE LUIS GAVE CH.
Histograma
1,0
0,8
F re c u e n c ia
0,6
0,4
0,2
Media =295,000
Desviacin tpica =100,
861
N =3
0,0
150,000 200,000 250,000 300,000 350,000 400,000
RIO HUAYTARA: SOLIDOS TOTALES (mg/L)
__
1,0
0,8
F re c u e n c ia
0,6
0,4
0,2
Media =0,008
Desviacin tpica =0,002
N =3
0,0
0,005 0,006 0,007 0,008 0,009 0,010
RIO HUAYTARA: COBRE (mg/L Cu)
_
_
126
ESTADISTICA APLICADA JOSE LUIS GAVE CH.
2,5
2,0
F r e c u e n c ia
1,5
1,0
0,5
Media =0,002
Desviacin tpica =0,001
N =3
0,0
0,000E0 1,000E-3 2,000E-3 3,000E-3 4,000E-3
RIO HUAYTARA: CROMO (mg/L Cr)
_
_
2,0
F r e c u e n c ia
1,5
1,0
0,5
Media =0,115
Desviacin tpica =0,045
N =3
0,0
0,080 0,100 0,120 0,140 0,160 0,180
RIO HUAYTARA: FIERRO (mg/L Fe)
_
_
1,2
1,0
F r e c u e n c ia
0,8
0,6
0,4
0,2
Media =0,002
Desviacin tpica =0,001
N =3
0,0
5,000E-4 1,000E-3 1,500E-3 2,000E-3 2,500E-3 3,000E-3 3,500E-3
RIO HUAYTARA: MANGANESO (mg/L Mn)
127
ESTADISTICA APLICADA JOSE LUIS GAVE CH.
2,5
2,0
F r e c u e n c ia
1,5
1,0
0,5
Media =0,001
Desviacin tpica =5,
774E-4
N =3
0,0
5,000E-4 1,000E-3 1,500E-3 2,000E-3 2,500E-3
RIO HUAYTARA: PLOMO (mg/L Pb)
_
_
MEDIDAS DE DISPERSION
Se utilizan para lograr una mejor descripcin de los datos, dado que muchas veces
las medidas de tendencia central no son suficientes para ello. Dos grupos diferentes
de datos pueden tener iguales medidas dc tendencia central, pero sus
caractersticas de distribucin pueden ser diferentes.
Las medidas de dispersin nos ilustran sobre la manera como variara los datos
observados alrededor de una medida de tendencia central, indican como estn
concentrados los datos alrededor del parmetro de centralizacin, permiten
comparar una informacin con otra y ayudan a verificar si determinadas medidas de
tendencia central son o no significativas.
128
ESTADISTICA APLICADA JOSE LUIS GAVE CH.
variacin es el que tiene la mayor dispersin. (Si las medias de dos grupos
son iguales, entonces el grupo que tenga mayor desviacin estndar ser el
de mayor dispersin
Ejercicio
Los siguientes datos corresponden a los resultados de anlisis de metales pesados de muestras
procedentes de agua de rio
ANALISIS DE METALES PESADOS DEL RIO
PAMPAS
INFORME N 3265-
2011-LIA.FIA
PARAMETRO UNIDAD M1 M2 M3 METODO
Aceites y Grasas mg/L N.D. N.D. N.D. Gravimtrico
393, 518,
Solidos Totales mg/L 00 00 496,00 Gravimtrico
Cobre mg/ L Cu 0,005 0,006 0,009 Absorcin Atmica
Cromo mg/ L Cr 0,001 0,001 0,001 Absorcin Atmica
Fierro mg/ L Fe 0,216 0,3115 0,191 Absorcin Atmica
Manganeso mg/ L Mn 0,013 0,019 0,009 Absorcin Atmica
Plomo mg/ L Pb 0,001 0,001 0,001 Absorcin Atmica
Zinc mg/ L Zn 0,004 0,005 0,004 Absorcin Atmica
Cadmio mg/ L Cd 0,0005 0,0001 0,0003 Absorcin Atmica
129
ESTADISTICA APLICADA JOSE LUIS GAVE CH.
Continuar
aceptar
130
ESTADISTICA APLICADA JOSE LUIS GAVE CH.
RIO RIO
PAMPAS: RIO PAMPAS: PAMPAS: RIO PAMPAS:
FIERRO MANGANESO PLOMO RIO PAMPAS: Cadmio (mg/L
(mg/L Fe) (mg/L Mn) (mg/L Pb) ZINC (mg/L Zn) Cd)
N Vlidos 3 3 3 3 3
Perdidos 0 0 0 0 0
Error tp. de la media ,036716 ,002906 ,000000 ,000333 ,0001155
Desv. tp. ,063594 ,005033 ,000000 ,000577 ,0002000
Varianza ,004 ,000 ,000 ,000 ,000
Rango ,121 ,010 ,000 ,001 ,0004
Mnimo ,191 ,009 ,001 ,004 ,0001
Mximo
,312 ,019 ,001 ,005 ,0005
Coeficiente de variacin
Grafico
1,0
0,8
F r e c u e n c ia
0,6
0,4
0,2
Media =0,014
Desviacin tpica =0,005
N =3
0,0
0,008 0,010 0,012 0,014 0,016 0,018 0,020
RIO PAMPAS: MANGANESO (mg/L Mn)
131
ESTADISTICA APLICADA JOSE LUIS GAVE CH.
2,5
F r e c u e n c ia
2,0
1,5
1,0
0,5
Media =0,004
Desviacin tpica =5,
774E-4
N =3
0,0
0,0035 0,004 0,0045 0,005 0,0055
RIO PAMPAS: ZINC (mg/L Zn)
1,2
1,0
F r e c u e n c ia
0,8
0,6
0,4
0,2
Media =3,00E-4
Desviacin tpica =2,
000E-4
N =3
0,0
0,0000E0 1,0000E-4 2,0000E-4 3,0000E-4 4,0000E-4 5,0000E-4 6,0000E-4
RIO PAMPAS: Cadmio (mg/L Cd)
MEDIDAS DE ASIMETRIA
Para el caso de distribuciones un modales se utiliza el SESGO DE PEARSON, el
cual se calcula teniendo en cuenta que en este tipo de curvas la media tiende a
situarse con respecto a la moda, al mismo lado de la cola ms larga. (Skewness).
El sesgo de Pearson se obtiene:
Si K=O.263, mesocrtica
132
ESTADISTICA APLICADA JOSE LUIS GAVE CH.
Si K>O.263, platcrtca
Si K<O.263, leptocrtca
Ejercicio
Los siguientes datos corresponden a los resultados de anlisis de metales pesados de muestras
procedentes de agua de rio
ANALISIS DE METALES PESADOS DEL RIO TAMBO
INFORME N 326 -2011-
LIA.FIA
PARAMETRO UNIDAD M1 M2 M3 METODO
Aceites y Grasas mg/L N.D. N.D. N.D. Gravimtrico
490, 768,
Solidos Totales mg/L 00 00 738,00 Gravimtrico
mg/ L
Cobre Cu 0,042 0,062 0,087 Absorcin Atmica
Cromo mg/ L Cr 0,001 0,009 0,013 Absorcin Atmica
mg/ L
Fierro Fe 23,741 37,315 44,942 Absorcin Atmica
mg/ L
Manganeso Mn 0,709 1,4 1,835 Absorcin Atmica
mg/ L
Plomo Pb 0,008 0,016 0,02 Absorcin Atmica
mg/ L
Zinc Zn 0,087 0,201 0,334 Absorcin Atmica
mg/ L
Cadmio Cd 0,0006 0,0006 0,0012 Absorcin Atmica
Hallar
a) La media
b) La mediana
c) Rango
c) La desviacin estndar
d) La varianza
e) El valor de asimetra
f) Grafico de Cu, Pb, Fe y Zn
Solucin.
133
ESTADISTICA APLICADA JOSE LUIS GAVE CH.
Estadsticos
RIO TAMBO:
RIO TAMBO: SOLIDOS RIO TAMBO:
ACEITES Y TOTALES COBRE (mg/L RIO TAMBO:
GRASA (mg/L) (mg/L) Cu) CROMO (mg/L Cr)
N Vlidos 3 3 3 3
Perdidos 0 0 0 0
Media ,00000 665,33333 ,06367 ,00767
Mediana ,00000 738,00000 ,06200 ,00900
Desv. tp. ,000000 152,582218 ,022546 ,006110
Varianza ,000 23281,333 ,001 ,000
Error tp. de asimetra 1,225 1,225 1,225 1,225
Rango ,000 278,000 ,045 ,012
Asimetra -1,657 ,331 -,935
134
ESTADISTICA APLICADA JOSE LUIS GAVE CH.
Asimetra
RIO TAMBO: RIO RIO
SOLIDOS RIO TAMBO: TAMBO: TAMBO:
TOTALES COBRE CROMO FIERRO
(mg/L) (mg/L Cu) (mg/L Cr) (mg/L Fe)
N Vlidos 3 3 3 3
Perdidos 0 0 0 0
Error tp. de asimetra 1,225 1,225 1,225 1,225
Asimetra -1,657 ,331 -,935 -,802
1,0
0,8
F r e c u e n c ia
0,6
0,4
0,2
Media =0,064
Desviacin tpica =0,023
N =3
0,0
0,040 0,050 0,060 0,070 0,080 0,090
RIO TAMBO: COBRE (mg/L Cu)
_
_
135
ESTADISTICA APLICADA JOSE LUIS GAVE CH.
1,0
0,8
F r e c u e n c ia
0,6
0,4
0,2
Media =35,333
Desviacin tpica =10,
739
N =3
0,0
20,000 25,000 30,000 35,000 40,000 45,000
RIO TAMBO: FIERRO (mg/L Fe)
1,0
0,8
F r e c u e n c ia
0,6
0,4
0,2
Media =0,015
Desviacin tpica =0,006
N =3
0,0
0,005 0,010 0,015 0,020 0,025
RIO TAMBO: PLOMO (mg/L Pb)
1,0
0,8
F r e c u e n c ia
0,6
0,4
0,2
Media =0,207
Desviacin tpica =0,124
N =3
0,0
0,050 0,100 0,150 0,200 0,250 0,300 0,350
RIO TAMBO: ZINC (mg/L Zn)
136
ESTADISTICA APLICADA JOSE LUIS GAVE CH.
Ejemplo
Los siguientes datos estn referidos al tiempo de perforacin, longitud de
perforacin en pies, la experiencia del trabajador el tipo de perforadora que
utiliza la velocidad de perforacin, el tipo de roca edad y grado de instruccin
de los trabajadores de una muestra de 20 trabajadores del crucero alfa.
N Tiemp Long. Exp. Equipo Velocidad Roca edad edcateg Estud.
1 2,5 8 1 1 2 1 18 1 2
2 3 14 2 2 8 2 25 1 2
3 5 13 1 3 14 3 40 3 2
4 4,5 15 2 3 15 4 43 4 1
5 5,5 15 2 3 14 4 42 4 2
6 5 12 1 1 5 1 23 1 3
7 4,5 12 1 1 6 2 28 2 3
8 3 11 1 2 4 1 22 1 2
9 3,5 10 1 2 4 3 19 1 1
10 6 8 2 1 20 4 20 1 2
11 5 10 1 1 5 1 22 1 1
12 5,5 12 1 2 5 4 24 1 2
13 6 14 2 2 6 3 30 2 3
14 3,5 12 2 2 10 2 35 3 3
15 4 11 2 3 8 3 18 1 1
16 5 12 2 3 9 2 22 1 1
17 3 13 2 1 4 1 24 1 2
18 5 10 2 2 8 1 39 3 3
19 5,5 15 2 2 10 4 38 3 3
20 4,5 15 2 2 12 1 19 1 1
Procedimiento en el SPSS
Analizar: Tablas de contingencia:
137
ESTADISTICA APLICADA JOSE LUIS GAVE CH.
Casos
Recuento
Grado de instruccin
de 34 a 40 aos 0 1 3 4
de 41 a mas 1 1 0 2
Total 6 8 6 20
138
ESTADISTICA APLICADA JOSE LUIS GAVE CH.
DEFINICIN DE VARIABLES
VISTA VARIABLES
139
ESTADISTICA APLICADA JOSE LUIS GAVE CH.
Son aquellas que admiten cualquier nmero como valor vlido, pudiendo ir
precedido del signo ms o del menos. Su longitud mxima es de 40 caracteres, de
los cuales 16 pueden ser cifras decimales.
Si se deciden introducir los signos o la coma (o el punto decimal, luego aclararemos
este asunto), estos caracteres deben contabilizarse a la hora de definir la longitud de
la variable.
140
ESTADISTICA APLICADA JOSE LUIS GAVE CH.
Para las variables alfanumricas ya vimos que una casilla en blanco era considerada
como un valor vlido de la variable. Bien para tratar el caso de este ltimo tipo de
variables, bien porque para las numricas se quieran establecer distinciones entre
diferentes tipos de informacin ausente, es posible asignar cdigos especficos a los
valores ausentes, y en este caso se trata de valores ausentes definidos por el
usuario.
Esto es posible realizarlo con todo tipo de variables excepto con las alfanumricas
largas.
Para especificar este tipo de valores, debe pulsarse el botn correspondiente en el
cuadro principal.
141
ESTADISTICA APLICADA JOSE LUIS GAVE CH.
Las tres restantes se corresponden con las tres formas de asignar valores
ausentes de que dispone el sistema. En cualquiera de los tres hasta con teclear
los valores en los cuadros de texto correspondientes.
Para definir el rango, si se ignora el valor concreto del lmite superior o del inferior,
puede sustituirse uno de ellos por el asterisco.
Estas dos ltimas posibilidades no estn disponibles para variables alfanumricas.
142
ESTADISTICA APLICADA JOSE LUIS GAVE CH.
Se pide Hallar:
a) construir una base de datos, considerando las 6 variables del cuadro dado.
b) Encontrar los estadgrafos de posicin para el tiempo de detonacin
c) Encontrar los estadgrafos de dispersin para el peso neto y peso bruto.
d) Construir un diagrama apropiado para la variable frente y otra para la
variable contenido
Barras de herramientas
Encontrar variables
Para localizar rpidamente una variable se puede usar el botn (Ir a) Variables que
aparece en el cuadro de dilogo de la opcin de Variables del men
143
ESTADISTICA APLICADA JOSE LUIS GAVE CH.
Se pide Hallar:
b) construir una base de datos, considerando las 6 variables del cuadro dado.
b) Encontrar los estadgrafos de posicin para el tiempo de detonacin
c)Encontrar los estadgrafos de dispersin para el peso neto y peso bruto.
d) Construir un diagrama apropiado para la variable frente y otra para la variable
contenido
BARRAS DE HERRAMIENTAS
Encontrar variables
Para localizar rpidamente una variable se puede usar el botn (Ir a) Variables
que aparece en el cuadro de dilogo de la opcin de Variables del men Edicin
144
.Jos Luis Gave Chagua
Encontrar casos
Para localizar un caso determinado basta con seleccionar en el men Edicin
desplegndose la ventana siguiente, en la que se escoge ir a casos:
Aqu debe ingresar el numero de la fila o registro de la matriz de datos, luego clic
en aceptar y el cursor se ubicara en la fila correspondiente.
Encontrar un valor concreto
145
.Jos Luis Gave Chagua
RECODIFICACION DE VALORES
146
.Jos Luis Gave Chagua
Introduzca un nuevo nombre de variable de resultado para cada nueva variable y pulse
en Cambiar.
147
.Jos Luis Gave Chagua
Ordenar variables
El archivo de datos se ordenar en funcin de los valores de las variables de
ordenacin. Si selecciona ms de una variable de ordenacin, los casos se
ordenarn por los valores de cada variable dentro de las categoras de la
variable anterior de la lista Ordenar por.
148
.Jos Luis Gave Chagua
SELECCIN DE CASOS
Seleccin de casos basados en una expresin condicional
Elija en los mens: Dato Seleccionar casos:
149
.Jos Luis Gave Chagua
150
.Jos Luis Gave Chagua
SINTAXIS DE COMANDOS
Aadir casos fusiona el archivo de datos de trabajo con otro archivo de datos que
contiene las mismas variables pero diferentes casos. Por ejemplo, podra registrar
la misma informacin de los clientes de dos zonas de venta diferentes y conservar
los datos de cada zona en archivos distintos.
151
.Jos Luis Gave Chagua
Variables desemparejadas. Son las variables que se van a excluir del nuevo
archivo de datos fusionado. Las variables del archivo de trabajo se identifican
mediante un asterisco (*); las del archivo externo presentan un signo ms (+). Por
defecto, la lista contiene:
Las variables de cualquiera de los archivos de datos que no coincidan con
un nombre de variable del otro archivo. Puede crear pares a partir de
variables desemparejadas e incluirlos en el nuevo archivo fusionado.
Las variables definidas como datos numricos en un archivo y como datos
de cadena en el otro. Las variables numricas no pueden fusionarse con
variables de cadena.
Variables de cadena de longitud diferente. La longitud definida de una
variable de cadena debe ser la misma en ambos archivos de datos.
Abra uno de los archivos de datos. Los casos de este archivo aparecern
primero en el nuevo archivo de datos fusionado.
152
.Jos Luis Gave Chagua
Aadir variables:
Aadir variables fusiona el archivo de datos de trabajo con un archivo de datos
externo que contiene los mismos casos pero variables diferentes. Por ejemplo, es
posible que desee fusionar un archivo de datos que contenga los resultados
previos de la prueba con otro que contenga los resultados posteriores.
Los casos debern tener el mismo orden en ambos archivos.
Si se utiliza una o ms variables clave para emparejar los casos, los dos
archivos deben estar ordenados por orden ascendente de la variable o
variables clave.
Los nombres de las variables del segundo archivo que duplican los del
archivo de trabajo se excluyen por defecto, ya que Aadir variables
153
.Jos Luis Gave Chagua
1
Variables excluidas. Muestra las variables que se van a excluir del nuevo archivo
de datos fusionado. Por defecto, la lista contiene los nombres de variable del
archivo externo que duplican los del archivo de trabajo. Las variables del archivo
de trabajo se identifican mediante un asterisco (*); las del archivo externo
presentan un signo ms (+). Si desea incluir en el archivo fusionado una variable
excluida con un nombre duplicado, cmbiele el nombre y adala a la lista de
variables que se van a incluir.
Nuevo archivo de datos de trabajo. Muestra las variables que se van a incluir
en el nuevo archivo de datos fusionado. Por defecto, se incluyen en la lista todos
los nombres de variable que sean nicos en ambos archivos de datos.
Variables clave. Si algunos casos de un archivo no se emparejan con los del otro
archivo (es decir, si faltan casos en un archivo), utilice las variables clave para
identificar y emparejar correctamente los casos de ambos archivos. Tambin
puede utilizar las variables clave segn tablas de claves.
Las variables clave deben tener los mismos nombres en ambos archivos.
154
.Jos Luis Gave Chagua
tabla de referencia y aplicar los datos comunes de la familia a cada uno de sus
miembros en el archivo fusionado.
Para fundir archivos con los mismos casos pero variables diferentes
Datos
Fundir archivos
Aadir variables...
Seleccione las variables entre las variables del archivo externo (marcadas
con el signo +) en la lista Variables excluidas.
Seleccione Emparejar los casos en las variables clave para los archivos
ordenados.
Puede cambiar los nombres de las variables del archivo de datos de trabajo o del
archivo de datos externo antes de desplazarlas a la lista de variables que se van a
incluir en el archivo de datos fusionado. Esta medida es especialmente til cuando
se desea incluir dos variables que tienen el mismo nombre pero informacin
diferente en los dos archivos.
Agregar datos
Agregar datos combina grupos de casos en casos de resumen nicos y crea un
nuevo archivo de datos agregado. Los casos se agregan en funcin del valor de
una o mas variables de agrupacin. El nuevo archivo de datos contiene un caso
para cada grupo. Por ejemplo, se pueden agregar datos de regiones por estado y
155
.Jos Luis Gave Chagua
Agregar variables. Muestra las variables que se van a utilizar con las funciones
de agregacin para crear las nuevas variables del archivo agregado. Por defecto,
Agregar datos crea nuevos nombres de variables agregadas usando los primeros
caracteres del nombre de la variable de origen seguidos de un carcter de
subrayado y un nmero secuencial de dos dgitos. El nombre de la variable
agregada viene seguido de una etiqueta de variable opcional entrecomillada, el
nombre de la funcin de agregacin y el nombre de la variable de origen entre
parntesis. Para las funciones de agregacin, las variables de origen deben ser
numricas.
Puede anular los nombres por defecto de las variables agregadas con nuevos
nombres de variable, proporcionar etiquetas de variable descriptivas y cambiar las
funciones empleadas para calcular los valores de los datos agregados. Tambin
puede crear una variable que contenga el nmero de casos en cada grupo de
segmentacin.
e
Para agregar un archivo de datos
156
.Jos Luis Gave Chagua
Este cuadro de dilogo permite especificar la funcin que se utilizar para calcular
los valores de los datos agregados para las variables seleccionadas en la lista
variables, en el cuadro de dilogo Agregar datos. Las funciones de agregacin
incluyen:
Funciones de resumen, incluyendo la media, la desviacin tpica y la suma.
Segmentar archivo
Segmentar archivo divide el archivo de datos en distintos grupos para el anlisis
basndose en los valores de una o ms variables de agrupacin. Si selecciona
varias variables de agrupacin, los casos se agruparn por variable dentro de las
categoras de la variable anterior de la lista Grupos basados en. Por ejemplo, si
selecciona gnero como la primera variable de agrupacin y minora como la
segunda, los casos se agruparn por minoras dentro de cada categora de
gnero.
157
.Jos Luis Gave Chagua
FRECUENCIAS
El procedimiento Frecuencias proporciona estadsticos y representaciones
grficas que resultan tiles para describir muchos tipos de variables. Es un buen
procedimiento para una inspeccin inicial de los datos.
Para los informes de frecuencias y los grficos de barras, puede organizar los
diferentes valores en orden ascendente o descendente u ordenar las categoras
por sus frecuencias. Es posible suprimir el informe de frecuencias cuando una
158
.Jos Luis Gave Chagua
variable posee muchos valores diferentes. Puede etiquetar los grficos con las
frecuencias (la opcin por defecto) o con los porcentajes.
Datos. Utilice cdigos numricos o cadenas cortas para codificar las variables
categricas (medidas de nivel nominal u ordinal).
Estadsticas
Valores percentiles. Los valores de una variable cuantitativa que dividen los
datos ordenados en 2rupos, de forma que un porcentaje de los casos se
encuentre por encima y otro porcentaje se encuentre por debajo. Los cuartiles (los
percentiles 25, 50 y 75) dividen las observaciones en cuatro grupos de igual
tamano. Si desea un numero igual de grupos que no sea cuatro, seleccione
Puntos de corte para n grupos iguales. percentil 95, el Tambin puede especificar
percentiles individuales (por ejemplo, el valor por debajo del cual se encuentran el
95% de las observaciones).
159
.Jos Luis Gave Chagua
Los valores son puntos medios de grupos. Silos valores de los datos los
puntos medios de grupos (por ejemplo. si las edades de todas las personas entre
treinta y cuarenta anos se codifican como 35). seleccione esta opcin para
estimar la mediana y los percentiles para los datos originales no agrupados.
TABLAS PIVOTE
Muchos de los resultados del visor se presentan en tablas que se pueden pivotar
de forma interactiva. Es decir, puede reorganizar las filas, columnas y capas.
Repita los pasos para cada tabla pivote que desee editar.
Cada tabla pivote aparecer en una ventana independiente lista para ser editada.
Pivotar
160
.Jos Luis Gave Chagua
Paneles de pivotado
Site el puntero del ratn sobre cada icono para obtener una pista emergente
que le indicar la dimensin de la tabla que representa el icono.
Existen muchos factores que pueden afectar al aspecto que presentan los
grficos pivote impresos. Estos factores pueden controlarse cambiando los
atributos de las tablas pivote.
Utilice Presentacin preliminar, en el men Archivo, para ver cmo aparecern las
tablas pivote en la pgina impresa.
Formato
Propiedades de tabla...
Tambin puede imprimir cada capa de una tabla pivote en una hoja diferente.
Las tablas pivote que son o demasiado anchas o largas para imprimirlas en el
tamao de pgina definido se dividen automticamente y se imprimen en varias
161
.Jos Luis Gave Chagua
Controlar la posicin de las filas y las columnas por donde se dividen las
tablas de gran tamao.
Especificar las filas y las columnas que deben permanecer unidas cuando
se dividen las tablas.
Afa de Cronbach
l mtodo de fiabilidad ms utilizado en psicometra es el Alfa de Cronbach
(desarrollado el ao 1951). Se trata de un ndice de consistencia interna que toma
valores entre 0 y 1 y que sirve para comprobar si el instrumento que se est
evaluando recopila informacin defectuosa y por tanto nos llevara a conclusiones
equivocadas o si se trata de un instrumento fiable que hace mediciones estables y
consistentes. Alfa es por tanto un coeficiente de correlacin al cuadrado que, a
grandes rasgos, mide la homogeneidad de las preguntas promediando todas las
correlaciones entre todos los tems para ver que, efectivamente, se parecen.
162
.Jos Luis Gave Chagua
Ejemplo: los siguientes datos estn referidos a una encuesta tipo Liker
considerando 10 items, instrumento que se aplico a 30 muestra de 30
estudiantes , siendo los resultados:
Indique Ud. si el instrumento es confiable.
FICHA X1 X2 X3 X4 X5 X6 X7 X8 X9 X10
1 3 3 4 5 3 3 1 2 3 3
2 5 3 3 4 2 2 2 2 3 3
3 3 4 3 3 5 1 4 3 1 4
4 4 5 3 2 1 3 4 2 2 3
5 2 3 2 3 3 2 5 4 4 3
6 2 5 3 3 3 1 1 3 4 3
7 2 3 2 1 4 4 2 3 2 4
8 2 3 1 3 3 2 4 2 3 1
9 2 4 2 3 3 3 3 2 3 1
10 3 3 4 3 3 4 2 3 3 1
11 5 3 2 2 2 4 3 2 2 1
12 4 3 1 3 4 4 2 4 3 3
13 3 3 4 3 2 3 3 3 3 3
14 3 3 4 3 2 3 3 3 5 3
15 1 3 3 2 3 4 4 2 2 2
16 3 2 3 4 3 3 1 5 2 2
17 2 3 4 2 4 4 3 3 2 3
18 4 3 3 3 5 1 2 3 4 2
19 3 1 3 2 5 4 2 3 3 5
20 4 3 2 4 3 4 3 2 3 3
21 3 4 3 4 3 3 5 1 3 4
22 3 2 4 4 2 2 4 4 3 5
23 4 3 1 2 3 4 3 3 3 2
24 2 4 4 3 3 3 2 2 4 3
25 4 4 3 2 3 3 3 4 2 3
26 3 2 3 3 2 2 3 5 3 3
27 3 3 1 4 2 4 3 3 3 3
28 4 2 2 1 2 4 2 2 2 3
29 4 3 3 4 2 3 3 3 4 3
30 4 2 2 3 2 3 4 3 3 3
163
.Jos Luis Gave Chagua
K 10
Vi 9,2954
Vt 5,5644
-0,745
Interpretacin:
164
.Jos Luis Gave Chagua
165
.Jos Luis Gave Chagua
=0,675
Siendo alfa igual a 0,675 y de acuerdo a la valoracin de Herrera(1998), se puede
decir que: el instrumento es muy confiable.
166
.Jos Luis Gave Chagua
Obtenindose:
167
.Jos Luis Gave Chagua
168
.Jos Luis Gave Chagua
Para poder cuantificar el grado de relacin lineal existente entre dos variables
cuantitativas, as como medir el grado de ajuste de la nube de puntos a una
recta, vamos a estudiar coeficientes de correlacin. En el procedimiento de
Tablas de Contingencia ya se puede obtener el coeficiente de correlacin de
Pearson, en este apartado estudiaremos el procedimiento Correlaciones que
incluye tres opciones (1) Bivariadas, para el estudio de la relacin entre dos
variables cuantitativas, (2) Parciales, para el estudio de la relacin entre
dos variables cuantitativas cuando se controla o elimina el efecto de
terceras variables y (3) Distancias, para el estudio de la relacin entre dos
variables cualesquiera que sea su nivel de medida.
Correlaciones Bivariadas
Analizar
Correlaciones
Divariadas
169
.Jos Luis Gave Chagua
La lista de variables slo muestra las variables que poseen formato numrico. Es
necesario trasladar al menos dos variables.
170
.Jos Luis Gave Chagua
Peason: Es una medida de la asociacin lineal entre dos variables. Los valores
del coeficiente de correlacin van de -1 a 1. El signo del coeficiente indica la
direccin de la relacin y su valor absoluto indica la fuerza. Los valores mayores
indican que la relacin es ms estrecha.
Tau-b de Kendall: Es una medida no paramtrica de asociacin para variables
ordinales o de rangos que tiene en consideracin los empates. El signo del
coeficiente indica la direccin de la relacin y su valor absoluto indica la
magnitud de la misma, de tal modo que los mayores valores absolutos indican
relaciones ms fuertes. Los valores posibles van de -1 a 1, pero un valor de -1
o +1 slo se puede obtener a partir de tablas cuadradas.
Spearman: Versin no paramtrica del coeficiente de correlacin de Pearson,
que se basa en los rangos de los datos en lugar de hacerlo en los valores
reales. Resulta apropiada para datos ordinales, o los de intervalo que no
171
.Jos Luis Gave Chagua
172
.Jos Luis Gave Chagua
- Excluir casos segn pareja: Excluye del anlisis los casos que
tengan valores perdidos en cualquiera (o en ambas) de las variables de
una pareja implicada en el clculo de un estadstico especfico.
- Excluir casos segn pareja: Excluye los casos que tienen valores
perdidos en cualquiera de las variables utilizadas en cualquiera de los
anlisis.
3.-CORRELACIONES PARCIALES
173
.Jos Luis Gave Chagua
desea controlar.
Se habla de correlacin de primer orden (r12.3), para indicar que se est
controlando el efecto de una variable; de segundo orden (r12.34 ), para indicar
que se est controlando el efecto de dos variables; etc.
Prueba de significacin. Es exactamente como en Bivariadas pero para los
coeficientes parciales, dando opcin a elegir el tipo de nivel crtico deseado.
Mostrar el nivel de significacin real. Se muestran la probabilidad y los
grados de libertad para cada coeficiente. Es una opcin activa por defecto,
cuando se desactiva el Visor muestra un asterisco al lado de los coeficientes de
correlacin significativos al nivel 0,05 y, con dos asteriscos, los significativos al
nivel 0,01.
174
.Jos Luis Gave Chagua
Distancias
En Etiquetar los casos mediante: Por defecto, en los resultados los casos se
identifican mediante el nmero de caso. De manera opcional, puede utilizar
los valores de una variable de cadena para identificar los casos.
175
.Jos Luis Gave Chagua
176