- HUARAZ
ESTADÍSTICA
Dr. Oscar Robles Villanueva
ddddd PASO 10
PASO 6 PASO 7 PASO 8 PASO 9
METODOLOGIA DE LA INVESTIGACIÓN
Roberto Hernandez – Carlos Fernández – Pilar Baptista
RECOLLECION DE DATOS
PRESENTACION DE DATOS
DATOS
RESUMEN DE DATOS
PREDICCION DE DATOS
CLASIFICACIÓN DE LA ESTADÌSTICA
ESTADÍSTICA DESCRIPTIVA:
Realiza el estudio sobre la población completa, observando una característica de la misma y
calculando unos parámetros que den información global de toda la población.
ESTADÍSTICA INFERENCIAL:
Realiza el estudio descriptivo sobre un subconjunto de la población llamado muestra y,
posteriormente, extiende los resultados obtenidos a toda la población.
ESTADISTICA DESCRIPTIVA
POBLACIO Descripción
N
POBLACIO
N Parámetro
Inferir
Muestra
(n) Estimador (Indicador)
4
RECOLECCION DE DATOS
Tema Fuentes de
problema Información
¿? POBLACIÓN (primaria-
secundaria)
Objetivos Muestra
INSTRUMENTO
Cuestionario, Test, Examen escrito,
Guía de observación, Entrevista, etc.
( VALIDEZ - CONFIABILIDAD )
Crear base de datos - Software
Técnicas de recolección de datos
DEFINICIONES BASICAS
POBLACION (N)
Conjunto de elementos que determinan la cobertura de un estudio y tienen al
menos una característica común.
MUESTRA (n)
Subconjunto adecuado y representativo de la población.
VARIABLE (X, Y, Z, …)
Es una característica de los elementos de una población, es observable es
medible.
DATO
Es el valor que toma la variable en cada momento que es analizado.
Ejercicio:
Teniendo como referencia estas definiciones, construya una base de datos.
5
VARIABLE DE ESTUDIO
Se denomina “variable” en la investigación científica a toda propiedad,
rasgo, aspecto, cualidad, dimensión, atributo etc., de una persona u objeto,
si tal propiedad puede asumir distintos estados o valores, sea por
modificación, aumento o disminución, y si esa variación es observable y
medible en una misma o en distintos unidades de observación.
VARIABLES ESTADISTICAS
Una variable estadística es la variable de estudio operacionalizada. Mide
una característica observable y medible, que varía entre los diferentes
elementos de una población. La información que disponemos de cada
individuo u objeto puede ser resumido en una o varias variables.
Ejemplos:
6
CLASIFICACIÓN DE VARIABLES
SEGÚN LA NATURALEZA.
VARIABLE CUALITATIVA
DISCRETA
VARIABLE CUANTITATIVA
CONTINUA
SEGÚN LA RELACIÓN
.
VARIABLE INDEPENDIENTE (X)
VARIABLE INTERVINIENTE
PRESENTACION DE DATOS
7
CUADRO Nº 11.3:
SIMPLE ( fi )
ABSOLUTA
ACUMULADA (Fi)
FRECUENCIA
SIMPLE (hi)
RELATIVA
ACUMULADA (Hi)
8
Nº de
4 3 4 2 insistencias Nº de
3 2 2 2 docentes Fi hi Hi
4 4 2 2
4 3 2 3
4 2 2 4
4 3 2 Total
440 560 335 587 613 400 424 466 565 393
453 650 407 376 470 560 320 500 528 526
570 430 618 537 409 600 550 432 591 428
440 340 558 460 560 607 382 667 512 492
450 530 501 471 660 470 364 634 580 450
574 500 462 380 518 480 625 507 645 382
Ingreso Nº de Marca de
Semanal trabajadores Fi hi Hi Clase
[ 320 - 370 ) 4 4 0.067 0.067 345
[ 370 - 420 ) 8 12 0.133 0.200 395
[ 420 - 470 ) 14 26 0.233 0.433 445
[ 470 - 520 ) 9 35 0.150 0.583 495
[ 520 - 570 ) 11 46 0.183 0.766 545
[ 570 - 620 ) 8 54 0.133 0.899 595
[ 620 - 670 ) 6 60 0.100 1.00 645
TOTAL 60 1.00
9
REDUCCION DE DATOS
(X)
MEDIA ( )
MODA (Mo)
MEDIANA (Me)
PERCENTILES (Pi)
ESTADIGRAFOS RANGO ( R )
(Medidas de resumen)
DESVIACION MEDIA (D.M.)
DE DISPERSION
2
O VARIABILIDAD VARIANZA (S ) (σ2)
DE DEFORMACION
O ASIMETRIA
DE APUNTAMIENTO
O KURTOSIS
10
PREDICCIÓN DE DATOS
SIMPLE
(X,Y) *Parábola Y= a + b X + c X2
NO
LINEAL *Exponencial
* REGRESION *Potencial
Y ******
CORRELACION
MULTIPLE Y= Bo + B1 X1 + B2 X2
(X,Y)
(X,Y,Z) LINEAL Y= Bo + B1 X1 + B2 X2 + B3 X3
(X,Y,Z,W) *****
******
y 1 x1 ... k xk
NO
LINEAL
* PROMEDIOS MOVILES
* ESTIMACION PUNTUAL
* ESTIMACION INTERVÁLICA
* PRUEBA DE HIPÓTESIS
11
MEDIDAS DE RESUMEN – MEDIDAS ESTADÍSTICAS
(REDUCCIÓN DE DATOS)
1.1. ESTADIGRAFOS
Son medidas de resumen que describen a una muestra. Son las que se utilizan como
ESTIMADORES de los parámetros, los estadígrafos de mayor uso son: La Media Aritmética , la
Varianza, la desviación estándar, el Coeficiente de Variación, proporción, etc.
Ejemplo1
Xi : 45,1 67,7 73,7 42,5 64,4 66,7 50,5 62,7 60,7 63,6
45.1 67.7 73.7 42.5 64.4 66.7 50.5 62.7 60.7 6.6
x 59.76
10
12
Mediana (Me)
Es la observación que se encuentra en el centro cuando los datos están ordenados, divide a los
datos en dos partes iguales de 50% cada una.
- Si n es impar:
la mediana es la observación que está en el lugar (n+1)/2, esto es
- Si n es par:
la mediana es el promedio de las observaciones n/2 y n/2 +1, esto es
Ejemplo 2
Encuentra la mediana para el siguiente conjunto de datos
X i : 18 24 19 20 19 18 19 22 19 18 17 16 16 20 19
Se ordenan los datos en forma creciente o decreciente y la mediana ocupa el lugar (n+1)/2, en este
caso como n = 15 el lugar que ocupa la Me es, (15+1)/2 = 8 es decir el 8vo lugar.
X i : 16 16 17 18 18 18 19 (19) 19 19 19 20 20 22 24
Mediana = 19 años
Ejemplo 3
Calcula la mediana para el siguiente conjunto de datos
X i : 62 71 64 66 58 62 65 68 70 58
X i : 58 58 62 62 (64 65) 66 68 70 71
Una vez ordenados, como el número de datos es par (10), se busca el número que tiene la
posición n/2 y el que tiene la posición n/2 +1, o sea 10/2 = 5º y 10/2 +1 = 6.
13
Los números que tienen la posición cuarta y quinta son 64 y 65. Estos números se promedian y el
resultado será la mediana.
Moda (Mo)
Nota: Si ninguna observación se repite, se dice que esos datos no tienen moda. Si todos los datos
se repiten el mismo número de veces, los datos serán multimodales.
Ejemplo4
Encuentra la moda de los siguientes datos
4 9567
Solución
Como los datos sólo existen una vez, este conjunto de datos no tienen moda.
Ejemplo5
Encuentra la moda del siguiente conjunto de datos
9 367985973
Solución
El 3 se repite dos veces, el 7 se repite también dos veces, pero como el 9 se repite tres veces, este
último número es la moda para este conjunto de datos.
Ejemplo6
Calcula la moda para los datos que se presentan a continuación
6 786978568
Solución
El máximo número de veces que se repiten los datos son tres, y hay dos datos que se repiten tres
veces, el 6 y el 8. El conjunto de datos es bimodal y sus modas son el 6 y el 8.
Ejemplo7
Calcula la moda para estos datos
8 65596865989
Solución
En este conjunto de datos, todos se repiten tres veces. El 5, 6, 8 y el 9 son moda. Es un caso
multimodal
14
B. MEDIDAS DE DISPERSIÓN
Son medidas que nos dicen que tan dispersos se encuentran los datos con respecto a su media.
Símbolos comunes en su uso son:
S2 : Varianza Muestral
VARIANZA (Variancia) S2
La varianza o variancia es el promedio de las desviaciones al cuadrado entre los datos y su media
aritmética
( xi ) 2
x 2
( xi x ) 2 i
n
S
2
n 1 n 1
donde:
xi: es el i-ésimo dato
: es la media aritmética para datos no agrupados
n: es el número de datos
Ejemplo 01
Calcula la varianza para el siguiente conjunto de datos.
5 9 12 7 15 3
Solución
Aplicando la definición (primera fórmula).
x = 5 +9 +12 +7 +15 +3 = 51
S2 = [ 533-(51)2/6 ] /5 = 99.5/5 = 19.9 que es el mismo resultado que obtuvimos con la definición
anterior.
15
DESVIACIÓN ESTÁNDAR
( xi ) 2
x 2
i
S n
n 1
Ejemplo 02
Calcula la desviación estándar para el siguiente conjunto de datos.
5 9 12 7 15 3
Solución
Con el cálculo de la varianza previo S2 = 19.9
S 19.9 4.46
NOTA:
1. La varianza expresa a la unidad de medida elevada al cuadrado mientras que la
desviación estándar lo expresa en su unidad original
2.
Ejemplo
Si se ha calculado la varianza de Peso en Kg.
Ejemplo 03:
Determinar la distribución de notas en estadística mas variable de estos dos grupos de estudiantes:
X : 08 12 18 06 14 13
Y : 10 16 15 12 12 14
16
COEFICIENTE DE VARIACIÓN.(CV%)
A menudo nos interesamos por comparar la variabilidad de dos o más conjuntos de datos; esto se
resuelve determinando las respectivas varianzas o desviaciones estándar, siempre y cuando las
variables presenten la misma unidad de medida y además sus MEDIAS sean relativamente cercanas.
Cuando faltan estas condiciones la medida que se utiliza para comparar la variabilidad de dos o más
conjuntos de datos se conoce como COEFICIENTE DE VARIACION ; que es una medida relativa
de variabilidad, y se define por la siguiente expresión:
S
CV % x100
x
S1 = 1285 Lb S2 = 0.16 Lb
17
EJERCICIOS PROPUESTOS
1. Cada una de las siguientes afirmaciones diga Ud. si son ciertas (V) o falsas(F):
d. El rendimiento académico es menor si el tiempo de ver televisión es mayor en los alumnos del
segundo ciclo de Enfermería de la USP. .....................................................
b. Para el estudio de presión arterial , edad y nivel depresivo de personas de la tercera edad.
VI: VD:
d. Estudio del nivel de satisfacción, sueldo y horario de trabajo de los médicos del Hospital de Policía.
VI: VD:
18
4. La siguiente información contiene Los puntajes en Lectura e interpretación de Imágenes en niños de
4 años; Antes y después de aplicar un programa de canciones infantiles (para promover la lectura e
interpretación de imágenes).
Grupo Experimental
N° Pre Test Post Test
1 07 15
2 09 16
3 07 15
4 12 18
5 05 14
6 12 16
7 12 20
8 09 12
9 11 18
10 08 11
11 11 16
12 04 11
13 10 14
14 14 17
15 08 12
Promedio
Desviación
Estándar
CV%
Determine el Promedio, la desviación Estándar y el Coeficiente de Variación para los puntajes en el Pre
Test y Pos Test.
19
7. Se comparó tres métodos de enseñanza en el área de Matemática; el Expositivo receptivo(A); el
expositivo dialogado (B) y el expositivo con apoyo de texto autoinstructivo(C). La composición de
los alumnos por método y los puntajes de sus rendimientos fueron:
Determine e interprete la Media o promedio y el Coeficiente de Variación, y compare para los tres
grupos.
REFERENCIA BIBLIOGRAFICA:
1.AVILA R.B.(2000), “Estadística Elemental”. Nueva Edición. Estudios y Ediciones Lima-Perú.
2.HERNANDEZ S., FERNANDEZ C, BAPTISTA(2005), Metodología de la Investigación Científica. Mexico. Editorial McGRAW-
HILL.
3.MILTON J. SUSAN (2004): Estadística para Biología y Ciencias de la Salud, Edit. McGraw-Hill. España.
4.WAYNE, Daniel (2002). Estadistica Aplicada a las Ciencias Sociales. Colombia. Editorial McGRAW-HILL LATINOAMERICANA.
S.A.
5.WAYNE, Daniel (2005). Bioestadística. Edit. Limusa. México.
20
DISTRIBUCIONES BIDIMENSIONALES DE FRECUENCIAS
Distribución bidimensional de 150 trabajadores de Chimbote, por simpatía política (VD) según
Grado de Instrucción (VI).
Cuadro Nº 13
TRABAJADORES DE UNA EMPRESA POR SIMPATIA POLITICA SEGÚN
GRADO DE INSTRUCCIÓN, CHIMBOTE. 2014.
Ejemplo:
Edad y número de hijos de 15 docentes de la Institución Educativa “José Olaya”, Chimbote -
2014.
Edad : 30 40 30 50 40 40 30 50 50 40 30 40 40 30 30
N° de hijos: 2 3 1 3 3 2 1 3 3 2 2 2 3 1 2
Con los datos anteriores construir una tabla de distribución bidimensional de frecuencias (tabla de
contingencia)
21
REGRESIÓN Y CORRELACIÓN LINEA ( r ) (Y* = a + bX )
Ejemplo:
Analizar la relación entre el ingreso y egreso diario de 6 trabajadores del distrito “Z”.
Ingreso : 35 40 38 55 42 60
Egreso : 30 35 30 50 35 50
CALCULO DE r:
Ejemplo:
INGRESO EGRESO
XY X2 Y2
X Y
35 30 1050 1225 900
40 35 1400 1600 1225
38 30 1140 1444 900
55 50 2750 3025 2500
42 35 1470 1764 1225
60 50 3000 3600 2500
270 230 10810 12658 9250
∑X ∑Y ∑XY ∑X 2 ∑Y2
22
PROPIEDADES DE r:
- 1 ≤ r ≤ + 1
Ejemplo:
Analizar la relación entre la edad y el tiempo de servicios de 15 docentes de un Centro
Educativo.
Edad : 48 40 30 39 46 42 27 36 34 46 32 42 40 32 27
Tiempo de: 24 18 9 14 22 22 4 13 10 20 12 18 16 8 6
Servicios
23
APUNTES DE:
PROBABILIDAD – ESPACIO MUESTRAL – EVENTO O SUCESO
INTRODUCCION
Frecuentemente se usa el término probabilidad para sugerir que existe duda o incertidumbre sobre
lo que ocurrió, lo que ocurre o ocurrirá. La experiencia humana demuestra que existe una serie de
hechos, acontecimientos, experimentos cuyos resultados no se pueden determinar anticipadamente; sin
embargo si es posible definir, estimar o predecir el probable resultado. Podemos conocer le pasado,
pero nunca el futuro, pero existe un permanente interés por despejar las incertidumbres.
Todo estos aspectos de ocurrencia de un hecho serán materia de este guía académica, donde el
alumno podrá asimilar los contenidos de probabilidad, espacio muestral y evento o suceso. Teniendo al
alcance una herramienta muy importante para la toma de decisiones en la organización y gestión de
datos.
COMPETENCIAS :
DEFINICION DE PROBABILIDAD
Definición de Probabilidad.-
Es el estudio de fenómenos o experimentos puramente “aleatorios”, o libres de determinación.
Definición Clásica de probabilidad.-
24
Si A es un sub conjunto de , donde el suceso A puede ocurrir de “n” maneras y puede ocurrir de N
maneras igualmente posibles, entonces la probabilidad de A será:
n Número de elementos de A
P(A) = ---- = -----------------------------------
N Número de elementos de
Donde 0 P(A) 1
EXPERIMENTO ALEATORIO.-
Es cualquier experimento u operación cuyo resultado no puede predecirse con exactitud antes
de realizar el experimento. (No determinístico) y se puede repetir muchas veces.
ESPACIO MUESTRAL.-
Espacio muestral es el conjunto de todos los resultados posibles de un experimento aleatorio
dado. Comúnmente se denota a este conjunto con .
En la teoría de conjuntos representa al conjunto Universal
Experimento 3 : 3: Lanzar un dado y observar el número que aparece en la cara superior.
Espacio muestral : 3 = { 1, 2, 3, 4, 5, 6 }
Experimento 5 : 5: De una urna que contiene 3 bolitas rojas, 4 blancas y 2 verdes, se
escoge una y se anota el color.
Espacio muestral : 5 = { R, R, R, B, B, B, B, V, V }
SUCESO O EVENTO.-
Suceso es un subconjunto de resultados posibles, en otras palabras suceso es un subconjunto
del espacio muestral . Es decir, Sí A es suceso, entonces A . Usualmente los sucesos
se denotan con letras mayúsculas, tales como: A,B,C,D, etc.
Ejemplos de eventos:
Experimento 1 : 1: Lanzar una moneda y observar la cara superior .
Espacio muestral : 1 = { Cara, Sello } = { C, S }
Eventos : A = { } (suceso imposible)
B={C} (suceso elemental)
C={ S} (suceso elemental)
D = { C, S } (suceso seguro o cierto)
Nota: El número máximo de eventos que se puede obtener de un espacio muestral es:
2 = 22 = 2 x 2 = 4 = { { } , { C } , { S }, { C, S } }
Eventos :
A= { } (suceso imposible)
B = { (CC) } (suceso elemental)
C = { (CS) } (suceso elemental)
D = { (SC) }
26
E = { (SS) }
F = { (CC), (CS) }
G = { (CC), ( SC) }
H = { (CC), (SS) }
I = { (CS), ( SS) }
J = { (SC), (SS) }
K = { (CC), ( SC) }
L = { (CC), (CS), (SC) }
M = { (CC), ( CS), (SS) }
N = { (CC), ( SC), (SS) }
Ñ = { (CS), ( SC), (SS) }
O = { (CC), ( CS), (SC), (SS) }
(suceso seguro o cierto)
Nota: El número máximo de eventos que se puede obtener de este espacio muestral es:
2 = 24 = 2 x 2 x 2 x 2 = 16 sucesos o eventos
Experimento 3 : 3: Lanzar un dado y observar el número que aparece en la cara superior.
Espacio muestral : 3 = { 1, 2, 3, 4, 5, 6 }
Eventos :
A = { } (suceso imposible)
B = { 1 } (suceso elemental)
C = { 2 } (suceso elemental)
---
---
G = { 1, 2 }
H = { 1, 3 }
---
---
K = { 1, 2, 3 }
---
---
M = { 1, 2, 3, 4 }
---
---
P = { 1, 2, 3, 4, 5 }
---
---
Z = { 1, 2, 3, 4, 5, 6 } (suceso seguro o cierto)
Nota: El número máximo de eventos que se puede obtener de este espacio muestral es:
2 = 26 = 2 x 2 x 2 x 2 x 2 x 2 = 64 sucesos o eventos
EJEMPLOS DE CALCULO DE PROBABILIDAD :
27
Para el experimento 1:
n Número de elementos de B 1
P(B) = ---- = ---------------------------------------- = ------ = 0,25
N Número de elementos de 4
n Número de elementos de D 1
P(D) = ---- = -------------------------------------- = ------ = 0,25
N Número de elementos de 4
Experimento 3 : 3: Lanzar un dado y observar el número que aparece en la cara superior.
Espacio muestral : 3 = { 1, 2, 3, 4, 5, 6 }
n 1
P(E) = ---- = ------ = 0,166
N 6
( R= { 3. 4, 5, 6} ) n 4
P(R) = ---- = ------ = 0,66
N 6
29
EJERCICIOS PROPUESTOS
Para cada uno de los ejercicios propuestos, determinar el espacio muestral, el evento o suceso
y calcular la respectiva probabilidad.
EJERCICIO 1:
Sea el experimento:
2: Lanzar dos monedas y observar el resultado
a) Calcular la probabilidad de obtener como resultado máximo un sello.
b) Calcular la probabilidad de obtener como resultado más de una cara.
EJERCICIO 2:
Sea el experimento
3: Lanzar un dado y observar el número que aparece en la cara superior.
a) Calcular la probabilidad de obtener como resultado un número par.
b) Calcular la probabilidad de obtener como resultado mayor o igual a 2.
EJERCICIO 3:
Sea el experimento
4: Designar un delegado de un grupo de 50 personas
a) Calcular la probabilidad de que un alumno sea seleccionado como delegado.
EJERCICIO 4:
Sea el experimento
5: De una urna que contiene 3 bolitas rojas, 4 blancas y 2 verdes, se escoge una y se anota su
color.
a) Calcular la probabilidad de obtener una bolita Roja.
b) Calcular la probabilidad de obtener una bolita verde.
c) Calcular la probabilidad de obtener una bolita blanca.
EJERCICIO 5:
Sea el experimento
7: De un salón de clase de matemáticas donde hay 7 mujeres y 6 hombres se elige un alumno
al azar y se anota sexo (genero).
a) Calcular la probabilidad de que el alumno seleccionado sea hombre.
b) Calcular la probabilidad de que el alumno seleccionado sea mujer.
REFERENCIA BIBLIOGRAFICA
R.B. AVILA ACOSTA
“Estadística Elemental” , Nueva Edición, Estudios y Ediciones R.A. Lima - Perú , 2002.
RUFINO MOYA C. – GREGORIO SARAVIA A.
“Teoría de Probabilidad e Inferencia Estadística”, Editorial “San Marcos”, Lima – Perú, 1998.
30
DISTRIBUCIONES DE PROBABILIDAD
Binomial
DISCRETA Poisson
Hipergeométrica
DISTRIBUCIÓN
DE PROBABILIDAD
CONTINUA Normal
t- student
Chi-cuadrado
F
31
DISTRIBUCIÓN NORMAL
3.14159265…….
2.71828……
32
Ejercicios para usar la tabla de áreas de la Curva Normal Estandarizada
9) Que Z sea menor que –1,96 o mayor que 1,96 P(Z ≤ -1,96 o Z ≥ 1,96) =
11) En una muestra de estudiantes de Administración, se encuentra que la nota promedio en Estadística
fue 12 puntos, con una desviación estándar igual a 2. ¿Cuál es la probabilidad de que un alumno
elegido al azar tenga nota entre 11 y 14 puntos?.
Supongamos que las notas se distribuyen como una normal.
12) La media de los sueldos de 600 empleados de una universidad es de 4300 soles y la desviación
estándar o típica 400 soles. Suponiendo que los sueldos se distribuyen normalmente, hallar cuántos
empleados tienen sueldos:
a) Entre 3500 y 4500 soles
b)De 5000 y más soles
13) Los puntajes en un examen de selección para seguir estudios superiores están distribuidos
normalmente con media 76 y desviación estándar 15. Se ha establecido que el 15% de los
concursantes, que son los mejores recibirán una beca integral de estudios. Hallar el puntaje mínimo
para ganar la beca.
14) El promedio de las alturas de 800 pacientes de un hospital es de 1.50 m. y la desviación estándar es
0.30 m. asumiendo que las altura están normalmente distribuidas, encontrar cuántos alumnos miden
entre 1.30 m. y 1.70 m.
33
TEORIA DE MUESTREO Y APLICACIONES
1.1. INTRODUCCIÓN
Muestreo es el proceso por el cual se realizan inferencias a la población examinando sólo una parte
de ella. Este proceso es aplicable en nuestra vida personal y pública. Así, una pareja contrae
matrimonio en base a un corto enamoramiento; con un simple grano de arroz el ama de casa
prueba si todo el arroz contenido en la olla está cocido; paladeando el café contenido en una
cucharita se determina la calidad de la marca del café; los dosajes o análisis médicos (de sangre,
de orina, etc..) se realizan en base a nuestras y finalmente una muestra de roca lunar proporciona
información científica sobre el origen de la luna y así diferentes aspectos de la vida, cultura y
ciencia son investigados en base a muestras.
Ejemplos:
En las industrias de transformación de una determinada región geográfica del país y en
un período de tiempo determinado es necesario determinar el valor del parámetro:
Número de obreros y empleados en dicha industria.
El número medio de miembros por familia en la ciudad de Chimbote en el mes de
Diciembre del 2006.
El valor total de la producción de harina de pescado de las Fabricas Pesqueras del Perú,
en el año 2006.
El porcentaje de aportes al Seguro Social no pagados por los empresarios a nivel
nacional y en los últimos cinco años.
Las técnicas de muestreo permiten estimar lo mismos parámetros que aquellos en el caso de un
censo, es decir, permiten obtenerlos aproximadamente a través de una muestra. Si esa muestra se
obtiene de una manera probabilística se le llama muestra PROBABILÍSTICA y al conjunto de estas
técnicas se le denomina TÉCNICAS DE MUESTREO PROBABILÍSTICA.
Adecuada (tamaño), quiere decir que debe incluir un número óptimo y mínimo de unidades. Este
número se determina mediante el empleo de fórmulas estadísticas
Los aspectos referentes a al representatividad o calidad de la muestra, son más importantes que los
referentes a su cantidad y no debe pensarse que la representatividad de la muestra depende de su
cantidad. Si quisiéramos estudiar las características del pueblo peruano y estudiamos solamente a
los habitantes de la Costa, aun que estudiaremos a todos ellos, nuestra muestra no sería todavía
representativa de todo el país.
1.3. VENTAJAS DEL MUESTREO:
El estudio de una muestra tiene ventajas potenciales sobre el Censo, razones por las cuales se le
prefiere. Entre otras tenemos:
1. COSTO REDUCIDO
Una muestra requiere relativamente menores recursos para diseñarla y procesarla
adecuadamente, así, el costo de unidad de observación es alto en comparación con el censo,
pero el costo total de un estudio por muestreo es mucho menor cubierto los mismos ítems de la
encuesta, debido a que los datos se obtienen únicamente de una pequeña fracción del total.
2. MAYOR RAPIDEZ:
Un número pequeño de observaciones pueden recolectarse y procesarse más rápido que un
censo y dar resultados más oportunos.
3. MAYOR ALCANCE:
El muestreo tiene un mayor alcance frente al censo con relación a la variedad de información
dada su flexibilidad, adaptabilidad y posibilidad de estudiar la interrelación de varios factores.
4. MAYOR EXACTITUD
Los datos obtenidos con un censo o una muestra están sujetos a diferentes tipos de errores y
sesgo, la magnitud de los cuales depende del procedimiento particular de estudios. Sin
embargo, si el mismo procedimiento se sigue para la muestra y el censo, la exactitud de una
observación será la misma, pero comparativamente con una pequeña escala de operaciones
un estudio muestral posibilita mayor exactitud por practicarse un mejor staff y dar con
intensidad entrenamiento y mejor equipo a los encuestadores.
2. El error debido a muestreo tiende a ser alto en áreas administrativas pequeñas y de gran
variabilidad. Como las observaciones en la población son muy variables, las muestras que se
pueden seleccionar difieren una de otras y como se estudia una sola muestra para generalizar
a la población, los resultados serán diferentes según la muestra que hayamos escogido. Esta
diferencia entre el valor dado por la muestra y el verdadero valor poblacional, constituye el error
por muestreo; el cual puede medirse estadísticamente y en cierto modo disminuirse a voluntad
aumentando el tamaño de muestra.
Ejemplo: Se trata de diseñar una encuesta sobre el consumo familiar en el distrito de Nuevo
Chimbote y en el presente año, tenemos:
Como la población en estudio debe estar definida sin ambigüedad, de manera que no de lugar a
confusiones, es necesario aclarar qué entendemos como familia en este estudio: “todas las
personas que comparten un mismo presupuesto familiar”. Así, nuestra población será: las
familias del distrito de Nuevo Chimbote en el año 2006; considerando como familia todas las
personas que comparten un mismo presupuesto familiar.
MARCO MUESTRAL.
Es el documento material (lista, fichero, etc) donde se consigna individualmente las unidades o
elementos de muestreo, de tal forma que se pueda sortear de allí las unidades que constituirán
la muestra. Este documento es indispensable, al menos cuando se trata de realizar un muestreo
probabilístico. El marco muestral debe estar perfectamente actualizado, sin omisiones ni
duplicaciones. Ejemplos:
Para los Ciudadanos.- los requisitos electorales, es decir de personas mayores de 18 años
de edad y no privados de sus derechos políticos electorales. Pero es preciso no olvidar que
algunas personas en edad electoral o que acaban de llegar a ella, descuidan su inscripción,
además muchos electores olvidan notificar su cambio de residencia, salvo el año que están
previstas las elecciones.
Para las Empresas y Establecimiento Industriales.-El mejor marco para la muestra a este
respecto, lo da el registro que lleva el instituto Nacional de Seguridad Social. Cada
establecimiento está allí caracterizado además por su razón social, dirección, actividad
económica y número de personal asalariado, lo que permite estratificar la población de los
establecimientos según estos dos últimos criterios esenciales.
Para Muestreo Por Áreas.- El marco de la muestra es en este caso el mapa geográfico del
País o fotografías aéreas y la unidad de muestreo es un área delimitada sobre ese mapa o
plano. Evidentemente interesa poseer un mapa recientemente y a gran escala, en el que
figuren el máximo de detalles que permiten reconocer sobre el terreno las áreas muestrales.
Hay ocasiones, sin embargo, en que las muestras de criterio o juicio son útiles. Por ejemplo, un
experto puede coger una muestra de arroz de la parte superior de un montón, para examinar su
calidad. Puede ser físicamente imposible seleccionar una muestra al azar o probabilística
tomándola de dentro del montón. Sin embargo, por experiencia el experto puede conocer ciertos
hechos relacionados con el arroz; tal vez, que éste generalmente es uniforme en calidad. En este
caso, una muestra del montón, puede ser suficiente para obtener la información necesaria acerca
del arroz.
Se utiliza mayormente para estudios cualitativos y exploratorios.
Se divide la población en grupos o estratos, según las exigencias del estudio, generalmente edad,
sexo y clase social, aunque pueden utilizarse otras clasificaciones. Demasiados estratos hacen el
estudio difícil y costoso. Los que tienen a cargo el estudio determinan las cuotas a los
entrevistadores se les señalan los sitios específicos para buscar a sus informantes. La selección
de éstos, corre por cuenta de los entrevistadores y esto puede causar sesgo cuyas consecuencias
“no pueden medirse objetivamente”.
Al establecer una muestra por cuotas debe procurarse la distribución de los diversos grupos según
la proporción de su importancia en el conjunto de la población. Esto significa que debe estudiarse
la población y analizarla teniendo en cuenta que las clasificaciones abarquen las características
básicas, útiles para los propósitos del estudio. Para esto los encargados del estudio, deben
valerse de datos publicados como censos oficiales de población, y producción.
La rapidez, la economía y simplicidad administrativa son las ventajas de este tipo de muestreo.
En los estudios de opinión y de mercado aún se emplean estos tipos de muestreo, aunque su uso
tiende a disminuir por sus imprecisiones.
Este tipo de muestras se usa en estudios de laboratorio donde se procura que los sujetos sean
homogéneos en variables tales como edad, sexos o inteligencia, de manera que los resultados o
efectos no obedezcan a diferencias individuales, sino a las condiciones a las que fueron sometidos.
MUESTRAS CUALITATIVAS
Muestra variada
Documentar diversidad para buscar diferencias y coincidencias, patrones y particularidades.
Muestra homogénea
Enfocarse en el tema a investigar. Enfatizar situaciones, proceso o episodios en un grupo
social.
Muestra en cadena o por redes
Se identifican casos de gente que conoce otra gente que dará riqueza de información.
Muestra dirigida por teoría o muestra por criterios
Se selecciona los sujetos o al grupo social, porque tiene uno o varios atributos que ayudan a ir
desarrollando una teoría.
Casos típicos
Individuos, sistemas u organizaciones que poseen claramente las situaciones que se analizan
o estudian.
Una muestra aleatoria simple se extrae por selección aleatoria empleando los números aleatorios o
colocando los elementos de la población numerados del 1 a N en una urna y mezclándolos
perfectamente. Si se usa la urna y se sacan “n” números en sucesión. Las unidades que llevan
estos números constituyen la muestra, En cualquier etapa del proceso de obtención de la muestra,
este proceso ofrece la oportunidad de que todos los elementos que no han sido sacados
previamente tengan igual probabilidad de selección. Los procedimientos aleatorios evitan la
preferencia o inclinación a incluir en la muestra, determinadas observaciones que son de
conveniencia.
Una muestra estratificada puede ser proporcional al tamaño de los estratos u óptima donde en la
representación de la muestra se considera la variedad y tamaño de cada estrato y/o costo en cada
uno de ellos.
MUESTREO SISTEMÁTICO
Es el procedimiento de selección del K-ésimo elemento de la población con un comienzo aleatorio.
Si se desea extraer una muestra del 5%=5/100=1/20 de la población, seleccionamos
aleatoriamente un número entre 1 y 20, supongamos que el número seleccionado es 12, entonces
la 12ava, 32ava, 52ava, etc unidades de la población constituirían la muestra sistemática. Este
método es muy usual por su simplicidad y se prefiere frente al muestreo estratificado si la población
puede ponerse fácilmente en una disposición ordenada.
Con el muestreo sistemático se logra mayor eficiencia si las unidades que se hallan próximas
tienen mayor uniformidad que las unidades que se encuentran alejadas entre sí.
También lo empleamos para seleccionar los elementos que serán los que conformarán la muestra,
cuando el tamaño (n) de la muestra ya ha sido calculado con otro tipo de muestreo...
Entonces la selección sistemática de elementos maestrales será 1/K (1/3), es decir, tomaremos 1
elemento de cada 3. Se selecciona al azar el inicio (puede tener 3 cifras), supongamos que el
número seleccionado sea el 112, entonces, tomaremos el 112, el 115, el 118, el 121, etc. y
volvemos a empezar por los primeros números si es necesario, hasta completar los 547 unidades
que conformarán la muestra.
Cuando este muestreo se realiza por etapas, también se le puede conocer como muestreo
probabilístico por racimos.
Ejemplo:
Problema:
Una compañía de televisión necesita saber con precisión, con la finalidad de planear sus
estrategias, en que momento los adultos de los distritos de Chimbote y Nuevo Chimbote de
1’200,00 habitantes, es decir, qué tanto televisión ven, a qué horas, qué contenidos prefieren y sus
opiniones con respecto a los programas noticiosos.
Procedimiento:
Se diseñará un cuestionario que indague estas áreas sobre el uso de la televisión. Los
cuestionarios se aplicarán por entrevistadores a una muestra de sujetos adultos.
Población:
Todos aquellos sujetos hombres y mujeres de más de 18 años de edad, y que vivan en una casa o
un departamento propio o rentado de los distritos de Chimbote y Nuevo Chimbote.
Las cuadras se utilizarán como racimos, es decir, como unidades maestrales, a partir de las cuales obtendremos en última instancia a nuestros sujetos adultos
mayores de 18 años.
Se pueden emplear dos o tres tipos de muestreos probabilísticos para obtener el tamaño de
muestra y para seleccionar las unidades para el estudio.
FORMULAS PARA CALCULAR EL TAMAÑO DE MUESTRA PARA
ESTIMAR UNA MEDIA O PROMEDIO
Z 2S 2
(1) n Para cuando no se conoce el tamaño de la población
E2
NZ 2 S 2
(2) n Para cuando se conoce el tamaño de la población.
N 1 E 2 Z 2 S 2
Donde:
Z : Puntaje Z correspondiente al nivel de confianza considerado (para 99% de
confianza Z=2.58, para 95% de confianza Z= 1.96, para 90% de confianza Z=
1.65).
N : Total de elementos de la población en estudio
E : Error permitido (precisión)
S2 : Varianza de la población o su estimación.
n : tamaño de muestra a ser estudiada
NZ 2 PQ
(2) n
N 1 E 2 Z 2 PQ Para cuando se conoce el tamaño de la población
Donde:
Z : Puntaje Z correspondiente al nivel de confianza considerado (para 99% de
confianza Z=2.58, para 95% de confianza Z= 1.96, para 90% de confianza Z=
1.65) (También se llama coeficiente de confiabilidad).
N : Total de elementos de la población en estudio
E : Error permitido (precisión)
n : tamaño de muestra a ser estudiada
P : Proporción de unidades que poseen cierto atributo.
Q : Q =1-P (si no se tiene P, se puede considerar P=0.50=Q
Ejemplo 1:
Queremos hacer un estudio para estimar el ingreso medio de las familias del distrito de Nuevo
Chimbote, para esto decidimos hacerlo con un nivel de confianza del 95%. Y deseamos también que
la estimación se encuentre por lo menos en S/20 nuevos soles alejados del ingreso medio
poblacional. ¿qué tamaño debe tener la muestra?. Tenemos información que la desviación estándar
de los ingresos en dicho distrito es de S/140.
Ejemplo 2:
Si en el ejercicio anterior tenemos que en el distrito de Nuevo Chimbote tiene 600 familias, entonces
se puede aplicar la fórmula para muestras finitas.
1.96 2.140 2.600
n
20 2 (599) 1.96 2.140 2
143.46 n = 144
Ejemplo 3:
Un especialista en mercadotecnia desea calcular el tamaño de la muestra de hogares que va ha tomar
del distrito de Coishco para determinar en qué proporción de hogares por lo menos uno de sus
miembros ve un programa determinado de televisión. En esta comunidad hay en total 500 hogares. El
analista desea que su estimación esté a 0.04 de la proporción verdadera, con un 90% de confianza. En
una muestra piloto de 15 hogares, el 35% de los entrevistados indicaron que alguien de su casa veía
regularmente dicho programa. Con base a esta información podemos calcular la muestra
Ejemplo 4:
Un economista desea hacer un estudio sobre los profesores de las Universidades de Chimbote en
referencia a cantidad de dinero por semana que cada profesor dedica a la alimentación de su familia.
Para ello acude a los niveles administrativos correspondientes, a fin de conseguir un listado de los
2,000 profesores que trabajan en estas universidades. Los niveles administrativos superiores también
tienen necesidad de obtener alguna información entre los profesores y se ponen de acuerdo para
aprovechar esa encuesta y para introducir 51 preguntas adicionales.
Una vez que el economista tiene estructurado el cuestionario, le pide a un estadístico que le estime el
tamaño de muestra apropiado para el estudio. Indicar el procedimiento y determinar el tamaño de
muestra apropiado.
1.- El estadístico interroga a los encargados del estudio sobre cuál es la pregunta más importante
en el estudio, a lo cual responden que todas por igual.
2. El estadístico vuelve a hacer la misma pregunta formulada de una y otra manera y al final el grupo
llegó a la conclusión de que las preguntas verdaderamente importantes son las 7 primeras.
3. Con la información obtenida, analiza el cuestionario, fórmula más preguntas y llega a las
siguientes conclusiones:
Con la primera pregunta se trata de estimar una media
Con la segunda pregunta, también se trata de estimar una media.
Con la 3era, 4ta, 5ta, 6ta y 7ma se trata de estimar un porcentaje o proporción.
4. Determinar la precisión con que se desea cada estimación. El economista dice que la media
que a él le interesa debe encontrarse en alrededor de 1,000 soles ya que la mayoría de los
maestros son casados, entre 30 y 50 años de edad y el nivel de sueldos de las Universidades
de Chimbote es regular. Además añade que él ha hecho algunas sondeos que arrojan
resultados congruentes con sus supuestos. Con estos datos el estadístico estima gruesamente
una varianza de 50,000 y como se pide un error del 5% y una confianza del 95%, se obtiene:
Z 2 PQ 2 2 (0.50)(0.50)
n0 400
E2 52
De la misma manera se trabaja el resto de porcentaje hasta obtener los resultados siguientes:
Pregunta : 1 2 3 4 5 6 7
Tamaño de Muestrea : 80 98 334 300 200 200 400
Nota.- en este ejemplo se trata de ilustrar la situación usual en muchas encuestas, donde se incluyen
cada vez mayor número de preguntas.
TAR EA
DETERMINACION DE LA MUESTRA: TÉCNICA DEL MUESTREO PROBABILÍSTICO
TIPO DE MUESTREO BIETAPICO: MUESTREO ESTRATIFICADO (PRIMERA ETAPA), Y
MUESTREO ALEATORIO SISTEMÁTICO (SEGUNDA ETAPA)
Muestra:
NZ 2 PQ
n
N 1 E 2 Z 2 PQ
Distribución proporcional
Ni
ni xn
N
Ing.
Ciclos Medicina Ing. Civil Sistemas Derecho Contabilidad Administración
Ni ni Ni ni Ni ni Ni ni Ni ni Ni ni
I 18 40 123 77 67 58
II 75 29 69 141 42 43
III 44 41 72 75 37 25
IV 53 22 46 154 61 38
V 28 17 38 90 64 14
VI 22 27 83 127 58 35
VII 21 19 50 98 38 19
VIII 19 17 47 110 57 24
IX 14 21 21 80 48 12
X 16 14 31 64 90 24
XI 11 41
XII 15 95
XIII 17
Total 353 n1= 247 n2= 580 n3= 1152 n4= 562 n5= 292 n6=
Población Muestra
FACULTAD Ni ni
Educación N1 = 68 n1 =
Ingeniería N2 = 57 n2 =
Derecho N3 = 68 n3 =
CC. CC. Y ADM. N4 = 39 n4 =
CC. DE LA SALUD N5 = 38 n5 =
TOTAL N = 270 n=
Muestra:
NZ 2 PQ
n
N 1 E 2 Z 2 PQ
Distribución proporcional
Ni
ni xn
N
a) Formulación de Hipótesis.
Ho : = 0
H1 : 0
x 0
t
DE
n
donde :
1 n 2 2
DE x i n x
(n -1) i 1
DE = Desviación estándar
d) Valor tabular
t tab t (n-1
; 1 - 2 )
e) Decisión
Ejemplo :
Un empresario está interesado en averiguar si el sueldo promedio de los trabajadores de
cierta empresa es de 420 dólares como el respectivo de la empresa que el regenta. Para
realizar tal averiguación se seleccionó una muestra aleatoria de 20 de los sueldos de
dichos trabajadores y se encontró un sueldo promedio de 430 dólares con una desviación
estándar de 100 dólares. ¿Existe evidencia suficiente para afirmar que el sueldo promedio
es de 420 dólares?
a) Formulación de Ho y Ha .
Ho : = 420
Ha : 420
b) = 0.05
c) Estadística de prueba
-
x 420
t t (19)
S
n
430 420
t 0.45 , p 0.657
100
20
d) Decisión
Como p > 0.05 no se rechaza la hipótesis nula, por tanto no existe evidencia suficiente
para poder afirmar que el sueldo promedio es diferente de 420 dólares.
PRUEBA DE HIPOTESIS PARA LA DIFERENCIA ENTRE LAS MEDIAS DE DOS POBLACIONES
INDEPENDIENTES
a) Formulación de Hipótesis.
Ho : 1 = 2
H1 : 1 2
donde :
2 2
(n 1 - 1)S1 (n 2 - 1 )S2
( DE ) 2
n 1 n2 - 2
d) Valor de p
p: Es la probabilidad que hay del valor t calculado hacia la derecha
e) Decisión
Rechazar Ho si p < 0.05 ó p < 0.01
No rechazar Ho si ( p > 0.05 )
Criterios de decisión :
Si p < 0.05, Existe diferencia estadísticamente significativa entre
los puntajes promedio de los 2 grupos de estudio.
Ejemplo
Treinta empleados de una gran empresa fueron distribuidos en dos grupos iguales a dos
diferentes programas de capacitación industrial. El grupo I fue capacitado con el Método
A, que consiste en adiestrarlos directamente en la maquinaria y el grupo II con el Método
B, con la atención personal de un instructor. Los puntajes obtenidos después de la
capacitación en una prueba apropiada fueron :
Método A Método B
Media ( x ) 78 70
Desviació estándar (S) 6 4
N 15 15
Solución
a) Formulación de Hipótesis.
Ho : 1 = 2
H1 : 1 2
c) Nivel de significación :
= 0,05
c) Estadística de prueba
78 - 70
t0
1 1
(26) = 4,30
15 15
e) Decisión
Como p < 0.01, se rechaza Ho. Por tanto existe diferencia estadísticamente
significativa en los dos métodos de capacitación.
Prueba de hipótesis :
a) Hipótesis estadísticas
Ho : 1 = 2
H1 : 1 ≠ 2
b) Nivel de significación
= 0.05
Prueba
d n d i X1i X 2i
tc ,
Sd
n
di
d i 1
n
n 2
(d i d)
Sd2 i 1
n -1
d) Valor de p
e) Decisión
Rechazar Ho si p < 0.05 ó p < 0.01
No rechazar Ho si ( p > 0.05 )
Criterios de decisión :
Si p < 0.05, Existe diferencia estadísticamente significativa
entre los puntajes promedio de los 2 grupos de
estudio.
Si p < 0.01, Existe diferencia estadística altamente
significativa entre los puntajes promedio de
los 2 grupos de estudio
Si p > 0.05, No existe diferencia estadísticamente significativa
entre los puntajes promedio de los 2 grupos de
estudio
Ejemplo:
Se llevó a cabo un experimento para probar el efecto de dos medicamentos distintos sobre el
tiempo de coagulación de la sangre (en minutos). Se extrajeron muestras de sangre de 10
personas y se dividieron igualmente en dos partes que se asignaron al azar a uno de los dos
medicamentos. Los resultados fueron los siguientes:
Persona X1 X2 Dif.
1 1.5 1.6 -0.1
2 1.4 1.4 0.0
3 1.8 1.6 0.2
4 1.3 1.2 0.1
5 2.0 2.1 -0.1
6 1.1 1.0 0.1
7 1.5 1.6 -0.1
8 1.5 1.5 0.0
9 1.2 1.0 0.2
10 1.5 1.6 -0.1
Solución
a) Hipótesis
H0 : 1 = 2 ó H0 : d = 0
H1 : 1 2 H1 : d 0
b) = 0,05
c) Prueba
d 0,0220
t
S 0,12273/ 10
d
0,0220
0.567
0,03881
d) Valor tabular
t = t (9; 0.975) = 2,26 p = 0.5846
e) Decisión
No se puede rechazar H0 puesto que p > 0.05
donde :
d = X 1 - X2
d = 0,022
S2 = 0,12273
n = 10
No existe diferencia estadísticamente significativa entre el efecto de los dos medicamentos en
el tiempo de coagulación de la sangre.
Ejercicio:
Grupos de estudio
1 2 3 . . . t
a) Hipótesis
H0 : 1 = 2 = 3 = . . . = t
H1 : Al menos 1 promedio es diferente
b) Nivel de significación
c) Función de prueba
CMT
F F= CMT/CME
CME
d) Valor de la probabilidad a la derecha de F calculado en c)
e) Decisión
Rechazar Ho si p < 0.05 ó p < 0.01
No rechazar Ho si p > 0.05
- Si p < 0.05, Existe diferencia estadísticamente significativa entre los puntajes promedio de
los t grupos de estudio (Al menos 1 es diferente)
- Si p < 0.01, Existe diferencia altamente significativa entre los puntajes promedio de
los t grupos de estudio (Al menos 1 es diferente)
- Si p>0.05, No existe diferencia significativa entre los puntajes promedio de los t grupos de
estudio.
Tabla ANVA
Fuente Variación Gl SC CM F
donde :
2 X2
Xi . ..
T
xx t N
E W - T
xx xx xx
X2
W Xij2 .. , CMT = SC/gl
xx N
Ejemplo :
En un estudio del efecto de la glucosa sobre la liberación de insulina, se trataron muestras de
tejio pancrático de animales de laboratorio con cinco estimulantes distintos. Posteriormente,
se determinó la cantidad de insulina liberada. Los resultados referentes a la insulina liberada
se muestran en la tabla a continuación. El experimentador deseaba saber si existe diferencia
significativa entre las cinco poblaciones con respecto a la cantidad media de insulina liberada.
Estimulante
A B C D E
1.53 3.15 3.89 8.18 5.86
1.61 3.96 3.68 5.64 5.46
3.75 3.59 5.70 7.36 5.69
2.89 1.89 5.62 5.33 6.49
3.26 1.45 5.79 8.82 7.81
1.56 5.33 5.26 9.03
7.10 7.49
8.98
Xi. 13.04 15.60 30.01 47.69 56.81 163.15
Xi 2.6080 2.8080 4.3733 6.6275 7.1013 5.0984
S 0.9959 1.0889 1.6704 1.4238 1.4394 2.2898
2
S i
ri 5 6 6 7 8 32
Solución
a) Hipótesis
H0 : A = B = C = D = E
H1 : Al menos 1 estimulante (tratamiento) es diferente
b) = 0,05
c) Prueba estadística
F CMT 14,62
CME
d) Valor tabular
F tab = F(4, 28; 0,05) = 2,71
e) Decisión
Se rechaza H0 puesto que F > Ftab
Existe evidencia suficiente para asegurar que al menos 1 tratamiento produce
efectos diferentes.
Criterio 1
Criterio 2 1 2 ... c ni.
1 O11 O12 ... O1c n1.
2 O21 O22 ... O2c n2.
c) Función pivotal
(Oij - E ij )2
2
E ij
n i. x n. j
E ij
n i.
Oij : Frecuencia observada
Eij : Frecuencia esperada
No rechazar Ho si 2
2
tab , ( p > 0.05)
Esto es :
HARDWARE SOFTWARE
Parte física Parte intangible
SISTEMAS
CPU, MONITOR, OPERATIVOS
TECLADO, MOUSE,
IMPRESORA, ETC.
LENGUAJES DE
PROGRAMACION
PAQUETES DE
APLICACIÓN
PROGRAMAS DE
APLICACION
PARA ANALISIS
PARA USO DE CUANTITATIVO PARA ANALISIS EXISTEN
OFICINA -Excel CUALITATIVOS DIFERENTES
OFFICE: Word, -Minitab -Atlas
-The Etnograph
.... PROGRAMAS
Excel, Power -Epi Info PARA CADA
Point, Etc. -Data ming -Nud ist ESPECIALIDAD
-Microstat -Sonar
-Estad graph -Decisión explorer
-HyperQual, Etc.
-SPSS
-Stata
-SAS
-STATS
-Abstat PROGRAMA ESTADISTICO
-Epi data, Etc. PARA CIENCIAS SOCIALES
PRACTICA DE EXCEL
A B C D E F G H I J
:
4 Nº EDAD SEXO PUNTAJE Nº DE HERM UBIC.VIVI CONDICION
n = 10
5 1 12 MASCULINO 14 2 LADERAS SIN BECA pacientes
LOS de un
6 2 11 FEMENINO 13 0 PINOS SIN BECA consultorio
LOS
7 3 13 MASCULINO 13 2 PINOS SIN BECA
8 4 12 FEMENINO 13 3 LADERAS SIN BECA
9 5 13 MASCULINO 12 2 LADERAS BECA
10 6 11 FEMENINO 12 2 LADERAS SEMI BECA
2 DE
11 7 13 MASCULINO 13 3 JUNIO SEMI BECA
2 DE
12 8 13 MASCULINO 14 1 JUNIO SIN BECA
13 9 12 FEMENINO 11 0 LADERAS SIN BECA
14 10 13 MASCULINO 12 1 LADERAS SIN BECA
15
16
Nº de
17 EDAD pacient % Ejemplos:
18 11 2 20 2 =CONTAR.SI(C5:C14,11)
19 12 3 30 20 =(E18/E$21)*100
20 13 5 50 10 =SUMA(E18:E20)
21 TOTAL 10 100
22
23
24
25
26
27
28
29
30
31
32
33
34
35
38
Nº
39 SEXO Pacientes %
40 MASCULINO 6 60 6 =CONTAR.SI(D5:D14,"MASCULINO")
41 FEMENINO 4 40 60 =(E40/E$42)*100
42 TOTAL 10 100 10 =SUMA(E40:E41)
43
44
45
46
47
48
INTRODUCCIÓN
La estadística tiene como finalidad estudiar detalladamente las características de una muestra de datos.
Este estudio se realiza a través de variables. Variables: Son características que pueden tomar distintos
valores en cada unidad de investigación (unidad de análisis).
En el ejemplo se estudian las características de una muestra de 40 sujetos. Se estudian siete variables:
Edad, sexo, estatus, región, ci (cociente intelectual), estatura y peso. La edad es una propiedad (tiempo
vivido) de los casos (sujetos en este caso) que pueden tomar distintos valores: 40, 35, 43, 54, etc. Sexo
es una variable porque puede tomar distintos valores: hombre o mujer.
Variables y Casos: Todo conjunto de datos puede ser visto como una matriz. Las filas corresponden
con los distintos sujetos o unidades de investigación, sobre los que se han realizado las distintas
observaciones(columnas). Los sujetos (filas) suelen denominarse casos y las observaciones (columnas)
suelen denominarse variables.
A modo de ejemplo, por caso, dependiendo del estudio, puede entenderse un alumno, un profesor, o
una sesión de clase. Por variables, asociadas a los casos anteriores, puede entenderse el sexo y la
edad del alumno, el cociente intelectual y el rendimiento en una asignatura determinada obtenida en el
desarrollo de una asignatura. Es importante notar que, con frecuencia se confunde, en este último caso,
cuál es el sujeto de análisis, si el alumno con varios episodios de recurrencia o cada episodio de
recurrencia es un caso en sí, pudiendo haber varios episodios para un mismo alumno. La distinción de
la unidad de análisis en cada situación la marcará el objetivo de la investigación.
Tipo de variables
Cualitativas Cuantitativas
Contienen información cualitativa de los sujetos Miden la magnitud de una medida sobre un
denotando la cualidad o la categoría a la que individuo.
pertenece un sujeto.
Nominales Ordinales Escala
Las observaciones se En esta escala de medición Estas variables miden una magnitud de los sujetos
clasifican en categorías no tiene sentido medir la resultando en un valor numérico. Utilizan escalas
(mutuamente distancia entre posibles numéricas y sí tiene sentido medir la distancia que
excluyentes y valores de la variable ni se hay entre posibles valores de los datos. En estas
colectivamente pueden realizar operaciones variables cabe distinguir aquellos casos donde el
exhaustivas) sin que aritméticas con ellos pues punto cero es arbitrario (medición a nivel de
éstas tengan un orden no toman valores numéricos intervalo) como por ejemplo la temperatura, o
específico (por ejemplo específicos ni existe datos donde el cero es un punto fijo (nivel de
los grupos sanguíneos). proporcionalidad entre razón) como por ejemplo el peso o la glucemia. Si
Un caso particular de categorías vecinas. Sí bien el SPSS no hace distinción entre variables del
datos nominales es el pueden sin embargo ser tipo escala, los procedimientos estadísticos
caso de los datos ordenados pues existe una distinguen entre variables discretas y continuas.
dicotómicos en los que relación de orden entre las En el primer caso el conjunto de posibles valores
existen sólo dos distintas clases o de la variable es finito siendo en el segundo
categorías (como por categorías. El pronóstico de continuo. Un ejemplo de variable discreta es el
ejemplo en el sexo). una enfermedad (menos número de días de ingreso en un Hospital, y un
grave, grave, más grave) es ejemplo de variable continua es la glucemia.
un dato medido en escala
ordinal.
APLICANDO UN CUESTIONARIO
Sr(a)(ta): Se solicita su valiosa colaboración que nos permita recolectar datos para
analizarlos e interpretarlos de un Trabajo de Investigación que favorecerá a la ciudad de
Chimbote.
6.- De las alternativa dadas ubique, la región o zona en que se ubica su domicilio:
1.- Ingrese al programa estadístico SPSS. Defina las variables según las referencias. Finalmente guarde con el nombre practica1
Nombre Tipo Anchura Decimales Etiqueta Valores Valores Column Alineación Medida
Valor Etiqueta Perdidos
Número de None
Iden Numérica 2 0 -9 8 Derecha Escala
identificación del sujeto
edad Numérica 2 0 None -9 8 Derecha Ordinal
1 Hombre
Sexo Numérica 1 0 8 Derecha Ordinal
2 Mujer 9
nombre Cadena 10 None 10 Izquierda Nominal
Estatus 1 Alto
Estatus Numérica 1 0 socioeconómico 2 Medio 9 8 Derecha Ordinal
3 Bajo
1 Norte
2 Este
región Numérica 1 0 8 Derecha Ordinal
3 Oeste 9
4 Sur
ci Numérica 3 1 Cociente Intelectual None -9.0 8 Derecha Escala
estatura Numérica 3 0 None -9 8 Derecha Escala
peso Numeric 5 1 None -9.0 8 Derecha Escala
PRACTICA N° 02: INGRESO DE DATOS
1.- Mediante trabajo en equipo (2 personas), ingresará los datos de las 40 encuestas al archivo
que contiene la definición de las variables.
ENCUESTA
Los resultados de una encuesta son producto de varios pasos, que involucran el
plano teórico y el práctico; un solo error en cualquier proceso amenaza todo lo
hecho.
ORGANIZACIÓN DE UNA ENCUESTA
Proyecto de Organización
cuestionario del trabajo de
terreno
Aplicación de la
encuesta
OBJETIVOS
Encuesta
piloto Procesamiento
Confección
definitiva del
cuestionario Análisis final
Organización
preliminar del
trabajo de terreno
Plan de CONCLUSIONES
tabulación
LA ENTREVISTA Y EL CUESTIONARIO
Las herramientas más frecuentes para realizar una encuesta son la entrevista y
el cuestionario.
La entrevista es una conversación seria entre dos o más personas, siempre con
un propósito definido. Es el instrumento más empleado en la Psicología Clínica.
ENTREVISTA CUESTIONARIO
MARCO MARCO
TEORICO SITUACIONAL
MARCO
CUESTIONARIO MARCO DE
METODOLOGICO REFERENCIA
Determinar la codificación de
preguntas cerradas
Primer Momento: Se diseñaran los instrumentos y deberá consultarse a una muestra de expertos
(profesores especialistas), quienes analizaron y evaluaron la estructura de los mismos, teniendo en
cuenta la correlación de las preguntas, la cohesión y el grado de pertinencia en la orientación para el
logro de los objetivos planteados y el marco referencial que lo sustenta.
Cuarto Momento: Finalmente se procederá al diseño definitivo de los instrumentos, los mismos que
deberán ser aplicados a las muestras respectivas de estudios.
II. CONFIABLIDAD DE LOS INSTRUMENTOS:
Según Hernández, Fernández y Baptista. La confiabilidad de un instrumento de medición, se refiere
al grado en que su aplicación repetida al mismo sujeto u objeto produce resultados iguales.
La confiabilidad de un instrumento se refiere a la constitución interna de las personas, a la mayor o
menor acescencia de errores de medida. Un instrumento confiable significa que si lo aplicamos por
más de una vez a un mismo elemento entonces obtendríamos iguales resultados.
CONFIABILIDAD
Muy Baja Baja Regular Aceptada Elevada
0
1
0% 100%
k S iS
2
1
k 1 S T2
Donde:
K : Es el número de ítems.
S2i : Sumatoria de varianzas de los ítems.
ST2 : Varianza de la suma de los ítems.
: Coeficiente de Alfa de cronbach.
EJEMPLO:
Se tienen los resultados referidos a la opinión de 06 alumnos respecto a los ítems formulados en un
cuestionario.
ITEMS
ALUMNO I II III
1 3 5 5
2 5 4 5
3 4 4 5
4 4 5 3
5 1 2 2
6 4 3 3
PROCEDIMIENTO:
Paso 1: Calcular las varianzas de cada uno de los ítems; en el cuadro de cálculo.
ITEMS
ALUMNO I II III
1 3 5 5
2 5 4 5
3 4 4 5
4 4 5 3
5 1 2 2
6 4 3 3
Xi 21 23 23
Xi 2 83 95 97
Si2 1.9 1.37 1.77
Xi 2
–
x2
n
Donde: Si2 = __________________
n–1
SUMA DE ITEMS
13
14
13
12
5
10
Xi = 67
Xi2 = 803
2 x 2
xi
Donde: ST2 = n ST2 = 10.97
n 1
3
1 0.4594348
2
= 0.81085
= 0.81
Paso 5: Interpretación de la significancia de = 0.81; lo que significa que los resultados de opinión
de los 06 alumnos respeto a los ítems considerados se encuentran correlacionados de manera
altamente confiable y muy aceptable.
ANEXO 1:
AREAS BAJO LA CURVA NORMAL
ANEXO 2:
DISTRIBUCIÓN t STUDENT
T
ANEXO 3:
VALORES CRÍTICOS DE JI CUADRADA