Estadística-Documento de trabajo-UNASAM - ABRIL 2019-B

UNIVERSIDAD NACIONAL SANTIAGO ANTUNEZ DE MAYOLO
- HUARAZ
ESTADÍSTICA
Dr. Oscar Robles Villanueva
HUARAZ - ABRIL - 2019
UNASAM - Dr. Oscar Robles Villanueva

La estadíística es una ciencia que estudia la recoleccioí n,
presentacioí n, anaí lisis e interpretacioí n de datos, ………..
Es el vehíículo que permite llevar a cabo el proceso

relacionado con la investigacioí n cientíífica……...
Es transversal a una amplia variedad de disciplinas,

……………..

LA ESTADÍSTICA EN EL PROCESO DE INVESTIGACION
PASO 1 PASO 2 PASO 3 PASO 4 PASO 5
Plantear el Establecer la
Concebir la problema de Elaborar el Definir el hipótesis
idea a investigación Marco alcance de la Variables
investigar Justificación Teórico investigación Definiciones
Objetivos Operacionales
Antecedentes, Marco Exploratorio, descriptivo,

teórico, Definiciones correlacional, explicativo
ddddd PASO 10
PASO 6 PASO 7 PASO 8 PASO 9
Seleccionar Seleccionar Recolección Analizar los Elaborar y

el diseño la muestra de datos datos presentar
apropiado (Encuesta) reporte
DISEÑO: Experimental Elaborar el instrumento Cuadro, Gráficos,

(Puro, Pre, Cuasi) Población - muestra Esquema
(Cuestionario, entrevista) Estadígrafos: x, Mo, S2
Formato DIFUSION
No Experimental Probabilística Intervalos, Prueba de
No probabilística Validez – confiablidad Protocolo APLICACION
(transversal, Longitudinal) Codificación, crear base, Hipótesis
software Modelos, Regresión, ANVA,
NUEVAS IDEAS NUEVOS CONOCIMIENTOS
METODOLOGIA DE LA INVESTIGACIÓN
Roberto Hernandez – Carlos Fernández – Pilar Baptista

DATOS Y ESTADISTICA
RECOLLECION DE DATOS
PRESENTACION DE DATOS
DATOS
RESUMEN DE DATOS
PREDICCION DE DATOS
CLASIFICACIÓN DE LA ESTADÌSTICA
ESTADÍSTICA DESCRIPTIVA:
Realiza el estudio sobre la población completa, observando una característica de la misma y
calculando unos parámetros que den información global de toda la población.
ESTADÍSTICA INFERENCIAL:
Realiza el estudio descriptivo sobre un subconjunto de la población llamado muestra y,
posteriormente, extiende los resultados obtenidos a toda la población.
ESTADISTICA DESCRIPTIVA
POBLACIO Descripción
N
ESTADISTICA ESTADÍSTICA INFERENCIAL
POBLACIO
N Parámetro
Inferir
Muestra
(n) Estimador (Indicador)
4
RECOLECCION DE DATOS
Tema Fuentes de
problema Información
¿? POBLACIÓN (primaria-
secundaria)
Objetivos Muestra
INSTRUMENTO
Cuestionario, Test, Examen escrito,
Guía de observación, Entrevista, etc.
( VALIDEZ - CONFIABILIDAD )
Crear base de datos - Software
Técnicas de recolección de datos
DEFINICIONES BASICAS
POBLACION (N)
Conjunto de elementos que determinan la cobertura de un estudio y tienen al
menos una característica común.
MUESTRA (n)
Subconjunto adecuado y representativo de la población.
VARIABLE (X, Y, Z, …)
Es una característica de los elementos de una población, es observable es
medible.
DATO
Es el valor que toma la variable en cada momento que es analizado.
Ejercicio:
Teniendo como referencia estas definiciones, construya una base de datos.
5
VARIABLE DE ESTUDIO
Se denomina “variable” en la investigación científica a toda propiedad,
rasgo, aspecto, cualidad, dimensión, atributo etc., de una persona u objeto,
si tal propiedad puede asumir distintos estados o valores, sea por
modificación, aumento o disminución, y si esa variación es observable y
medible en una misma o en distintos unidades de observación.
VARIABLES ESTADISTICAS
Una variable estadística es la variable de estudio operacionalizada. Mide
una característica observable y medible, que varía entre los diferentes
elementos de una población. La información que disponemos de cada
individuo u objeto puede ser resumido en una o varias variables.
Ejemplos:
– Edad: {15, 20, 16, 45, …, 36}  Variable Cuantitativa continua

– Hemoglobina: {12.5, 11.8, 14.2, …, 10.5}  Variable Cuantitativa contínua
– Sexo: {femenino, masculino}  Variable Cualitativa Nominal
– Nivel de educación: {Analfabeto, primaria, secundaria, superior}  Variable Cualitativa
Ordinal
– Número de hijos: {0,1,2,3,4,5,...}  Variable Numérica discreta
– Toxicidad hematológica: {normal, G1, G2, G3, G4}  Variable cualitativa ordinal
6
CLASIFICACIÓN DE VARIABLES
SEGÚN LA NATURALEZA.
VARIABLE CUALITATIVA
DISCRETA
VARIABLE CUANTITATIVA
CONTINUA
SEGÚN LA RELACIÓN
.
VARIABLE INDEPENDIENTE (X)
VARIABLE DEPENDIENTE (Y)
VARIABLE INTERVINIENTE
SEGÚN EL NÚMERO DE VARIABLES

.
ESTADÍSTICAS UNIDIMENSIONALES (X)
ESTADÍSTICAS BIDIMIENSIONALES (X,Y)
ESTADÍSTICAS PLURIDIMENSIONALES (X,Y,Z) , (X,Y,Z,V), ….
PRESENTACION DE DATOS
7
CUADRO Nº 11.3:
ARRIBOS * EN EL HOTEL DE LA POLICIA POR ESTACIONES

LIMA 2011 – 2018
(miles de personas)
E S TAC I O N E S PARTES PRINCIPALES

AÑOS VERANO OTOÑO INVIERNO PRIMAVERA TOTAL Nº DEL cuadro
2011 31.7 32.1 33.1 34.7 131.6 Título
2012 38.5 36.8 38.2 37.2 150.7 Encabezamiento o conceptos
2013 37.9 38.7 38.2 38.8 153.6 Cuerpo
2014 41.3 41.7 44.8 45.5 173.3 Nota de pie o llamadas
2015 51.3 51.3 49.8 53.6 206.0 Fuente
2016 53.3 57.5 58.6 61.4 230.8 Nota de unidad de medida
2017 65.5 67.3 68.5 73.9 275.2 Elaboración
2018 78.6 80.7 82.2 88.6 330.1
PROMEDIO 49.8 50.8 51.7 54.2 206.4
* Son las personas que llegan a la ciudad de Lima y se hospedan en el Hotel de la Policía, se registran y hacen un pago por el.
Fuente: Estadística mensual del Casino de Policía - Lima-2019
Elaboración: Instituto Información y Desarrollo S.A.C. IID SAC
TABLAS DE DISTRIBUCIÓN DE FRECUENCIAS
SIMPLE ( fi )
ABSOLUTA
ACUMULADA (Fi)
FRECUENCIA
SIMPLE (hi)
RELATIVA
ACUMULADA (Hi)
Estado de salud de 24 estudiantes de la Inst. Educ. “Estrellita”, Chimbote- 2018
Bueno Regular Regular Malo Estado de Nº de

Regular Malo Bueno Malo salud Estudiantes Fi hi Hi
Malo Regular Bueno Regular Bueno
Bueno Malo Regular Regular Regular
Regular Regular Regular Malo Malo
Regular Bueno Bueno Regular Total
Nº de inasistencias de los docentes del Instituto “ABC” en el año 2018.
8
Nº de
4 3 4 2 insistencias Nº de
3 2 2 2 docentes Fi hi Hi
4 4 2 2
4 3 2 3
4 2 2 4
4 3 2 Total
Ingreso Semanal de los trabajadores administrativos de las Universidades de Chimbote - 2018.
440 560 335 587 613 400 424 466 565 393
453 650 407 376 470 560 320 500 528 526
570 430 618 537 409 600 550 432 591 428
440 340 558 460 560 607 382 667 512 492
450 530 501 471 660 470 364 634 580 450
574 500 462 380 518 480 625 507 645 382
Ingreso Nº de Marca de
Semanal trabajadores Fi hi Hi Clase
[ 320 - 370 ) 4 4 0.067 0.067 345
[ 370 - 420 ) 8 12 0.133 0.200 395
[ 420 - 470 ) 14 26 0.233 0.433 445
[ 470 - 520 ) 9 35 0.150 0.583 495
[ 520 - 570 ) 11 46 0.183 0.766 545
[ 570 - 620 ) 8 54 0.133 0.899 595
[ 620 - 670 ) 6 60 0.100 1.00 645
TOTAL 60 1.00
9
REDUCCION DE DATOS
(X)
MEDIA ( )
MODA (Mo)
MEDIANA (Me)
DE POSICION CUARTILES (Qi)

O TENDENCIA
CENTRAL DECILES (Di)
PERCENTILES (Pi)
MEDIA ARMONICA (MA)
MEDIA GEOMETRICA (MH)
ESTADIGRAFOS RANGO ( R )
(Medidas de resumen)
DESVIACION MEDIA (D.M.)
DE DISPERSION
2
O VARIABILIDAD VARIANZA (S ) (σ2)
DESVIACION ESTANDAR (S) (σ)
COEFICIENTE DE VARIACION (C.V.)
DE DEFORMACION
O ASIMETRIA
DE APUNTAMIENTO
O KURTOSIS
10
PREDICCIÓN DE DATOS
LINEAL línea recta Y= a + b X
SIMPLE
(X,Y) *Parábola Y= a + b X + c X2
NO
LINEAL *Exponencial
* REGRESION *Potencial
Y ******
CORRELACION
MULTIPLE Y= Bo + B1 X1 + B2 X2
(X,Y)
(X,Y,Z) LINEAL Y= Bo + B1 X1 + B2 X2 + B3 X3
(X,Y,Z,W) *****
******
y    1 x1  ...   k xk  
NO
LINEAL
* SERIE DE TIEMPO Y= f (t)
* PROMEDIOS MOVILES
* ESTIMACION PUNTUAL
* ESTIMACION INTERVÁLICA
* PRUEBA DE HIPÓTESIS
11
MEDIDAS DE RESUMEN – MEDIDAS ESTADÍSTICAS
(REDUCCIÓN DE DATOS)
1.1. ESTADIGRAFOS
Son medidas de resumen que describen a una muestra. Son las que se utilizan como
ESTIMADORES de los parámetros, los estadígrafos de mayor uso son: La Media Aritmética , la
Varianza, la desviación estándar, el Coeficiente de Variación, proporción, etc.
1.2. PRINCIPALES ESTADIGRAFOS O MEDIDAS ESTADISTICAS

A. MEDIDAS DE TENDENCIA CENTRAL
Media Aritmética o Promedio

La media aritmética o promedio, no es más que la suma de los datos que se quieren promediar,
dividida entre el número de datos y se representa con equis testada.
Simbolos :
X : Media Muestral
 : Media Poblacional (parámetro)
Ejemplo1
Calcula la media aritmética para el siguiente conjunto de datos.
Sea Xi el peso en Kg. de 10 alumnos del Colegio ABC
Xi : 45,1 67,7 73,7 42,5 64,4 66,7 50,5 62,7 60,7 63,6
45.1  67.7  73.7  42.5  64.4  66.7  50.5  62.7  60.7  6.6
x  59.76
10
INTERPRETACION: Si se elige a un estudiante del colegio ABC. al azar se espera que su

peso sea de 59,76 Kg.
12
Mediana (Me)
Es la observación que se encuentra en el centro cuando los datos están ordenados, divide a los
datos en dos partes iguales de 50% cada una.
- Si n es impar:
la mediana es la observación que está en el lugar (n+1)/2, esto es
- Si n es par:
la mediana es el promedio de las observaciones n/2 y n/2 +1, esto es
Ejemplo 2
Encuentra la mediana para el siguiente conjunto de datos
X i edad de 15 alumnos de la Escuela de Enfermería de la USP
X i : 18 24 19 20 19 18 19 22 19 18 17 16 16 20 19
Se ordenan los datos en forma creciente o decreciente y la mediana ocupa el lugar (n+1)/2, en este
caso como n = 15 el lugar que ocupa la Me es, (15+1)/2 = 8 es decir el 8vo lugar.
X i : 16 16 17 18 18 18 19 (19) 19 19 19 20 20 22 24
Mediana = 19 años
INTERPRETACION: Se espera que el 50 % de alumnos de Sistemas tengan una edad inferior a

19 años y el otro 50 % supere dicha edad.
Ejemplo 3
Calcula la mediana para el siguiente conjunto de datos
X i : Peso (kg.) de alumnos de la Escuela de Medicina de la USP
X i : 62 71 64 66 58 62 65 68 70 58
Se ordenan los datos en forma creciente
X i : 58 58 62 62 (64 65) 66 68 70 71
Una vez ordenados, como el número de datos es par (10), se busca el número que tiene la
posición n/2 y el que tiene la posición n/2 +1, o sea 10/2 = 5º y 10/2 +1 = 6.
13
Los números que tienen la posición cuarta y quinta son 64 y 65. Estos números se promedian y el
resultado será la mediana.
Mediana = (64 + 65)/2 = 64,5 kg.
INTERPRETACION: Se espera que el 50% de alumnos de arquitectura tengan un peso inferior a

64.5 kg y el otro 50% supere dicho peso.
Moda (Mo)
Es la observación de mayor frecuencia.
Nota: Si ninguna observación se repite, se dice que esos datos no tienen moda. Si todos los datos
se repiten el mismo número de veces, los datos serán multimodales.
Ejemplo4
Encuentra la moda de los siguientes datos
4 9567
Solución
Como los datos sólo existen una vez, este conjunto de datos no tienen moda.
Ejemplo5
Encuentra la moda del siguiente conjunto de datos
9 367985973
Solución
El 3 se repite dos veces, el 7 se repite también dos veces, pero como el 9 se repite tres veces, este
último número es la moda para este conjunto de datos.
Ejemplo6
Calcula la moda para los datos que se presentan a continuación
6 786978568
Solución
El máximo número de veces que se repiten los datos son tres, y hay dos datos que se repiten tres
veces, el 6 y el 8. El conjunto de datos es bimodal y sus modas son el 6 y el 8.
Ejemplo7
Calcula la moda para estos datos
8 65596865989
Solución
En este conjunto de datos, todos se repiten tres veces. El 5, 6, 8 y el 9 son moda. Es un caso
multimodal
14
B. MEDIDAS DE DISPERSIÓN
Son medidas que nos dicen que tan dispersos se encuentran los datos con respecto a su media.
Símbolos comunes en su uso son:
S2 : Varianza Muestral
2: Varianza poblacional (parámetro)
VARIANZA (Variancia) S2
La varianza o variancia es el promedio de las desviaciones al cuadrado entre los datos y su media
aritmética
(  xi ) 2
x  2
 ( xi  x ) 2 i
n
S 
2

n 1 n 1
donde:
xi: es el i-ésimo dato
: es la media aritmética para datos no agrupados
n: es el número de datos
Ejemplo 01
Calcula la varianza para el siguiente conjunto de datos.
5 9 12 7 15 3
Solución
Aplicando la definición (primera fórmula).
Primero hay que calcular la media

= (5+9+12+7+15+3) / 6 = 51/ 6 = 8.5,
S2 = [ (5-8.5)2+(9-8.5)2+(12-8.5)2+(7-8.5)2+(15-8.5)2+(3-8.5)2 ]/ 5 = 99.5/5 = 19.9
La varianza para este conjunto de datos es 19.9.
Usando la segunda fórmula

n=6
x = 5 +9 +12 +7 +15 +3 = 51
x2 = 52 +92 +122 +72 +152 +32 = 533
S2 = [ 533-(51)2/6 ] /5 = 99.5/5 = 19.9 que es el mismo resultado que obtuvimos con la definición
anterior.
15
DESVIACIÓN ESTÁNDAR
Es la raíz cuadrada positiva de la varianza
(  xi ) 2
x  2
i
S n
n 1
Ejemplo 02
Calcula la desviación estándar para el siguiente conjunto de datos.
5 9 12 7 15 3
Solución
Con el cálculo de la varianza previo S2 = 19.9
S  19.9  4.46
NOTA:
1. La varianza expresa a la unidad de medida elevada al cuadrado mientras que la
desviación estándar lo expresa en su unidad original
2.
Ejemplo
Si se ha calculado la varianza de Peso en Kg.
Tenemos que S2 = 49.0 kg2

Por lo tanto S = 7.0 kg
3. La varianza y desviación estándar cumplen una función más importante cuando se

quiere comparar la variabilidad o dispersión de dos o más conjunto de datos.
Ejemplo 03:
Determinar la distribución de notas en estadística mas variable de estos dos grupos de estudiantes:
X : 08 12 18 06 14 13
Y : 10 16 15 12 12 14
Los resultados fueron:

S x2  18.57 Sx= 4.31
S y2  4.96 Sy= 2.23
Por lo tanto las notas del Grupo X es más variable.
16
COEFICIENTE DE VARIACIÓN.(CV%)
A menudo nos interesamos por comparar la variabilidad de dos o más conjuntos de datos; esto se
resuelve determinando las respectivas varianzas o desviaciones estándar, siempre y cuando las
variables presenten la misma unidad de medida y además sus MEDIAS sean relativamente cercanas.
Cuando faltan estas condiciones la medida que se utiliza para comparar la variabilidad de dos o más
conjuntos de datos se conoce como COEFICIENTE DE VARIACION ; que es una medida relativa
de variabilidad, y se define por la siguiente expresión:
S
CV %  x100
x
EJEMPLO 1: Se tiene las siguientes poblaciones:

P1 : Población de elefantes P2 : Población de ratones
1 = 24000 Lb de peso 2 = 1.05 Lb de peso.
S1 = 1285 Lb S2 = 0.16 Lb
¿Cuál es la población más variable?

* Si se toman las desviación estándar para su comparación entonces se concluye que la población
de elefantes es más variable por ser S1 > S2
* En este caso se puede observar que la unidad de medida es la misma, pero sus promedios o
medias no son relativamente cercanas.
Ahora utilizaremos el Coeficiente de Variación.
CV1 % = 1285 x 100 CV2 % = 0.16 x 100

24000 1.05
CV1 % = 5.354 % CV2 % = 15.238 %
CONCLUSION: La población de ratones es más variable porque tiene mayor porcentaje de

variabilidad.
17
EJERCICIOS PROPUESTOS
1. Cada una de las siguientes afirmaciones diga Ud. si son ciertas (V) o falsas(F):
a. Generalmente las variables continuas tomas valores enteros . ( )

b. Todas las variables Nº de hermanos es una variables cuantitativa discreta ( )
c. Coeficiente de Inteligencia es una variable cualitativa ( )
2. En los siguientes casos diga Ud. si corresponde a un enunciado de la estadística descriptiva o

inferencial.
a. Determinar el puntaje promedio de los ingresantes a la UCV en el último examen de

admisión. ............................................
b. Realizar al Censo universitario en el Perú. .............................................
c. A mayor edad mayor presión arterial. ....................................................
d. El rendimiento académico es menor si el tiempo de ver televisión es mayor en los alumnos del
segundo ciclo de Enfermería de la USP. .....................................................
3. En los siguientes enunciados identifique a la(s) variable(s) independiente(s) y la variable dependiente.

(por su relación causal)
a. Para analizar horas dedicadas al estudio, rendimiento académico, y autoestima.

VI: VD:
b. Para el estudio de presión arterial , edad y nivel depresivo de personas de la tercera edad.
VI: VD:
c. Grado de Instrucción, número de hijos y nivel de conocimiento sobre Planificación familiar de la

población de Chimbote.
VI: VD:
d. Estudio del nivel de satisfacción, sueldo y horario de trabajo de los médicos del Hospital de Policía.
VI: VD:
18
4. La siguiente información contiene Los puntajes en Lectura e interpretación de Imágenes en niños de
4 años; Antes y después de aplicar un programa de canciones infantiles (para promover la lectura e
interpretación de imágenes).
Grupo Experimental
N° Pre Test Post Test
1 07 15
2 09 16
3 07 15
4 12 18
5 05 14
6 12 16
7 12 20
8 09 12
9 11 18
10 08 11
11 11 16
12 04 11
13 10 14
14 14 17
15 08 12
Promedio
Desviación
Estándar
CV%
Determine el Promedio, la desviación Estándar y el Coeficiente de Variación para los puntajes en el Pre
Test y Pos Test.
19
7. Se comparó tres métodos de enseñanza en el área de Matemática; el Expositivo receptivo(A); el
expositivo dialogado (B) y el expositivo con apoyo de texto autoinstructivo(C). La composición de
los alumnos por método y los puntajes de sus rendimientos fueron:
Rendimiento académico en Matemática de Alumnos por método de enseñanza.

Método A Método B Método C
10.6 8.8 12.4
12.5 12.4 17.6
8.6 15.2 15.2
14.2 14.6 14.8
9.6 12.7 12.5
7.6 10.4 14.6
13.2 16.2 13.7
10.6 8.8 12.8
12.2 14.5
11.6 10.8
14.6
17.2
Determine e interprete la Media o promedio y el Coeficiente de Variación, y compare para los tres
grupos.
REFERENCIA BIBLIOGRAFICA:
1.AVILA R.B.(2000), “Estadística Elemental”. Nueva Edición. Estudios y Ediciones Lima-Perú.
2.HERNANDEZ S., FERNANDEZ C, BAPTISTA(2005), Metodología de la Investigación Científica. Mexico. Editorial McGRAW-
HILL.
3.MILTON J. SUSAN (2004): Estadística para Biología y Ciencias de la Salud, Edit. McGraw-Hill. España.
4.WAYNE, Daniel (2002). Estadistica Aplicada a las Ciencias Sociales. Colombia. Editorial McGRAW-HILL LATINOAMERICANA.
S.A.
5.WAYNE, Daniel (2005). Bioestadística. Edit. Limusa. México.
20
DISTRIBUCIONES BIDIMENSIONALES DE FRECUENCIAS
Distribución bidimensional de 150 trabajadores de Chimbote, por simpatía política (VD) según
Grado de Instrucción (VI).
Cuadro Nº 13
TRABAJADORES DE UNA EMPRESA POR SIMPATIA POLITICA SEGÚN
GRADO DE INSTRUCCIÓN, CHIMBOTE. 2014.
Grado de Simpatía Política Total

instrucción Izquierda Centro Derecha
Primaria 26 24 17 67
Secundaria 12 27 13 52
Superior 12 10 9 31
Total 50 61 39 150
Fuente: Encuesta de Simpatía Política en Chimbote. 2014.
Elaboración: Instituto Información y Desarrollo ( IID SAC)
Ejemplo:
Edad y número de hijos de 15 docentes de la Institución Educativa “José Olaya”, Chimbote -
2014.
Edad : 30 40 30 50 40 40 30 50 50 40 30 40 40 30 30
N° de hijos: 2 3 1 3 3 2 1 3 3 2 2 2 3 1 2
Con los datos anteriores construir una tabla de distribución bidimensional de frecuencias (tabla de
contingencia)
21
REGRESIÓN Y CORRELACIÓN LINEA ( r ) (Y* = a + bX )
Ejemplo:
Analizar la relación entre el ingreso y egreso diario de 6 trabajadores del distrito “Z”.
Ingreso : 35 40 38 55 42 60
Egreso : 30 35 30 50 35 50
CALCULO DE r:
Ejemplo:
INGRESO Y EGRESO DIARIO DE UNA MUESTRA DE 6 TRABAJADORES.
INGRESO EGRESO
XY X2 Y2
X Y
35 30 1050 1225 900
40 35 1400 1600 1225
38 30 1140 1444 900
55 50 2750 3025 2500
42 35 1470 1764 1225
60 50 3000 3600 2500
270 230 10810 12658 9250
∑X ∑Y ∑XY ∑X 2 ∑Y2
Para este ejemplo calcular e interpretar “r”
22
PROPIEDADES DE r:
- 1 ≤ r ≤ + 1
De donde se deduce que:

a) Si r > 0, entonces existe “correlación directa positiva
b) Si r < 0, se trata de una “correlación inversa negativa”
Interpretación del coeficiente de correlación:

a) 0.00 ≤ r < 0.20 existe correlación no significativa.
b) 0.20 ≤ r < 0.40 existe una correlación baja
c) 0.40 ≤ r < 0.70 existe una significativa correlación
d) 0.70 ≤ r < 1.00 existe alto grado de asociación.
Ejemplo:
Analizar la relación entre la edad y el tiempo de servicios de 15 docentes de un Centro
Educativo.
Edad : 48 40 30 39 46 42 27 36 34 46 32 42 40 32 27
Tiempo de: 24 18 9 14 22 22 4 13 10 20 12 18 16 8 6
Servicios
23
APUNTES DE:
PROBABILIDAD – ESPACIO MUESTRAL – EVENTO O SUCESO
INTRODUCCION
Frecuentemente se usa el término probabilidad para sugerir que existe duda o incertidumbre sobre
lo que ocurrió, lo que ocurre o ocurrirá. La experiencia humana demuestra que existe una serie de
hechos, acontecimientos, experimentos cuyos resultados no se pueden determinar anticipadamente; sin
embargo si es posible definir, estimar o predecir el probable resultado. Podemos conocer le pasado,
pero nunca el futuro, pero existe un permanente interés por despejar las incertidumbres.
Permanentemente nos interesa predecir o estimar lo que sucederá en ciertas circunstancias. Un

empresario puede decidir la comercialización de un producto si conoce que la probabilidad de éxito es
muy alta. Un aficionado de fútbol, puede apostar contra su equipo favorito si sabe que la probabilidad
de que gane es muy pequeña. El agricultor no sembrará demasiadas hectáreas de café si la probabilidad
de que baje el precio es muy elevada.
Todo estos aspectos de ocurrencia de un hecho serán materia de este guía académica, donde el
alumno podrá asimilar los contenidos de probabilidad, espacio muestral y evento o suceso. Teniendo al
alcance una herramienta muy importante para la toma de decisiones en la organización y gestión de
datos.
COMPETENCIAS :
1.- Conoce brevemente la reseña histórica de la teoría de probabilidad

2.- Define probabilidad
3.- Define e interpretar un experimento aleatorio
4.- Define y determinar un espacio muestral
5.- Define y determinar un evento o suceso
6.- Calcula probabilidades para eventos o sucesos.
DEFINICION DE PROBABILIDAD
Definición de Probabilidad.-
Es el estudio de fenómenos o experimentos puramente “aleatorios”, o libres de determinación.
Definición Clásica de probabilidad.-
24
Si A es un sub conjunto de , donde el suceso A puede ocurrir de “n” maneras y  puede ocurrir de N
maneras igualmente posibles, entonces la probabilidad de A será:
n Número de elementos de A
P(A) = ---- = -----------------------------------
N Número de elementos de 
Donde 0  P(A)  1
EXPERIMENTO ALEATORIO.-
Es cualquier experimento u operación cuyo resultado no puede predecirse con exactitud antes
de realizar el experimento. (No determinístico) y se puede repetir muchas veces.
Ejemplos de experimento aleatorio :

1: Lanzar una moneda y observar la cara superior .
2: Lanzar dos monedas y observar el resultado
3: Lanzar un dado y observar el número que aparece en la cara superior.
4: Designar un delegado de un grupo de 50 personas
5: De una urna que contiene 3 bolitas rojas, 4 blancas y 2 verdes, se escoge una y se anota
su color.
6: Observar el tiempo de vida de un artefacto eléctrico.
7: De un salón de clase de matemáticas donde hay 7 mujeres y 6 hombres se elige un alumno
al azar y se anota su genero.
ESPACIO MUESTRAL.-
Espacio muestral es el conjunto de todos los resultados posibles de un experimento aleatorio
dado. Comúnmente se denota a este conjunto con .
En la teoría de conjuntos  representa al conjunto Universal
Ejemplos de espacio muestral para un experimento aleatorio dado.
Experimento 1 : 1: Lanzar una moneda y observar la cara superior .

Espacio muestral :  1 = { Cara, Sello } = { C, S }
Experimento 2 : 2: Lanzar dos monedas y observar el resultado

Espacio muestral :  2 = { (CC), (CS), (SC), (SS) }
Experimento 3 : 3: Lanzar un dado y observar el número que aparece en la cara superior.
Espacio muestral :  3 = { 1, 2, 3, 4, 5, 6 }
Experimento 4 : 4: Designar un delegado de un grupo de 50 personas

25
Espacio muestral :  4 = { 1, 2, 3, 4, 5, 6, 7, ..... , 46, 47, 48, 49, 50 }
Experimento 5 : 5: De una urna que contiene 3 bolitas rojas, 4 blancas y 2 verdes, se
escoge una y se anota el color.
Espacio muestral :  5 = { R, R, R, B, B, B, B, V, V }
Experimento 6 : 6: Observar el tiempo de vida de un artefacto eléctrico.

Espacio muestral:  6 = { t  R / t  0 } , donde t: tiempo R: Campo de los números
reales.
Experimento 7 : 7: De un salón de clase de matemáticas donde hay 7 mujeres y 6 hombres

se elige un alumno al azar y se anota su genero.
Espacio muestral :  7 = { M, M, M, M, M, M, M, H, H, H, H, H, H }
SUCESO O EVENTO.-
Suceso es un subconjunto de resultados posibles, en otras palabras suceso es un subconjunto
del espacio muestral . Es decir, Sí A es suceso, entonces A   . Usualmente los sucesos
se denotan con letras mayúsculas, tales como: A,B,C,D, etc.
El suceso que consta de un solo elemento se llama suceso elemental.

El conjunto vacío { } y el conjunto espacio muestral  son considerados sucesos o eventos.
El conjunto vacío { } se le denomina Suceso imposible y  es el suceso Seguro o cierto
Ejemplos de eventos:
Eventos : A = { } (suceso imposible)
B={C} (suceso elemental)
C={ S} (suceso elemental)
D = { C, S } (suceso seguro o cierto)
Nota: El número máximo de eventos que se puede obtener de un espacio muestral es:
2 = 22 = 2 x 2 = 4 = { { } , { C } , { S }, { C, S } }

Eventos :
A= { } (suceso imposible)
B = { (CC) } (suceso elemental)
C = { (CS) } (suceso elemental)
D = { (SC) }
26
E = { (SS) }
F = { (CC), (CS) }
G = { (CC), ( SC) }
H = { (CC), (SS) }
I = { (CS), ( SS) }
J = { (SC), (SS) }
K = { (CC), ( SC) }
L = { (CC), (CS), (SC) }
M = { (CC), ( CS), (SS) }
N = { (CC), ( SC), (SS) }
Ñ = { (CS), ( SC), (SS) }
O = { (CC), ( CS), (SC), (SS) }
(suceso seguro o cierto)
Nota: El número máximo de eventos que se puede obtener de este espacio muestral es:
2 = 24 = 2 x 2 x 2 x 2 = 16 sucesos o eventos
Eventos :
A = { } (suceso imposible)
B = { 1 } (suceso elemental)
C = { 2 } (suceso elemental)
---
---
G = { 1, 2 }
H = { 1, 3 }
---
---
K = { 1, 2, 3 }
---
---
M = { 1, 2, 3, 4 }
---
---
P = { 1, 2, 3, 4, 5 }
---
---
Z = { 1, 2, 3, 4, 5, 6 } (suceso seguro o cierto)
Nota: El número máximo de eventos que se puede obtener de este espacio muestral es:
2 = 26 = 2 x 2 x 2 x 2 x 2 x 2 = 64 sucesos o eventos
EJEMPLOS DE CALCULO DE PROBABILIDAD :
27
Para el experimento 1:
Eventos : A = { } (suceso imposible)

B={C} (suceso elemental)
C={ S} (suceso elemental)
D = { C, S } (suceso seguro o cierto)
a) Calcular la probabilidad de obtener cara

n Número de elementos de B 1
P(B) = ---- = ---------------------------------------- = ------ = 0,5
N Número de elementos de  2
Donde: 0  P(B)  1
b) Calcular la probabilidad de obtener sello
n Número de elementos de C 1
P(C) = ---- = ---------------------------------------- = ------ = 0,5
a) Calcular la probabilidad de obtener cara en las dos monedas ( B={ (CC) } )
n Número de elementos de B 1
P(B) = ---- = ---------------------------------------- = ------ = 0,25
b) Calcular la probabilidad de obtener sello en la primera moneda y cara en la segunda

( D = { (SC) } )
n Número de elementos de D 1
P(D) = ---- = -------------------------------------- = ------ = 0,25
c) Calcular la probabilidad de obtener sello en ambas monedas ( E = { ( SS) } )

28
n Número de elementos de E 1
P(E) = ---- = ---------------------------------------- = ------ = 0,25
d) Obtener mínimo un sello ( Ñ = { (CS), ( SC), (SS) } )

n Número de elementos de Ñ 3
P(Ñ) = ---- = ---------------------------------------- = ------ = 0,75
a) Calcular la probabilidad de obtener como resultado el número 6 ( E = {6} )
n 1
P(E) = ---- = ------ = 0,166
N 6
b) Calcular la probabilidad de obtener como resultado un número menor que 3 ( G={1, 2} )

n 2
P(G) = ---- = ------ = 0,33
N 6
c) Calcular la probabilidad de obtener como resulatdo un número mayor que 2
( R= { 3. 4, 5, 6} ) n 4
P(R) = ---- = ------ = 0,66
N 6
d) Calcular la probabilidad de obtener como resultado un número impar

( W = { 1, 3, 5 } )
n 3
P(W) = ---- = ------ = 0,5
N 6
29
EJERCICIOS PROPUESTOS
Para cada uno de los ejercicios propuestos, determinar el espacio muestral, el evento o suceso
y calcular la respectiva probabilidad.
EJERCICIO 1:
Sea el experimento:
2: Lanzar dos monedas y observar el resultado
a) Calcular la probabilidad de obtener como resultado máximo un sello.
b) Calcular la probabilidad de obtener como resultado más de una cara.
EJERCICIO 2:
Sea el experimento
3: Lanzar un dado y observar el número que aparece en la cara superior.
a) Calcular la probabilidad de obtener como resultado un número par.
b) Calcular la probabilidad de obtener como resultado mayor o igual a 2.
EJERCICIO 3:
Sea el experimento
4: Designar un delegado de un grupo de 50 personas
a) Calcular la probabilidad de que un alumno sea seleccionado como delegado.
EJERCICIO 4:
Sea el experimento
5: De una urna que contiene 3 bolitas rojas, 4 blancas y 2 verdes, se escoge una y se anota su
color.
a) Calcular la probabilidad de obtener una bolita Roja.
b) Calcular la probabilidad de obtener una bolita verde.
c) Calcular la probabilidad de obtener una bolita blanca.
EJERCICIO 5:
Sea el experimento
7: De un salón de clase de matemáticas donde hay 7 mujeres y 6 hombres se elige un alumno
al azar y se anota sexo (genero).
a) Calcular la probabilidad de que el alumno seleccionado sea hombre.
b) Calcular la probabilidad de que el alumno seleccionado sea mujer.
REFERENCIA BIBLIOGRAFICA
R.B. AVILA ACOSTA
“Estadística Elemental” , Nueva Edición, Estudios y Ediciones R.A. Lima - Perú , 2002.
RUFINO MOYA C. – GREGORIO SARAVIA A.
“Teoría de Probabilidad e Inferencia Estadística”, Editorial “San Marcos”, Lima – Perú, 1998.
30
DISTRIBUCIONES DE PROBABILIDAD
Binomial
DISCRETA Poisson
Hipergeométrica
DISTRIBUCIÓN
DE PROBABILIDAD
CONTINUA Normal
t- student
Chi-cuadrado
F
31
DISTRIBUCIÓN NORMAL
3.14159265…….
2.71828……
DISTRIBUCIÓN NORMAL ESTANDARIZADA (z)
32
Ejercicios para usar la tabla de áreas de la Curva Normal Estandarizada
A partir de la Distribución Normal, Graficar el área correspondiente y calcular la probabilidad de un

suceso, cuya variable estandarizada (Z) está comprendida entre los siguientes valores:
1) Entre Z = 0 y Z = 1,3 P (0 ≤ Z ≤ 1,3) =
2) Entre Z = -0,72 y Z = 0 P (-0,72 ≤ Z ≤ 0) =
3) Entre Z = -0,48 y Z = 2,15 P (-0,48 ≤ Z ≤ 2,15) =
4) Entre Z = 0,80 y Z = 1,94 P (0,80 ≤ Z ≤ 1,94) =
5) Entre Z = -2,30 y Z = -0,82 P (-2,30 ≤ Z ≤ -0.82) =
6) A la izquierda o menores de Z = -0,90 P (- ∞ ≤ Z ≤ -0,90) = P (Z ≤ -0,90) =
7) A la derecha o mayor de Z = 1,72 P (1,72 ≤ Z ≤ + ∞) = P (Z ≥ 1,72) =
8) A la derecha de Z = -1,25 o mayor de Z= -1.25 P (Z ≥ -1,25) =
9) Que Z sea menor que –1,96 o mayor que 1,96 P(Z ≤ -1,96 o Z ≥ 1,96) =
10) A la derecha de Z =2,06 y a la izquierda de Z = -1,48 P (Z ≥ 2,06 o Z ≤ -1,48) =
11) En una muestra de estudiantes de Administración, se encuentra que la nota promedio en Estadística
fue 12 puntos, con una desviación estándar igual a 2. ¿Cuál es la probabilidad de que un alumno
elegido al azar tenga nota entre 11 y 14 puntos?.
Supongamos que las notas se distribuyen como una normal.
12) La media de los sueldos de 600 empleados de una universidad es de 4300 soles y la desviación
estándar o típica 400 soles. Suponiendo que los sueldos se distribuyen normalmente, hallar cuántos
empleados tienen sueldos:
a) Entre 3500 y 4500 soles
b)De 5000 y más soles
13) Los puntajes en un examen de selección para seguir estudios superiores están distribuidos
normalmente con media 76 y desviación estándar 15. Se ha establecido que el 15% de los
concursantes, que son los mejores recibirán una beca integral de estudios. Hallar el puntaje mínimo
para ganar la beca.
14) El promedio de las alturas de 800 pacientes de un hospital es de 1.50 m. y la desviación estándar es
0.30 m. asumiendo que las altura están normalmente distribuidas, encontrar cuántos alumnos miden
entre 1.30 m. y 1.70 m.
33
TEORIA DE MUESTREO Y APLICACIONES
1.1. INTRODUCCIÓN
Muestreo es el proceso por el cual se realizan inferencias a la población examinando sólo una parte
de ella. Este proceso es aplicable en nuestra vida personal y pública. Así, una pareja contrae
matrimonio en base a un corto enamoramiento; con un simple grano de arroz el ama de casa
prueba si todo el arroz contenido en la olla está cocido; paladeando el café contenido en una
cucharita se determina la calidad de la marca del café; los dosajes o análisis médicos (de sangre,
de orina, etc..) se realizan en base a nuestras y finalmente una muestra de roca lunar proporciona
información científica sobre el origen de la luna y así diferentes aspectos de la vida, cultura y
ciencia son investigados en base a muestras.
El propósito del muestreo es proporcionar diferentes tipos de información estadística de la

naturaleza cuantitativa y cualitativa del todo mediante el examen o análisis de un poco de unidades
seleccionadas.
Método Muestral: es el procedimiento científico de selección de unidades muestrales, las cuales

proveerán los estimadores requeridos con cierto margen de seguridad, toda vez que son obtenidos
en base a una parte y no del todo.
1.2. CENSO Y MUESTRA

El Censo o enumeración Completa, es una técnica que permite determinar el valor de parámetros
que existen en un conjunto de elementos o unidades en consideración, mediante una revisión de
todos ellos.
Ejemplos:
 En las industrias de transformación de una determinada región geográfica del país y en
un período de tiempo determinado es necesario determinar el valor del parámetro:
Número de obreros y empleados en dicha industria.
 El número medio de miembros por familia en la ciudad de Chimbote en el mes de
Diciembre del 2006.
 El valor total de la producción de harina de pescado de las Fabricas Pesqueras del Perú,
en el año 2006.
 El porcentaje de aportes al Seguro Social no pagados por los empresarios a nivel
nacional y en los últimos cinco años.
Las técnicas de muestreo permiten estimar lo mismos parámetros que aquellos en el caso de un
censo, es decir, permiten obtenerlos aproximadamente a través de una muestra. Si esa muestra se
obtiene de una manera probabilística se le llama muestra PROBABILÍSTICA y al conjunto de estas
técnicas se le denomina TÉCNICAS DE MUESTREO PROBABILÍSTICA.
La Muestra es una pequeña porción ADECUADA y REPRESENTATIVA de la población.
Adecuada (tamaño), quiere decir que debe incluir un número óptimo y mínimo de unidades. Este
número se determina mediante el empleo de fórmulas estadísticas
Representativa (selección) en el sentido de reflejar fielmente las características de la población de

la cual procede y diferir de ella, sólo en el número de unidades incluidas.
Los aspectos referentes a al representatividad o calidad de la muestra, son más importantes que los
referentes a su cantidad y no debe pensarse que la representatividad de la muestra depende de su
cantidad. Si quisiéramos estudiar las características del pueblo peruano y estudiamos solamente a
los habitantes de la Costa, aun que estudiaremos a todos ellos, nuestra muestra no sería todavía
representativa de todo el país.
1.3. VENTAJAS DEL MUESTREO:
El estudio de una muestra tiene ventajas potenciales sobre el Censo, razones por las cuales se le
prefiere. Entre otras tenemos:
1. COSTO REDUCIDO
Una muestra requiere relativamente menores recursos para diseñarla y procesarla
adecuadamente, así, el costo de unidad de observación es alto en comparación con el censo,
pero el costo total de un estudio por muestreo es mucho menor cubierto los mismos ítems de la
encuesta, debido a que los datos se obtienen únicamente de una pequeña fracción del total.
2. MAYOR RAPIDEZ:
Un número pequeño de observaciones pueden recolectarse y procesarse más rápido que un
censo y dar resultados más oportunos.
3. MAYOR ALCANCE:
El muestreo tiene un mayor alcance frente al censo con relación a la variedad de información
dada su flexibilidad, adaptabilidad y posibilidad de estudiar la interrelación de varios factores.
4. MAYOR EXACTITUD
Los datos obtenidos con un censo o una muestra están sujetos a diferentes tipos de errores y
sesgo, la magnitud de los cuales depende del procedimiento particular de estudios. Sin
embargo, si el mismo procedimiento se sigue para la muestra y el censo, la exactitud de una
observación será la misma, pero comparativamente con una pequeña escala de operaciones
un estudio muestral posibilita mayor exactitud por practicarse un mejor staff y dar con
intensidad entrenamiento y mejor equipo a los encuestadores.
5. ÚNICO MÉTODO DE ESTUDIO

Se emplean estudios donde el examen de las unidades implica su destrucción, tales como: El
estudio de la calidad de alimentos envasados, estudio de la calidad de cohetes, granadas y
municiones, etc.
1.4. DESVENTAJAS DEL MUESTREO

1. Cuando se requiere información básica para cada unidad, obviamente, tiene que realizarse un
censo.
2. El error debido a muestreo tiende a ser alto en áreas administrativas pequeñas y de gran
variabilidad. Como las observaciones en la población son muy variables, las muestras que se
pueden seleccionar difieren una de otras y como se estudia una sola muestra para generalizar
a la población, los resultados serán diferentes según la muestra que hayamos escogido. Esta
diferencia entre el valor dado por la muestra y el verdadero valor poblacional, constituye el error
por muestreo; el cual puede medirse estadísticamente y en cierto modo disminuirse a voluntad
aumentando el tamaño de muestra.
3. En algunos estudios de tabulaciones cruzadas donde el número de observaciones muestrales

que caen en una cierta celda son muy pequeños y no satisfacen los requerimientos de ciertas
pruebas.
1.5. RELACIÓN ENTRE MUESTRA Y CENSO

Muestra y Censo en general no son competitivos; en muchos casos son complementarios.
En operaciones tales como: prueba de procedimientos censales, ordenamiento de ítems,

evaluación y control de datos procesados, adelanto de tabulaciones de variables seleccionadas o
ampliación de análisis de variables, se aplica el muestreo como parte integral de un censo.
1.6. DEFINICION DE TERMINOS:
UNIDAD DE ANALISIS, es la unidad para la cual se realiza el análisis. En una encuesta de
presupuesto familiares, la unidad de análisis puede ser la familia o las familias de un cierto nivel
de ingresos. La unidad de análisis se denomina frecuentemente como elemento de la población.
POBLACIÓN, Es el conjunto de todas las unidades de análisis cuyas características se van a

estimar. La población debe definirse en términos de su contenido, extensión y tiempo. Es el
conjunto de elementos que determinan la cobertura de un estudio.
Ejemplo: Se trata de diseñar una encuesta sobre el consumo familiar en el distrito de Nuevo
Chimbote y en el presente año, tenemos:
Unidad de Análisis: Familias

Contenido: Personas
Extensión: Distrito de Nuevo Chimbote
Tiempo: Año 2007
Como la población en estudio debe estar definida sin ambigüedad, de manera que no de lugar a
confusiones, es necesario aclarar qué entendemos como familia en este estudio: “todas las
personas que comparten un mismo presupuesto familiar”. Así, nuestra población será: las
familias del distrito de Nuevo Chimbote en el año 2006; considerando como familia todas las
personas que comparten un mismo presupuesto familiar.
MARCO MUESTRAL.
Es el documento material (lista, fichero, etc) donde se consigna individualmente las unidades o
elementos de muestreo, de tal forma que se pueda sortear de allí las unidades que constituirán
la muestra. Este documento es indispensable, al menos cuando se trata de realizar un muestreo
probabilístico. El marco muestral debe estar perfectamente actualizado, sin omisiones ni
duplicaciones. Ejemplos:
 Para los Ciudadanos.- los requisitos electorales, es decir de personas mayores de 18 años
de edad y no privados de sus derechos políticos electorales. Pero es preciso no olvidar que
algunas personas en edad electoral o que acaban de llegar a ella, descuidan su inscripción,
además muchos electores olvidan notificar su cambio de residencia, salvo el año que están
previstas las elecciones.
 Para Hogares y Viviendas.- las células de vivienda implementadas en el último Censo,

constituyen un marco de la muestra utilizado por el INE para las unidades hogares y
viviendas. Este marco establecido en una fecha dada pierde su valor a medida que el tiempo
transcurre, por eso conviene tenerlo al día en la medida de lo posible.
 Para las Empresas y Establecimiento Industriales.-El mejor marco para la muestra a este
respecto, lo da el registro que lleva el instituto Nacional de Seguridad Social. Cada
establecimiento está allí caracterizado además por su razón social, dirección, actividad
económica y número de personal asalariado, lo que permite estratificar la población de los
establecimientos según estos dos últimos criterios esenciales.
 Para Muestreo Por Áreas.- El marco de la muestra es en este caso el mapa geográfico del
País o fotografías aéreas y la unidad de muestreo es un área delimitada sobre ese mapa o
plano. Evidentemente interesa poseer un mapa recientemente y a gran escala, en el que
figuren el máximo de detalles que permiten reconocer sobre el terreno las áreas muestrales.
PLAN MUESTRAL Conjunto de reglas o especificaciones para seleccionar una muestra.

DISEÑO MUESTRAL Comprende el método de selección y estimación, el cual debe ser indicado
en todo estudio muestral.
1.7. MÉTODOS MUESTRALES
A.- MUESTREO NO PROBABILISTICO

Es un proceso por el cual no se puede asignar objetivamente probabilidades a los elementos
seleccionados y por consiguiente no se puede determinar la precisión de los resultados
muestrales en términos de probabilidad.
MUESTREO A DE CRITERIO (DE EXPERTOS):

Es un proceso por el cual la selección depende del “juicio humano”, y no de la rigurosa aplicación
de la teoría de la probabilidades. La representatividad de una muestra obtenida por este método
queda abierta a la duda; no es probable que los expertos se pongan de acuerdo acerca de lo que
debe incluir una muestra representativa.
Hay ocasiones, sin embargo, en que las muestras de criterio o juicio son útiles. Por ejemplo, un
experto puede coger una muestra de arroz de la parte superior de un montón, para examinar su
calidad. Puede ser físicamente imposible seleccionar una muestra al azar o probabilística
tomándola de dentro del montón. Sin embargo, por experiencia el experto puede conocer ciertos
hechos relacionados con el arroz; tal vez, que éste generalmente es uniforme en calidad. En este
caso, una muestra del montón, puede ser suficiente para obtener la información necesaria acerca
del arroz.
Se utiliza mayormente para estudios cualitativos y exploratorios.
MUESTREO POR CUOTAS:

Es una forma de muestreo “a juicio” en que los sesgos que surgen del método no probabilístico de
selección se controlan hasta cierto punto por la estratificación y establecimiento de cuotas a cada
estrato.
Se divide la población en grupos o estratos, según las exigencias del estudio, generalmente edad,
sexo y clase social, aunque pueden utilizarse otras clasificaciones. Demasiados estratos hacen el
estudio difícil y costoso. Los que tienen a cargo el estudio determinan las cuotas a los
entrevistadores se les señalan los sitios específicos para buscar a sus informantes. La selección
de éstos, corre por cuenta de los entrevistadores y esto puede causar sesgo cuyas consecuencias
“no pueden medirse objetivamente”.
Al establecer una muestra por cuotas debe procurarse la distribución de los diversos grupos según
la proporción de su importancia en el conjunto de la población. Esto significa que debe estudiarse
la población y analizarla teniendo en cuenta que las clasificaciones abarquen las características
básicas, útiles para los propósitos del estudio. Para esto los encargados del estudio, deben
valerse de datos publicados como censos oficiales de población, y producción.
La rapidez, la economía y simplicidad administrativa son las ventajas de este tipo de muestreo.
CUESTIONARIO POR CORREO:

Se emplea por ser de bajo costo y fácil administración. La principal objeción a este muestreo es el
sesgo causado por el no retorno de cuestionarios; para superarlo se propone:
i) Combinar el cuestionario por correo con la entrevista personal.
ii) Exceder el número esperado de cuestionarios que retornan,
En los estudios de opinión y de mercado aún se emplean estos tipos de muestreo, aunque su uso
tiende a disminuir por sus imprecisiones.
LA MUESTRA DE SUJETOS VOLUNTARIOS:

Son frecuentes en ciencias sociales y ciencias de la conducta. Se trata de muestras fortuitas,
utilizadas también en la medicina y la arqueología, donde el investigador elabora conclusiones
sobre especimenes que llegan a sus manos de forma casual. Pensemos, por ejemplo, en los
sujetos que voluntariamente acceden a participar en un estudio que monitorea los efectos de un
medicamento, o en el investigador que anuncia en una clase que está haciendo un estudio sobre
motivación en el universitario e invita a aquellos que acepten someterse a una prueba. En estos
casos, la elección de los individuos que serán sujetos a análisis depende de circunstancias
fortuitas.
Este tipo de muestras se usa en estudios de laboratorio donde se procura que los sujetos sean
homogéneos en variables tales como edad, sexos o inteligencia, de manera que los resultados o
efectos no obedezcan a diferencias individuales, sino a las condiciones a las que fueron sometidos.
MUESTRAS CUALITATIVAS
Muestra variada
Documentar diversidad para buscar diferencias y coincidencias, patrones y particularidades.
Muestra homogénea
Enfocarse en el tema a investigar. Enfatizar situaciones, proceso o episodios en un grupo
social.
Muestra en cadena o por redes
Se identifican casos de gente que conoce otra gente que dará riqueza de información.
Muestra dirigida por teoría o muestra por criterios
Se selecciona los sujetos o al grupo social, porque tiene uno o varios atributos que ayudan a ir
desarrollando una teoría.
Casos típicos
Individuos, sistemas u organizaciones que poseen claramente las situaciones que se analizan
o estudian.
MUESTRAS NO PROBALILISTICAS SEGÚN DIFERENTES AUTORES

CRISTOBAL EXEBIO
MUESTREO A CRITERIO
MUESTREO POR CUOTAS
CUESTIONARIO POR CORREO
HUGO SANCHEZ CARLESSI - CARLOS REYES MEZ

MUESTREO INTENCIONAL, INTENCIONADO O CRITERIAL
MUESTREO SIN NORMAS O CIRCUNSTACIAL
ROBERTO HERNADEZ S. – CARLOS FERNANDEZ C. – PILAR BAPTISTA LUCIO

MUESTRA DE SUJETOS VOLUNTARIOS
LA MUESTRA DE EXPERTOS
LOS SUJETOS-TIPO
LA MUESTRA POR CUOTAS
MUESTRAS CUALITATIVAS
B.- MUESTREO PROBABILISTICO

Es un proceso muestral donde cada elemento de la población tiene una probabilidad perfectamente
conocida de ser incluida en la muestra; solo una muestra probabilística proporciona estimaciones
con medida de su precisión.
MUESTREO ALEATORIO SIMPLE:

Es un procedimiento de selección de una muestra por el cual todos y cada uno de los elementos de
la población tienen una oportunidad igual e independiente de ser incluidos en la muestra. Además,
si se toma la muestra de tamaño n, cualquier muestra posible en n elementos tiene la misma
probabilidad de ser extraída que cualquier otra combinación de n elementos, ya sea que la muestra
se seleccione con o sin reposición.
Una muestra aleatoria simple se extrae por selección aleatoria empleando los números aleatorios o
colocando los elementos de la población numerados del 1 a N en una urna y mezclándolos
perfectamente. Si se usa la urna y se sacan “n” números en sucesión. Las unidades que llevan
estos números constituyen la muestra, En cualquier etapa del proceso de obtención de la muestra,
este proceso ofrece la oportunidad de que todos los elementos que no han sido sacados
previamente tengan igual probabilidad de selección. Los procedimientos aleatorios evitan la
preferencia o inclinación a incluir en la muestra, determinadas observaciones que son de
conveniencia.
Este tipo de muestreo es eficiente si la población no es grande y heterogénea, así es relativamente

fácil y barato seleccionar las unidades muestrales. El inconveniente en poblaciones grandes es la
enumeración de todos sus elementos.
MUESTREO ALEATORIO ESTRATIFICADO

Es un método que trata de diseñar una muestra más eficiente que la que se obtiene por un
procedimiento aleatorio simple. El proceso de estratificación requiere que la población este dividida
en grupos homogéneos (Sub población) o clases llamados estratos. Se toma luego una muestra de
cada estrato por el método aleatorio simple; la muestra que resulta se denomina Muestra
Estratificada.
Una muestra estratificada puede ser proporcional al tamaño de los estratos u óptima donde en la
representación de la muestra se considera la variedad y tamaño de cada estrato y/o costo en cada
uno de ellos.
MUESTREO SISTEMÁTICO
Es el procedimiento de selección del K-ésimo elemento de la población con un comienzo aleatorio.
Si se desea extraer una muestra del 5%=5/100=1/20 de la población, seleccionamos
aleatoriamente un número entre 1 y 20, supongamos que el número seleccionado es 12, entonces
la 12ava, 32ava, 52ava, etc unidades de la población constituirían la muestra sistemática. Este
método es muy usual por su simplicidad y se prefiere frente al muestreo estratificado si la población
puede ponerse fácilmente en una disposición ordenada.
Con el muestreo sistemático se logra mayor eficiencia si las unidades que se hallan próximas
tienen mayor uniformidad que las unidades que se encuentran alejadas entre sí.
También lo empleamos para seleccionar los elementos que serán los que conformarán la muestra,
cuando el tamaño (n) de la muestra ya ha sido calculado con otro tipo de muestreo...
Ejemplo: Si la tenemos una población de N=1548 y una muestra de n=547, entonces

seleccionamos un intervalo K, donde:
K = N/n = 1548 /547 = 2.83 = 3 (por redondeo)
Entonces la selección sistemática de elementos maestrales será 1/K (1/3), es decir, tomaremos 1
elemento de cada 3. Se selecciona al azar el inicio (puede tener 3 cifras), supongamos que el
número seleccionado sea el 112, entonces, tomaremos el 112, el 115, el 118, el 121, etc. y
volvemos a empezar por los primeros números si es necesario, hasta completar los 547 unidades
que conformarán la muestra.
MUESTREO AGRUPADO O DE CONGLOMERADOS (DE RACIMOS).

Se refiere al procedimiento de dividir a la población en grupos o conglomerados de unidades y se
extrae una muestra de conglomerados que representan a la población. Cuando se observan todas
las unidades elementales en las agrupaciones muestrales, tenemos lo que se conoce como
muestreo MONOETAPICO. Cunado se extrae una muestra de las unidades elementales de las
agrupaciones, tenemos el Llamado muestreo BIETAPICO. En ambos procedimientos se selecciona
una muestra aleatoria. Por ejemplo: podemos seleccionar facultades=unidades primarias como la
1era etapa, luego extrae secciones como 2da etapa y elegir a los estudiantes como tercera y última
etapa.
Cuando este muestreo se realiza por etapas, también se le puede conocer como muestreo
probabilístico por racimos.
Ejemplo:
Problema:
Una compañía de televisión necesita saber con precisión, con la finalidad de planear sus
estrategias, en que momento los adultos de los distritos de Chimbote y Nuevo Chimbote de
1’200,00 habitantes, es decir, qué tanto televisión ven, a qué horas, qué contenidos prefieren y sus
opiniones con respecto a los programas noticiosos.
Procedimiento:
Se diseñará un cuestionario que indague estas áreas sobre el uso de la televisión. Los
cuestionarios se aplicarán por entrevistadores a una muestra de sujetos adultos.
Población:
Todos aquellos sujetos hombres y mujeres de más de 18 años de edad, y que vivan en una casa o
un departamento propio o rentado de los distritos de Chimbote y Nuevo Chimbote.
Se recurre entonces a la estrategia de seleccionar racimos y se considera el uso de un mapa

actualizado de los distritos en mención, el cual indica que en dicha ciudad hay 5,000 cuadras.
Las cuadras se utilizarán como racimos, es decir, como unidades maestrales, a partir de las cuales obtendremos en última instancia a nuestros sujetos adultos
mayores de 18 años.
ESTRATOS O Nº DE CUADRAS EN Nº DE CUADRAS EN LA Nº TOTAL DE HOGARES POR

CONGLOMERADOS CADA UNO MUESTRA ESTRATO O
SELECCIONADOS DE LOS ESTRATOS CORRESPONDIENTE A CONGLOMERADOS
PARA EL ESTUDIO O CADA ESTRATO O CONSIDERADOS PARA EL
CONGLOMERADOS CONGLOMERADO ESTUDIO
I 270 50 1000
II 1940 353 7060
III 2000 363 7220
IV 790 143 2860
N = 5000 n = 909 11840
Se pueden emplear dos o tres tipos de muestreos probabilísticos para obtener el tamaño de
muestra y para seleccionar las unidades para el estudio.
FORMULAS PARA CALCULAR EL TAMAÑO DE MUESTRA PARA
ESTIMAR UNA MEDIA O PROMEDIO
Z 2S 2
(1) n  Para cuando no se conoce el tamaño de la población
E2
NZ 2 S 2
(2) n Para cuando se conoce el tamaño de la población.
 N  1 E 2  Z 2 S 2
Donde:
Z : Puntaje Z correspondiente al nivel de confianza considerado (para 99% de
confianza Z=2.58, para 95% de confianza Z= 1.96, para 90% de confianza Z=
1.65).
N : Total de elementos de la población en estudio
E : Error permitido (precisión)
S2 : Varianza de la población o su estimación.
n : tamaño de muestra a ser estudiada
FORMULAS PARA CALCULAR EL TAMAÑO DE MUESTRA PARA

ESTIMAR UNA PROPORCIÓN O PORCENTAJE
Z 2 PQ
(1) n  Para cuando no se conoce el tamaño de la población
E2
NZ 2 PQ
(2) n
 N  1 E 2  Z 2 PQ Para cuando se conoce el tamaño de la población
Donde:
Z : Puntaje Z correspondiente al nivel de confianza considerado (para 99% de
confianza Z=2.58, para 95% de confianza Z= 1.96, para 90% de confianza Z=
1.65) (También se llama coeficiente de confiabilidad).
N : Total de elementos de la población en estudio
E : Error permitido (precisión)
n : tamaño de muestra a ser estudiada
P : Proporción de unidades que poseen cierto atributo.
Q : Q =1-P (si no se tiene P, se puede considerar P=0.50=Q
Ejemplo 1:
Queremos hacer un estudio para estimar el ingreso medio de las familias del distrito de Nuevo
Chimbote, para esto decidimos hacerlo con un nivel de confianza del 95%. Y deseamos también que
la estimación se encuentre por lo menos en S/20 nuevos soles alejados del ingreso medio
poblacional. ¿qué tamaño debe tener la muestra?. Tenemos información que la desviación estándar
de los ingresos en dicho distrito es de S/140.
Z = 1.96 para un nivel de confianza del 95%

E = 20
2 = 1402
(1.96)2 (140)2
entonces n = ---------------- = 188.24 entonces hacemos n= 189
(20)2
Ejemplo 2:
Si en el ejercicio anterior tenemos que en el distrito de Nuevo Chimbote tiene 600 familias, entonces
se puede aplicar la fórmula para muestras finitas.
1.96 2.140 2.600
n
20 2 (599)  1.96 2.140 2
 143.46 n = 144
Ejemplo 3:
Un especialista en mercadotecnia desea calcular el tamaño de la muestra de hogares que va ha tomar
del distrito de Coishco para determinar en qué proporción de hogares por lo menos uno de sus
miembros ve un programa determinado de televisión. En esta comunidad hay en total 500 hogares. El
analista desea que su estimación esté a 0.04 de la proporción verdadera, con un 90% de confianza. En
una muestra piloto de 15 hogares, el 35% de los entrevistados indicaron que alguien de su casa veía
regularmente dicho programa. Con base a esta información podemos calcular la muestra
1.652 (0.35) (0.65) (500)

n = ----------------------------------------------- = 217.68 n= 218
0.042 (500 -1) + 1.652 (0.35) (0.65)
Ejemplo 4:
Un economista desea hacer un estudio sobre los profesores de las Universidades de Chimbote en
referencia a cantidad de dinero por semana que cada profesor dedica a la alimentación de su familia.
Para ello acude a los niveles administrativos correspondientes, a fin de conseguir un listado de los
2,000 profesores que trabajan en estas universidades. Los niveles administrativos superiores también
tienen necesidad de obtener alguna información entre los profesores y se ponen de acuerdo para
aprovechar esa encuesta y para introducir 51 preguntas adicionales.
Una vez que el economista tiene estructurado el cuestionario, le pide a un estadístico que le estime el
tamaño de muestra apropiado para el estudio. Indicar el procedimiento y determinar el tamaño de
muestra apropiado.
1.- El estadístico interroga a los encargados del estudio sobre cuál es la pregunta más importante
en el estudio, a lo cual responden que todas por igual.
2. El estadístico vuelve a hacer la misma pregunta formulada de una y otra manera y al final el grupo
llegó a la conclusión de que las preguntas verdaderamente importantes son las 7 primeras.
3. Con la información obtenida, analiza el cuestionario, fórmula más preguntas y llega a las
siguientes conclusiones:
Con la primera pregunta se trata de estimar una media
Con la segunda pregunta, también se trata de estimar una media.
Con la 3era, 4ta, 5ta, 6ta y 7ma se trata de estimar un porcentaje o proporción.
4. Determinar la precisión con que se desea cada estimación. El economista dice que la media
que a él le interesa debe encontrarse en alrededor de 1,000 soles ya que la mayoría de los
maestros son casados, entre 30 y 50 años de edad y el nivel de sueldos de las Universidades
de Chimbote es regular. Además añade que él ha hecho algunas sondeos que arrojan
resultados congruentes con sus supuestos. Con estos datos el estadístico estima gruesamente
una varianza de 50,000 y como se pide un error del 5% y una confianza del 95%, se obtiene:
5.- Tamaño de muestra:

E = 5% (1,000) = 50
Z = 2 (aproximadamente) (el valor de Z es 1.96, pero para abreviar cálculos se usa 2)
S2 = 50,000
2 2 (50,000)
n0   80
50 2
Similarmente para la media de la pregunta 2 se obtiene una muestra de tamaño 98.

Al preguntar sobre el porcentaje de la pregunta 3, le indican que éste debe encontrarse entre
30% y 60% y que la desean estimar con un 5% de error y un 95% de confianza. Luego;
Z 2 PQ 2 2 (0.50)(0.50)
n0    400
E2 52
De la misma manera se trabaja el resto de porcentaje hasta obtener los resultados siguientes:
Pregunta : 1 2 3 4 5 6 7
Tamaño de Muestrea : 80 98 334 300 200 200 400
Se concluye que el tamaño de muestra a usar es de 400.
Nota.- en este ejemplo se trata de ilustrar la situación usual en muchas encuestas, donde se incluyen
cada vez mayor número de preguntas.
TAR EA
DETERMINACION DE LA MUESTRA: TÉCNICA DEL MUESTREO PROBABILÍSTICO
TIPO DE MUESTREO BIETAPICO: MUESTREO ESTRATIFICADO (PRIMERA ETAPA), Y
MUESTREO ALEATORIO SISTEMÁTICO (SEGUNDA ETAPA)
Alumnos matriculados según carrera profesional y ciclos, Semestre 2013-II
ESCUELA Población Muestra

PROFESIONAL Ni ni
Medicina N1 = 353 n1 =
Ingeniería Civil N2 = 247 n2 =
Ingeniería Sistemas N3 = 580 n3 =
Derecho N4= 1152 n4 =
Contabilidad N5 = 562 n5 =
Administración N6 = 292 n6 =
TOTAL N = 3186 n=
Muestra:
NZ 2 PQ
n
 N  1 E 2  Z 2 PQ
Distribución proporcional
Ni
ni  xn
N
Ing.
Ciclos Medicina Ing. Civil Sistemas Derecho Contabilidad Administración
Ni ni Ni ni Ni ni Ni ni Ni ni Ni ni
I 18 40 123 77 67 58
II 75 29 69 141 42 43
III 44 41 72 75 37 25
IV 53 22 46 154 61 38
V 28 17 38 90 64 14
VI 22 27 83 127 58 35
VII 21 19 50 98 38 19
VIII 19 17 47 110 57 24
IX 14 21 21 80 48 12
X 16 14 31 64 90 24
XI 11 41
XII 15 95
XIII 17
Total 353 n1= 247 n2= 580 n3= 1152 n4= 562 n5= 292 n6=
N: Total de la población (Alumnos matriculados en el semestre 2013-II )

P: Proporción asumida de sujetos (Alumnos) con opinión favorable acerca de…
Q: Proporción asumida de sujetos (Alumnos) con opinión no favorable acerca de…
: Nivel de confianza para determinar el tamaño de muestra (asumido). Ej. 1-0,05= 0,95
Z: Valor de la distribución normal, depende del nivel de confianza al determinar “n”. Ej. 1,96
E: Precisión en la estimación del parámetro poblacional, en base a la muestra a seleccionar. Ej. 0,03
DISTRIBUCIÓN DE DOCENTES SEGÚN FACULTAD Y CONDICIÓN ACADÉMICA,
SEMESTRE 2013-II
Población Muestra
FACULTAD Ni ni
Educación N1 = 68 n1 =
Ingeniería N2 = 57 n2 =
Derecho N3 = 68 n3 =
CC. CC. Y ADM. N4 = 39 n4 =
CC. DE LA SALUD N5 = 38 n5 =
TOTAL N = 270 n=
Muestra:
NZ 2 PQ
n
 N  1 E 2  Z 2 PQ
Distribución proporcional
Ni
ni  xn
N
Condición Educación Ingeniería Derecho CC. CC y Adm CC. de la Salud

Académica Ni ni Ni ni Ni ni Ni ni Ni ni
Nombrado 5 17 8 15 9
Contratado 63 40 60 24 29
Total 68 n1= 57 n2= 68 n3= 39 n4 = 38 n5 =
N: Total de la población (Docentes Semestre 2013-II)

P: Proporción asumida de sujetos (Docentes) con opinión favorable acerca de…
Q: Proporción asumida de sujetos (Docentes) con opinión no favorable acerca de…
: Nivel de confianza para determinar el tamaño de muestra (asumido). Ej. 1-0,05= 0,95
Z: Valor de la distribución normal, depende del nivel de confianza al determinar “n”. Ej. 1,96
E: Precisión en la estimación del parámetro poblacional, en base a la muestra a seleccionar. Ej. 0,07
ESTIMACIÓN PUNTUAL E INTERVÁLICA
PRUEBA DE HIPOTESIS
Las hipótesis son afirmaciones o conjeturas respecto al problema planteado. Tales

afirmaciones pueden ser verdaderas o falsas, por lo que se requiere de una comprobación
en base a un conjunto de datos muestrales para determinar si los resultado afirman o
contradicen tal suposición con cierta probabilidad pre establecida.
El procedimiento a seguir en una prueba de hipótesis es :
a) Formular las hipótesis estadísticas.- Se refiere a la formulación de la hipótesis nula ( H o) y
de la alternativa ( H1)
Ho : No existe diferencia significativa (efecto nulo)
H1 : Si existe diferencia significativa (efecto no nulo).
b) Fijar el nivel de significación (  ) .- Probabilidad de rechazar la hipótesis nula ( H o)
cuando realmente es cierta.
c) Función pivotal o función de prueba ( estadística de prueba ) .- Es la fórmula asociada a
cada tipo de hipótesis en prueba y nos permite obtener el valor experimental.
d) Valor tabular.- Es un valor obtenido de tablas estadísticas de acuerdo a la distribución de
la estadística de prueba. Generalmente se usa la prueba t, z, 2, F.
e) Decisión .-
- Rechazar Ho si el valor experimental es mayor al valor tabular ( p <  ), (valor
sugerido de  es de 0.05).
- No rechazar Ho si el valor experimental es menor o igual al valor tabular. (p >  )
PRUEBA DE HIPOTESIS PARA LA MEDIA DE UNA SOLA POBLACIÓN
a) Formulación de Hipótesis.
Ho :  = 0
H1 :   0
 : Puntaje promedio poblacional

0 : Puntaje promedio hipotético
b) Nivel de significación o probabilidad de equivocarse (error tipo I)

 = 0,05
c) Estadística de prueba
x  0
t 
DE
n
donde :
1  n 2 2

DE   x i  n x 
(n -1)  i 1 
DE = Desviación estándar
d) Valor tabular
t tab  t (n-1 
; 1 - 2 )
e) Decisión
Rechazar Ho si p < 0.05 ó p < 0.01

No rechazar Ho si p > 0.05
Criterios de decisión :
Si p < 0.05, Existe diferencia estadísticamente significativa
entre el puntaje promedio real y el valor supuesto.
Si p < 0.01, Existe diferencia altamente significativa entre el
puntaje promedio real y el valor supuesto.
Si p > 0.05, No existe diferencia estadísticamente significativa
entre el puntaje promedio real y el valor supuesto.
Ejemplo :
Un empresario está interesado en averiguar si el sueldo promedio de los trabajadores de
cierta empresa es de 420 dólares como el respectivo de la empresa que el regenta. Para
realizar tal averiguación se seleccionó una muestra aleatoria de 20 de los sueldos de
dichos trabajadores y se encontró un sueldo promedio de 430 dólares con una desviación
estándar de 100 dólares. ¿Existe evidencia suficiente para afirmar que el sueldo promedio
es de 420 dólares?
a) Formulación de Ho y Ha .
Ho :  = 420
Ha :   420
b)  = 0.05
-
x  420
t   t (19)
S
n
430  420
t   0.45 , p  0.657
100
20
d) Decisión
Como p > 0.05 no se rechaza la hipótesis nula, por tanto no existe evidencia suficiente
para poder afirmar que el sueldo promedio es diferente de 420 dólares.
PRUEBA DE HIPOTESIS PARA LA DIFERENCIA ENTRE LAS MEDIAS DE DOS POBLACIONES
INDEPENDIENTES
Ho : 1 = 2
H1 : 1  2
1 : Puntaje promedio del grupo 1

2 : Puntaje promedio del grupo 2
b) Nivel de significación o probabilidad de equivocarse (error tipo I)
 = 0,05
x  x
t
1 2

 
 1 1 
(DE)  2
 
 n1 n
2 
 
donde :
2 2
(n 1 - 1)S1  (n 2 - 1 )S2
( DE ) 2 
n 1  n2 - 2
d) Valor de p
p: Es la probabilidad que hay del valor t calculado hacia la derecha
e) Decisión
No rechazar Ho si ( p > 0.05 )
Si p < 0.05, Existe diferencia estadísticamente significativa entre
los puntajes promedio de los 2 grupos de estudio.
Si p < 0.01, Existe diferencia estadística altamente significativa

entre los puntajes promedio de los 2 grupos de
estudio
entre los puntajes promedio de los 2 grupos de estudio
Ejemplo
Treinta empleados de una gran empresa fueron distribuidos en dos grupos iguales a dos
diferentes programas de capacitación industrial. El grupo I fue capacitado con el Método
A, que consiste en adiestrarlos directamente en la maquinaria y el grupo II con el Método
B, con la atención personal de un instructor. Los puntajes obtenidos después de la
capacitación en una prueba apropiada fueron :
Método A Método B
Media ( x ) 78 70
Desviació estándar (S) 6 4
N 15 15
¿ Proporcionan estos datos evidencia suficiente que el método A es diferente que el

método B?.
Solución
Ho : 1 = 2
H1 : 1  2
c) Nivel de significación :
 = 0,05
78 - 70
t0 
 1 1 
(26)  = 4,30
 
 15 15 
(15 - 1)62  (15 - 1)42

( DE ) 2  = 26
15  15 - 2
d) Valor de p
p = 0.0002
e) Decisión
Como p < 0.01, se rechaza Ho. Por tanto existe diferencia estadísticamente
significativa en los dos métodos de capacitación.
PRUEBA DE HIPOTESIS PARA LA DIFERENCIA ENTRE LAS MEDIAS DE DOS POBLACIONES

CORRELACIONADAS
Debe usarse cuando se desea comparar 2 tratamientos y las unidades en estudio son
heterogéneas pero es factible conformar parejas homogéneas o gemelas, Ejm. Cuando se
desea comparar :
- 2 tipos de cueros de zapatos en diferentes individuos.
- 2 marcas de termómetros en diferentes ambientes.
- Efectividad de una técnica de ventas (antes y después de la aplicación de la técnica ).
- 2 tipos de alimentación en cerdos de diferentes camadas.
Prueba de hipótesis :
a) Hipótesis estadísticas
Ho : 1 = 2
H1 : 1 ≠ 2
b) Nivel de significación
 = 0.05
Prueba
d n d i  X1i  X 2i
tc  ,
Sd
n
 di
d  i 1
n
n 2
 (d i  d)
Sd2  i 1
n -1
d) Valor de p
e) Decisión
No rechazar Ho si ( p > 0.05 )
Si p < 0.05, Existe diferencia estadísticamente significativa
estudio.
Si p < 0.01, Existe diferencia estadística altamente
significativa entre los puntajes promedio de
los 2 grupos de estudio
estudio
Ejemplo:
Se llevó a cabo un experimento para probar el efecto de dos medicamentos distintos sobre el
tiempo de coagulación de la sangre (en minutos). Se extrajeron muestras de sangre de 10
personas y se dividieron igualmente en dos partes que se asignaron al azar a uno de los dos
medicamentos. Los resultados fueron los siguientes:
Persona X1 X2 Dif.
1 1.5 1.6 -0.1
2 1.4 1.4 0.0
3 1.8 1.6 0.2
4 1.3 1.2 0.1
5 2.0 2.1 -0.1
6 1.1 1.0 0.1
7 1.5 1.6 -0.1
8 1.5 1.5 0.0
9 1.2 1.0 0.2
10 1.5 1.6 -0.1
¿Proporciona evidencia de diferencia entre el efecto de ambos medicamentos sobre el tiempo de

coagulación de la sangre. Use α=0.05?
Solución
a) Hipótesis
H0 : 1 = 2 ó H0 : d = 0
H1 : 1  2 H1 : d  0
b)  = 0,05
c) Prueba
d 0,0220
t  
S 0,12273/ 10
d
0,0220
  0.567
0,03881
d) Valor tabular
t = t (9; 0.975) = 2,26 p = 0.5846
e) Decisión
No se puede rechazar H0 puesto que p > 0.05
donde :
d = X 1 - X2
d = 0,022
S2 = 0,12273
n = 10
 No existe diferencia estadísticamente significativa entre el efecto de los dos medicamentos en
el tiempo de coagulación de la sangre.
Ejercicio:
En un experimento con 18 pollos agrupados en parejas sumamente homogéneas de un día de nacidos se

probaron 2 hormonas sexuales, la hormona A y la hormona B. Los efectos se estimaron pesando las crestas
después de 9días. Los resultados se dan a continuación
A 57 120 101 137 119 117 104 73 53

B 89 60 82 50 39 22 57 32 96
a) Realice la hipótesis conveniente. Use =0.05

b) Justifique el método empleado e interprete sus resultados.
PRUEBA DE HIPÓTESIS DE COMPARACIÓN DE MEDIAS EN t

GRUPOS DE ESTUDIO INDEPENDIENTES
La técnica que se aplica cuando se desea comparar promedios de t grupos (poblaciones)
cuando se ajustan a una distribución normal y presentan homogeneidad de varianzas es
llamada “Análisis de Varianza”. Los datos ordenados pueden representarse simbólicamente
de la siguiente manera :
Grupos de estudio
1 2 3 . . . t
X11 X21 X31 . . . Xt1

X12 X22 X32 . . . Xt2
X13 X23 X33 . . . Xt3
. . . . . . .
. . . . . . .
. . . . . . .
X1. X2. X3. . . . Xt.
a) Hipótesis
H0 : 1 = 2 = 3 = . . . = t
H1 : Al menos 1 promedio es diferente
b) Nivel de significación
c) Función de prueba
CMT
F  F= CMT/CME
CME
d) Valor de la probabilidad a la derecha de F calculado en c)
e) Decisión
No rechazar Ho si p > 0.05
Con paquete estadístico:
- Si p < 0.05, Existe diferencia estadísticamente significativa entre los puntajes promedio de
los t grupos de estudio (Al menos 1 es diferente)
- Si p < 0.01, Existe diferencia altamente significativa entre los puntajes promedio de
los t grupos de estudio (Al menos 1 es diferente)
- Si p>0.05, No existe diferencia significativa entre los puntajes promedio de los t grupos de
estudio.
La tabla de análisis de varianza se muestra a continuación:
Tabla ANVA
Fuente Variación Gl SC CM F
Tratamientos t–1 txx CMT CMT/CME F(t –1 , v)
Error Experim. n–t=v Exx CME
Total n-1 Wxx
donde :
2 X2
 Xi . ..
T  
xx t N
E W - T
xx xx xx
X2
W    Xij2  .. , CMT = SC/gl
xx N
Ejemplo :
En un estudio del efecto de la glucosa sobre la liberación de insulina, se trataron muestras de
tejio pancrático de animales de laboratorio con cinco estimulantes distintos. Posteriormente,
se determinó la cantidad de insulina liberada. Los resultados referentes a la insulina liberada
se muestran en la tabla a continuación. El experimentador deseaba saber si existe diferencia
significativa entre las cinco poblaciones con respecto a la cantidad media de insulina liberada.
Estimulante
A B C D E
1.53 3.15 3.89 8.18 5.86
1.61 3.96 3.68 5.64 5.46
3.75 3.59 5.70 7.36 5.69
2.89 1.89 5.62 5.33 6.49
3.26 1.45 5.79 8.82 7.81
1.56 5.33 5.26 9.03
7.10 7.49
8.98
Xi. 13.04 15.60 30.01 47.69 56.81 163.15
Xi 2.6080 2.8080 4.3733 6.6275 7.1013 5.0984
S 0.9959 1.0889 1.6704 1.4238 1.4394 2.2898
2
S i
ri 5 6 6 7 8 32
Solución
a) Hipótesis
H0 : A = B = C = D = E
H1 : Al menos 1 estimulante (tratamiento) es diferente
b)  = 0,05
c) Prueba estadística
F  CMT  14,62
CME
d) Valor tabular
F tab = F(4, 28; 0,05) = 2,71
e) Decisión
Se rechaza H0 puesto que F > Ftab
 Existe evidencia suficiente para asegurar que al menos 1 tratamiento produce
efectos diferentes.
PRUEBA DE HIPÒTESIS DE INDEPENDENCIA DE CRITERIOS

(COMPARACIÓN DE PROPORCIONES DE K GRUPOS).-
PRUEBA JI CUADRADO DE PEARSON

Uno de los usos más frecuentes de la distribución ji-cuadrado es probar la hipótesis nula de
que dos criterios de clasificación, son independientes. Se dice que dos criterios de clasificación
son independientes si la distribución de uno no se ve afectada por la distribución del otro.
Para realizar el análisis de los datos o frecuencias conjuntas (O ij) los datos deben disponerse en una
tabla de contingencia, de acuerdo a dos criterios.
Criterio 1
Criterio 2 1 2 ... c ni.
1 O11 O12 ... O1c n1.
2 O21 O22 ... O2c n2.
r Or1 Or2 ... Orc nr.

n. j n.1 n. 2 ... n.c n
El procedimiento de la prueba es el siguiente :

a) Hipótesis
Ho : Ambos criterios de clasificación son independientes
H1 : Ambos criterios de clasificación no son independientes
b) Nivel de significación :  = 0,05
c) Función pivotal
 (Oij - E ij )2
2 
E ij
n i. x n. j
E ij 
n i.
Oij : Frecuencia observada
Eij : Frecuencia esperada
d) Valor de p ó valor  tab

2
  (2r 1)(c 1) ; 1-
e) Decisión
Rechazar Ho si 2   tab2 , ( p < 0.05 ó p < 0.01)
No rechazar Ho si  2
  2
tab , ( p > 0.05)
Esto es :
Si p < 0.05, Existe relación estadísticamente significativa

entre las variables en estudio.
Si p < 0.01, Existe relación altamente significativa entre las

variables en estudio.
Si p > 0.05, No existe relación estadísticamente significativa

entre las variables en estudio.
COMPUTACION
HARDWARE SOFTWARE
Parte física Parte intangible
SISTEMAS
CPU, MONITOR, OPERATIVOS
TECLADO, MOUSE,
IMPRESORA, ETC.
LENGUAJES DE
PROGRAMACION
PAQUETES DE
APLICACIÓN
PROGRAMAS DE
APLICACION
PARA ANALISIS
PARA USO DE CUANTITATIVO PARA ANALISIS EXISTEN
OFICINA -Excel CUALITATIVOS DIFERENTES
OFFICE: Word, -Minitab -Atlas
-The Etnograph
.... PROGRAMAS
Excel, Power -Epi Info PARA CADA
Point, Etc. -Data ming -Nud ist ESPECIALIDAD
-Microstat -Sonar
-Estad graph -Decisión explorer
-HyperQual, Etc.
-SPSS
-Stata
-SAS
-STATS
-Abstat PROGRAMA ESTADISTICO
-Epi data, Etc. PARA CIENCIAS SOCIALES
PRACTICA DE EXCEL
A B C D E F G H I J
:
4 Nº EDAD SEXO PUNTAJE Nº DE HERM UBIC.VIVI CONDICION
n = 10
5 1 12 MASCULINO 14 2 LADERAS SIN BECA pacientes
LOS de un
6 2 11 FEMENINO 13 0 PINOS SIN BECA consultorio
LOS
7 3 13 MASCULINO 13 2 PINOS SIN BECA
8 4 12 FEMENINO 13 3 LADERAS SIN BECA
9 5 13 MASCULINO 12 2 LADERAS BECA
10 6 11 FEMENINO 12 2 LADERAS SEMI BECA
2 DE
11 7 13 MASCULINO 13 3 JUNIO SEMI BECA
2 DE
12 8 13 MASCULINO 14 1 JUNIO SIN BECA
13 9 12 FEMENINO 11 0 LADERAS SIN BECA
14 10 13 MASCULINO 12 1 LADERAS SIN BECA
15
16
Nº de
17 EDAD pacient % Ejemplos:
18 11 2 20 2 =CONTAR.SI(C5:C14,11)
19 12 3 30 20 =(E18/E$21)*100
20 13 5 50 10 =SUMA(E18:E20)
21 TOTAL 10 100
22
23
24
25
26
27
28
29
30
31
32
33
34
35
38
Nº
39 SEXO Pacientes %
40 MASCULINO 6 60 6 =CONTAR.SI(D5:D14,"MASCULINO")
41 FEMENINO 4 40 60 =(E40/E$42)*100
42 TOTAL 10 100 10 =SUMA(E40:E41)
43
44
45
46
47
48
INTRODUCCIÓN
ESTADÍSTICA DESCRIPTIVA (CONCEPTOS BÁSICOS)
La estadística tiene como finalidad estudiar detalladamente las características de una muestra de datos.
Este estudio se realiza a través de variables. Variables: Son características que pueden tomar distintos
valores en cada unidad de investigación (unidad de análisis).
En el ejemplo se estudian las características de una muestra de 40 sujetos. Se estudian siete variables:
Edad, sexo, estatus, región, ci (cociente intelectual), estatura y peso. La edad es una propiedad (tiempo
vivido) de los casos (sujetos en este caso) que pueden tomar distintos valores: 40, 35, 43, 54, etc. Sexo
es una variable porque puede tomar distintos valores: hombre o mujer.
Variables y Casos: Todo conjunto de datos puede ser visto como una matriz. Las filas corresponden
con los distintos sujetos o unidades de investigación, sobre los que se han realizado las distintas
observaciones(columnas). Los sujetos (filas) suelen denominarse casos y las observaciones (columnas)
suelen denominarse variables.
A modo de ejemplo, por caso, dependiendo del estudio, puede entenderse un alumno, un profesor, o
una sesión de clase. Por variables, asociadas a los casos anteriores, puede entenderse el sexo y la
edad del alumno, el cociente intelectual y el rendimiento en una asignatura determinada obtenida en el
desarrollo de una asignatura. Es importante notar que, con frecuencia se confunde, en este último caso,
cuál es el sujeto de análisis, si el alumno con varios episodios de recurrencia o cada episodio de
recurrencia es un caso en sí, pudiendo haber varios episodios para un mismo alumno. La distinción de
la unidad de análisis en cada situación la marcará el objetivo de la investigación.
Tipo de variables
Cualitativas Cuantitativas
Contienen información cualitativa de los sujetos Miden la magnitud de una medida sobre un
denotando la cualidad o la categoría a la que individuo.
pertenece un sujeto.
Nominales Ordinales Escala
Las observaciones se En esta escala de medición Estas variables miden una magnitud de los sujetos
clasifican en categorías no tiene sentido medir la resultando en un valor numérico. Utilizan escalas
(mutuamente distancia entre posibles numéricas y sí tiene sentido medir la distancia que
excluyentes y valores de la variable ni se hay entre posibles valores de los datos. En estas
colectivamente pueden realizar operaciones variables cabe distinguir aquellos casos donde el
exhaustivas) sin que aritméticas con ellos pues punto cero es arbitrario (medición a nivel de
éstas tengan un orden no toman valores numéricos intervalo) como por ejemplo la temperatura, o
específico (por ejemplo específicos ni existe datos donde el cero es un punto fijo (nivel de
los grupos sanguíneos). proporcionalidad entre razón) como por ejemplo el peso o la glucemia. Si
Un caso particular de categorías vecinas. Sí bien el SPSS no hace distinción entre variables del
datos nominales es el pueden sin embargo ser tipo escala, los procedimientos estadísticos
caso de los datos ordenados pues existe una distinguen entre variables discretas y continuas.
dicotómicos en los que relación de orden entre las En el primer caso el conjunto de posibles valores
existen sólo dos distintas clases o de la variable es finito siendo en el segundo
categorías (como por categorías. El pronóstico de continuo. Un ejemplo de variable discreta es el
ejemplo en el sexo). una enfermedad (menos número de días de ingreso en un Hospital, y un
grave, grave, más grave) es ejemplo de variable continua es la glucemia.
un dato medido en escala
ordinal.
APLICANDO UN CUESTIONARIO
UNIVERSIDAD PRIVADA SAN PEDRO
Sr(a)(ta): Se solicita su valiosa colaboración que nos permita recolectar datos para
analizarlos e interpretarlos de un Trabajo de Investigación que favorecerá a la ciudad de
Chimbote.
Escriba en el espacio en blanco o con la letra “X” según corresponda.
GRACIAS POR SU COLABORACIÓN
1.- N° de Identificación de la encuesta: ............... (Valores del 01 al 40)
2.- Edad ( en años cumplidos): .........................
3.- Sexo: Hombre ( ) Mujer ( )
4.- Escriba solamente su primer o único nombre: ...............................
5.- En forma relativa indique el estatus socioeconómico en el que se ubicaría:
Alto ( ) Medio ( ) Bajo ( )
6.- De las alternativa dadas ubique, la región o zona en que se ubica su domicilio:
Norte ( ) Este ( ) Oeste ( ) Sur ( )
7.- Escriba el valor relativo de su cociente intelectual. (Escriba valores como
mínimo desde 52 hasta un valor máximo de 159): ...................
8.- Estatura (en centímetros) : ......................................
9.- Peso en kilogramos (Con aproximación a un decimal): .......................

PRACTICA N° 01: DEFINICIÓN DE VARIABLES DEL CUESTIONARIO AL PAQUETE ESTADÍSTICO
1.- Ingrese al programa estadístico SPSS. Defina las variables según las referencias. Finalmente guarde con el nombre practica1
Nombre Tipo Anchura Decimales Etiqueta Valores Valores Column Alineación Medida
Valor Etiqueta Perdidos
Número de None
Iden Numérica 2 0 -9 8 Derecha Escala
identificación del sujeto
edad Numérica 2 0 None -9 8 Derecha Ordinal
1  Hombre
Sexo Numérica 1 0 8 Derecha Ordinal
2  Mujer 9
nombre Cadena 10 None 10 Izquierda Nominal
Estatus 1  Alto
Estatus Numérica 1 0 socioeconómico 2  Medio 9 8 Derecha Ordinal
3  Bajo
1  Norte
2  Este
región Numérica 1 0 8 Derecha Ordinal
3  Oeste 9
4  Sur
ci Numérica 3 1 Cociente Intelectual None -9.0 8 Derecha Escala
estatura Numérica 3 0 None -9 8 Derecha Escala
peso Numeric 5 1 None -9.0 8 Derecha Escala
PRACTICA N° 02: INGRESO DE DATOS
1.- Mediante trabajo en equipo (2 personas), ingresará los datos de las 40 encuestas al archivo
que contiene la definición de las variables.
DATOS RECOLECTADOS A PARTIR DEL CUESTIONARIO APLICADO

IDEN EDAD SEXO NOMBRE ESTATUS REGIÓN CI ESTATURA PESO
1 15 2 Abigail 1 3 124 154 57.9
2 16 1 Carlos 1 3 95 154 56.7
3 31 1 Alberto 1 2 101 156 52.8
4 24 2 Adela 2 3 116 184 104.2
5 24 1 Luis 1 1 102 173 87.5
6 32 2 Adelina 2 1 102 170 71.5
7 26 1 Antonio 1 1 81 176 93.3
8 21 1 Juan 1 4 109 188 99.2
9 22 2 Adriana 2 4 61 169 76.6
10 18 2 Agata 2 1 93 175 87.9
11 25 1 Cosme 2 3 119 177 80.3
12 29 2 Aida 3 1 52 181 82.3
13 25 2 Alameda 1 1 128 164 61.8
14 19 1 Juan 2 1 65 160 75.0
15 30 1 Carlos 1 1 116 162 60.3
16 29 2 Alana 1 1 65 156 53.9
17 29 1 Jose 3 4 147 172 78.6
18 16 2 Albertina 1 1 113 175 85.7
19 31 1 Armando 1 3 99 168 75.4
20 18 1 Constante 2 4 117 159 73.0
21 21 1 Toribio 1 2 105 178 87.6
22 29 1 Borja 1 2 92 174 74.2
23 23 2 Alejandra 3 4 78 178 100.9
24 28 2 Alicia 1 4 97 163 77.1
25 19 1 Manuel 3 4 77 180 74.6
26 31 1 Carlos 3 4 81 174 70.2
27 33 1 Antonio 2 1 126 137 99.3
28 17 2 Alma 1 3 95 153 62.1
29 34 2 Almeda 2 1 122 168 77.4
30 20 2 Almeria 1 2 85 161 67.9
31 21 1 Toribio 2 4 124 124 104.2
32 29 1 Borja 1 1 95 95 87.5
33 23 2 Alejandra 1 3 101 101 71.5
34 28 2 Alicia 3 1 116 116 93.3
35 19 1 Manuel 1 1 102 102 99.2
36 31 1 Carlos 1 1 102 102 76.6
37 33 1 Antonio 2 1 81 81 87.9
38 17 2 Toribio 1 1 109 109 80.3
39 34 2 Pedro 1 4 61 61 82.3
40 20 2 Manuel 3 1 93 93 61.8
Guarde todos los datos ingresados con el nombre: practica2

TECNICAS E INTRUMENTOS
Ventajas y Desventajas
(Metodología de la Investigación Científica, Alejandro Caballero Romero.
Edición 2000 Editorial Udegraf S.A.
TECNICA INSTRUMENTO VENTAJAS DESVENTAJAS

APLICABLE A GRAN
ENCUESTA CUESTIONARIO NUMERO DE POCA PROFUNDIDAD.
INFORMENTES SOBRE
GRAN NUMEROS DE
DATOS
GUIA DE PERMITE PROFUNDISAR -SOLO APLICABLE A UN
ENTREVISTA ENTREVISTA LOS ASPECTOS PEQUENO NUMERO.
INTERESANTES. -DIFICIL Y COSTOSO
FICHAS
ANALISIS (PRESISAR EL TIPO: MUY OBJETIVA PUEDE -LIMITADA A FUENTES
DOCUMENTAL TEXTUALES, CONSTITUIR EVIDENCIA ESCRITAS.
RESUMEN,ETC.)
GUIA DE CONTACTO DIRECTO -APLICACIÓN LIMITADA A
OBSERVACIO OBSERVACION DEL INVESTIGADOR ASPECTOS FIJOS O
N DE CAMPO CAMPO CON LA REALIDAD. REPETITIVOS.
............. ............. ............. .............
ENCUESTA
Actividad compleja que exige alto grado de organización y demanda colaboración

de profesionales y técnicos de diversas especialidades y perfiles.
Método que se realiza por medio de técnicas de interrogación, procurando

conocer aspectos relativos a los grupos.
Técnica de recolección de datos donde se obtiene la información tal como se

necesita, preparada exprofesamente y con objetivo estadístico. Permite registrar
características en las unidades de análisis de una determinada población o
muestra, delimitada en el tiempo y en el espacio.
Los resultados de una encuesta son producto de varios pasos, que involucran el
plano teórico y el práctico; un solo error en cualquier proceso amenaza todo lo
hecho.
ORGANIZACIÓN DE UNA ENCUESTA
PASOS PARA REALIZAR UNA ENCUESTA EMPLEANDO UN CUESTIONARIO
1.- REDACTAR UN CUESTIONARIO

2.- CONFECCIONAR UN PLAN DE TABULACION Y ANALISIS
3.- CONSTRUIR UN MARCO MUESTRAL ADECUADO
4.- DISEÑAR LA MUESTRA
5.- APLICAR EL CUESTIONARIO A LAS UNIDADES ELEGIDAS
6.- PROCESAR LA INFORMACION
7.- REALIZAR INFERENCIAS
DIAGRAMA DE LA ORGANIZACIÓN Y DESARROLLO DE UNA ENCUESTA POR

MUESTREO
Construcción del Diseño Selección

marco muestral. muestral muestral
Proyecto de Organización
cuestionario del trabajo de
terreno
Aplicación de la
encuesta
OBJETIVOS
Encuesta
piloto Procesamiento
Confección
definitiva del
cuestionario Análisis final
Organización
preliminar del
trabajo de terreno
Plan de CONCLUSIONES
tabulación
LA ENTREVISTA Y EL CUESTIONARIO
Las herramientas más frecuentes para realizar una encuesta son la entrevista y
el cuestionario.
La entrevista es una conversación seria entre dos o más personas, siempre con
un propósito definido. Es el instrumento más empleado en la Psicología Clínica.
El cuestionario es un sistema de preguntas racionales, ordenadas en forma

coherente, tanto desde el punto de vista lógico como psicológico, expresadas en
un lenguaje sencillo y comprensible, que generalmente responde por escrito la
persona interrogada, sin que sea necesaria la intervención de un encuestador.
Es un documento para ayudar en el proceso de obtener información a través de
una secuencia de preguntas o mediciones.
Las diferencias fundamentales entre la entrevista y el cuestionario son el grado

de estructuración de las preguntas y la presencia o no del encuestador.
Mayor estructuración de las preguntas
ENTREVISTA CUESTIONARIO
Mayor participación del encuestador
EL DISEÑO DEL CUESTIONARIO

La elaboración de un cuestionario requiere de:
MARCO MARCO
TEORICO SITUACIONAL
MARCO
CUESTIONARIO MARCO DE
METODOLOGICO REFERENCIA
PROCESO PARA CONSTRUIR UN CUESTIONARIO

Revisión de la literatura de cuestionarios que midan las mismas
variables que pretendemos medir en la investigación.
Evaluar la validez y confiabilidad

de cuestionarios anteriores
Desarrollar un cuestionario propio,

Adaptar un cuestionario tomando en cuenta otros(s)
aplicado en otro estudio VALIDEZ
Indicar los niveles de medición de

preguntas y escalas
Determinar la codificación de
preguntas cerradas
Elaborar la primera versión del

cuestionario
Consultar con expertos o personas familiarizadas con

los temas investigados
Ajustar la primera versión
Entrenar encuestadores, si es que se

requerirán ( o supervisores)
Llevar a cabo la prueba piloto
Elaborar la versión final del

cuestionario
Codificar las Decidir el contexto

Aplicar
preguntas abiertas en que se aplicará
VALIDEZ Y CONFIABILIDAD DE LOS INSTRUMENTOS
Estos procesos se aplican con la finalidad de evaluar la consistencia del diseño de la estructura de los
instrumentos que se usaran para la recolección de datos en la ejecución de una investigación.
I. VALIDEZ DE LOS INSTRUMENTOS:

Se refiere al grado en que un instrumento realmente mide la variable que pretende medir la validez
de un instrumento se refiere al grado hasta el cual las inferencias derivadas de las puntuaciones son
significativas.
Asimismo un instrumento será válido cuando está constituido por ítems pertinentes y rinde puntajes
confiables.
Para comprobar la validez de los instrumentos utilizados en una investigación podría utilizarse el
criterio de la opinión de expertos y de nuestros pilotos a los elementos de estudio. Se realiza en
cuatro momentos detallados o continuación:
Primer Momento: Se diseñaran los instrumentos y deberá consultarse a una muestra de expertos
(profesores especialistas), quienes analizaron y evaluaron la estructura de los mismos, teniendo en
cuenta la correlación de las preguntas, la cohesión y el grado de pertinencia en la orientación para el
logro de los objetivos planteados y el marco referencial que lo sustenta.
Segundo Momento: Después de haber recepcionado y acopiado las opiniones, observaciones y

críticas al respecto, hecho con el apoyo de expertos, se elaborará nuevamente el diseño de los
instrumentos con las correcciones del caso y deberá consultarse nuevamente a la muestra de
expertos.
Tercer Momento: Recepcionada la opinión favorable de la mayoría de expertos con las

recomendaciones del caso, que los instrumentos cumplían con las características apropiadas para que
puedan ser aplicados a las muestras respectivos. Se tomará en cuenta las recomendaciones realizadas
por los expertos se elaborará nuevamente el diseño de los instrumentos y serán aplicados a una
muestra piloto conformada por los elementos de estudio. Si se registra un porcentaje superior de que
por lo menos el 60% de los elementos de estudio respondan con facilidad, implicará que los
instrumentos cumplen con las características y condiciones del trabajo.
Cuarto Momento: Finalmente se procederá al diseño definitivo de los instrumentos, los mismos que
deberán ser aplicados a las muestras respectivas de estudios.
II. CONFIABLIDAD DE LOS INSTRUMENTOS:
Según Hernández, Fernández y Baptista. La confiabilidad de un instrumento de medición, se refiere
al grado en que su aplicación repetida al mismo sujeto u objeto produce resultados iguales.
La confiabilidad de un instrumento se refiere a la constitución interna de las personas, a la mayor o
menor acescencia de errores de medida. Un instrumento confiable significa que si lo aplicamos por
más de una vez a un mismo elemento entonces obtendríamos iguales resultados.
METODOS PARA CALCULAR LA CONFIABILIDAD DE UN INSTRUMENTO DE

MEDICIÓN:
Hay diversos métodos para determinar la confiabilidad de un instrumento de medición. Todos
utilizan formulas que producen coeficientes de confiabilidad estos coeficientes pueden oscilar entre
0 y 1, donde un coeficiente de o significa nulo confiabilidad y 1 representa un máximo de
confiabilidad (confiabilidad total).
CONFIABILIDAD
Muy Baja Baja Regular Aceptada Elevada
0
1
0% 100%
MÉTODO COEFICIENTE ALFA DE CRONBACH:

Requiere de una sola administración del instrumento de medición y se basa en la medición de la
respuesta del sujeto con respecto a los ítems del instrumento.
Su ventaja reside en que no es necesario dividir en dos mitades a los ítems del instrumento de
medición; simplemente se aplica la medición y se calcula el coeficiente.
CÁLCULO DEL COEFICIENTE:
k   S iS 
2
 1  
k  1  S T2 
Donde:
K : Es el número de ítems.
 S2i : Sumatoria de varianzas de los ítems.
ST2 : Varianza de la suma de los ítems.
 : Coeficiente de Alfa de cronbach.
EJEMPLO:
Se tienen los resultados referidos a la opinión de 06 alumnos respecto a los ítems formulados en un
cuestionario.
ITEMS
ALUMNO I II III
1 3 5 5
2 5 4 5
3 4 4 5
4 4 5 3
5 1 2 2
6 4 3 3
PROCEDIMIENTO:
Paso 1: Calcular las varianzas de cada uno de los ítems; en el cuadro de cálculo.
ITEMS
ALUMNO I II III
1 3 5 5
2 5 4 5
3 4 4 5
4 4 5 3
5 1 2 2
6 4 3 3
 Xi 21 23 23
 Xi 2 83 95 97
Si2 1.9 1.37 1.77
 Xi 2
–
  x2
n
Donde: Si2 = __________________
n–1
Paso 2: Calcular la sumatoria de varianzas de los ítems.

 Si2 = 5.04
Paso 3: Calcular la varianza de la suma de los ítems.
SUMA DE ITEMS
13
14
13
12
5
10
 Xi = 67
 Xi2 = 803
2   x 2
 xi 
Donde: ST2 = n ST2 = 10.97
n 1
Paso 4: Calcular el coeficiente de Alfa de Cronbach.

3  5.04 
 1
3  1  10.97 

3
 1  0.4594348
2
 = 0.81085
 = 0.81
Paso 5: Interpretación de la significancia de  = 0.81; lo que significa que los resultados de opinión
de los 06 alumnos respeto a los ítems considerados se encuentran correlacionados de manera
altamente confiable y muy aceptable.
ANEXO 1:
AREAS BAJO LA CURVA NORMAL
ANEXO 2:
DISTRIBUCIÓN t STUDENT
T
ANEXO 3:
VALORES CRÍTICOS DE JI CUADRADA

Estadística-Documento de trabajo-UNASAM - ABRIL 2019-B

Diunggah oleh

Informasi Dokumen

Deskripsi Asli:

Judul Asli

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

Estadística-Documento de trabajo-UNASAM - ABRIL 2019-B

Diunggah oleh

Hak Cipta:

Format Tersedia

UNIVERSIDAD NACIONAL SANTIAGO ANTUNEZ DE MAYOLO

HUARAZ - ABRIL - 2019

UNASAM - Dr. Oscar Robles Villanueva

Es el vehíículo que permite llevar a cabo el proceso

Es transversal a una amplia variedad de disciplinas,

UNASAM - Dr. Oscar Robles Villanueva

Antecedentes, Marco Exploratorio, descriptivo,

Seleccionar Seleccionar Recolección Analizar los Elaborar y

DISEÑO: Experimental Elaborar el instrumento Cuadro, Gráficos,

NUEVAS IDEAS NUEVOS CONOCIMIENTOS

UNASAM - Dr. Oscar Robles Villanueva

ESTADISTICA ESTADÍSTICA INFERENCIAL

– Edad: {15, 20, 16, 45, …, 36}  Variable Cuantitativa continua

VARIABLE DEPENDIENTE (Y)

SEGÚN EL NÚMERO DE VARIABLES

ESTADÍSTICAS BIDIMIENSIONALES (X,Y)

ESTADÍSTICAS PLURIDIMENSIONALES (X,Y,Z) , (X,Y,Z,V), ….

ARRIBOS * EN EL HOTEL DE LA POLICIA POR ESTACIONES

E S TAC I O N E S PARTES PRINCIPALES

Elaboración: Instituto Información y Desarrollo S.A.C. IID SAC

TABLAS DE DISTRIBUCIÓN DE FRECUENCIAS

Estado de salud de 24 estudiantes de la Inst. Educ. “Estrellita”, Chimbote- 2018

Bueno Regular Regular Malo Estado de Nº de

Nº de inasistencias de los docentes del Instituto “ABC” en el año 2018.

Ingreso Semanal de los trabajadores administrativos de las Universidades de Chimbote - 2018.

DE POSICION CUARTILES (Qi)

MEDIA ARMONICA (MA)

MEDIA GEOMETRICA (MH)

DESVIACION ESTANDAR (S) (σ)

COEFICIENTE DE VARIACION (C.V.)

LINEAL línea recta Y= a + b X

* SERIE DE TIEMPO Y= f (t)

1.2. PRINCIPALES ESTADIGRAFOS O MEDIDAS ESTADISTICAS

Media Aritmética o Promedio

 : Media Poblacional (parámetro)

Calcula la media aritmética para el siguiente conjunto de datos.

Sea Xi el peso en Kg. de 10 alumnos del Colegio ABC

INTERPRETACION: Si se elige a un estudiante del colegio ABC. al azar se espera que su

X i edad de 15 alumnos de la Escuela de Enfermería de la USP

INTERPRETACION: Se espera que el 50 % de alumnos de Sistemas tengan una edad inferior a

X i : Peso (kg.) de alumnos de la Escuela de Medicina de la USP

Se ordenan los datos en forma creciente

Mediana = (64 + 65)/2 = 64,5 kg.

INTERPRETACION: Se espera que el 50% de alumnos de arquitectura tengan un peso inferior a

Es la observación de mayor frecuencia.

2: Varianza poblacional (parámetro)

Primero hay que calcular la media

S2 = [ (5-8.5)2+(9-8.5)2+(12-8.5)2+(7-8.5)2+(15-8.5)2+(3-8.5)2 ]/ 5 = 99.5/5 = 19.9

La varianza para este conjunto de datos es 19.9.

Usando la segunda fórmula

x2 = 52 +92 +122 +72 +152 +32 = 533

Es la raíz cuadrada positiva de la varianza

Tenemos que S2 = 49.0 kg2

3. La varianza y desviación estándar cumplen una función más importante cuando se

Los resultados fueron:

S y2  4.96 Sy= 2.23

Por lo tanto las notas del Grupo X es más variable.

EJEMPLO 1: Se tiene las siguientes poblaciones:

1 = 24000 Lb de peso 2 = 1.05 Lb de peso.

¿Cuál es la población más variable?

Ahora utilizaremos el Coeficiente de Variación.

CV1 % = 1285 x 100 CV2 % = 0.16 x 100