Anda di halaman 1dari 48

UNIVERSIDAD NACIONAL DEL CALLAO

FACULTAD DE INGENIERIA INDUSTRIAL Y DE


SISTEMAS
UNIDAD DE POSGRADO

MAESTRIA: INGENIERIA DE SISTEMAS

CURSO: PROBABILIDAD Y ESTADSTICA


CAPITULO I
RECOLECCION Y PRESENTACION DE DATOS
Mg. GERMAN ELIAS POMACHAGUA PEREZ

Material de Clases German Pomachagua Perez 29-abr-17


RECOLECCION DE DATOS
La recoleccin de datos es la fase en el cul el
investigador se pone en contacto con los elementos
sometidos a estudio, con el fin de obtener datos o
respuestas de las variables consideradas y a partir de
aqu se prepara la informacin estadstica.
Antes de recolectar datos es importante determinar el
objetivo de estudio, precisar las variables, las fuentes de
datos, con la finalidad de definir que datos hay que
recolectar

Material de Clases German Pomachagua Perez 29-abr-17


TIPOS DE FUENTES
a) Fuentes Secundarias:
Datos ya recolectados para cumplir otros objetivos
Contiene informacin, sintetizada y organizada
Es la primera fuente que se debe analizar.
Ejemplo:
Datos publicados (en papel o en forma electrnica) en revistas especializadas,
tesis, censos y en las hojas de registro anteriores
Principales organismos que disponen de publicaciones son:
Portal del Estado Peruano www.peru.gob.pe/
Instituto Nacional del Estadstica e Informtica www.inei.gob.pe
Banco Central de Reserva del Per www.bcrp.gob.pe/
Ministerio de Salud del Per www.minsa.gob.pe
Organizacin Mundial de la Salud www.who.int/es/
Ministerio de Educacin www.minedu.org.pe
Ipsos Apoyo. Opinin y Mercado www.ipsos-apoyo.com.pe/

Material de Clases German Pomachagua Perez 29-abr-17


TIPOS DE FUENTES

FUENTES PRIMARIAS:
Datos que hay que recolectar para el trabajo
Personas que por su conocimiento proporciona
informacin especifica para el investigador
Las tcnica mas empleadas de recoleccin de datos son
La observacin:
La experimentacin
La entrevista.
La encuesta (Cuestionario)

Material de Clases German Pomachagua Perez 29-abr-17


(a) La observacin

Es el registro visual de lo
ocurre, es una situacional real,
clasificando y consignando los
acontecimientos pertinentes de
acuerdo con algn esquema
previsto y segn el problema que
se estudia.
Cuando se mide el desempeo,
la persona observada no debe
saber que es sujeta de
observacin

Material de Clases German Pomachagua Perez 29-abr-17


(b) La experimentacin
Se registra un dato bajo condiciones provocadas
simulando el proceso lo ms real posible.

Ejemplo:
Un mercado prueba para introducir un tipo jabn
de antisptico con fragancia .

Material de Clases German Pomachagua Perez 29-abr-17


(c) La entrevista
Permite recolectar datos
o partir de un dialogo.
Puede se estructurada o
no estructurada

Ejemplo:
Entrevista al Director de una
Clnica sobre la aplicacin de
norma de calidad ISO 9000

Material de Clases German Pomachagua Perez 29-abr-17


(a) La encuesta
Diseo de cuestionario para la
encuesta

1. Cuestionario de preguntas abiertas o


cerradas
2. Al disearla se debe:
Decidir forma de aplicarlo: correo,
telfono, personal, web
Plantear preguntas
Realizar una prueba piloto y hacer
revisiones finales
Ejemplo:
Encuesta para conocer el grado de
satisfaccin de los asegurados a una
clnica.

Material de Clases German Pomachagua Perez 29-abr-17


RECOMENDACIONES EN LA ELABORACIN DE CUESTIONARIOS

Es una tarea difcil y que requiere tiempo


Construir el instrumento de modo que refleje calidad
Hacer el cuestionario lo ms breve posible, de modo
que se requiera el mnimo de tiempo para llenarlo.
Todos los reactivos (preguntas) debern estar en
funcin del problema de investigacin.
Debe partirse de las hiptesis y especficamente de los
indicadores que expresan a las variables. Estos
indicadores deben traducirse en las preguntas del
cuestionario.
Material de Clases German Pomachagua Perez 29-abr-17
El lenguaje utilizado en la redaccin debe ser
entendible por los encuestados

Debe evitarse la ambigedad


Ejemplo: En un estudio de sobre tabaquismo

Frecuentemente fuma? SI . NO

No formular preguntas dirigidas. Evitar adjetivos


Ejemplo: Cree usted que precio de las tarifas
postales son altas?
SI .. NO

Material de Clases German Pomachagua Perez 29-abr-17


Neutralidad de las preguntas. El investigador debe
intentar adoptar una postura neutral con respecto al
problema objeto de estudio.

Ejemplo 1: La defensa del pas exige contar


con un presupuesto adecuado. Est usted de
acuerdo con que se destinen fondos del
presupuesto nacional a la actualizacin del
Armamento de las Fuerzas Armadas?
Forma tendenciosa grotesca

Material de Clases German Pomachagua Perez 29-abr-17


Ejemplo 2: Considera usted que la empresa X
ofrece un buen servicio postventa?
Si ____
No ____
No sabe/ no contesta_____________

Forma ms sutil de sesgar la pregunta

Material de Clases German Pomachagua Perez 29-abr-17


Ejemplo 3:
Cmo encuentra usted el servicio post-venta de la empresa X?
Bueno _________
Regular ________
Malo ___________
No sabe/ no contesta __________
Aprueba o desaprueba la labor que viene desarrollando Ollanta
Humala como Presidente de la Repblica? (%)
Aprueba 1

Desaprueba 2
Esta a favor o en contra de otorgar indulto a Alberto Fujimori? (%)

A favor 1

En Contra 2

Forma objetiva
Material de Clases German Pomachagua Perez 29-abr-17
Tipos de preguntas
I. Segn su formulacin en el cuestionario:
1) Preguntas cerradas
Las posibles respuestas se presentan como alternativas.
Facilita la codificacin y operatividad de los datos.
Ejemplo : Posee Ud. un seguro mdico?
Si 1 No 2 Cerradas Dicotmicas (Si /No)

Ejemplo: Categora docente


Principal ( ) 1
Cerradas mltiple
Asociado ( ) 2
Auxiliar ( ) 3
Ejemplo: Cmo se entero de nuestra de nuestra institucin?
Internet ( ) 1
Peridico ( ) 2
Cerradas de eleccin
Radio ( ) 3
multiple
Tv ( ) 4
Amigos ( ) 5
Material de Clases German Pomachagua Perez 29-abr-17
2) Preguntas abiertas

Los encuestados tienen libertad para emitir su


opinin.
Se utilizan cuando no se tiene precisin sobre las
posibles respuestas.
Dificulta la recoleccin de datos (incomoda al
encuestado).
Es necesario codificar las respuestas para ser
procesadas
Ejemplo:
Qu opinin tiene sobre la poltica de salud del
actual Gobierno ?

Material de Clases German Pomachagua Perez 29-abr-17


3) Preguntas Literales

Sonpreguntas
Son preguntas abiertas
abiertas cuyasserespuestas
cuyas respuestas se palabra
expresan con una expresan con
o cantidad
Ejemplo:
una palabra o cantidad
Cul es su edad?
Ejemplo:
Cuntos hijos tiene? ..
Cul
Cules es su edad?
su ocupacin
actual? .

Preguntas
4) Cuntoscon
hijos tiene? de grados
respuestas ..
de intensidad
Cul es su ocupacin actual? .
Sus respuestas indican un grado de intensidad en sus respuestas
Ejemplo : Esta usted de acuerdo con la poltica econmica del actual gobierno?

1. Totalmente en desacuerdo ( )
2. En desacuerdo ( )
3. Ni en acuerdo ni desacuerdo ( ) Escala de Likert
4. De acuerdo ( )
5. Totalmente de acuerdo ( )
VALIDEZ Y CONFIABILIDAD DE UN CUESTIONARIO
Toda medicin o instrumento de recoleccin de datos debe reunir dos requisitos
bsicos: VALIDEZ Y CONFIABILIDAD de un instrumento.

1) VALIDEZ: Se refiere al grado en que un instrumento mide la variable que


pretende medir. Por ejemplo, un instrumento vlido para medir inteligencia
debe medir la inteligencia y no la memoria.
(Hernndez Sampieri, Fernndez Collado, & Baptista Lucio, 1998).
Pero cuando se trata de variables como motivaciones, actitudes, sentimientos,
emociones, etc., la validez de un instrumento que pretenda medirlas se torna
ms compleja, y por lo tanto, cabe preguntarse si realmente el instrumento
estar midiendo lo que pretende medir?

2) CONFIABILIDAD: Un test es fiable cuando al aplicarlo dos a mas veces al


mismo individuo en circunstancias similares obtenemos resultados anlogos
(precisin) Ej: El lunes me peso en la balanza y resulta 90 Kg; luego el martes
resulta 70Kg luego la balanza no es fiable
VALIDEZ: Segn Arias (2006): La validezsignifica que las preguntas o tems deben
tener una correspondencia directa con los objetivos de la investigacin. Es decir, las
interrogantes consultarn slo aquello que se pretende conocer o medir" (p.79).

Es recomendable determinar la validez mediante la tcnica del juicio de experto,


por ello, se solicit la colaboracin de tres profesionales en las reas de
metodologa, lenguaje y contenido quienes efectuaron valoraciones cualitativas,
estableciendo que los instrumentos cumplen con su propsito.

CONFIABILIDAD: An cuando el instrumento haya sido revisado por los expertos,


todava no se ha demostrado su eficacia en condiciones reales, por ello, antes de
iniciar el trabajo de campo, es conveniente verificar su confiabilidad. Definen
Palella y Martins (2003), la confiabilidad como la ausencia de error aleatorio en
un instrumento de recoleccin de datos. Representa la influencia del azar en la
medida, es decir, es el grado en que las mediciones estn libres de la desviacin
producida por errores causales. (p.150).
Adems, segn los autores, un instrumento es confiable cuando, aplicado al
mismo sujeto en diferentes circunstancias, los resultados o puntajes obtenidos son
aproximadamente los mismos
VALIDEZ Y CONFIABILIDAD DE LOS INSTRUMENTOS DE RECOLECCIN DE DATOS
PRESENTACION DE DATOS
Nota: Manual para la presentacin de cuadros estadsticos D.L. 604
Tipos de Presentacin de datos

Tablas de Contingencia: Es un arreglo ordenado de filas


y columnas de variables cualitativas
Tabla 01: LIMA: POBLACION DE ALUMNOS QUE FUMA SEGN
SEXO, 2014
Tabla de contingencia SEXO * FUMAR

Recuento
FUMAR
FUMA NO FUMA Total
SEXO HOMBRE 55 25 80
MUJER 16 4 20
Total 71 29 100

Fuente:
Apoyo 2014

Material de Clases German Pomachagua Perez 29-abr-17


En SPSS ir a Analizar / Estadsticos Descriptivos/ Tablas de Contingencia

Luego clic en Casillas

Despus Continuar / Aceptar

Tabla de contingencia SEXO * FUMAR

Recuento
FUMAR
FUMA NO FUMA Total
SEXO HOMBRE 55 25 80
MUJER 16 4 20
Total 71 29 100
Tipos de Presentacin de datos
2. Tabla de Frecuencia: Es una tabla que divide a un conjunto de datos
en un numero adecuado de intervalos o categoras.
Elementos de una Tabla de Frecuencia:
Frecuencia Absoluta (fi): Es el nmero de veces que se repite cada
valor de una variable.
Donde: m = nmero de intervalos o categoras
n = nmero total de observaciones
m
Adems
fi n
i 1
y 0 fi n

Frecuencia Relativa (hi): Se expresa en trminos de porcentajes.


Donde fi
hi
n m

Adems h
i 1
i 1 y 0 h1 1
Frecuencia Absoluta Acumulada (Fi): Es la acumulacin
sucesivamente de las frecuencias absolutas, donde:
F 1 = f1
F2 = f1 + f2 = F1 + f2
=

Fm = f1 + f2 + + fm = Fm-1 + fm = n

Frecuencia Relativa Acumulada (Hi): Resulta de sumar


sucesivamente las frecuencias relativas, donde:
H1 = h1
H 2 = h 1 + h 2 = H 1 + h2
=
Hm = h1 + h2 + + hm = Hm-1 + hm = 1

Material de Clases German Pomachagua Perez 29-abr-17


Tabla de frecuencia con intervalos: Se sigue el
procedimiento siguiente:
1) Determinar el rango R= Xmax - Xmin
2) Determinar el nmero m de intervalos. Se
recomienda generalmente entre (5 m 15).
m = 1 + 3.3 x log (n) (Redondear al entero ms
cercano).
3) Se determina el tamao del intervalo de clase.
En lo preferible se debe encontrar un nmero entero
R
C tal que Cm R
m
(Redondear por exceso, a la cantidad de
decimales que tienen los datos).
En caso de no cumplir, cambiar m o C
Material de Clases German Pomachagua Perez 29-abr-17
4) Calcular el rango ampliado R= Cm
(5) Hallar la diferencia a= R- R

(6) Distribuir la diferencia


-(Lmite inferior del primer intervalo)
+(Lmite superior del ltimo intervalo)

(7) Construccin de los intervalos [ >, < ]

(8) Hallar la marca de clase que es el promedio del


intervalo
( Li Ls )
Mi
2

(9) Se elabora la tabla: titulo, cuerpo y fuente

. Material de Clases German Pomachagua Perez 29-abr-17


Histograma de Frecuencias: Constituido por un conjunto
sucesivo de rectngulos

Polgono de Frecuencias: Se construye tomando en cuenta la


marca de clase
Ejemplo 1: La siguiente tabla muestra las edades de los 21
trabajadores que laboran en Siderrgica Aceros Arequipa:

Construir a partir de estos datos


Una tabla de frecuencia
Un histograma
Un polgono de frecuencia

Material de Clases German Pomachagua Perez 29-abr-17


Solucin
1. El rango R =72 39 =33
2. Determinar el intervalo
m =1 + 3.3log(21)
m =1 + 3.3x1.322 = 1 + 4.36 = 5.36
m=5
3. Hallar la amplitud
C =R/m=33/5= 6.6 (la cantidad de decimales que tienen los
datos).C=7
4. Luego el rango ampliado R=C*m= 7x5=35
5. La diferencia a=R-R =35-33=2
6. Distribuyendo la diferencia

Min Max +a
V. Corregido 39 72+2=74

Material de Clases German Pomachagua Perez 29-abr-17


Interpretar

1) f1, F2, h3, H4


2) Calcular el nmero y porcentaje de trabajadores entre 47 aos y 68 aos?

3) Calcular el porcentaje de trabajadores que tienen por lo menos 55 aos?

Material de Clases German Pomachagua Perez 29-abr-17


Histograma de Frecuencias: Constituido por un conjunto sucesivo
de rectngulos.
.
Histograma de Frecuencias fi

8 7
7 6
6

Frecuencia
5
4 3 3
3 2
2
1
0
[39 - 46] <46 - 53] <53 - 60] <60 - 67] <67 - 74]

Polgono de Frecuencias: Se construye tomando en cuenta la marca


de clase Poligono de Frecuencias fi
8
7
6
Frecuencia

5
4
3
2
1
0
35.5 42.5 49.5 56.5 63.5 70.5 77.5

Material de Clases German Pomachagua Perez 29-abr-17


Reporte del SPSS

Material de Clases German Pomachagua Perez 29-abr-17


En SPSS despus de poner los datos
Ir a Transformar / Recodificar en distintas variables ..

Luego clic en
Valores antiguos y nuevos

Y as hasta completar
todos los intervalos
Luego clic en
Continuar/ Cambiar Aceptar

Luego hallar la tabla de frecuencia de la


variable EDADRECO
En Minitab Polgono de Frecuencia
Grfica de dispersin de FRECUENCIA vs. MARCA
7
7

6
6

FRECUENCIA
4

3 3
3

2
2

0 0
0
35.5 42.5 49.5 56.5 63.5 70.5 77.5
MARCA
Variables Cuantitativas (Discretas y Continuas)
Distribuciones de frecuencias para datos discretos con muchos valores y
datos continuos (Varios valores se agrupan en una clase)

ELABORACION DE HISTOGRAMAS
EN MINITAB
a) Luego de elegir
Graficas/Histograma
aparece la ventana
Histograma.

b) Elegir Simple y dar


Aceptar; luego ingresar en
la ventana Variables de
grafica el nombre de la
columna (variable) que se
desea analizar. La ventana
resultante es:

29/04/2017 . 41
Variables Cuantitativas (Discretas y Continuas)
Distribuciones de frecuencias para datos discretos con muchos valores
y datos continuos (Varios valores se agrupan en una clase)

c) Dar click en
Etiquetas) y luego
seleccionar Etiqueta
de datos / Usar
etiquetas de valor y a
fin de que se muestre
la altura de la barra
(frecuencia).
d) Aceptar La grafica
resultante es:

29/04/2017 42
Variables Cuantitativas (Discretas y Continuas)
Distribuciones de frecuencias para datos discretos con muchos valores
y datos continuos (Varios valores se agrupan en una clase)

e) Este grfico no es
el que se desea
obtener. Vea que
C=7 y m=5, como
lo habamos
planteado.
f) Dar click en una
barra cualquiera y
se obtiene la
ventana Edit
Barras:
Variables Cuantitativas (Discretas y Continuas)
Distribuciones de frecuencias para datos discretos con muchos valores
y datos continuos (Varios valores se agrupan en una clase)

g) A continuacin, se elige
la opcin
Seccionamiento y se
abre el cuadro de datos
Punto medio y Punto de
corte , tal como se
muestra a continuacin:
Variables Cuantitativas (Discretas y Continuas)

h) Ntese que en Tipo


de intervalo, se ha
elegido la opcin
Punto de corte. En
Definicin de
intervalo se ha
elegido Posiciones
de punto medio de
corte
Xmn:Xmx/m

i) A continuacin se da
click en Aceptar y se
obtiene la ventana
Histograma:
Variables Cuantitativas (Discretas y Continuas)
Distribuciones de frecuencias para datos discretos con muchos valores
y datos continuos (Varios valores se agrupan en una clase)

j) El grafico obtenido es
denominado: Histograma de
Frecuencias Absolutas.
Note que ahora m=5 y los
valores de los lmites superior
inferior de cada clase, se
muestran en el eje horizontal
del grfico.

k) Esto nos facilita elaborar la


correspondiente Tabla de
Distribucin de Frecuencias
GRAFICO DE TALLOS Y HOJAS

EDAD Stem-and-Leaf Plot


3*10+9 tallo=3, hoja= 9, anchura =10
Frequency Stem & Leaf

1,00 3. 9
3,00 4. 029
8,00 5. 14678889
5,00 6. 34689
4,00 7. 0012

Stem width: 10
Each leaf: 1 case(s)

Material de Clases German Pomachagua Perez 29-abr-17


GRAFICO DE CAJAS Y BIGOTES
(BOX PLOT)

25

24 46

23 52

22 41
71
47
62

21 43
93
65
28
94

20

19

18
EDAD

17
N= 80 20

HOMBRE MUJER

SEXO

Material de Clases German Pomachagua Perez 29-abr-17

Anda mungkin juga menyukai