Anda di halaman 1dari 40

Sistema de Gestin

de la Investigacin
UPN
2012
ESTADSTICA PARA PROYECTOS DE
INVESTIGACIN




GUA DE INVESTIGACIN UPN pg. 2









ESTADSTICA
PARA
PROYECTOS DE
INVESTIGACIN


Profesor: MsC. Luis Alberto Rubio Jcobo









GUA DE INVESTIGACIN UPN pg. 3
PRESENTACIN

El equipo de docentes que coordina las propuestas y la elaboracin de instrumentos para
el Sistema de Gestin de la Investigacin de la Universidad Privada del Norte, tiene el
agrado de presentar la primera versin del Manual de Estadstica para Proyectos de
Investigacin.

Este manual pretende ser un material de consulta bsica para docentes y estudiantes de
las diferentes carreras profesionales de nuestra universidad, en cuanto al uso adecuado
de la estadstica, requerida en diversos momentos del proceso investigativo.

Esperamos que con su uso, el presente manual vaya enriquecindose y hacindose ms
familiar para todos los que de una u otra manera estamos involucrados con la
investigacin en todas sus expresiones.








GUA DE INVESTIGACIN UPN pg. 4
NDICE

LA ESTADSTICA .............................................................................................................................. 8
1. DEFINICIN. .................................................... 8
2. CLASIFICACIN DE LA ESTADSTICA ................................ 8
DISEOS DE INVESTIGACIN ........................................................................................................ 8
I.1. DISEOS DE INVESTIGACIN EN EL ENFOQUE CUANTITATIVO: ........... 8
I.1.1 DISEOS NO EXPERIMENTALES ............................... 9
A. DISEOS TRANSECCIONALES O TRANSVERSALES ............. 9
A.1. DISEOS EXPLORATORIOS ............................ 9
A2. DISEOS DESCRIPTIVOS .............................. 9
A3. DISEOS DESCRIPTIVOS ............................. 10
B. DISEOS LONGITUDINALES O EVOLUTIVOS .................. 10
B1. DISEOS DE TENDENCIA ............................. 10
B2. DISEOS DE EVOLUCIN DE GRUPO (cohorte) ........... 11
B3. DISEOS DE PANEL ................................. 11
I.1.2 DISEOS EXPERIMENTALES ................................. 11
A. DISEOS PRE-EXPERIMENTALES ........................... 11
A1. DISEO DE UN SOLO GRUPO CON UNA SOLA MEDICIN: ...... 12
A2. DISEO DE PREPRUEBA-POSPRUEBA CON UN SOLO GRUPO 12
B. EXPERIMENTOS PUROS .................................. 12
B1. DISEO DE POSPRUEBA NICAMENTE Y GRUPO CONTROL .. 12
B2. DISEO CON PREPRUEBA-POSPRUEBA Y GRUPO CONTROL 12
B3. DISEO DE CUATRO GRUPOS DE SALOMN ............................. 13
B4. DISEOS EXPERIMENTALES DE SERIES CRONOLGICAS
MLTIPLES ....................................................................................... 13
B5. DISEOS FACTORIALES ................................................................ 13
C. CUASI-EXPERIMENTOS ................................... 13
C1. DISEO DE POSPRUEBA NICAMENTE Y GRUPOS INTACTOS13
C2. DISEO CON PREPRUEBA-POSPRUEBA Y GRUPOS INTACTOS
........................................................................................................... 13
DEFINICIONES ESTADSTICAS .................................................................................................... 14
1. UNIVERSO. .................................................... 14
2. POBLACIN. ................................................... 14
A. SEGN SU EXTENSIN: ....................................... 14
B. SEGN SU MBITO O NATURALEZA: ............................. 14
3. MUESTRA. .................................................... 14
4. UNIDAD DE ESTUDIO. ............................................ 14
5. VARIABLE. .................................................... 14




GUA DE INVESTIGACIN UPN pg. 5
6. PARMETRO. .................................................. 15
7. ESTIMADOR. ................................................... 15
8. TCNICAS DE RECOLECCIN DE DATOS. ............................ 15
OBSERVACIN: ......................................................................................................... 16
ENTREVISTA: ............................................................................................................. 16
ENCUESTAS: .............................................................................................................. 16
Otras tcnicas de recoleccion de datos: ................................................................. 16
9. INSTRUMENTOS DE RECOLECCIN DE DATOS: ....................... 17
COMO DETERMINAR UNA MUESTRA ......................................................................................... 17
1. DEFINICIN DE MUESTREO ....................................... 17
2. ETAPAS PRINCIPALES EN UNA ENCUESTA POR MUESTREO ............ 17
3. TRMINOS TCNICOS EN EL MUESTREO ............................ 17
A. UNIDAD DE MUESTREO. ....................................... 18
B. MARCO MUESTRAL. .......................................... 18
C. ERROR DE ESTIMACIN: ...................................... 18
D. ERROR NO MUESTRAL: ....................................... 18
E. NIVEL DE CONFIANZA: (1-o) .................................... 19
F. NIVEL DE ERROR: ............................................ 19
G. POTENCIA (1-|): ............................................. 19
4. TIPOS DE MUESTREO ........................................... 19
A. MUESTREO PROBABILSTICO: .................................. 19
A1. Muestreo aleatorio simple (m.a.s.): ........................................................... 19
A2. Muestreo sistemtico .................................................................................. 19
A3. Muestreo estratificado ................................................................................ 19
A4. Muestreo por etapas ................................................................................... 20
B. MUESTREO NO PROBABILSTICO O EMPRICO: .................... 21
B1. Muestreo de conveniencia ......................................................................... 21
B2. Muestreo de juicio ....................................................................................... 21
B3. Muestreo por cuotas ................................................................................... 21
5. DETERMINACIN DEL TAMAO DE MUESTRA: ....................... 21
A. PARA UNA VARIABLE CUANTITATIVA: ........................ 21
B. PARA UNA VARIABLE CUALITATIVA: ......................... 22
TCNICAS ESTADSTICAS EN DISEOS DESCRIPTIVOS ........................................................ 24
1. CUADRO DE DISTRIBUCIN DE FRECUENCIAS (CDF): .................. 24
1.1. DEFINICIN: ................................................................................................................ 24
1.2. PARTES DE UN CUADRO DE DISTRIBUCIN DE FRECUENCIAS: ...................... 24
1.3. ELEMENTOS PARA CONSTRUIR UN CDF:.............................................................. 24
1.4. PROPIEDADES DE UN CDF: ..................................................................................... 25
1.5. CONSTRUCCIN DE CUADROS DE FRECUENCIAS: ............................................ 25




GUA DE INVESTIGACIN UPN pg. 6
1.6. EXCEL EN LA CONSTRUCCION DE CDF. ................................................................ 26
2. GRFICOS ESTADSTICOS: ....................................... 27
2.1 DEFINICIN ................................................................................................................. 27
2.2 PARTES DE UN GRFICO ESTADSTICO:............................................................... 28
2.3 CRITERIOS PARA CONSTRUIR GRFICOS: ........................................................... 28
2.4 TIPOS DE GRFICOS ESTADSTICOS ..................................................................... 28
2.5 CONSTRUCCIN DE GRFICOS ESTADSTICOS DE EXCEL: .............................. 28
3. MEDIDAS ESTADSTICAS ......................................... 29
3.1 MEDIDAS DE TENDENCIA CENTRAL ....................................................................... 29
A. MEDIA ARITMTICA:...................................................................................................... 29
B. MEDIANA: ........................................................................................................................ 29
C. MODA: ............................................................................................................................. 30
3.2 MEDIDAS DE LOCALIZACIN: ................................................................................. 30
A. CUARTILES: .................................................................................................................... 30
B. DECILES: ......................................................................................................................... 30
C. PERCENTILES: ............................................................................................................... 30
3.3 MEDIDAS DE VARIABILIDAD: ................................................................................... 30
A. RANGO: ........................................................................................................................... 30
B. VARIANZA: ...................................................................................................................... 30
C. DESVIACIN ESTANDAR: ............................................................................................. 30
D. COEFICIETE DE VARIACIN: ....................................................................................... 31
3.4 MEDIDAS DE FORMA:................................................................................................ 31
A. ASIMETRIA: ..................................................................................................................... 31
B. KURTOSIS: ...................................................................................................................... 31
3.5 MEDIDAS ESTADSTICAS CON EXCEL: .................................................................. 32
TCNICAS ESTADSTICAS EN DISEOS DE DOS GRUPOS ..................................................... 33
1. ANALISIS DE CORRELACIN: ..................................... 33
2. ANLISIS DE REGRESIN ........................................ 33
A. ANLISIS DE REGRESIN LINEAL SIMPLE: .............................................................. 33
B. ANLISIS DE REGRESIN LINEAL MLTIPLE: .......................................................... 34
3. REGRESIN LINEAL CON EXCEL: .................................. 34
INFERENCIA ESTADSTICA .......................................................................................................... 35
ESTIMACIN ESTADSTICA ............................................. 35
A. ESTIMACIN PUNTUAL: .......................................... 35
B. ESTIMACIN INTERVLICA: ...................................... 35
PRUEBA DE HIPTESIS ................................................ 37
A. DEFINICIONES PRELIMINARES: .................................................................................. 37
B. CLASES DE HIPTESIS: ............................................................................................... 37
C. ERRORES QUE SE COMETEN EN UNA PRUEBA DE HIPTESIS: ........................... 37




GUA DE INVESTIGACIN UPN pg. 7
D. TIPOS DE PRUEBAS DE HIPTESIS:........................................................................... 38
E. ETAPAS DE UNA PRUEBA DE HIPTESIS: ................................................................ 38
F. FRMULAS DE LOS ESTADSTICOS DE PRUEBA: ................................................... 38
G. PRUEBA DE HIPTESIS CON EXCEL: ......................................................................... 40








GUA DE INVESTIGACIN UPN pg. 8
LA ESTADSTICA

1. DEFINICIN.
La Estadstica es una ciencia que nos ofrece un conjunto de mtodos y tcnicas para
recopilar, organizar, presentar, analizar e interpretar un conjunto de datos respecto a variables
en estudio de una poblacin, con el fin de obtener conclusiones y tomar decisiones sobre
determinados hechos o fenmenos en estudio.
La estadstica es una rama de la matemtica y es parte del mtodo cientfico. En la actualidad,
para hacer investigacin cientfica se necesita conocer de estadstica.

2. CLASIFICACIN DE LA ESTADSTICA
La Estadstica se clasifica de la siguiente manera:
2.1. Estadstica Descriptiva
Es el rea de la Estadstica que describe y analiza una poblacin, sin pretender sacar
conclusiones de tipo general. Es decir, las conclusiones obtenidas son vlidas slo para
dicha poblacin.
2.2. Estadstica Inferencial
Es el rea de la Estadstica, cuyo propsito es inferir o inducir leyes de comportamiento de
una poblacin, a partir del estudio de una muestra. Es decir, las conclusiones obtenidas a
partir de una muestra, son vlidas para toda la poblacin.


PARTE I:

DISEOS DE INVESTIGACIN

Segn Hernndez, Fernndez y Baptista (2006), una vez que se ha realizado el planteamiento del
problema, se ha definido el alcance de la investigacin y se formularon las hiptesis, se debe
visualizar la manera prctica y concreta de responder a las interrogantes de investigacin, y
cumplir con los objetivos propuestos.
Para esto se debe seleccionar o desarrollar uno o ms diseos de investigacin y aplicarlos al
contexto particular de cada estudio.
El diseo se refiere al plan o estrategia concebida para obtener la informacin que se desea.
- En el enfoque cualitativo, el investigador utiliza el diseo o diseos para analizar la
certeza de las hiptesis formuladas en un contexto en particular o para aportar evidencia
respecto a los lineamientos de la investigacin.
- En el enfoque cuantitativo, la calidad de una investigacin se encuentra relacionada con
el grado en que se aplica el diseo tal y como fue preconcebido, aunque en algunos casos
el diseo se debe ajustar ante posibles cambios en la situacin.

I.1. DISEOS DE INVESTIGACIN EN EL ENFOQUE CUANTITATIVO:
La literatura presenta diversas clasificaciones de los diseos de investigacin. En primer lugar
se presentan la clasificacin de Hernndez, Fernndez y Baptista, y posteriormente se
presentan otras clasificaciones.
Hernndez, Fernndez y Baptista clasifican a los diseos en: investigacin experimental e
investigacin no experimental. Entendindose por experimento a la situacin de control en
la cual se manipula, de manera intencional, una o ms variables independientes (causas)
para analizar las consecuencias de tal manipulacin, sobre una o ms variables dependientes
(efectos).





GUA DE INVESTIGACIN UPN pg. 9
I.1.1 DISEOS NO EXPERIMENTALES
En la investigacin no experimental se observa el fenmeno tal como se da en su
contexto natural para despus analizarlos, no se manipula deliberadamente o
intencionalmente las variables independientes. En un estudio no experimental no se
construye ninguna situacin, sino que se observan situaciones ya existentes, no
provocadas intencionalmente en la investigacin por el investigador. Las variables
independientes ocurren y no es posible manipularlas, no se tiene control directo sobre
dichas variables ni se puede influir en ellas porque ya sucedieron, al igual que sus
efectos.
Para clasificar la investigacin no experimental se han adoptado tambin diversos
criterios. Hernndez, Fernndez y Baptista, presentan la siguiente clasificacin por su
dimensin temporal o el nmero de momentos o puntos en el tiempo en el cual se
recolectan datos.

A. DISEOS TRANSECCIONALES O TRANSVERSALES
En estos diseos se recolectan datos en un solo momento, en un tiempo nico. Su
propsito es describir variables y analizar su incidencia o interrelacin en un
momento dado. Estos diseos se esquematizan de la siguiente manera:



Estos diseos pueden abarcar varios grupos o subgrupos de personas, objetos o
indicadores, as como diferentes comunidades, situaciones o eventos.

A.1. DISEOS EXPLORATORIOS
Tienen como propsito conocer una variable o un conjunto de variables, una
comunidad, un contexto, un evento, una situacin. Se trata de una
exploracin inicial en un momento especfico. Por lo general se aplican a
problemas de investigacin nuevos o poco conocidos. Constituyen el
prembulo de otros diseos, no experimentales y experimentales.

A2. DISEOS DESCRIPTIVOS
Tienen como objetivo indagar la incidencia
de las modalidades o niveles de una o ms
variables en una poblacin. Los estudios
son puramente descriptivos, y cuando
establecen hiptesis, son puramente
descriptivas.
En ciertas ocasiones, el investigador
pretende realizar descripciones
comparativas entre grupos o subgrupos de
personas, objetos o indicadores.
El inters es cada variable
tomada individualmente



Ejemplos:
1. En las encuestas pre-electorales de opinin sobre las tendencias electorales de
la poblacin, su objetivo es describir en una eleccin especfica- el nmero de
electores que se inclinan por los diferentes candidatos contendientes, es decir se
centran en la descripcin de las preferencias del electorado.
2. En una investigacin para evaluar los niveles de satisfaccin de los clientes de
CLARO, su propsito es describir la satisfaccin, no busca evaluar si las mujeres
estn ms satisfechas que los hombres, ni asociar el nivel de satisfaccin con la
actividad laboral de los usuarios.
Recoleccin de
datos nica
X
1

X
2

X
3

A3. DISEOS DESCRIPTIVOS
Describen relaciones entre dos o ms
categoras, conceptos o variables en
momento determinado. A veces,
nicamente en trminos correlacionales,
otros en funcin de la relacin causa-
efecto (causales).
Los diseos correlacionales-causales
pueden limitarse a establecer relaciones
entre variables sin precisar sentido de
causalidad o pretender analizar
relaciones causales.
El inters es la relacin
entre variables
Correlacin
X
1
Y
1

X
2
Y
2

X
3
Y
3

Relacin causal
X
1
Y
1

X
2
Y
2

X
3
Y
3

Ejemplos:
1. Un estudio pretende indagar la relacin entre la atraccin y la confianza durante
el noviazgo en parejas jvenes, observando cun vinculadas estn ambas
variables (correlacional).
2. Un estudio pretende analizar quines compran ms en las megatiendas, los
hombres o las mujeres (correlacional: asocia gnero y nivel de compras).
3. En un estudio se tiene inters en analizar las causas por las cuales algunos
clientes, y otros no, han utilizado el crdito que les fue otorgado por Saga
Falabella. (causal, retrospectivo).
4. En un estudio se desea indagar si la antigedad provoca o no mayor lealtad a la
empresa y por qu. (causal, prospectivo).

En los estudios correlacionales-causales la causalidad ya existe, pero es el
investigador quien establece un nexo causal:
a. La o las variables independientes deben anteceder en el tiempo a la o
las variables dependientes.
b. Debe existir covariacin entre la o las variables independientes y
dependientes.
c. La causalidad tiene que ser verosmil.

Los diseos correlacionales-causales en ocasiones describen relaciones en
uno o ms grupos o subgrupos, y suelen describir primero las variables
incluidas en la investigacin, para luego establecer las relaciones entre
stas.
Ejemplo:
1. Una investigacin evala la credibilidad de tres conductores de TV, y relaciona
esta variable con el gnero, la ocupacin y el nivel socioeconmico de la
teleaudiencia.


B. DISEOS LONGITUDINALES O EVOLUTIVOS
Se utilizan cuando se desea analizar cambios a travs del tiempo del fenmeno en
estudio, en puntos o perodos, para hacer inferencias respecto al cambio, sus
determinantes y consecuencias. Tales perodos por lo comn se especifican de
antemano. Los diseos longitudinales se fundamentan en hiptesis de diferencia
de grupos correlacionales y causales.

B1. DISEOS DE TENDENCIA
Analizan cambios a travs del tiempo dentro de una poblacin. Se puede
observar o medir a toda la poblacin, o bien, tomar una muestra de ella,
cada vez que se observen o midan las variables o las relaciones entre
stas. Es importante sealar que los sujetos del estudio no son los mismos,







GUA DE INVESTIGACIN UPN pg. 11
pero la poblacin s.
Ejemplo
1. Analizar la manera en que evoluciona la percepcin sobre tener relaciones
sexuales prematrimoniales en las mujeres adultas jvenes (20-25 aos) de
Trujillo, hasta el ao 2020. Las mujeres aumentan de edad, pero siempre habr
una poblacin de mujeres entre esas edades. La poblacin particular en estudio
son las mujeres adultas jvenes de 20-25 aos.

B2. DISEOS DE EVOLUCIN DE GRUPO (cohorte)
Examinan cambios a travs del tiempo en subpoblaciones o grupos
especficos. Su atencin son las cohortes o grupos de individuos vinculados
de alguna manera o identificados por una caracterstica comn.
Ejemplo
2. Una investigacin sobre las actitudes de los estudiantes hacia el estudio en la
UPN, ingresantes el ao 2011-I. Cada ao se puede tomar una muestra de estos
estudiantes, analizndose en cada oportunidad la actitud hacia el estudio,
analizndose la evolucin y los cambios en las actitudes. En cada oportunidad la
muestra puede ser distinta, pero todos ellos pertenecen a la poblacin de ingreso
2012-I, la cual es la poblacin de inicio.

B3. DISEOS DE PANEL
Un mismo grupo de participantes (panel) es observado o medido en todos
los tiempos o momentos. En estos diseos, adems de conocer los cambios
grupales, se conocen los cambios individuales.
Ejemplo
1. En un estudio se analiza la evolucin de las pacientes de cncer de mama. En la
primera etapa, se evalan un mes despus de iniciar la terapia. La segunda, seis
meses despus; la tercera, una ao despus; y la cuarta, dos aos despus.
Siempre se incluirn a las mismas pacientes, descartndose a quienes fallecen.
2. Se analiza en rendimiento de los motores de autos tico pertenecientes a una
compaa de taxis a travs del tiempo. El rendimiento se analiza anualmente,
desde su compra por un lapso de cinco aos. Los autos son siempre los mismos.

I.1.2 DISEOS EXPERIMENTALES
Un experimento se lleva a cabo para analizar si una o ms variables independientes
afectan a una o ms variables dependientes y por qu lo hace. En un experimento, la
variable independiente resulta de inters para el investigador, ya que hipotticamente
ser una de las causas que producen el efecto supuesto. Para obtener evidencia de la
supuesta relacin causal, el investigador manipula la variable independiente y as
observa si la variable dependiente vara o no. En el contexto estadstico, la variable
independiente se denomina factor y a la variable dependiente se la llama variable
respuesta.
En un experimento para que una variable se considere independiente (factor) debe
cumplir tres requisitos:
- Que anteceda a la dependiente,
- Que vare o sea manipulada, y
- Que esta variacin pueda controlarse.


A. DISEOS PRE-EXPERIMENTALES





GUA DE INVESTIGACIN UPN pg. 12

A1. DISEO DE UN SOLO GRUPO CON UNA SOLA MEDICIN:
G: X O
1

A un grupo se le administra un estmulo o tratamiento y despus se realiza
una medicin de una o ms variables para observar cul es el nivel del
grupo en estas variables

A2. DISEO DE PREPRUEBA-POSPRUEBA CON UN SOLO GRUPO
G: O
1
X O
2

A un grupo se le aplica una prueba previa al estmulo o tratamiento
experimental, despus se le administra el tratamiento y finalmente se le
vuelve a aplicar una prueba. Tiene una ventaja respecto al anterior, puesto
que existe un punto de referencia inicial.
Los diseos pre-experimentales no son adecuados para el establecimiento
de relaciones causales. Consideran que pueden utilizarse como ensayos de
otros experimentos.


B. EXPERIMENTOS PUROS
Los experimentos puros son aquellos que renen los dos requisitos para logar el
control y la validez interna: 1) grupos de comparacin, y 2) equivalencia de grupos.

B1. DISEO DE POSPRUEBA NICAMENTE Y GRUPO CONTROL
RG
1
: X O
1

RG
2
: - O
2

R: Indica asignacin aleatoria de los sujetos a cada grupo
Incluye dos grupos, uno recibe el tratamiento experimental y el otro no
(grupo control). La manipulacin de la variable independiente alcanza slo
dos niveles: presencia y ausencia. Los sujetos se asignan a los grupos de
manera aleatoria. La nica diferencia entre los dos grupos debe ser la
presencia-ausencia de la variable independiente. A ambos grupos se les
realiza una medicin de la variable dependiente, despus de
administrarse el estmulo.

B2. DISEO CON PREPRUEBA-POSPRUEBA Y GRUPO CONTROL
RG
1
: O
1
X O
2

RG
2
: O
3
- O
4

Incorpora la aplicacin de pruebas a los grupos que componen el
experimento. Los sujetos se asignan al azar a los grupos, despus a
stos se les aplica simultneamente la preprueba; un grupo recibe el
tratamiento experimental y el otro no. Finalmente, se les aplica tambin
simultneamente la posprueba.
En estos diseos, la aplicacin de la preprueba ofrece dos ventajas. La
primera, que las puntuaciones de la preprueba sirven para fines de control
del experimento, al compararse los resultados entre los dos grupos. La
segunda, debido a que permite analizar el cambio existente en el grupo
experimental, y tambin en el grupo control.





GUA DE INVESTIGACIN UPN pg. 13
B3. DISEO DE CUATRO GRUPOS DE SALOMN
RG
1
: O
1
X O
2

RG
2
: O
3
- O
4

RG
3
: X O
5

RG
4
: - O
6

Constituye una mezcla de los dos diseos anteriores. Utiliza dos grupos
experimentales y dos grupos control. Los dos primeros reciben el
tratamiento experimental y los segundos no reciben tratamiento. Slo a uno
de los grupos experimentales y a uno de los grupos control se les administra
la preprueba. A los cuatro grupos se les aplica la posprueba. Los sujetos se
asignan en forma aleatoria.

B4. DISEOS EXPERIMENTALES DE SERIES CRONOLGICAS
MLTIPLES

Diseo que efecta a travs del tiempo varias observaciones o mediciones
sobre una o ms variables. En estos diseos se pueden tener dos o ms
grupos, y los participantes son asignados al azar a cada grupo.

B5. DISEOS FACTORIALES
Se utilizan para analizar experimentalmente el efecto sobre la(s) variable(s)
dependiente(s) que tiene la manipulacin de ms de una variable
dependiente o factor. Cada variable independiente puede tener dos ms
niveles de presencia. La construccin bsica de un diseo factorial consiste
en que todos los niveles de cada variable independiente se combinan con
todos los niveles de las otras variables independientes.

C. CUASI-EXPERIMENTOS
En los diseos cuasi-experimentales tambin se manipulan deliberadamente, al
menos, una variable independiente para analizar su efecto y relacin con una o
ms variables dependientes. Se diferencian de los experimentos puros en el
grado de seguridad o confiabilidad que pueda tenerse sobre la equivalencia inicial
de los grupos. En estos diseos, los sujetos no se asignan al azar a los grupos
ni se emparejan, sino que dichos grupos ya estn formados antes del
experimento: son grupos intactos.

C1. DISEO DE POSPRUEBA NICAMENTE Y GRUPOS INTACTOS
G
1
: X O
1

G
2
: - O
2


C2. DISEO CON PREPRUEBA-POSPRUEBA Y GRUPOS INTACTOS
G
1
: O
1
X O
2

G
2
: O
3
- O
4




GUA DE INVESTIGACIN UPN pg. 14

PARTE II:

DEFINICIONES ESTADSTICAS


1. UNIVERSO.
Es el conjunto de individuos, objetos o entes que tienen caractersticas comunes, definidas en
forma general en un espacio y tiempo.
Ejemplo:
- Conjuntos de alumnos, conjunto de docentes universitarios, conjunto de de pacientes, conjunto de
clientes, conjunto de proveedores, conjunto de viviendas, conjunto de establecimientos, conjunto de
documentos, etc.; de una determinada regin o zona en un tiempo determinado.

2. POBLACIN.
Es un conjunto grande y completo de individuos, elementos o unidades que presentan como
mnimo una caracterstica en comn y observable. Para definir una poblacin esta debe
contener los siguientes elementos: CONTENIDO, ESPACIO Y TIEMPO.
Al nmero de elementos de una poblacin de denota por N.
Una poblacin puede clasificarse de la siguiente manera:

A. SEGN SU EXTENSIN:
Poblacin Finita: es aquella que tiene un determinado nmero de elementos.
Poblacin Infinita: es aquella cuyos elementos no se pueden contar.

B. SEGN SU MBITO O NATURALEZA:
Poblacin Objeto: est dada por los elementos que forman la poblacin.
Poblacin Objetivo: est dada por la informacin que da la poblacin objeto

Nota: De un universo se pueden desprender muchas poblaciones, pero operativamente se
pueden hablar indistintamente como poblacin o universo.

3. MUESTRA.
Es una parte o un subconjunto de la poblacin en estudio. Tambin se puede decir que es
una coleccin de unidades de muestreo seleccionados de un marco muestral o de varios
marcos muestrales. Al nmero de elementos de la muestra se denota por n.
Una muestra tiene las siguientes caractersticas:
a. Es representativa.
b. Es adecuada.
c. Homognea.

4. UNIDAD DE ESTUDIO.
Es el animal persona o cosa de quien se dice algo. Es el elemento quien nos va a dar la
informacin. Es el individuo u objeto del cual se toman las mediciones u observaciones.
Ejemplos:
- Un docente, un auxiliar de educacin, un votante, una factura, una empresa, una botella de cerveza,
una universidad, una vaca, una gota de sangre, etc.

5. VARIABLE.
Una variable es una caracterstica de estudio de una poblacin. Una variable es lo que se
quiere evaluar en una investigacin. Las caractersticas toma diferentes valores que varan de
individuo a individuo o de objeto a objeto. Aquellas caractersticas que permanecen



GUA DE INVESTIGACIN UPN pg. 15
inalterables en las unidades de estudio reciben el nombre de constantes.
Generalmente, las variables se designan con las ltimas letras maysculas del abecedario: X,
Y, Z; y los valores de las variables se designan con letras minsculas: x
i
, y
i
, etc.
Las variables se clasifican de la siguiente manera:
- Por su relacin: Variable dependiente - Variable independiente.
- Por su escala de medicin: Nominal Ordinal Intervalo Razn.
- Por su naturaleza: Cuantitativas - Cualitativas.

Ejemplos:
Unidad de estudio
- Estudiante

- Empresa

- PYME

Variable
- Peso, talla, edad, ci, nmero de hermanos,
raza, color de ojos, tipo de sangre, etc.
- Ganancia, costos, produccin, nmero de
trabajadores, numero de computadoras, etc.
- Nmero de trabajadores, aos de
funcionamiento, ganancias, etc





















6. PARMETRO.
Es un valor, una cantidad, un indicador que se obtiene con informacin de la poblacin.
Dentro de estos tenemos:
a. El promedio poblacional
b. La varianza poblacional.
c. La proporcin poblacional, etc.

7. ESTIMADOR.
Es un valor, una cantidad, un indicador que se obtiene con informacin de la muestra. Dentro
de estos tenemos:
a. El promedio muestral.
b. La varianza muestral.
c. La proporcin muestral, etc.

8. TCNICAS DE RECOLECCIN DE DATOS.
Las tcnicas de recoleccin de datos permiten la obtencin sistemtica de informacin acerca
de los objetos de estudio y de su entorno. Como ya se mencion, la recoleccin de datos
tiene que ser sistemtica, ya que, si los datos se recolectan al azar ser difcil responder las
preguntas de investigacin de una manera concluyente.



V Va ar ri ia ab bl le e
Cualitativa
Cuantitativa
Nominal

Ordinal Discreta Continua
Cualidad
O
Atributo
Cantidad
o
nmero
Conteo Medicin No orden Orden



GUA DE INVESTIGACIN UPN pg. 16
Las tcnicas ms comunes de recoleccin de datos son:
1. Observacin
2. Entrevista (cara a cara)
3. Encuestas
4. Experimentacin
5. Focus Groups
6. Lluvia de ideas
7. Otras


OBSERVACIN:
La observacin es una tcnica que implica seleccionar ver y registrar sistemticamente, la
conducta y caractersticas de seres vivos, objetos o fenmenos. La observacin de la
conducta humana es una tcnica de recoleccin de datos muy utilizada que puede llevarse
a cabo de diferentes formas:
a. Observacin participativa: El observador participa en la situacin que observa
b. Observacin no participativa: El observador no participa en la situacin que observa
Las observaciones pueden servir para diferentes propsitos. Pueden dar informacin
adicional y ms confiable de la conducta de las u.e. que las entrevistas o los cuestionarios.
Los cuestionarios pueden ser incompletos ya que se pueden olvidar algunas preguntas o
porque los entrevistados olvidan o no desean contestar algunas cosas. Con la observacin
se puede, entonces, verificar la informacin recolectada (especialmente sobre temas como
alcoholismo, drogadiccin, sida,) pero tambin puede ser una fuente primaria de
informacin (observacin sistemtica de los juegos de los nios).
La observacin de la conducta humana puede formar parte de algn estudio, pero como
consume tiempo se usa con mayor frecuencia en estudios de pequea escala.

ENTREVISTA:
La entrevista es una tcnica de recoleccin de datos que involucra el cuestionamiento oral
de los entrevistados ya sea individualmente o en grupo. Las respuestas a las preguntas
durante la entrevista pueden ser registradas por escrito o grabadas en una cinta. La
entrevista puede conducirse con diferentes grados de flexibilidad.
Las entrevistas utilizan una cdula para asegurar que se discuten todos los puntos, pero
dando suficiente tiempo y permitiendo seguir cualquier orden. El entrevistador puede hacer
preguntas adicionales para obtener tanta informacin adicional como sea posible, Las
preguntas son abiertas y no hay restricciones para las respuestas.
Este mtodo poco estructurado de hacer las preguntas puede ser til para entrevistas
individuales o grupales con informantes claves.
Un mtodo de entrevista flexible es til si el investigador sabe poco del problema o de la
situacin que esta investigando. Se aplica en estudios exploratorios y en los estudios de
caso.

ENCUESTAS:
Hoy en da la palabra "encuesta" se usa ms frecuentemente para describir un mtodo de
obtener informacin de una muestra de individuos. Una "encuesta" recoge informacin de
una "muestra. Las encuestas pueden ser usadas para estudiar poblaciones humanas o no
humanas (por ejemplo, objetos animados o inanimados, animales, terrenos, viviendas).
Las encuestas pueden ser clasificadas por su mtodo de recoleccin de datos: las
encuestas por correo, telefnicas y entrevistas en persona son las ms comunes. En los
mtodos ms nuevos de recoger datos, la informacin se entra directamente a la
computadora ya sea por un entrevistador adiestrado o an por la misma persona
entrevistada. Un ejemplo bien conocido es la medicin de audiencias de televisin usando
aparatos conectados a una muestra de televisores que graban automticamente los
canales que se observan

Otras tcnicas de recoleccion de datos:
a. Tcnica delphi
b. Historias de vida



GUA DE INVESTIGACIN UPN pg. 17
c. Ensayos
d. Estudios de casos
e. Mapeo
f. Tcnicas rpidas de evaluacin de sondeo
g. Encuestas participativas.


9. INSTRUMENTOS DE RECOLECCIN DE DATOS:
Si tenemos presente el tema de investigacin por el que nos estarnos guiando se percibir
que, una vez obtenidos los indicadores de los elementos tericos y definido el diseo de la
investigacin, se har necesario estructurar las tcnicas d recoleccin de datos
correspondientes, para as poder construir los instrumentos que nos permitan obtener tales
datos de la realidad.
Un instrumento de recoleccin de datos es, en principio, cualquier recurso de que pueda
valerse el investigador para acercarse a los fenmenos y extraer de ellos informacin. Ya
adelantbamos que dentro de cada instrumento concreto pueden distinguirse dos aspectos
diferentes: una forma y un contenido. De este modo, el instrumento sintetiza en s toda la
labor previa de investigacin: resume los aportes del marco terico al seleccionar datos que
corresponden a los indicadores y, por lo tanto, a las variables o conceptos utilizados; pero
tambin expresa todo lo que tiene de especficamente emprico nuestro objeto de estudio,
pues sintetiza a travs de las tcnicas de recoleccin que emplea, el diseo concreto
escogido para el trabajo.


PARTE III:

COMO DETERMINAR UNA MUESTRA


1. DEFINICIN DE MUESTREO
Es una herramienta de la investigacin cientfica, su funcin bsica es determinar qu parte
de la realidad en estudio (poblacin o universo) debe de examinarse con la finalidad de hacer
inferencias sobre el TODO de la que procede.
El muestreo estadstico es un enfoque sistemtico que se refiere al proceso de seleccin de
los elementos, sujetos o casos de una poblacin. Para que el muestreo est bien realizado es
necesario que los elementos escogidos representen bien a toda la poblacin. Si la muestra no
cumple este cometido se dice que la muestra es sesgada o tendenciosa; en el caso
contrario, cuando la muestra ha sido bien seleccionada, se habla de muestra representativa.

2. ETAPAS PRINCIPALES EN UNA ENCUESTA POR MUESTREO
La encuesta por muestreo comprende varios aspectos ntimamente ligados, ya que el fallo de
cualquiera de ellos puede invalidar la encuesta en su totalidad. A continuacin se intenta dar
una visin de conjunto sobre el contenido de los ms importantes.
a. Establecimiento de Objetivos.
b. Definir la Poblacin Objetivo.
c. El Marco Muestral.
d. Diseo de Muestreo
e. Mtodo de Medicin
f. Instrumento de Medicin
g. Seleccin y Adiestramiento de Investigadores de Campo
h. Prueba Piloto
i. Organizacin de Trabajo de Campo
j. Anlisis de los Datos.


3. TRMINOS TCNICOS EN EL MUESTREO



GUA DE INVESTIGACIN UPN pg. 18
A. UNIDAD DE MUESTREO.
Es cada uno de los elementos que forma el marco muestral, que aparecen separados y
por una sola vez. Esta unidad a veces coincide con la unidad de anlisis.
Ejemplos:
- En un estudio de presin arterial alta, la unidad de estudio es la persona adulta con hipertensin
y la unidad de muestreo es la familia.
- En un estudio de parasitosis la unidad de estudio y la unidad de muestreo puede ser la familia.
- En un estudio sobre mortalidad infantil, la unidad de estudio es el recin nacido y la unidad
muestral es la historia clnica de la madre gestante.

B. MARCO MUESTRAL.
Es una lista o registro actualizado de todas las unidades de la poblacin, de manera que
puedan ser ordenadas numricamente desde el primer elemento hasta el ltimo elemento
(N) de la poblacin. Las diferentes especificaciones que se tenga del marco muestral
definirn su alcance geogrfico, periodo de estudio y su fuente. De este marco muestral se
seleccionarn los elementos de la muestra.
Ejemplo:
- Base de datos de pacientes atendidos en el Hospital Regional Docente. Ao 2000.
- Historias Clnicas del Servicio de Pediatra del HRDT.
- Directorio de los mdicos del Hospital
- Plano de viviendas del distrito de Trujillo.
- Listado de los alumnos matriculados en la UNT-2004.
- Listado de las facturas de las ventas del primer trimestre de una Farmacia.
- Listado de todas las farmacias del Departamento de La Libertad.

C. ERROR DE ESTIMACIN:
El error de estimacin es la diferencia que existe entre el valor de una estimacin muestral
y el valor del parmetro obtenido de la poblacin.
Esta clase de error es llamado tambin error de muestreo.

Ejemplo:
- Si el valor de la edad promedio de una poblacin es 19 y la edad promedio obtenida de los
mismos en base a una muestra es 18, el error de muestreo ( E ) ser de 1 ao.

Generalmente este error es desconocido, por lo tanto el investigador tienen fijar este error
(variacin mxima entre el estimador y el parmetro).
Esta diferencia recibe el nombre de Precisin del estimador o error tolerable.
Este error se expresar en valores absolutos: 2 aos, 3 aos o en trminos relativos:
5%, 8 %, 0.002.

D. ERROR NO MUESTRAL:
Estos errores, son llamados tambin errores ajenos al muestreo o errores de no muestreo.
No se pueden medir fcilmente, y aumentan a medida que aumenta el tamao de la
muestra. Los tipos de errores no muestrales que suelen presentarse son:
- Definicin equivocada del problema,
- Definicin defectuosa de la poblacin;
- Marco muestral imperfecto o desactualizado,
- La no-respuesta,
- El sesgo de respuesta,
- Diseo pobre del cuestionario, etc.

Sin embargo, los errores ajenos al muestreo pueden ser controlados mediante una
atencin cuidadosa en la definicin del problema, en la construccin de los instrumentos
de medicin (cuestionario) y en los detalles del trabajo de campo.
Estos errores tienen una presencia fuerte en las encuestas de opinin.

-E +E
x+z
s+ 1-/2 xst o
o



GUA DE INVESTIGACIN UPN pg. 19
E. NIVEL DE CONFIANZA: (1-o)
Distribucin Normal
Es la probabilidad de que la estimacin efectuada o calculada
se ajuste a la calidad. Cualquier Informacin que se analiza se
distribuye segn una ley de probabilidad (Normal o Student),
entonces se llamar nivel de confianza a la probabilidad de que
el intervalo construido en torno a un estadstico capte el
verdadero valor del parmetro.

F. NIVEL DE ERROR:
Error Alfa (o):
Es la probabilidad de rechazar incorrectamente una Hiptesis cuando es verdadera, a esta
probabilidad se le denomina VALOR P. Tambin se le llama error tipo I.

Error Beta (|):
Es la probabilidad de aceptar incorrectamente una hiptesis cuando es falsa. Tambin se
llama error tipo II.

G. POTENCIA (1-|):
Es la probabilidad de llegar a la conclusin de que haba una diferencia cuando
efectivamente as era.

VALORES DE LA DISTRIBUCIN NORMAL ESTANDARIZADA
ERROR (Tipo I): Puede ser unilateral o bilateral
Nivel de confianza (1-o) Error
(o)
Valor Z
Bilateral Unilateral
90%
95%
99%
0.10
0.05
0.01
1.64
1.96
2.57
1.28
1.64
2.32
ERROR (Tipo II): Siempre es unilateral
Poder
(1-|)
Error
(|)
Valor Z
0.80
0.90
0.95
0.99
0.20
0.10
0.05
0.01
0.842
1.282
1.645
2.326


En ciencias de salud los valores mas usuales son o = 0.05 y | = 0.20.

4. TIPOS DE MUESTREO

A. MUESTREO PROBABILSTICO:

A1. Muestreo aleatorio simple (m.a.s.):
Si se selecciona una muestra de tamao n de una poblacin de tamao N elementos,
de tal manera que cada elemento tiene la misma probabilidad de pertenecer a la
muestra, el procedimiento de muestreo se denomina Muestreo Aleatorio Simple
(M.A.S) y a la muestra as obtenida se la llama muestra aleatoria simple (m.a.s). Es el
muestreo ms sencillo y de fcil comprensin.

A2. Muestreo sistemtico
Si una muestra se obtienen al seleccionar aleatoriamente un elemento de los primeros
k elementos del MARCO y despus cada k-simo elemento, esta muestra se
denomina Muestra Sistemtica de intervalo de seleccin k.
El muestreo sistemtico puede ser de dos formas, muestreo sistemtico simple y
muestreo sistemtico circular.

A3. Muestreo estratificado



GUA DE INVESTIGACIN UPN pg. 20
Una muestra estratificada es obtenida mediante la separacin de elementos en grupos
llamados estratos, y la seleccin posterior de una muestra aleatoria (m.a.s, m.
sistemtica, etc.) de cada estrato.



Procedimiento de Seleccin
El procedimiento de seleccin de una muestra estratificada consiste en:
(i) Dividir la poblacin en L estratos mutuamente excluyentes y colectivamente
exhaustivos, siendo (L>1). Cada estrato de la poblacin tendr N
i
unidades, y la
poblacin total consta de:

=
=
L
i
i
N N
1


ii) Seleccionar una muestra aleatoria independientemente de cada estrato, de tal
manera que el tamao total de la muestra es:

=
=
L
i
i
n n
1
, donde n
i
= tamao de la muestra en el estrato i.

A4. Muestreo por etapas
En la mayora de las encuestas por muestreo, las unidades de muestreo suelen ser un
grupo de elementos que comnmente es llamado conglomerado de elementos. El
muestreo de estas unidades (grupo de elementos) es llamado muestreo de
conglomerados.
El muestreo de conglomerados usualmente se aplica en ciudades y pases, donde un
conglomerado de elementos suele ser una pequea regin geogrfica.
A estos conglomerados se les llaman conglomerados compactos, ya que estn
formados por elementos contiguos. Lo usual en estos conglomerados es que los
elementos presentan caractersticas similares, por lo tanto no sera conveniente tomar
informacin de todos los elementos del conglomerado.
Una prctica usual consiste en seleccionar una muestra (submuestra) de elementos
de cada conglomerado seleccionado, a este tipo de muestreo se le denomina
muestreo en dos etapas o bietpico. La generalizacin de este muestreo a ms etapas
se llama muestreo multietpico.
La forma ms comn de usar el muestreo por etapas es mediante el muestreo por
reas, que es ampliamente usado en la investigacin comercial, en donde se
seleccionan reas geogrficas y se entrevista a una muestra de residentes de ella.
El muestreo de conglomerados es un diseo efectivo para obtener informacin por las
siguientes ventajas que ofrece:
i. Reduce el costo de la encuesta, al no utilizar una lista de elementos de la
poblacin (marco) y slo una lista de conglomerados que es ms fcil y ms
barato de obtener.
ii. Adems reduce el costo y el tiempo de transporte en las entrevistas.
Muestra del
estrato 1, con
n unidades
1
Muestra del
estrato 3, con
n unidades
3
ESTRATO 3
N
3
ESTRATO 1
N = n de unidades
del estrato I
1
ESTRATO 4
N
4
Muestra del
estrato 2, con
n unidades
2
Muestra del
estrato 4, con
n unidades
4



GUA DE INVESTIGACIN UPN pg. 21


B. MUESTREO NO PROBABILSTICO O EMPRICO:
Los mtodos no probabilsticos son aquellos en los que no se puede establecer a priori
una probabilidad de seleccin de los elementos de la poblacin que pueden formar parte
de la muestra; es decir, el proceso de seleccin de los elementos de la muestra es
subjetivo, depende la voluntad y criterio del investigador. Las muestras no probabilsticas
son fciles de conseguir y a un costo bajo, pero tienen el inconveniente de su poca validez
al no controlar los mrgenes de error. Entre los ms importantes se encuentran:

B1. Muestreo de conveniencia
En este caso la muestra estar formada por unidades muestrales que nos faciliten su
medida, que sean accesibles o que sean favorables, por ello si bien reducen el costo
del muestreo y de la recogida de informacin, normalmente los estimadores obtenidos
no sern muy parecidos a los parmetros de la poblacin.
Este tipo de muestra suele ser utilizada en determinadas ocasiones, por ejemplo
cuando se est realizando una prueba de un cuestionario, o ante un ensayo previo a
la realizacin de un estudio.

B2. Muestreo de juicio
Consiste en acudir a expertos en la materia para que nos ayuden en la determinacin
de una muestra representativa. En l, se deja de lado la muestra probabilstica, para
por medio de un conocimiento profundo del tema objeto de estudio escoger una
muestra adecuada.
Por ejemplo, si queremos saber cul es la evolucin de las ventas de un determinado
electrodomstico, podemos acudir a expertos para que nos indiquen cules son las
marcas ms representativas del mercado, y nos ayuden a seleccionar unidades
muestrales adecuadas para el estudio.

B3. Muestreo por cuotas
Suponen una estratificacin de la poblacin y la eleccin de cuotas proporcionales en
la muestra a los estratos de la poblacin. La eleccin de las cuotas es el resultado de
la eleccin de varias categoras y variables, dejando en manos del entrevistador, la
eleccin ultima de los elementos.
Es el muestreo no probabilstica ms usado, que suele introducirse en la ultima etapa
del muestreo.
Por ejemplo, si se realiza un estudio entre los jvenes comprendidos entre 14 y 25
aos, para identificar sus hbitos de uso del tiempo libre, seria acertado establecer
unas cuotas en funcin de la actividad principal de los entrevistados (si son
estudiantes o trabajan); en funcin del tipo de residencia de los mismos (residencia
paterna, vivienda compartida o domicilio propio).


5. DETERMINACIN DEL TAMAO DE MUESTRA:

Para determinar el tamao, primeramente hay que identificar la variable a estudiar
(cuantitativa o cualitativa). Luego depende de cuatro factores o elementos que son los
siguientes:

A. PARA UNA VARIABLE CUANTITATIVA:
a. Un nivel de confianza: Que es adoptado por el investigador, el cual puede ser 90%,
95% o 99% y que origina el valor de Z.
b. El error de estimacin (E): Que tambin es fijado por el investigador
c. La desviacin estndar varianza: que son valores que se obtienen por estudios
anteriores, por la muestra piloto o por la distribucin de la poblacin.
d. El Tamao de la poblacin (N): Que generalmente no se conoce.




GUA DE INVESTIGACIN UPN pg. 22
B. PARA UNA VARIABLE CUALITATIVA:
a. Un nivel de confianza: Que es adoptado por el investigador, el cual puede ser 90%,
95% o 99% y que origina el valor de Z.
b. El error de estimacin (E): Que tambin es fijado por el investigador
c. La proporcin poblacional (P): que son valores que se obtienen por estudios
anteriores, por la muestra piloto y si no se conoce asumir p=0.5.
d. El Tamao de la poblacin (N): Que generalmente no se conoce.


FRMULAS PARA DETERMINAR EL TAMAO DE MUESTRA:


VARIABLE
Cualitativa
(Proporcin Poblacional)
Cuantitativa
(Promedio Poblacional)
POBLACIN INFINITA
(Cuando no se conoce N)
2
2
0
) 1 (
E
P P Z
n

=

2
2 2
0
E
S Z
n =

POBLACIN FINITA
(Cuando se conoce N)

) 1 ( ) 1 (
) 1 (
2 2
2
P P Z N E
N P P Z
n
+

=



2 2 2
2 2
) 1 ( S Z N E
N S Z
n
+
=



- Z = es el valor de la distribucin normal estandarizada para un nivel de confianza
fijado por el investigador.
- S = Desviacin estndar de la variable fundamental del estudio o de inters para el
investigador. Obtenida por estudios anteriores, muestra piloto, criterio de experto o
distribucin de la variable de inters.
- P = es la proporcin de la poblacin que cumple con la caracterstica de inters.
- E = % del estimador o en valor absoluto (unidades). Fijada por el investigador.
- N = Tamao de la poblacin.


6. TCNICAS DE SELECCIN DE UNIDADES:

A. SELECCIN ALEATORIA DE UNIDADES:
Para hacer uso de este mtodo se necesita conocer el tamao de la poblacin (N), el
tamao de la muestra (n) y la tabla de nmeros aleatorios, cuyo procedimiento es el
siguiente:
a. Determinar en forma aleatoria el punto de arranque: A(x,y)
b. Conocer el nmero de cifras del tamao de la poblacin y en funcin a ste
seleccionar los nmeros aleatorios.
c. A los nmeros aleatorios que superan N (el tamao de la poblacin), restar
consecutivamente este tamao hasta lograr que sea menor que N.
d. Descartar el nmero aleatorio dependiendo del tipo de muestreo que se est
realizando (con reemplazo y sin reemplazo).


TABLA DE NMEROS ALEATORIOS




Fila

Columna
01-05 06-10 11-15 16-20 21-25 26-30 31-35 36-40 41-45 46-50



GUA DE INVESTIGACIN UPN pg. 23
01
02
03
04
05
54463
15389
85941
61149
05219
22662
85205
40756
49440
81619
65905
18850
82414
11286
10651
70639
39226
02015
88218
67079
79365
42249
13858
58925
92111
67382
90669
78030
03638
59888
29085
96325
16269
52862
84502
69831
23248
65978
62733
72095
47058
60933
01385
33451
83453
08186
26927
15345
77455
75577
06
07
08
09
10
41417
28357
17783
40950
82995
98326
94070
00015
84820
64157
87719
20652
10806
29881
66164
92294
35774
83091
85966
41180
46614
16249
91530
62800
10089
50948
75019
36466
70326
41757
64886
21145
39981
84740
78258
20002
05217
62481
62660
96448
97365
47286
49177
77379
88629
30976
76305
75779
90279
37231
11
12
13
14
15
96574
34754
06318
62111
47534
17676
88040
73403
52820
09243
55659
53364
49927
07243
67879
44105
71726
57715
79931
00544
47361
45690
50423
89292
23410
34833
66334
67372
84767
12740
86679
60332
63116
85693
02540
23930
22554
48888
73947
54440
53249
90600
21515
22278
32949
27083
71113
80183
11551
13491
16
17
18
19
20
98614
24856
96887
90801
55165
75993
03648
12479
21472
77312
84460
44898
80621
42815
83666
62846
09351
66223
77408
36028
59844
98795
86085
37390
28420
14922
18644
78285
76766
70219
48730
39765
02432
52615
81369
73443
71058
53342
32141
41943
48167
90368
42856
30268
47366
34770
44104
94771
18106
41067
21
22
23
24
25
75884
16777
46230
42020
81007
12952
37116
43877
66892
00333
84318
58550
80207
46134
39693
95108
42958
88877
01432
28039
72305
21460
89380
94710
10154
64620
43910
32992
23474
95425
91318
01175
91380
20423
39220
89872
87894
03164
60137
19774
45375
81378
98656
60609
31782
85436
10620
59337
13119
49037
26
27
28
29
30
68089
20411
58212
70577
94522
01122
67081
13160
42866
74358
51111
89950
06468
24969
71659
72373
16944
15718
61210
62038
06902
93054
82627
76046
79643
74373
87687
76999
42054
44741
96199
66930
05999
42054
44741
97017
87236
58680
12696
05437
41273
77054
96739
93758
39038
21546
33848
63700
03283
13163
31
32
33
34
35
42626
16051
08244
59497
97155
86819
33763
27647
04392
13428
85651
57194
33851
09419
40293
88780
16752
44705
89964
09985
17401
54450
94211
51211
58434
03252
19031
46716
04894
01412
99547
58580
11738
72882
69124
32404
47629
55784
17805
82171
17918
54132
95374
21896
59058
62880
60631
72655
83864
82859
36
37
38
39
40
98409
45476
89300
50051
31753
66162
84882
69700
95137
85178
95763
65109
50741
91631
31310
47420
96597
30329
66315
89642
20792
25930
11658
91428
98364
61527
66790
23166
12275
02306
20441
65706
05400
24816
24617
39435
61203
66669
68091
09609
11859
53634
48708
71710
83942
41567
22557
03887
33258
22716
41
42
43
44
45
79152
44560
68328
46939
83544
53829
38750
83378
38689
86141
77250
86635
63369
58625
15707
20190
56540
71381
08342
96256
56535
64900
39564
30459
23068
18760
42912
05615
85863
13782
69942
13953
42451
20781
08467
77448
79149
64559
09284
89467
32278
18710
97501
26333
93842
48805
68618
65747
91777
55349
46
47
48
49
50
91621
91896
55751
85156
07521
00881
67126
62515
87689
56898
04900
04151
21108
95493
12236
54224
03795
80830
88842
60277
46177
59077
02263
00664
39102
55309
11848
29303
55017
62315
17852
12630
37204
55539
12239
27491
98375
96926
17771
07105
89415
52068
30506
69448
11844
23466
60142
09808
87530
01117


PUNTO DE ARRANQUE:

A (a , b)

Nmero de fila Nmero de columna


B. SELECCIN SISTEMTICA DE UNIDADES:
Si una muestra se obtienen al seleccionar aleatoriamente un elemento de los primeros k
elementos del MARCO y despus cada k-simo elemento, esta muestra se denomina
Muestra Sistemtica de intervalo de seleccin k.

PROCEDIMIENTO
El procedimiento de seleccin de una muestra sistemtica consiste en:
Tener el Marco Muestral cuyas unidades deben ser ordenados en magnitud de
acuerdo con algn esquema (poblacin ordenada).
En base al orden se establece la enumeracin desde 1 hasta N.



GUA DE INVESTIGACIN UPN pg. 24
Determinar el intervalo de seleccin k, k debe ser el mximo entero de N/n.
Seleccionar un nmero aleatorio entre 1 y k (arranque aleatorio).
Sea a = arranque aleatorio, entonces los elementos de la muestra sistemtica son:
a, k + a, 2k + a , .................................................., (n - 1)k + a



PARTE IV:

TCNICAS ESTADSTICAS EN DISEOS DESCRIPTIVOS


Cuando se va a analizar los datos obtenidos a travs de diseos descriptivos, las tcnicas
estadsticas a utilizar son las siguientes:
1. Cuadros de Distribucin de frecuencias
2. Grficos estadsticos
3. Medidas estadsticas descriptivas

1. CUADRO DE DISTRIBUCIN DE FRECUENCIAS (CDF):

1.1. DEFINICIN:
Un cuadro de distribucin de frecuencias, es una tabla resumen de un conjunto de
datos que muestra el comportamiento o distribucin de la variable en estudio en forma
rpida y resumida.
An cuando un cuadro de frecuencias se construye a libre criterio de quien lo ejecuta,
generalmente es comn seguir algunos pasos que de alguna forma homogenizan
criterios y ayudan a los fines didcticos.
Para realizar este anlisis se tienen que tener en cuenta el tipo de variable que se est
evaluando.

1.2. PARTES DE UN CUADRO DE DISTRIBUCIN DE FRECUENCIAS:
Las partes de un CDF son las siguientes:
a. Nmero del cuadro de frecuencias en forma correlativa.
b. Ttulo: Especificar la variable y la poblacin en estudio
c. Encabezado o conceptos.
d. Cuerpo o contenido del cuadro de frecuencias
e. Nota de pie (no siempre es necesaria)
f. Fuente
g. Elaboracin

1.3. ELEMENTOS PARA CONSTRUIR UN CDF:
Para construir un cuadro de frecuencias se utilizan los siguientes elementos:

a. Valores de la variable Xi:
Los valores de la variable o datos se representan por Xi. Ejm: Si se tienen 50
datos sus valores correspondientes no agrupados se representan como X
1
, X
2
,
X
3
, ..., X
50
.

b. Intervalos de clase:
Los intervalos son subconjuntos de la recta real Ron que estn definidos por un
lmite menor o inferior Li y un lmite mayor o superior Ls.

c. Frecuencia:

1. Frecuencia absoluta simple:



GUA DE INVESTIGACIN UPN pg. 25
Se denotan por fi. Est constituida por el nmero de veces que se repite un
valor. En el caso de intervalos es el nmero de observaciones
comprendidas en dicho intervalo. Estas frecuencias siempre son enteros
positivos y adems la suma de todos ellos es el tamao de la muestra n.
2. Frecuencia relativa:
Se denotan por hi. Indica la relacin o proporcin existente entre la
frecuencia absoluta simple y el nmero total de datos. Estas frecuencias son
numeros fraccionarios positivos entre o y 1. Para fines interpretativos estas
frecuencias se expresan en % (hi%). As:

n
fi
hi =

100 (%) x
n
i f
hi =

3. Frecuencia absoluta acumulada:
Se denotan por Fi. Resulta de la suma de las frecuencias cuyas marcas de
clase son iguales o menores a la marca de clase del intervalo dado o
considerado, es decir:
F
1
= f
1

F
2
= f
1
+ f
2

F
3
= f
1
+ f
2
+ f
3

.............................................

Fj = f
1
+ f
2
+ f
3
+ ....... + fi

4. Frecuencia relativa acumulada:
SE denotan Hi. Resulta de la suma de las frecuencias relativas simples hasta
la frecuencia del intervalo considerado. As:
H
4
= h
1
+ h
2
+ h
3
+ h
4

H
6
= h
1
+ h
2
+ ....+ h
6

Para fines interpretativos estas frecuencias se expresan en % (Hi%)

d. Marca de clase:
Se denota por Yi. Es el promedio de los valores correspondientes a los lmites
inferior y superior de cada uno de los intervalos determinados.

1.4. PROPIEDADES DE UN CDF:
A. Las fi y Fi son siempre nmeros enteros positivos. Es decir: fi , Fi 0.
B. Las hi y Hi son siempre nmeros fraccionarios positivos comprendidos entre 0 y
1, es decir 0 hi , Hi 1.
C. F1 siempre es igual f1 y H1 siempre es igual a h1.
D. La suma de todas las fi es igual a n y la suma de las hi es igual a 1.
E. Fm siempre es igual a n y Hm siempre es igual a 1.

1.5. CONSTRUCCIN DE CUADROS DE FRECUENCIAS:
Para la construccin de los CDF hay que tener en cuenta el tipo de variable que se est
analizando, es decir, si es cuantitativa continua, cuantitativa discreta o variable
cualitativa.

A. CDF PARA UNA VARIABLE CUANTITATIVA CONTINUA:
Para la construccin de este cuadro hay que realizar los siguientes pasos:
PASO 1. Determinar el Rango del conjunto de datos.



PASO 2. Determinar el nmero de intervalos m.


Este valor siempre es un nmero entero (Redondeo)

PASO 3. Determinar la amplitud A intervlica (de cada intervalo).
R = Valor mximo - Valor mnimo
m = 1 + 3.322 log
( n )



GUA DE INVESTIGACIN UPN pg. 26


Este valor est en funcin de la estructura de la base de datos (tomar el
inmediato superior)

PASO 4. Determinar el nuevo rango R
2
(Solamente si se tomo un inmediato
superior)



A: es la amplitud teniendo en cuenta el inmediato superior.

PASO 5. Determinar los intervalos y finalmente construir el cuadro.

B. CDF PARA UNA VARIABLE CUANTITATIVA DISCRETA:
Para la construccin de un CDF para una variable cuantitativa discreta (valores
discretos) ya no se utiliza los pasos anteriores solamente colocar en los intervalos a
los diferentes valores discretos.

C. CDF PARA UNA VARIABLE CUALITATIVA:
Para la construccin de un CDF para una variable cualitativa se sigue los mismos
pasos que para una variable cuantitativa discreta, es decir, solamente colocar en los
en los intervalos a las diferentes categoras de la variable cualitativa.

1.6. EXCEL EN LA CONSTRUCCION DE CDF.

Si bien es cierto que el EXCEL no es un programa exclusivamente diseado para
anlisis de datos, es muy utilizado dentro del anlisis de estos cuando se realiza una
investigacin cientfica. Una de las ventajas y razones de su uso, est en su fcil
acceso, pues en todas las computadoras est instalado y as se podr explorar el
funcionamiento de las herramientas que se presentan en este programa.

A. CONSTRUCCIN DE CUADROS DE FRECUENCIA UTILIZANDO TABLAS
DINMICAS:

Para construir cuadros de distribucin de frecuencias a travs de Excel se utiliza la
herramienta TABLAS DINAMICAS ver el uso de este programa analizaremos la
siguiente base de datos respecto a 50 casos y 10 variables de estudio. (Archivo
BASE 01.exe).
Teniendo en cuenta esta base de datos realizar los siguientes pasos:
Hacemos clic en Insertar /tabla dinmica aparece la siguiente pantalla:



Luego aparecen las siguientes ventanas de trabajo.activamos (a) lista de base
de datos de Excel y (b) Tabla Dinmica. Luego siguiente seleccionamos el rango
respectivo, luego siguiente..luego seleccionamos la opcin diseo.


En la opcin diseo seleccionamos la variable que
vamos a analizar y con el cursor activamos dicha
variable y lo arrastramos hasta la opcin FILA y luego la
misma variable la arrastramos hasta la opcin DATOS.
Finalmente aceptamos y obtenemos los resultados


A = R / m
R
2
= A * m



GUA DE INVESTIGACIN UPN pg. 27






En funcin a lo que se quiera obtener como
resultados de la variable analizada, se
selecciona OPCIONES DE TABLA DINMICA
para obtener ya sea totales, promedio o
frecuencia de dicha variable. Esta ventana de
trabajo es la siguiente:



B. CONSTRUCCIN DE CUADROS DE FRECUENCIA UTILIZANDO MEGASTAT:

Para construir cuadros de distribucin de frecuencias con Megaestat se utiliza la
opcin Complementos/MegaStat Frecuencias.. para variables cuantitativas y
variables cualitativas. Se aprecia la siguiente ventana. Leugo se hace la seleccin
de datos respectiva y a gozar este programa.





2. GRFICOS ESTADSTICOS:

2.1 DEFINICIN

- Un grfico estadstico es una representacin pictrica, cuyo objetivo es expresar el
comportamiento de una variable en estudio.
- Los grficos estadsticos son representaciones de informacin real que existe en
nuestro mundo, es una expresin artstica de datos reales y observados.



GUA DE INVESTIGACIN UPN pg. 28
- Un grfico sirve tambin para comparar visualmente el comportamiento de dos o
ms variables similares o relacionadas.

2.2 PARTES DE UN GRFICO ESTADSTICO:
- Numeracin.
- Titulo: Aqu se seala la poblacin en estudio y la variable de inters.
- Diagrama: esta dado por el propio dibujo el cual representa el comportamiento de
los datos.
- Escalas y/o leyendas: Son indicadores donde se precisa la correspondencia entre
los elementos del grfico y la naturaleza de las medidas representadas.
- Fuente: Aqu se seala el CDF que permiti obtener el respectivo grfico.

2.3 CRITERIOS PARA CONSTRUIR GRFICOS:
- No existe una regla especfica para la construccin de grficos, pero si es posible
considerar algunas recomendaciones o criterios.
- Se emplea una diversidad de grficos, cuya estructura o forma depender del tipo
de variable que se est estudiando.
- Este grfico debe tener rasgos simples y de fcil comprensin.

2.4 TIPOS DE GRFICOS ESTADSTICOS
Hay varias tipos de grficos, los cuales dependen del tipo de variable que est
evaluando. Presentaremos aqu los ms importantes:
a. Grfico de bastones: Se utiliza cuando se tienen datos de una variable
cuantitativa discreta.
b. Histograma: Se utiliza cuando se tienen datos de una variable cuantitativa
continua.
c. Grfico de Barras: Se utiliza cuando se tienen datos de una variable cualitativa.
d. Grfico Sectorial o Pastel: Se utiliza cuando se tienen informacin de una
variable cualitativa o cuantitativa discreta.
e. Polgono de frecuencias: Se utiliza para indicar el comportamiento de un
conjunto de datos.
f. Grfico de series de tiempo: Se utiliza para analizar variables cuantitativas
continuas pero expresadas en el tiempo.
g. Grfico de Cajas y Bigote: Se utiliza para analizar el comportamiento de una
variable cuantitativa. Se obtiene en base a los cuartiles.
h. Grafico de la telaraa: Sirve para visualizar el comportamiento de una variable
cuantitativa cuando evala ciertos criterios de evaluacin.

2.5 CONSTRUCCIN DE GRFICOS ESTADSTICOS DE EXCEL:

Excel puede crear grficos a partir de datos previamente seleccionados en una hoja de
clculo. El usuario puede incrustar un grfico en una hoja de clculo, o crear el grfico
en una hoja especial para grficos. En cada caso el grfico queda vinculado a los datos
a partir de los cuales fue creado, por lo que si en algn momento los datos cambian, el
grfico se actualizar de forma automtica. Los grficos de Excel contienen muchos
objetos, ttulos, etiquetas en los ejes que pueden ser seleccionados y modificados
individualmente segn las necesidades del usuario.

Para crear un grfico con el Asistente para Grficos, se deben seguir los siguientes
pasos:
1. Seleccionar los datos a representar.
2. Ejecutar el comando Insertar / Grfico o hacer clic en el botn

A continuacin aparece el siguiente cuadro de dilogo del Asistente para Grfico..que
permite elegir el tipo y subtipo de grfico que se va a utilizar entre dos listas que son
estndares y personalizados.




GUA DE INVESTIGACIN UPN pg. 29



Luego seleccionar el rango de los datos a evaluar, sealando correctamente las series
que estn evaluando.

Luego debemos configurar los aspectos que conciernen a la presentacin del grfico,
aportando una vista preliminar del mismo. As, se determinan el ttulo, las inscripciones
de los ejes, la apariencia de stos, la leyenda, la aparicin o no de tabla de datos y los
rtulos. Las opciones de <Atrs, Siguiente> y Finalizar son las mismas que en los
otros cuadros.

Finalmente hacer clic en el botn Finalizar, el grfico aparece ya en el lugar
seleccionado. Si se quiere desplazar a algn otro lugar sobre la propia hoja en que se
encuentra basta seleccionar todo el grfico y arrastrarlo con el mouse.


3. MEDIDAS ESTADSTICAS

La estadstica descriptiva es una tcnica que consiste en obtener indicadores que describen el
comportamiento de un conjunto de datos. Dentro de estas medidas estadsticas tenemos:
A. Las medidas de Posicin: Dentro de estas tenemos:
a. Medidas de tendencia central: Media, Moda, Mediana.
b. Medidas de localizacin: cuartiles, deciles y percentiles.
B. Las medidas de variacin: rango, varianza, desviacin estndar, coeficiente de variacin.
C. Las medidas de deformacin: asimetra y kurtosis.

3.1 MEDIDAS DE TENDENCIA CENTRAL

A. MEDIA ARITMTICA:
- Se denota por x
- Es la medida estadstica ms fcil de calcular.
- La media o promedio es el punto central de un conjunto de datos.
- Para calcular la media aritmtica se utilizan las formulas adecuadas ya sea sin
son datos agrupados o datos no agrupados.

B. MEDIANA:
- Se denota por Me.



GUA DE INVESTIGACIN UPN pg. 30
- Es un valor que divide al conjunto de datos en dos partes iguales, es decir,
cada segmento tiene el 50% de los datos.
- Para calcular la media aritmtica se utilizan las formulas adecuadas ya sea sin
son datos agrupados o datos no agrupados.

C. MODA:
- Se denota por Mo.
- La moda es el valor que ms se repite en un conjunto de datos.
- En un conjunto de datos se presentan los siguientes casos:
a. No existir datos Amodal
b. 1 moda Unimodal.
c. 2 modas Bimodal
d. 3 a ms modas Multimodal
- Para calcular la media aritmtica se utilizan las formulas adecuadas ya sea sin
son datos agrupados o datos no agrupados.

3.2 MEDIDAS DE LOCALIZACIN:

A. CUARTILES:
- Se denotan por Qk, donde k=1,2,3
- Son valores que dividen a un conjunto de datos en 4 partes iguales, es decir,
cada sector tiene el 25% de los datos.
- Para calcular la media aritmtica se utilizan las formulas adecuadas ya sea sin
son datos agrupados o datos no agrupados.

B. DECILES:
- Se denotan por Dk, donde k=1,2,3,4,5,6,7,8,9
- Son valores que dividen a un conjunto de datos en 10 partes iguales, es decir,
cada sector tiene el 10% de los datos.

C. PERCENTILES:
- Se denotan por Pk, donde k=1,2,3,4,5,6,7,8,9,10, , 99
- Son valores que dividen a un conjunto de datos en 100 partes iguales, es decir,
cada sector tiene el 1% de los datos.
- Para calcular la media aritmtica se utilizan las formulas adecuadas ya sea sin
son datos agrupados o datos no agrupados.

3.3 MEDIDAS DE VARIABILIDAD:

A. RANGO:
- Se denota por R y la medida de variabilidad ms fcil de calcular.
- Es la diferencia que existe entre el valor mximo y el valor mnimo del conjunto
de datos.

B. VARIANZA:
- Mide la variabilidad de un conjunto de datos respecto a un valor
central(promedio)
- Mide la variabilidad pero en unidades elevadas al cuadrado, por lo tanto es
ilgica su interpretacin.
- Para calcular la media aritmtica se utilizan las formulas adecuadas ya sea sin
son datos agrupados o datos no agrupados.

C. DESVIACIN ESTANDAR:
- Mide la variabilidad de un conjunto de datos respecto a su valor central pero en
unidades originales.
- Esta es la medida de variabilidad que tiene una interpretacin lgica.
- Se obtiene al sacar la raz cuadrada de la varianza.



GUA DE INVESTIGACIN UPN pg. 31

D. COEFICIETE DE VARIACIN:
- Se denota por C.V.
- El C.V. sirve para determinar si un conjunto de datos tiene un comportamiento
homogneo o heterogneo.
- Para llegar a determinar la homogeneidad se compara con un valor
convencional del 33%.
- Si el CV 33% el conjunto de datos tiene un comportamiento homogneo.
- Si el CV > 33% el conjunto de datos tiene un comportamiento heterogneo.

3.4 MEDIDAS DE FORMA:

A. ASIMETRIA:
- La asimetra se entiende como la deformacin horizontal de un conjunto de
datos.
- Para conocer esta asimetra se calcula el coeficiente de asimetra As.
- En un conjunto de datos pueden presentar los siguientes casos:
a. As= 0, el conjunto de datos es simtrica.
b. As<0, el conjunto de datos es asimtrica negativa.
c. As>0, el conjunto de datos es asimtrica positiva.





B. KURTOSIS:
- Se entiende por Kurtosis a la deformacin vertical de un conjunto de datos, es
decir, mide el apuntamiento o achatamiento de un conjunto de datos.
- Para conocer qu tipo de asimetra tiene un conjunto de datos, se utilizan las
siguientes formulas:

B.1 Kurtosis en funcin de los momentos:
- Si K1>3, el conjunto de datos es leptocrtica.
- Si K1=3, el conjunto de datos es mesoctica.
- Si K1<3, el conjunto de datos es platicrtica.




M4: Momento de orden cuatro respecto a la media
M2: Momento de orden dos respecto a la media

B.2 Kurtosis en funcin de los momentos de orden 4:

- Si K2>0, el conjunto de datos es leptocrtica.
- Si K2=0, el conjunto de datos es mesoctica.
- Si K2<0, el conjunto de datos es platicrtica.





B.3 Kurtosis en funcin de los cuantiles:
- Si K3>0.263, el conjunto de datos es leptocrtica.
- Si K3=0.263, el conjunto de datos es mesoctica.
- Si K3<0.263, el conjunto de datos es platicrtica.
S
Mo X
As

=
S
Me X
As
) ( 3
=
1 3
1 2 3
2
Q Q
Q Q Q
As

+
=
3
) (
2
2
4
=
s
M
K
2
2
4
) (
1
M
M
K =



GUA DE INVESTIGACIN UPN pg. 32






3.5 MEDIDAS ESTADSTICAS CON EXCEL:
En Excel los pasos a seguir para obtener estas medidas son las siguientes:
a. Tener una base de datos respecto a variables cuantitativas.
b. Seleccionar en MegaStat/Estadistica descriptiva/ aparece la siguiente ventana,
luego hay que ingresar los datos respectivos:








) ( 2
10 90
1 3
P P
Q Q
As

=



GUA DE INVESTIGACIN UPN pg. 33

Parte V:

TCNICAS ESTADSTICAS EN DISEOS DE DOS GRUPOS


1. ANALISIS DE CORRELACIN:

- El anlisis de correlacin es una tcnica estadstica que mide el grado de asociacin o
afinidad entre las variables cuantitativas consideradas en un estudio.
- Se llamar CORRELACIN SIMPLE cuando se trata de analizar la relacin entre dos
variables. Se llamar CORRELACIN LINEAL O RECTILNEA si la funcin es una recta, y
de CORRELACIN NO LINEAL cuando la funcin es una curva o una funcin de grado
superior.
- El COEFICIENTE DE CORRELACIN DE PEARSON, es el estadgrafo que mide el grado
de asociacin o afinidad entre las variables cuantitativas y se denota por r la cual se
define como:









Interpretacin:

-1 -0.7 -0.4 0 0.4 0.7 +1

Perfecta Alta Regular Baja Baja Regular Alta Perfecta

N E G A T I V A P O S I T I V A


2. ANLISIS DE REGRESIN

A. ANLISIS DE REGRESIN LINEAL SIMPLE:

- El anlisis de regresin es una tcnica estadstica que consisten en determinar la
relacin funcional entre dos variables cuantitativas en estudio.

- Esta relacin funcional entre las variables, es una ecuacin matemtica de la forma
Y= A + B X, que recibe el nombre tambin de Funcin de Regresin o Modelo de
Regresin.

- A la variable Y se le denomina variable dependiente, a la variable X independiente y a
A,B se les llama parmetros de la ecuacin de regresin.

- La finalidad del Anlisis de Regresin es hacer pronsticos es decir, hacer
estimaciones futuros de la variable dependiente.

PASOS A SEGUIR:



= = = =
= = =

=
n
i
n
i
i
n
i
n
i
i i
n
i
n
i
n
i
i i i i
Y Y n X X n
Y X Y X n
r
1
2
1
1
2
1 1
2 2
1 1 1
) ( ) (



GUA DE INVESTIGACIN UPN pg. 34
a. Realizar el diagrama de dispersin y ver el comportamiento de la variable.

b. Aplicar el mtodo de los Mnimos Cuadrados Ordinarios para estimar los parmetros
de la ecuacin. Las frmulas son las siguientes:



= =
= = =

=
n
i
n
i
i i
n
i
n
i
i i
n
i
i i
X X n
Y X Y X n
B
1
2
1
2
1 1 1
) (

X B Y A =


c. Para hacer el pronstico o el valor estimado de Y, reemplazar en la ecuacin
matemtica el respectivo valor de Xo, de la siguiente manera:

Y = A + B (Xo)

B. ANLISIS DE REGRESIN LINEAL MLTIPLE:
- El ARLM es una tcnica estadstica que consiste en determinar el modelo de
regresin linel mltiple de una variable respuesta (Y) y un conjunto de variables
independientes (Xs).
- El modelo de regresin lineal mltiple esta dado por la siguiente ecuacin:

c | | | | + + + + + =
K K
X X X Y ...
2 2 1 1 0

- Para encontrar este modelo, es decir, estimar sus coeficientes tambin se utiliza el
Mtodo de los Mnimos Cuadrados Ordinarios.
- Los elementos de este modelo de regresin mltiple son los siguientes:
- Y es la variable dependiente o variable respuesta.
- A las Xs se le llama variables independientes.
- Bs se les llama coeficientes de regresin.
- En el ARLM se prueban las siguientes Hiptesis:
Ho: Los Bs son iguales a cero (No hay efecto de las variables independientes en Y);
H1: Los Bs son diferentes de cero (Por lo menos un X influye en Y).
- Para dar respuesta a esta Hiptesis se utiliza el anlisis de varianza.


3. REGRESIN LINEAL CON EXCEL:

Para realizar estos ejercicios se deben
realizar los siguientes pasos:
Hacer clic en Herramientas/Anlisis de
datos/Regresin y aparece la siguiente
ventana.




Luego aparece la ventana de dilogo donde
hay que ingresar el rango de Y, el rango de X,
activar rtulos, las opciones de salida y
algunas alternativas de inters para el
investigador.
Luego tomar las decisiones respectivas.




GUA DE INVESTIGACIN UPN pg. 35


P PA AR RT TE E V VI I: :

INFERENCIA ESTADSTICA


ESTIMACIN ESTADSTICA



A. ESTIMACIN PUNTUAL:
Es aquel nico valor que se obtiene de la muestra, es decir, que para su clculo se debe tener
informacin muestral. Las formulas para calcular o realizar estas estimaciones son las
siguientes:


PROMEDIO VARIANZA PROPORCIN
PARMETRO


2
o P

ESTIMACIN
PUNTUAL




B. ESTIMACIN INTERVLICA:
Al realizar una estimacin, siempre se va a cometer un error. Entonces, cuando estimamos un
parmetro nunca va a ser exacto, ese valor ser mayor o menor al verdadero. Entonces se
obtendr un intervalo de valores posibles. Ese intervalo se llama estimacin intervlica. A esa
diferencia mayor o menor se llama error de estimacin, el cual est en relacin directa con la
variabilidad del estimador y el nivel de confianza determinado por el investigador. La
estimacin intervlica para un parmetro en general, est dada por:

u o u o
o u u o u
2 / 2 /

Z Z + s s


Error de Estimacin Error de estimacin

Tambin se puede escribir de la siguiente manera:

n
x
x
n
i
i
=
= =
1

1
) (

1
2
2 2

= =

=
n
x x
s
n
i
i
o
n
a
p P = =

ESTIMACIN: Es el proceso mediante el cual se intenta determinar el valor del parmetro de la


poblacin a partir de la informacin de una muestra. Al realizar una estimacin siempre se va a
cometer un error. Existen dos tipos de estimacin:

A. ESTIMACIN PUNTUAL B. ESTIMACIN INTERVLICA



GUA DE INVESTIGACIN UPN pg. 36
u o
o u u
2 /

: Z


Para determinar este intervalo se necesita de:
a. La estimacin puntual
b. La desviacin estndar del estimador.
c. Nivel de confianza, el cual ser repartido para cada lado del intervalo.

FRMULAS DE LOS INTERVALOS DE CONFIANZA
I. INTERVALO DE CONFIANZA PARA EL PROMEDIO POBLACIONAL

A. Si la muestra (n) es mayor de 30 y la varianza poblacional es conocida:

n
Z x
o

o 2 /
:

B. Si la muestra (n) es menor o igual a 30 y la varianza poblacional es desconocida:

n
s
t x
n ) 1 , 2 /
(
:



II. INTERVALO DE CONFIANZA PARA LA PROPORCIN POBLACIONAL

A. Si la proporcin poblacional se conoce:

n
PQ
Z p P
2 /
:
o


B. Si la proporcin poblacional No se conoce: (entonces hay que calcularla en la muestra)

n
pq
Z p P
2 /
:
o



III. INTERVALO DE CONFIANZA PARA LA DIFERENCIA DE MEDIAS

A. Si las muestras son de tamao n
1
>30 y n
2
>30 (grandes) y adems las varianzas
poblacionales se CONOCEN:

2
2
2
1
2
1
2 / 2 1 2 1
) ( :
n n
Z x x
o o

o
+

B. Si las muestras son de tamao n
1
<30 y n
2
<30 (pequeas) y adems las varianzas
poblacionales DESCONOCIDAS:

)
1 1
( ) ( :
2 1
2
) 2 , 2 / ( 2 1 2 1
2 1
n n
s t x x
c n n
+
+ o




Donde :

2 n n
s ) 1 n ( s ) 1 n (
s
2 1
2
2 2
2
1 1 2
c
+
+
=
, se llama varianza mancomunada

IV. INTERVALO DE CONFIANZA PARA LA DIFERENCIA DE PROPORCIONES:



GUA DE INVESTIGACIN UPN pg. 37
A. Si p
1
y p
2
se determinan a partir de muestras:

2
2 2
1
1 1
2 / 2 1 2 1
) ( :
n
q p
n
q p
Z p p P P +
o



PRUEBA DE HIPTESIS

- Para realizar un anlisis de pruebas de hiptesis hay que conocer algunas definiciones
preliminares que debemos conocer:

A. DEFINICIONES PRELIMINARES:
a. HIPTESIS: Es una respuesta a priori a un problema.
b. HIPTESIS ESTADSTICA: En un enunciado acerca del valor de un parmetro
poblacional.
c. PRUEBA DE HIPTESIS: Es un procedimiento basado en la informacin muestral y en
la teora de probabilidad, para determinar si una hiptesis estadstica debe ser aceptada
o rechazada.

B. CLASES DE HIPTESIS:
a. HIPTESIS NULA.
- Se denota por Ho.
- Es una afirmacin o enunciado tentativo que se realiza acerca del valor de un
parmetro poblacional.
- Por lo comn es una afirmacin acerca del parmetro de poblacin cuando toma
un valor especfico.
b. HIPTESIS ALTERNATIVA.
- Se denota por H1.
- Es una afirmacin o enunciado contraria a la presentada en la hiptesis nula.

C. ERRORES QUE SE COMETEN EN UNA PRUEBA DE HIPTESIS:

























Error Tipo I:
Se comete este error cuando se rechaza la hiptesis nula, cuando es verdadera.
Se denota por = P(Rechazar Ho/Ho es verdadera)
Error Tipo II:
Se comete este error cuando se acepta la hiptesis, cuando es falsa.
Se denota por = P(Aceptar Ho/Ho es falsa)
Decisin
posible
Ho Verdadera Ho Falsa
Aceptar Ho Decisin
correcta
Error Tipo II
Rechazar Ho Error tipo I Decisin Correcta
|
o



GUA DE INVESTIGACIN UPN pg. 38

D. TIPOS DE PRUEBAS DE HIPTESIS:

- PRUEBA BILATERAL O PRUEBA DE DOS COLAS





- PRUEBA UNILATERAL O PRUEBA DE UNA SOLA COLA:












E. ETAPAS DE UNA PRUEBA DE HIPTESIS:





F. FRMULAS DE LOS ESTADSTICOS DE PRUEBA:


FRMULAS DE LOS ESTADSTICOS DE PRUEBA
I. PRUEBA DE HIPTESIS PARA EL PROMEDIO POBLACIONAL:
Ho: u = u0
H1: u = u0

- Prueba de cola inferior o izquierda
Ho: u = u
0

H
1
: u < u
0


- Prueba de cola superior o derecha
Ho: u = u
0

H
1
: u > u
0

o/2 o/2
o
o
PASOS:
- Plantear la hiptesis nula y alternativa.
- Especificar el nivel de significancia (o confianza) que se va a
utilizar.(Generalmente la plantea el investigador)
- Elegir el estadstico de prueba que debe ser especificado en trminos de
un estimador del parmetro a probar.
- Establecer el valor o valores crticos para rechazar o aceptar Ho. (Se
encuentran en la tabla de probabilidades)
- Determinar la Regin de Aceptacin y de Rechazo, en funcin a los
valores crticos y tomar la decisin de aceptar o rechazar Ho.
- Dar la conclusin respectiva



GUA DE INVESTIGACIN UPN pg. 39
A. Si n es mayor de 30 y la varianza poblacional es conocida:
Estadstico de prueba:

n
x
Z
o

=

2 / o
Z Z
t
= (distribucin normal)
B. Si n es menor o igual a 30 y la varianza poblacional es desconocida:
Estadstico de prueba:

n
s
x
t

=
) 1 , 2 /
(

=
n
t
t t
o
(distribucin t de student)
II. PRUEBA DE HIPTESS PARA LA PROPORCIN POBLACIONAL
Estadstico de prueba:

n
PQ
P p
Z

=

Esta frmula es tanto para muestras grandes como para muestras pequeas.
III. PRUEBA DE HIPTESIS PARA LA DIFERENCIA DE MEDIAS
A. Si las muestras son de tamao n
1
>30 y n
2
>30 (grandes) y adems las varianzas poblacionales
se CONOCEN:
Estadstico de prueba:
2
2
1
1
2 1
) (
n n
D x x
Z
o o
+

=

B. Si las muestras son de tamao n
1
<30 y n
2
<30 (pequeas) y adems las varianzas
poblacionales DESCONOCIDAS:
2 1
2 1
1 1
) (
n n
S
D x x
t
c
+

=
(distribucin t de student)
Donde :
, se llama varianza mancomunada
IV. PRUEBA DE HIPTESIS PARA LA DIFERENCIA DE PROPORCIONES:
B. Si p
1
y p
2
se determinan a partir de muestras:

2
2 2
1
1 1
2 1
) (
n
q p
n
q p
D p p
Z
+

=

Esta frmula es tanto para muestras grandes como para muestras pequeas.


2 / o
Z Z
t
=
2 / o
Z Z
t
=
) 1 , 2 /
(

=
n
t
t t
o
2 n n
s ) 1 n ( s ) 1 n (
s
2 1
2
2 2
2
1 1 2
c
+
+
=
2 / o
Z Z
t
=



GUA DE INVESTIGACIN UPN pg. 40

G. PRUEBA DE HIPTESIS CON EXCEL:

Para resolver prueba de hiptesis con EXCEL hay que tener presente lo siguiente. En Excel
solamente se puede evaluar hiptesis de comparacin de medias en la cual se puede utilizar
la prueba de T de Student o la prueba Z.
Se utilizara la prueba T de Student cuando la varianza se desconoce y adems la muestra
es pequea (n30). Aqu hay que distinguir dos casos:
a. Cuando se supone que la varianza es igual en ambos grupos.
b. Cuando se supone que la varianza es diferente en ambos grupos.

PRUEBA Z:
Se utilizar la prueba Z cuando la varianza se conoce y cuando la muestra es grande (n>30).












Seleccionada la opcin correspondiente entonces ingresar la informacin que solicita
cada una de estas pruebas. La pruebas t no necesita como informacin de entrada las
varianzas, en cambio, la prueba Z si necesita ingresar como informacin la varianza.

Esto se muestra las siguientes ventanas de trabajo: