A para Proyectos de Inversion Social

Estadísticas para proyectos
I.-METODOS ESTADISTICOS PARA LA RECOPILACION,

ORGANIZACIÓN, PROCESAMIENTO Y ANALISIS DE DATOS E
INFORMACION PARA PROYECTOS DE INVERSION.-
Maestría en Gerencia de Proyectos de Desarrollo – Programa VIII Página 1
















II.- TEORIA , CALCULO Y DISTRIBUCION DE PROBABILIDADES.



DISTRIBUCION DE PROBABILIDADES
ESPACIO MUESTRAL. El el conjunto de todos los resultados posibles de un experimento

estadístico denotado por “S” o “ ”
VARIABLE. Se denomina variable a la entidad que puede tomar un valor cualesquiera durante
la duración de un proceso dado. Si la variable toma un solo valor durante el proceso se llama
constante.
VARIABLE ALEATORIA: Es una función que asocia un número real a cada elemento del
espacio muestral. Es decir son aquellas que pueden diferir de una respuesta a otra.
Una variable aleatoria se puede clasificar en:
Variable aleatoria discreta.
Variable aleatoria continua.
Variable aleatoria discreta. Una variable discreta proporciona datos que son llamados datos
cuantitativos discretos y son respuestas numéricas que resultan de un proceso de conteo.
Variable aleatoria continua. Es aquella que se encuentra dentro de un intervalo comprendido

entre dos valores cualesquiera; ésta puede asumir infinito número de valores y éstos se pueden
medir.
DISTRIBUCIONES
Una distribución de frecuencias es un listado de las frecuencias observadas de todos los

resultados de un experimento que, en realidad se han presentado cuando se lleva a cabo un
experimento; en cambio, una distribución de probabilidad es un listado de las probabilidades
de todos los resultados posibles que podrían presentarse si se efectuara el experimento.
Las probabilidades que se asocian a cada uno de los valores que toma la variable aleatoria x
constituyen lo que se conoce como DISTRIBUCIÓN DE PROBABILIDAD. La diferencia
consiste en que la función matemática se transforma en una función probabilística.

Se pueden clasificar en:

P(x
)
Discretas
x1 x2 xn x
Distribuciones
P(x)
Continua
s
x1 xn x
Distribuciones discretas. Son aquellas donde las variables asumen un número limitado de
valores, por ejemplo el número de años de estudio.
Binomial
Discretas Hipergeométric
a
Multinomial
Poisson
Distribuciones continuas. Son aquellas donde las variables en estudio pueden asumir
cualquier valor dentro de determinados límites; por ejemplo, la estatura de un estudiante.
Uniforme
Continuas Exponencial
Normal

Las distribuciones de probabilidad pueden ser representadas mediante una modelo matemático,
una gráfica o una tabla de valores
S E0 E1 ... En
X x0 X1 ... xn
P(X) p(x0) p(x1) ... p(xn)
Dados los eventos E1, E2, ..., En S, se dice que x es una variable aleatoria, si a cada valor de xi
que asume cada Ei, se le asocia su probabilidad de ocurrencia y cumple con las siguientes
condiciones:
a) La probabilidad para todo valor que asuma la variable aleatoria xi, será mayor o igual a
cero pero menor que uno.
0 P(xi) 1 xi
b) La suma de todas las probabilidades asociadas a todos los valores que toma la variable x,
es igual a la unidad.
P ( x i )dx 1
c) La probabilidad de seleccionar una variable aleatoria para a < x < b esta dada por:
b
P (a X b) f ( x )dx
a
Lo cual equivale a calcular el área bajo la curva

P(x)
a b x
Las distribuciones de probabilidad de una variable aleatoria están caracterizadas por magnitudes
llamadas momentos de la distribución, las mas usuales son:
La media aritmética o esperanza matemática
E(X) x p( x ) dx
La desviación estándar
2
var( X ) (x ) 2 p( x ) dx

DISTRIBUCIÓN NORMAL
2
La función de densidad de la variable aleatoria normal X, con media y varianza , es:
2
1 x
1 2
n ( x; , ) e
2
x
DISTRIBUCIÓN t
La distibución t pertenece a la familia Euler de las distribuciones gamma. La función de

densidad para cierto grado de libertad ( v ) es:
v 1 v 1
2 t2 2
h(t) 1 , t
v v
v
2
Donde
(v) (v - 1)!
La distibución T se parece a la Z, ya que ambas son simétricas alrededor de la media cero.

Tienen forma de campana, pero la distribución t varia más, debido al hecho de que los valores
de T dependen de X y S2.
Cuando el tamaño de n , entonces T Z

2
DISTRIBUCIÓN
v
Es un caso especial de la gamma, se obtiene haciendo y 2
2
La variable continua aleatoria X tiene una distribución 2 , con v grados de libertad, si su
función de densidad es:
v x
1 1
v
x2 e
, x 0 2
f (x) 2
v
2
2
0 en cualquier otro caso
v 0, entero
DISTRIBUCIÓN F
Sean U y V dos variables aleatorias independientes que tiene distribución 2 con v1 y v2

grados de libertad, respectivamente. Entonces la distribución de variable aleatoria:
U
v1
F
V
v2
está dada por,
v1
v1 v 2 v1 2
v1
1
2 v2 f 2
, 0 f
h(x) v1 v2 v1 v 2
v1 f 1
2 2 1
v2
0, en cualquier otro caso

DISTRIBUCIÓN NORMAL DE PROBABILIDAD.
La función de densidad de probabilidad normal es comúnmente empleada en el análisis

estadístico ya que existe una gran cantidad de fenómenos continuos de tipo económico, sociales,
de ingeniería, bilógicos, entre otros los cuales son posible expresarlos con ella; siendo la base
tanto para la descripción como para la inferencia.
La distribución normal de probabilidad es una distribución continua de probabilidades que es

simétrica y mesokúrtica. Representada por la siguiente figura.
P(x
)
La distribución normal de probabilidad es muy importante por las siguientes razones:
1.- Se sabe que las mediciones que se obtienen en muchos procesos aleatorios tienen esta
clase de distribución.
2.- Con frecuencia puede utilizarse en probabilidades normales para aproximar otras
distribuciones de probabilidad tales como la distribución Binomial y Poisson.
3.- Las distribuciones estadísticas como la media muestral y la proporción muestral tienen
distribución normal cuando el tamaño de la muestra es grande, sin importar la forma de la
distribución de la población de origen.
En el caso de distribuciones continuas de probabilidad sólo es posible determinar el valor de

probabilidad para un intervalo de valores. La altura de la función de densidad o curva de
probabilidad para una variable con distribución normal está dada por:
2
1 -
1 x
f(x) = e 2
2
donde:
π = 3.1416
e = 2.7183
μ = Media de la distribución
σ = Desviación estándar de la distribución
La tabla de probabilidades normales se basan en la distribución específica de la distribución
normal estándar, donde μ = 0 y σ = 1 cualquier valor de x de una población con distribución
normal se puede convertir a su valor normal estándar equivalente z por la siguiente ecuación.
x-
z =

CARACTERÍSTICAS DE UNA DISTRIBUCIÓN NORMAL DE PROBABILIDAD.
1.- Es unimodal ya que sólo tiene un valor máximo en el que coincide la media, la mediana y
la moda.
2.- Presenta una forma de campana y es simétrica.
3.- La media de una población distribuida normalmente se encuentra en el centro de su curva
normal.
4.- Los dos extremos de una distribución normal de probabilidad se extienden de manera
indefinida y nunca tocan el eje horizontal.
5.- Está determinada por medio de dos parámetros: la media y la desviación estándar.
6.- El área total bajo la curva se considera igual a la unidad y se usa como masa
probabilística.
7.- El área comprendida bajo la curva entre dos valores x1 y x2 es igual a la probabilidad de
que dicha variable suma cualquier valor dentro de ellos.
El promedio de estudiantes inscritos en jardín de niños es de μ = 500, con una desviación

estándar σ = 100. El número de alumnos inscritos tienen una distribución aproximadamente
normal. ¿Cuál es la probabilidad de que el número de alumnos inscritos en una escuela elegida
al azar sea?:
a) entre 500 y 650.

b) entre 450 y 600.
c) menor de 500.
d) menor de 500.
e) menor de 300.
f) mayor de 650.
g) mayor de 400.
h) menor de 610.

SOLUCIÓN:
a) P(500 < x < 650)
x- 650 500
z = 1.50
100
de las tablas estandarizadas obtenemos
A = 0.4332 = 43.32%
b) P(450 < x < 600)

x - 450 500
z1 = 1 0.50
100
A1 = 0.1915
x - 600 500
z2 = 2 1.00
100
A1 = 0.3413
A = A1 + A2 = 0.1915 + 0.3413 = 0.5338 = 53.38%
c) P(x > 500)

500 500
z= 0.00
100
de la gráfica observamos que:
A = 0.5000 = 50%
d) P(x < 500)

500 500
z= 0.00
100
de la gráfica observamos que:
A = 0.5000 = 50%
e) P(x < 300)

300 500
z1 = 2.00
100
A1= 0.4772 = 47.72%
A = 0.5 - A1 = 0.5 - 0.4772 = 0.0228 = 2.28%

f) P(x > 650)

650 500
z1 = 1.50
100
A1 = 0.4332 = 43.32%
A = 0.5 - A1 = 0.5 - 0.4332 = 0.0668 = 6.68%
g) P(x > 400)

400 500
z1 = 1.00
100
A1 = 0.3413
A = A1 + 0.5 = 0.3413 + 0.5 = 0.8413 = 84.13%

h) P(x < 610)
610 500
z1 = 1.10
100
A1 = 0.3665
A = 0.5 + A1 = 0.5 + 0.3665 = 0.8665 = 86.65%

III.- ELEMENTOS DEL MUESTREO ESTADISTICO EN PROYECTOS

DE INVERSION.-
3.1.- Definición y conceptos previos
En la investigación científica es habitual que se empleen muestras como medio de acercarse al

conocimiento de la realidad. Sin embargo, para que esto sea posible , para que a través de las
muestras sea posible reproducir el universo con la precisión que se requiera en cada caso es
necesario que el diseño muestral se atenga a los principios recogidos en las técnicas de
muestreo.
Antes de pasar describir algunos de los métodos de muestreo más habituales introduzcamos
algunos conceptos importantes en este contexto:
Población: Es todo conjunto de elementos, finito o infinito, definido por una o más
características, de las que gozan todos los elementos que lo componen, y sólo ellos.
En muestreo se entiende por población a la totalidad del universo que interesa considerar , y
que es necesario que esté bien definido para que se sepa en todo momento que elementos lo
componen.
No obstante, cuando se realiza un trabajo puntual, conviene distinguir entre población

teórica: conjunto de elementos a los cuales se quiere extrapolar los resultados, y población
estudiada : conjunto de elementos accesibles en nuestro estudio.
Censo: En ocasiones resulta posible estudiar cada uno de los elementos que componen la
población, realizándose lo que se denomina un censo, es decir, el estudio de todos los
elementos que componen la población.
La realización de un censo no siempre es posible, por diferentes motivos: a) economía: el

estudio de todos los elementos que componen una población, sobre todo si esta es grande,
suele ser un problema costoso en tiempo, dinero, etc; b) que las pruebas a las que hay que
someter a los sujetos sean destructivas; c) que la población sea infinita o tan grande que
exceda las posibilidades del investigador.
Si la numeración de elementos, se realiza sobre la población accesible o estudiada, y no

sobre la población teórica, entonces el proceso recibe el nombre de marco o espacio
muestral.
Muestra: En todas las ocasiones en que no es posible o conveniente realizar un censo, lo que
hacemos es trabajar con una muestra, entendiendo por tal una parte representativa de la
población. Para que una muestra sea representativa, y por lo tanto útil, debe de reflejar las
similitudes y diferencias encontradas en la población, ejemplificar las características de la
misma. Cuando decimos que una muestra es representativa indicamos que reúne
aproximadamente las características de la población que son importantes para la investigación.

Ejemplo:
El Ministerio de Educación, necesita determinar el el rendimiento académico de los niños

cursando actualmente estudios en el nivel de primaria, por problemas económicos solo es
posible acceder a los niños de zonas urbanas.
a.- ¿A quién deseo generalizar los resultados? : Todos los estudiantes del nivel de primaria.
(Población teórica).
b.- ¿A quién puedo acceder en el estudio? : Todos los niños estudiando en zonas urbanas
(población estudiada).
c.- ¿Cómo puedo acceder a ellos? : Numerando los sujetos accesibles (espacio o marco
muestral).
d.- ¿Quién forma parte del estudio? : Eligiendo un grupo de los sujetos enumerados (muestra).
3.2.- Tipos de muestreo

Los autores proponen diferentes criterios de clasificación de los diferentes tipos de muestreo,
aunque en general pueden dividirse en dos grandes grupos: métodos de muestreo
probabilísticos y métodos de muestreo no probabilísticos.
3.2.1.- Métodos de muestreo probabilísticos
Los métodos de muestreo probabilísticos son aquellos que se basan en el principio de

equiprobabilidad. Es decir, aquellos en los que todos los individuos tienen la misma
probabilidad de ser elegidos para formar parte de una muestra y, consiguientemente, todas las
posibles muestras de tamaño n tienen la misma probabilidad de ser elegidas. Sólo estos
métodos de muestreo probabilísticos nos aseguran la representatividad de la muestra extraída y
son, por tanto, los más recomendables. Dentro de los métodos de muestreo probabilísticos
encontramos los siguientes tipos:
3.2.1.1.- Muestreo aleatorio simple: El procedimiento empleado es el siguiente: 1) se asigna

un número a cada individuo de la población y 2) a través de algún medio mecánico (bolas
dentro de una bolsa, tablas de números aleatorios, números aleatorios generados con una
calculadora u ordenador, etc) se eligen tantos sujetos como sea necesario para completar el
tamaño de muestra requerido.
Este procedimiento, atractivo por su simpleza, tiene poca o nula utilidad práctica cuando la
población que estamos manejando es muy grande.
3.2.1.2.- Muestreo aleatorio sistemático: Este procedimiento exige, como el anterior,

numerar todos los elementos de la población, pero en lugar de extraer n números aleatorios
sólo se extrae uno. Se parte de ese número aleatorio i, que es un número elegido al azar, y los
elementos que integran la muestra son los que ocupan los lugares i, i+k, i+2k, i+3k,...,i+(n-1)k,
es decir se toman los individuos de k en k, siendo k el resultado de dividir el tamaño de la

población entre el tamaño de la muestra: k=N/n. El número i que empleamos como punto de
partida será un número al azar entre 1 y k.
El riesgo se este tipo de muestreo está en los casos en que se dan periodicidades en la
población ya que al elegir a los miembros de la muestra con una periodicidad constante (k)
podemos introducir una homogeneidad que no se da en la población. Imaginemos que estamos
seleccionando una muestra sobre listas de 10 individuos en los que los 5 primeros son varones
y los 5 últimos mujeres, si empleamos un muestreo aleatorio sistemático con k=10 siempre
seleccionaríamos o sólo hombres o sólo mujeres, no podría haber una representación de los
dos sexos.
3.2.1.3.- Muestreo aleatorio estratificado: Trata de obviar las dificultades que presentan los
anteriores ya que simplifican los procesos y suelen reducir el error muestral para un tamaño
dado de la muestra. Consiste en considerar categorías típicas diferentes entre sí (estratos) que
poseen gran homogeneidad respecto a alguna característica (se puede estratificar, por ejemplo,
según la profesión, el municipio de residencia, el sexo, el estado civil, etc). Lo que se pretende
con este tipo de muestreo es asegurarse de que todos los estratos de interés estarán
representados adecuadamente en la muestra. Cada estrato funciona independientemente,
pudiendo aplicarse dentro de ellos el muestreo aleatorio simple o el estratificado para elegir
los elementos concretos que formarán parte de la muestra. En ocasiones las dificultades que
plantean son demasiado grandes, pues exige un conocimiento detallado de la población.
(tamaño geográfico, sexos, edades,...).
La distribución de la muestra en función de los diferentes estratos se denomina afijación, y

puede ser de diferentes tipos:
Afijación Simple: A cada estrato le corresponde igual número de elementos muestrales.
Afijación Proporcional: La distribución se hace de acuerdo con el peso (tamaño) de la

población en cada estrato.
Afijación Optima: Se tiene en cuenta la previsible dispersión de los resultados, de modo que
se considera la proporción y la desviación típica. Tiene poca aplicación ya que no se suele
conocer la desviación.
Supongamos que estamos interesados en estudiar el grado de aceptación que la implantación

de la reforma educativa ha tenido entre los padres de un determinado departamento del país..
A tal efecto seleccionamos una muestra de 600 sujetos. Conocemos por los datos del
Ministerio de Educcion, que de los 10000 niños escolarizados en las edades que nos interesan,
6000 acuden a colegios públicos, 3000 a colegios privados sin subvencion y 1000 a colegios
privados subvencionados. Como estamos interesados en que en nuestra muestra estén
representados todos los tipos de colegio, realizamos un muestreo estratificado empleando
como variable de estratificación el tipo de centro.
Si empleamos una afijación simple elegiríamos 200 niños de cada tipo de centro, pero en este

caso parece más razonable utilizar una afijación proporcional pues hay bastante diferencia en
el tamaño de los estratos. Por consiguiente, calculamos que proporción supone cada uno de los
estratos respecto de la población para poder reflejarlo en la muestra.
Colegios públicos: 6000/10000=0.60

Colegios privados subvencionado : 3000/10000=0.30
Colegios privados no-subvencionados : 1000/10000=0.10
Para conocer el tamaño de cada estrato en la muestra no tenemos más que multiplicar esa
proporción por el tamaño muestral.
Colegios públicos: 0.60x600=360 sujetos

Colegios privados subvencionados: 0.30x600=180 sujetos
Colegios privados no-subvencionados : 0.10x600= 60 sujetos
3.2.1.4.- Muestreo aleatorio por conglomerados: Los métodos presentados hasta ahora están
pensados para seleccionar directamente los elementos de la población, es decir, que las
unidades muestrales son los elementos de la población. En el muestreo por conglomerados la
unidad muestral es un grupo de elementos de la población que forman una unidad, a la que
llamamos conglomerado. Las unidades hospitalarias, los departamentos universitarios, una
caja de determinado producto, etc, son conglomerados naturales. En otras ocasiones se pueden
utilizar conglomerados no naturales como, por ejemplo, las urnas electorales. Cuando los
conglomerados son área geográficas suele hablarse de "muestreo por áreas".
El muestreo por conglomerados consiste en seleccionar aleatoriamente un cierto número de

conglomerados (el necesario para alcanzar el tamaño muestral establecido) y en investigar
después todos los elementos pertenecientes a los conglomerados elegidos.
En una investigación en la que se trata de conocer el grado de satisfacción laboral los

profesores de instituto necesitamos una muestra de 700 sujetos. Ante la dificultad de acceder
individualmente a estos sujetos se decide hacer una muestra por conglomerados. Sabiendo que
el número de profesores por instituto es aproximadamente de 35, los pasos a seguir serían los
siguientes:
1. Recoger un listado de todos los institutos.

2. Asignar un número a cada uno de ellos.
3. Elegir por muestreo aleatorio simple o sistemático los 20 institutos (700/35=20) que nos
proporcionarán los 700 profesores que necesitamos.
Para finalizar con esta exposición de los métodos de muestreo probabilísticos es necesario
comentar que ante lo compleja que puede llegar a ser la situación real de muestreo con la que
nos enfrentemos es muy común emplear lo que se denomina muestreo polietápico. Este tipo

de muestreo se caracteriza por operar en sucesivas etapas, empleando en cada una de ellas el
método de muestreo probabilístico más adecuado.
3.2.2.- Métodos de muestreo no probabilísticos
A veces, para estudios exploratorios, el muestreo probabilístico resulta excesivamente costoso

y se acude a métodos no probabilísticos, aun siendo conscientes de que no sirven para realizar
generalizaciones, pues no se tiene certeza de que la muestra extraída sea representativa, ya que
no todos los sujetos de la población tienen la misma probabilidad de se elegidos. En general se
seleccionan a los sujetos siguiendo determinados criterios procurando que la muestra sea
representativa.
3.2.2.1.- Muestreo por cuotas: También denominado en ocasiones "accidental". Se asienta

generalmente sobre la base de un buen conocimiento de los estratos de la población y/o de los
individuos más "representativos" o "adecuados" para los fines de la investigación. Mantiene,
por tanto, semejanzas con el muestreo aleatorio estratificado, pero no tiene el carácter de
aleatoriedad de aquél.
En este tipo de muestreo se fijan unas "cuotas" que consisten en un número de individuos que
reúnen unas determinadas condiciones, por ejemplo: 20 individuos de 25 a 40 años, de sexo
femenino y residentes en Mateares . Una vez determinada la cuota se eligen los primeros que
se encuentren que cumplan esas características. Este método se utiliza mucho en las encuestas
de opinión.
Por ejemplo, El MINSA, desea estudiar la incidencia de las drogas en la adolescencia en las
escuelas. Lo que deberíamos hacer sería: conocer por los informes del Ministerio de
Educacion, Policia Nacional y ONG que trabajan en este problema, fijar un número de sujetos
a entrevistar proporcional a cada uno de los estratos (cuotas) y finalmente dejar en manos de
los responsables del trabajo de campo a que sujetos concretos se deberá entrevistar.
3.2.2.2.- Muestreo opinático o intencional: Este tipo de muestreo se caracteriza por un

esfuerzo deliberado de obtener muestras "representativas" mediante la inclusión en la muestra
de grupos supuestamente típicos. Es muy frecuente su utilización en sondeos preelectorales de
zonas que en anteriores votaciones han marcado tendencias de voto.
3.2.2.3.- Muestreo casual o incidental: Se trata de un proceso en el que el investigador

selecciona directa e intencionadamente los individuos de la población. El caso más frecuente
de este procedimiento el utilizar como muestra los individuos a los que se tiene fácil acceso
(los profesores de universidad emplean con mucha frecuencia a sus propios alumnos). Un caso
particular es el de los voluntarios.
3.2.2.4.- Bola de nieve: Se localiza a algunos individuos, los cuales conducen a otros, y estos
a otros, y así hasta conseguir una muestra suficiente. Este tipo se emplea muy frecuentemente
cuando se hacen estudios con poblaciones "marginales", delincuentes, sectas, determinados
tipos de enfermos, etc.

4.- Cálculo del tamaño de la muestra

A la hora de determinar el tamaño que debe alcanzar una muestra hay que tomar en cuenta
varios factores: el tipo de muestreo, el parámetro a estimar, el error muestral admisible, la
varianza poblacional y el nivel de confianza. Por ello antes de presentar algunos casos
sencillos de cálculo del tamaño muestral delimitemos estos factores.
Parámetro. Son las medidas o datos que se obtienen sobre la población.
Estadístico. Los datos o medidas que se obtienen sobre una muestra y por lo tanto una
estimación de los parámetros.
Error Muestral, de estimación o standard. Es la diferencia entre un estadístico y su parámetro

correspondiente. Es una medida de la variabilidad de las estimaciones de muestras repetidas en
torno al valor de la población, nos da una noción clara de hasta dónde y con qué probabilidad
una estimación basada en una muestra se aleja del valor que se hubiera obtenido por medio de
un censo completo. Siempre se comete un error, pero la naturaleza de la investigación nos
indicará hasta qué medida podemos cometerlo (los resultados se someten a error muestral e
intervalos de confianza que varían muestra a muestra). Varía según se calcule al principio o al
final. Un estadístico será más preciso en cuanto y tanto su error es más pequeño. Podríamos
decir que es la desviación de la distribución muestral(1) de un estadístico y su fiabilidad.
Nivel de Confianza. Probabilidad de que la estimación efectuada se ajuste a la realidad.

Cualquier información que queremos recoger está distribuida según una ley de probabilidad
(Gauss o Student), así llamamos nivel de confianza a la probabilidad de que el intervalo
construido en torno a un estadístico capte el verdadero valor del parámetro.
Varianza Poblacional. Cuando una población es más homogénea la varianza es menor y el

número de entrevistas necesarias para construir un modelo reducido del universo, o de la
población, será más pequeño. Generalmente es un valor desconocido y hay que estimarlo a
partir de datos de estudios previos.
3.1.- Tamaño de muestra para estimar la media de la población
Veamos los pasos necesarios para determinar el tamaño de una muestra empleando el
muestreo aleatorio simple. Para ello es necesario partir de dos supuestos: en primer lugar el
nivel de confianza al que queremos trabajar; en segundo lugar, cual es el error máximo que
estamos dispuestos a admitir en nuestra estimación. Así pues los pasos a seguir son:
1.- Obtener el tamaño muestral imaginando que :
donde:
: z correspondiente al nivel de confianza elegido

: varianza poblacional
e: error máximo
2.- Comprobar si se cumple
si esta condición se cumple el proceso termina aquí, y ese es el tamaño adecuado que debemos
muestrear.
Si no se cumple, pasamos a una tercera fase:

3.- Obtener el tamaño de la muestra según la siguiente fórmula:
Ejemplo :
El Ministerio del Trabajo, planea un estudio con el interés de conocer el promedio de horas
semanales trabajadas por las mujeres del servicio doméstico. La muestra será extraída de una
población de 10000 mujeres que figuran en los registros del Seguro Social y de las cuales se
conoce a través de un estudio piloto que su varianza es de 9.648. Trabajando con un nivel de
confianza de 0.95 y estando dispuestos a admitir un error máximo de 0,1, ¿cuál debe ser el
tamaño muestral que empleemos?.
Buscamos en las tablas de la curva normal el valor de que corresponde con el nivel de
confianza elegido: = ±1.96 y seguimos los pasos propuestos arriba.
1.-
2.- Comprobamos que no se cumple , pues en este caso
10000 < 3706 (3706 - 1); 10000 < 13730730
3.-

3.2.- Tamaño de muestra para estimar la proporción de la población
Para calcular el tamaño de muestra para la estimación de proporciones poblacionales hemos de

tener en cuenta los mismos factores que en el caso de la media. La fórmula que nos permitirá
determinar el tamaño muestral es la siguiente:
donde
: z correspondiente al nivel de confianza elegido

P: proporción de una categoría de la variable
e: error máximo
N: tamaño de la población
Siguiendo con el estudio planteado en el punto anterior, supongamos que tratamos de estimar
la proporción de mujeres que trabajan diariamente 10 horas o más. De un estudio piloto se
dedujo que P=0.30, fijamos el nivel de confianza en 0.95 y el error máximo 0.02.

DISTRIBUCIONES MUESTRALES.
La distribución de todos los valores posibles que pueden ser tomados por alguna estadística,
calculados a partir de muestras del mismo tamaño extraídas aleatoriamente de la misma
población, se llama distribución muestral de esa estadística.
Las distribuciones muestrales pueden construirse empiricamente cuando se obtiene de una

población finita, discreta. Para lo cual se procede como:
1.- De una población finita, discreta de tamaño N, se extraen aleatoriamente todas las muestras
posibles de tamaño n.
2.- Se calcula la estadística de interés para cada muestra.
3.- Se enumeran en una columna los diferentes valores observados de la estadística y, en otra
columna, la frecuencia correspondiente de la ocurrencia de cada uno de esos valores.
EJEMPLO:
Suponga se que de una población de tamaño N = 5 edades de niños, dadas como {6, 8, 10, 12,
14}, la media poblacional μ = 10 y la varianza poblacional σ2 = 8 y la varianza muestral es s2 =
10. Si extraemos todas las muestras posibles de tamaño n = 2, si consideramos un muestreo con
remplazo y calculamos la media tendremos Nn muestras posibles es decir 52 = 25 posibles
muestras de tamaño 2.
x1 = ( 6 + 6)/2 = 6 x2 = ( 6 + 8)/2 = 7 x3 = ( 6 + 10)/2 = 8

x4 = ( 6 + 12)/2 = 9 x5 = ( 6 + 14)/2 = 10 x6 = ( 8 + 6)/2 = 7
x7 = ( 8 + 8)/2 = 8 x8 = ( 8 + 10)/2 = 9 x9 = ( 8 + 12)/2 = 10
x10 = ( 8 + 14)/2 = 11 x11 = (10 + 6)/2 = 8 x12 = (10 + 8)/2 = 9
x13 = (10 + 10)/2 = 10 x14 = (10 + 12)/2 = 11 x15 = (10 + 14)/2 = 12
x16 = (12 + 6)/2 = 9 x17 = (12 + 8)/2 = 10 x18 = (12 + 10)/2 = 11
x19 = (12 + 12)/2 = 12 x20 = (12 + 14)/2 = 13 x21 = (14 + 6)/2 = 10
x22 = (14 + 8)/2 = 11 x23 = (14 + 10)/2 = 12 x24 = (14 + 12)/2 = 13
x25 = (14 + 14)/2 = 14

LA TABLA DE FRECUENCIAS ES:
X Frecuencia Frecuencia relativa

6 1 1/25
7 2 2/25
8 3 3/25
9 4 4/25
10 5 5/25
11 4 4/25
12 3 3/25
13 2 2/25
14 1 1/25
Total 25 1
Las graficas son las siguientes:
Distribución de la población Distribución muestral

DISTRIBUCIÓN MUESTRAL DE LA MEDIA
TEOREMA:Si X1, X2,..., Xn constituyen una muestra aleatoria de una población finita que tiene
la media μ y la varianza σ2, entonces:
E(x) = μ = μx
x
n
Población infinita
N-n
x =
n N -1
Población finita
Se denomina el error estándar de la media.
n
A la fracción se le llama fracción de muestreo. Cuando la fracción de muestreo es menor que
N
0.05, no es necesario usar el multiplicador de población finita.
TEOREMA DEL LIMITE CENTRAL.
Si X1, X2,..., Xn constituye un muestra aleatoria de población infinita que tiene la media μ, la
desviación estándar σ, entonces la distribución limitante es de:
x
z=
DISTRIBUCIÓN t
Si el tamaño de muestra es pequeño, los valores de S2, varian considerablemente de muestra a

muestra, para ello es necesario usar la distribución t.
x
t=
s
n

DIFERENCIA DE MEDIAS
Si se sacan al azar muestras independientes de tamaños n1 y n2 de dos poblaciones discretas o

continuas, con medias 1 2 y varianzas 1 y 2 respectivamente entonces la distribución
muestral de la diferencia de medias X1 X 2 , esta distribuida aproximadamente en forma
normal con medias y varianzas:
2 2
2 1 2
X1 X 2 1 2 y X1 X 2
n1 n2
Se tiene que
(X1 X2 ) ( 1 2 )
Z
2 2
1 2
n1 n2
DISTRIBUCIÓN DE PROPORCIONES
Si una población es infinita y distribuida binomialmente, si p y q son las probabilidades

respectivas y considerando muestras de tamaño n extraídas de esta población, la distribución
muestra de proporciones está dada por:
~
p p
z
p(1 p)
n
DISTRIBUCION DE LA DIFERENCIA ENTRE DOS PROPORCIONES DE

MUESTRAS.
(~
p1 ~
p 2 ) (p 1 p 2 )
z
p 1 (1 p 1 ) p 2 (1 p 2 )
n1 n2
DISTRIBUCIÓN MUESTRAL DE
Si S2 es la varianza de una muestra aleatoria de tamaño n tomada de una población normal que
tiene varianza 2, entonces los valores de la variable aleatoria X2 se calculan con:
2 (n 1)s 2
2

1
DISTRIBUCIÓN MUESTRAL DE
2
Si S1 y S2 son las varianzas de variables aleatorias independientes de tamaños n1 y n2 , que se
sacan de poblaciones normales con varianzas 1 y 2, respectivamente, entonces,
S12
2 2
1 2 S12
F 2 2
S 2 1 S 22
2
2
tiene una distribución F con v1 = n1 – 1 y v2 = n2 – 1 grados de libertad
si se escribe f (v1, v2) para f con v1 y v2 grados de libertad, se tiene que:
1
f 1 (v1 , v 2 )
f (v 2 , v1 )

IV.- ELEMENTOS DE LA ESTIMACION ESTADISTICA PARA PROYECTOS DE

INVERSION.
4.1.- INTRODUCCION.
4.2.- ESTIMACION Y PROPIEDADES DE LOS ESTIMADORES
Toda medida de tendencia central o de dispersión obtenida de una población, se conoce como
parámetro de la población; aquellas que son obtenidas de una muestra se denominan
estimadores, ya que con ellas se realizará la estimación de esos parámetros.
Muestreo. Es la operación para tomar una muestra del universo. El objetivo es contar con
datos necesarios para estimar parámetros en la población, hacer inferencia estadística con la
mayor confiabilidad posible.
Parámetros y estimadores más usuales
Parámetros Estimadores
Media poblacional: Media muestral
N n
Xi xi
x
i 1 N i 1 n
Varianza poblacional: Varianza muestral
N n
(X i )2 (x i x) 2
2 i 1
s2 i 1
N n 1
Desviación estándar poblacional: Desviación estándar
N n
(X i )2 (x i x) 2
i 1
s2 i 1
N n 1
Donde X es el valor de cada Donde x es el valor de cada
medición desde i = 1 hasta N medición desde i = 1 hasta n
N es el número de elemento que n es el número de elemento que
constituyen la población bajo constituyen la muestra estudiada
estudio
Proporción poblacional de Proporción poblacional de
elementos con atributo: elementos con atributo:
Xi xi
Px px
N n
N es el número de elementos de n es el número de elementos de
la población la muestra

ESTIMACIÓN
Es el procedimiento que consiste en emplear los estadísticos obtenidos de una muestra para
inferir o estimar los parámetros de una población.
Existen dos tipos de estimaciones fundamentales:
ESTIMACIÓN POR PUNTO

ESTIMACIÓN POR INTERVALO DE CONFIANZA
ESTIMACIÓN PUNTUAL O POR PUNTO
ESTIMACIÓN PUNTUAL O POR PUNTO: Consiste en emplear un solo valor de la

muestra para estimar el parámetro poblacional respectivo para que el estimador puntual sea
bueno deberá reunir las siguientes características.
INSESGADO: Es cuando al aumentar el tamaño de la muestra el valor del estadístico

x se aproxima al valor del parámetro . En el caso de que sean diferentes decimos que
es sesgado y que e = x – .
CONSISTENTE: Es cuando al aumentar el tamaño de la muestra n, el valor del
estadístico x se aproxima al valor del parámetro . n N, x
EFICIENTE : Un estimador es eficiente cuando es de varianza mínima.
SUFICIENTE: Un estimador es suficiente cuando es un estadístico que utiliza toda la
información que posee una muestra sobre el parámetro que se estima.
3.3.- ESTIMACIÓN POR INTERVALOS DE CONFIANZA
Es el rango dentro del cual se espera que se encuentre el valor del parámetro en cuestión, la
ventaja de la estimación por intervalos es que muestra la exactitud con que estima el
parámetro a menor longitud del intervalo mayor exactitud en la estimación. la probabilidad
de que un intervalo contenga el parámetro que se estima se denomina coeficiente de
confianza. Un valor cercano a la unidad indica un intervalo más reducido.
Nivel de significancia Nivel de significancia

/2 Nivel de /2
confianza 1-
l- Nivel de confianza

x z /2 x
x z /2 x
x z /2 x
Intervalo de confianza para la medi
x t /2 sx x t /2 sx
x t /2 sx
Intervalo de confianza para diferencia de medias 1 y 2 conocidas
2 2
1 2
(x 1 x2) z /2
n1 n2
Intervalo de confianza para diferencia de medias 1 y 2 desconocidas
1 1
(x 1 x2) t /2 p s
n1 n2
(n 1 1)s 12 (n 2 1)s 22
sp
n1 + n 2 2
= n1 + n2 –2
Intervalo de confianza para diferencia de medias 1 2 desconocidas
s 12 s 22
(x 1 x2) t /2
n1 n2
2
s 12 s 22
n1 n2
= 2 2
s 12 s 22
n1 n2
n1 1 n2 1

2
Intervalo de confianza para
(n 1)s 2 2 (n 1)s 2
2 2
/2 1 /2
= n - 1 grados de libertad
2
1
Intervalo de confianza para 2
2
s 12 1 2
s 12
1
f /2( 1 ,v2 )
con 1 = n1 – 1, 2 = n2 - 1
s 22 f /2( 1, 2 )
2
2 s 22

V.- ELEMENTOS DE LA TEORIA DE DECISION ESTADISTICA, ENSAYOS DE

HIPOTESIS Y SIGNIFICACION EN PROYECTOS DE INVERSION.
Dentro de la inferencia estadística se encuentra la prueba de hipótesis, cuyo objetivo es

probar o comprobar si la afirmación que se hace sobre un parámetro poblacional basados en
conclusiones obtenidas de una muestra es correcta o incorrecta.
Hipótesis estadística.
Es una proposición o suposición que se hace sobre los parámetros de una distribución
de probabilidad de una variable aleatoria. Dicha hipótesis puede ser verdadera o falsa, por lo
que se puede aceptar o rechazar.
Prueba de hipótesis estadística.
Es el procedimiento empleado para decidir si se acepta o se rechaza por su veracidad o

falsedad, una hipótesis estadística también se le conoce como “ensayos de significación”,
“reglas de decisión” ó “contraste de hipótesis”. Su objetivo es evaluar proposiciones o
afirmaciones que se hacen acerca de los parámetros poblacionales basados en estadísticos
muestrales con un grado o nivel de significancia determinado.
Hipótesis nula e hipótesis alternativa.
En una prueba de hipótesis de significación se plantean dos tipos de hipótesis

excluyentes, llamadas hipótesis nula e hipótesis alternativa.
La hipótesis nula expresa que una proposición es verdadera, mientras que la hipótesis
alternativa afirma que es falsa ó viceversa.
Ho = hipótesis nula H1 = hipótesis alternativa
Ejemplos:
Ho = 1.68 H1 1.68
H1 < 1.68
H1 > 1.68
Ho = 4200 H1 > 4200

H1 < 4200
H1 4200

Errores tipo I y tipo II : en el proceso de emplear una muestra para formar una decisión
poblacional en una prueba de hipótesis, podemos cometer dos equivocaciones, al rechazar una
hipótesis verdadera o al aceptar una hipótesis falsa; las equivocaciones se conocen como
errores Tipo I y II.
a) Error tipo I. Se comete cuando se rechaza una hipótesis que por ser verdadera debería ser
aceptada.
b) Error tipo II. Se comete cuando se acepta una hipótesis que por ser falsa debería ser
rechazada.
Buen estudiante Mal estudiante
Aprobarlo Decisión correcta Error tipo II
Repobarlo Error tipo I Decisión correcta
Nivel de significancia y nivel de confianza : El nivel de significancia se refiere a la

probabilidad de cometer error tipo I, es decir, rechazar una hipótesis verdadera.
El nivel de confianza se refiere a la probabilidad 1- de aceptar una hipótesis verdadera.
H0 verdadera H1 falsa
Se acepta Ho Decisión correcta (1 – ) Error tipo II ( )
Se rechaza Ho Error tipo I ( ) Decisión correcta (1 – )
Procedimiento para realizar una prueba de hipótesis.

1.- Del fenómeno estadístico a probar. Se establecen las hipótesis nula Ho, y la hipótesis
alternativa H1.
2.- Se especifica la probabilidad del error tipo I ( ) como nivel de significancia y 1 – como
nivel de confianza.
3.- Se selecciona el tamaño de la muestra, la función de distribución de probabilidad y el

estadístico muestral que sirva de base para la regla de decisión conocido como estadístico de
prueba.
4.- Se determinan los valores críticos que limita la región de aceptación de la región de
rechazo (que dependerá del valor de y de la hipótesis alternativa).
5.- Si el valor del estadístico muestral cae dentro de la región de rechazo, rechazamos H o,
debido a que la probabilidad de obtener ese valor del estadístico muestral cuando Ho es cierta
o verdadera, es tan pequeño que no debe atribuirse a errores de muestreo, lo que nos conduce a
deducir que Ho es falsa.
6.- Dar conclusión acerca del problema y/o formar una decisión.

Hipótesis unilateral y bilateral.
Al realizar una prueba de hipótesis nuestro interés puede estar en el valor extremo de
un solo lado de la distribución, o en ambos lados. En el primer casi, las pruebas se denominan
unilaterales o de una cola; en el segundo caso se conoce como bilaterales o de dos colas.
En los ensayos unilaterales la región de rechazo es única a un lado de la distribución

con un área determinada por el valor de .
En las bilaterales la región de rechazo el área se determina dividiendo el nivel de

significancia en dos partes iguales.
BILATERAL
Zona de aceptación
Zona de rechazo Zona de rechazo
/2 /2
UNILATERAL >
Zona de aceptación Zona de rechazo
UNILATERAL <
Zona de rechazo Zona de aceptación

H0 Estadístico de prueba
Distribución normal x
= 0 z=
n
Distribución t x
= 0 t= ;v = n – 1
s
n
Distribución normal (x 1 x2 ) d0
1 – 2 = d0 z
2 2
1 2
1 y 2 conocidas
n1 n2
Distribución t (x 1 x 2 ) d 0 (n 1 1)s 12 (n 2 1)s 22
1 – 2 = d0 t ; s 2p
1 1 n1 n 2 2
1 = 2 desconocidas sp
n1 n2
Distribución t s 12 s 22
2
1 – 2 = d0
(x 1 x2 ) d0 n1 n2
1 2 desconocidas t ;v 2 2
s 12 s 22 s 12 s 22
n1 n2 n1 n2
n1 1 n2 1
Distribución normal x np 0
p = p0 z
np 0 (1 p 0 )
Distribución normal (p̂ 1 p̂ 2 ) x1 x 2
p1= p2 z ; p̂
1 1 n1 n 2
p̂q̂
n1 n2
2
Distribución 2 (n 1)s 2
= 0 2
Distribución F s 12
f
1= 2 s 22

VI.- ANALISIS DE REGRESION.-













VII.- TASA DE VARIACION E INDICADORES : NUMEROS INDICE.-









SEGUNDA PARTE
ESTADISTICAS APLICADAS CON

EXCEL

ESTADISTICAS APLICADAS CON EXCEL















Y X1 X2 X3
Desv. Típica 32.23 22.19 9.26 13329.54
D:TMuestra 32.99 22.71 9.48 13643.22






Y = m*XI + b






















A para Proyectos de Inversion Social

Diunggah oleh

Informasi Dokumen

Judul Asli

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

A para Proyectos de Inversion Social

Diunggah oleh

Hak Cipta:

Format Tersedia

Estadísticas para proyectos

I.-METODOS ESTADISTICOS PARA LA RECOPILACION,

Maestría en Gerencia de Proyectos de Desarrollo – Programa VIII Página 1

Maestría en Gerencia de Proyectos de Desarrollo – Programa VIII Página 2

Maestría en Gerencia de Proyectos de Desarrollo – Programa VIII Página 3

Maestría en Gerencia de Proyectos de Desarrollo – Programa VIII Página 4

Maestría en Gerencia de Proyectos de Desarrollo – Programa VIII Página 5

Maestría en Gerencia de Proyectos de Desarrollo – Programa VIII Página 6

Maestría en Gerencia de Proyectos de Desarrollo – Programa VIII Página 7

Maestría en Gerencia de Proyectos de Desarrollo – Programa VIII Página 8

Maestría en Gerencia de Proyectos de Desarrollo – Programa VIII Página 9

Maestría en Gerencia de Proyectos de Desarrollo – Programa VIII Página 10

Maestría en Gerencia de Proyectos de Desarrollo – Programa VIII Página 11

Maestría en Gerencia de Proyectos de Desarrollo – Programa VIII Página 12

Maestría en Gerencia de Proyectos de Desarrollo – Programa VIII Página 13

Maestría en Gerencia de Proyectos de Desarrollo – Programa VIII Página 14

Maestría en Gerencia de Proyectos de Desarrollo – Programa VIII Página 15

Maestría en Gerencia de Proyectos de Desarrollo – Programa VIII Página 16

II.- TEORIA , CALCULO Y DISTRIBUCION DE PROBABILIDADES.

Maestría en Gerencia de Proyectos de Desarrollo – Programa VIII Página 17

Maestría en Gerencia de Proyectos de Desarrollo – Programa VIII Página 18

Maestría en Gerencia de Proyectos de Desarrollo – Programa VIII Página 19

ESPACIO MUESTRAL. El el conjunto de todos los resultados posibles de un experimento

Una variable aleatoria se puede clasificar en:

Variable aleatoria discreta.

Variable aleatoria continua.

Variable aleatoria continua. Es aquella que se encuentra dentro de un intervalo comprendido

Una distribución de frecuencias es un listado de las frecuencias observadas de todos los

Maestría en Gerencia de Proyectos de Desarrollo – Programa VIII Página 20

Se pueden clasificar en:

Maestría en Gerencia de Proyectos de Desarrollo – Programa VIII Página 21

Lo cual equivale a calcular el área bajo la curva

Maestría en Gerencia de Proyectos de Desarrollo – Programa VIII Página 22

La distibución t pertenece a la familia Euler de las distribuciones gamma. La función de

La distibución T se parece a la Z, ya que ambas son simétricas alrededor de la media cero.

Cuando el tamaño de n , entonces T Z

Maestría en Gerencia de Proyectos de Desarrollo – Programa VIII Página 23

Sean U y V dos variables aleatorias independientes que tiene distribución 2 con v1 y v2

Maestría en Gerencia de Proyectos de Desarrollo – Programa VIII Página 24

DISTRIBUCIÓN NORMAL DE PROBABILIDAD.

La función de densidad de probabilidad normal es comúnmente empleada en el análisis

La distribución normal de probabilidad es una distribución continua de probabilidades que es

La distribución normal de probabilidad es muy importante por las siguientes razones:

En el caso de distribuciones continuas de probabilidad sólo es posible determinar el valor de

Maestría en Gerencia de Proyectos de Desarrollo – Programa VIII Página 25

CARACTERÍSTICAS DE UNA DISTRIBUCIÓN NORMAL DE PROBABILIDAD.

El promedio de estudiantes inscritos en jardín de niños es de μ = 500, con una desviación

a) entre 500 y 650.

Maestría en Gerencia de Proyectos de Desarrollo – Programa VIII Página 26

b) P(450 < x < 600)

c) P(x > 500)

Maestría en Gerencia de Proyectos de Desarrollo – Programa VIII Página 27

d) P(x < 500)

e) P(x < 300)

Maestría en Gerencia de Proyectos de Desarrollo – Programa VIII Página 28

f) P(x > 650)

g) P(x > 400)

Maestría en Gerencia de Proyectos de Desarrollo – Programa VIII Página 29

h) P(x < 610)

Maestría en Gerencia de Proyectos de Desarrollo – Programa VIII Página 30

III.- ELEMENTOS DEL MUESTREO ESTADISTICO EN PROYECTOS

3.1.- Definición y conceptos previos

En la investigación científica es habitual que se empleen muestras como medio de acercarse al