Anda di halaman 1dari 141

MODULO EDUCATIVO DEL CURSO

DE MTODOS ESTADSTICOS
Autor: Msc. Csar A. Zatta Silva
Universidad Seor de Sipan
2011-I

INTRODUCCIN

Las acciones que acometemos hoy


se basan en un plan de ayer y
las expectativas del maana.

Para satisfacer las necesidades de conocimiento sobre los Mtodos Estadsticos, se


ha diseado este mdulo teniendo en consideracin los objetivos sealados en las
competencias, capacidades y actitudes que el alumno debe alcanzar en este curso.
Se contempla en este curso que los estudiantes conozcan el origen de la palabra
estadstica, las tcnicas de recoleccin, organizacin, conservacin, y tratamiento
de los datos para su anlisis y posterior interpretacin de la informacin.
En nuestros das, son de uso cotidiano las diferentes tcnicas estadsticas que
partiendo de observaciones muestrales o histricas, crean modelos lgicomatemticos que se "aventuran" describir o pronosticar un determinado fenmeno
con cierto grado de certidumbre medible.
El avance tecnolgico en la informtica ha contribuido enormemente al desarrollo
de la estadstica, sobre todo en la manipulacin de la informacin, pues en el
mercado existen paquetes estadsticos de excelente calidad como el SPSS y MS
Excel que ya existe en el computador sin mayores exigencias tcnicas,

Contenido
Semana 1

Introduccin, resea histrica, contenidos. Objetivos. Definicin de Estadstica.


Conceptos bsicos importantes. Importancia y objeto de la estadstica. Elementos
bsicos: Poblacin, muestra, variable, unidad de estudio, parmetro. Clasificacin de las
variables.

Semana 2

Organizacin y presentacin de los datos. Tablas de distribucin de frecuencias.


Tipos de tablas estadsticas. Procesamiento de datos en cuadros y grficos estadsticos.

Semana 3

Mtodos Estadsticos en la investigacin, etapas de la investigacin estadstica:


Planeamiento, organizacin, anlisis e interpretacin de datos, formulacin de
conclusiones. Tcnicas de recoleccin de datos, observacin, entrevista, cuestionario,
encuestas por muestreo, sistemas de recoleccin.

Semana 4

Medidas de Tendencia Central: Media Aritmtica. Media Ponderada. Mediana.


Moda. Medidas de Posicin: Cuartiles. Deciles y Percentiles.

Semana 5

Medidas de Dispersin. Descripcin de las medidas de dispersin: Rango,


Desviacin y Varianza para datos simples y agrupados, Coeficiente de Variacin

Semana 6

Introduccin al Clculo de Probabilidades. Experimento aleatorio, espacio


muestral, suceso o evento. Definicin de Probabilidad Clsica, Probabilidad de
Frecuencia Relativa, Probabilidad Subjetiva. Combinacin, Variacin, Permutacin.

Semana 7

Probabilidad de un evento. Teorema de la adicin y de la complementacin. Reglas


de multiplicacin y de probabilidad total. Probabilidad Condicional. Teorema de Bayes.

Semana 8

Variables aleatorias. Funcin de probabilidad. Variables aleatorias discretas y


continuas.
Distribuciones discretas de probabilidad. Distribucin Binomial y de Poisson.
Distribuciones continuas de probabilidad. Distribucin Normal. Uso de Tablas

Semana 9

Primer Examen Parcial

Semana 10

Introduccin a la Inferencia Estadstica. Mtodos y distribuciones de muestreo.


Muestreo de la poblacin. Mtodos de muestreo probabilstico. Error de muestreo.
Distribucin de muestreo de medias muestrales. Tamao de muestra.

Semana 11

Introduccin a la Teora de la estimacin Estadstica.Estimaciones puntuales e


Intervalos de Confianza sobre parmetros.

Semana 12

Prueba de Hiptesis, introduccin, hiptesis estadsticas, pasos para una verificacin de


hiptesis. Hiptesis para la media poblacional. Prueba de Hiptesis para una varianza
poblacional y una proporcin poblacional.

Semana 13

Anlisis de tendencia o series de tiempo. Anlisis de regresin, formas de encontrar la


regresin simple. Mtodo de los mnimos cuadrados. La tendencia lineal.

Semana 14

Correlacin y desviacin estndar. Tasas y Nmeros ndices, aplicacin de los nmeros


ndices.

Semana 15

Control de Calidad y Procesos Estadsticos. Aplicacin de la estadstica en trabajo de


Investigacin. Presentacin de Diagnstico en Proyecto Integrador.

Semana 16

Segundo Examen Parcial

Semana 1

ESTADSTICA
La Estadstica es la ciencia que nos ofrece un conjunto de mtodos y tcnicas para: Recolectar,
Resumir, Procesar, Presentar , Analizar e Interpretar un conjunto de datos, con la finalidad de
conocer el problema, proyectar su comportamiento y colaborar en la toma de decisiones sobre
dicho problema.
Otra definicin: La estadstica es una rama de las matemticas, constituye uno de los idiomas
esenciales para comunicarse en el mundo universal de la ciencia y la tecnologa. Aquellos
profesionales que no conozcan Estadstica tendrn serias dificultades para ser expertos en su
respectivo campo cientfico.
Importancia
Los mtodos estadsticos tradicionalmente se utilizan para propsitos descriptivos, para
organizar y resumir datos numricos. La estadstica descriptiva, por ejemplo trata de la
tabulacin de datos, su presentacin en forma grfica o ilustrativa y el clculo de medidas
descriptivas.
Ahora bien, las tcnicas estadsticas se aplican de manera amplia en mercadotecnia, contabilidad,
control de calidad y en otras actividades; estudios de consumidores; anlisis de resultados en
deportes; administradores de instituciones; en la educacin; organismos polticos; mdicos; y por
otras personas que intervienen en la toma de decisiones
Mtodo que sigue la Estadstica

Recolectar

Resumir y Ordenar

Procesar

ESTADISTICA

Tomar decisiones

Analizar e Interpretar

Presentar

Clasificacin: La Estadstica para su mejor estudio se ha dividido en dos grandes ramas: la


Estadstica Descriptiva y la Inferencial.
Estadstica Descriptiva: Comprende a los procesos de consolidacin, resumen y descripcin de
los datos recopilados. Consiste sobre todo en la presentacin de datos en forma de tablas y
grficas. Esta comprende cualquier actividad relacionada con los datos y est diseada para
resumir o describir los mismos sin factores pertinentes adicionales; esto es, sin intentar inferir
nada que vaya ms all de los datos, como tales.
Estadstica Inferencial: Incluye procedimientos que permiten la extrapolacin y generalizacin
sobre caractersticas que tipifican a todos los elementos de la poblacin. Es decir, la inferencia

estadstica es el proceso de hacer afirmaciones o predicciones sobre toda la poblacin tomando


como base slo a la informacin recabada a travs de una muestra representativa.
CONCEPTOS FUNDAMENTALES
1. POBLACIN: Es el conjunto de todos los datos que intervienen en una investigacin.
Al nmero de elementos de una poblacin se denota por N.
Poblacin finita: Es el conjunto finito de unidades de anlisis donde se puede identificar a
un elemento inicial y/o a un elemento final.
Ejemplo: Poblacin de hoteles de Lima, poblacin de agencias de viaje existentes en la
ciudad de Cajamarca, turistas de nacionalidad alemana que ingresaron al Per en el ao
2000.
Poblacin Infinita: Conjunto infinito de elementos donde no se podra identificar a una
unidad inicial ni a la unidad final.
Ejemplo: la poblacin de los peces del mar, los rboles de la selva peruana
2. MUESTRA: Es una parte de la poblacin y como tal es tambin un conjunto de datos.
Al nmero de elementos de una muestra se denota por n.
Una muestra tiene 2 caractersticas principales: Es representativa y es adecuada.
Muestra No Probabilstica: Corresponde al subconjunto de observaciones elegidas
siguiendo un criterio de representatividad establecida arbitrariamente por el investigador.
Ejm. Analizo todos los ratones que son de color blanco del total de ratones
Muestra Probabilstica: Comprende a las observaciones realizadas en unidades que han
sido elegidas siguiendo un criterio probabilstico, esto es a cada unidad de la poblacin se
asigna probabilidad conocida para estar incluida como parte de la muestra. Ejm. Sacar 2
pelotas blancas de una canasta de 8 pelotas entre blancas y negras.
3. UNIDAD DE ESTUDIO: Es el objeto o elemento indivisible que ser estudiado. Es
quien nos va a dar la informacin.
Ejemplo: Se va a estudiar la capacidad hotelera de la ciudad de Lima, se define la unidad
de anlisis hotel
4. VARIABLE: Es una caracterstica de estudio de una poblacin, que toma diferentes
valores
Las variables son caractersticas observables referidas a la unidad de estudio. Se denota
por las letras X, Y, Z, etc. Se clasifican en:
4.1 Variable cualitativa : Son aquellas variables que expresan cualidades o atributos, y
que por tanto su medida no tiene un carcter numrico, esta variables pueden ser:
Nominales Sus valores representan un atributo a manera de etiqueta y no contiene
informacin sobre ordenamiento. Ejm. Sexo del cliente, nacionalidad del entrevistado,
etc.
Ordinales Sus valores s representan un ordenamiento del atributo. Ejm. Grado de
educacin del entrevistado, grado de satisfaccin sobre la atencin recibida por el cliente,
etc.

4.2 Variable Cuantitativa: Comprende aquellos conceptos que s pueden ser expresados
en forma numrica porque corresponde a criterios de cantidad. Pueden ser:
v. c. Discretas Son variables que toman valores que se expresan en nmeros enteros. Es
el resultado del proceso de conteo. Ejm. Nmero de empleados, Nmero de habitaciones,
Total de alumnos, etc.
v.c. Continuas Son aquellas variables que sus cantidades se expresan con nmeros
reales, es decir, tienen parte fraccionaria. Son el resultado del proceso de medicin. Ejm.
Ingresos totales mes de julio, costo de servicio diario del hotel, toneladas embarcadas,
etc.
Ejemplos:
El alumno deber identificar las variables para las unidades de estudio siguiente
*UNIDAD DE ESTUDIO: Estudiante
Variables: Peso, edad, talla, tipo de sangre, color de ojos, ingreso familiar, nmero de hermanos,
etc.
*UNIDAD DE ESTUDIO: Empresa
Variables: Ventas, ganancias, nmero de trabajadores, nmero de computadoras, gastos en
publicidad, etc.

Prctica Calificada N 01
A. Determina la poblacin y la muestra, y la variable de los siguientes ejemplos:
1. Tiempo dedicado a las tareas domsticas por los hombres y las mujeres que trabajan fuera
del hogar en Lambayeque
2. Estudios que quieren hacer las alumnas y los alumnos del Colegio Manuel Pardo al
terminar la Educacin Secundaria
3. Intencin de voto en unas elecciones municipales
4. Horas que dedican a ver televisin los estudiantes de educacin primaria del colegio San
Jos
5. Nmero de aparatos de radio que hay en los hogares chiclayanos
6. Se quiere realizar un estudio para determinar la cantidad promedio de huevos que ponen
los pinginos hembras en el perodo reproductivo en Puerto Maldonado.
7. Se quiere determinar la audiencia de cierto programa televisivo de televisin de aire.
8. Se requiere determinar el grado de afectacin que tuvo la salmonella en las gallinas
provenientes de las granjas del empresario Gonzales
9. Se quiere estimar el grado de aceptacin que tiene la mermelada de carambola en la zona
oeste de Chiclayo
B. De las siguientes variables, determinar cules son cualitativas y cuales son cuantitativas
discretas o cuantitativas continuas
1. Precio del pollo
2. Angulo de inclinacin de los puentes
3. Grado de instruccin de los postulantes
4. Color de ojos de las finalistas
5. Peso promedio de las bolsas
6. Nmero de taxis que ingresan por hora a Chiclayo
7. Comida favorita
8. Nmero de goles marcados por la seleccin
9. Profesin que te gusta

10. Coeficiente intelectual de tus compaeros de clase


11. El color de los ojos de tus compaeros de clase
12. Temperaturas registradas en verano
13. Nmero de acciones vendidas en la Bolsa de valores
14. Dimetro de las ruedas de varios coches
15. Censo anual de los espaoles
16. Nmero de libro en un estante
17. Litros de agua contenidos en un depsito
18. La profesin de una persona
19. Suma de puntos obtenidos en un lanzamiento de dados
C. Determina lo siguiente:
CASO N 01:
Dentro de los estudios sociales que realiza el Dr. Pauling sobre rendimiento y caractersticas
cognoscitivas de los alumnos pertenecientes al Colegio Pblico San Carlos, ha llegado a
resultados inesperados.
Unidad de estudio
Variable de estudio
Poblacin
Muestra

CASO N 02
Un proveedor de servicios de lnea blanca desea saber cul es la marca preferida de cocinas de
las amas de casa pertenecientes a la ciudad de Chiclayo. Para llevar a cabo esta investigacin,
selecciona a 120 amas de casa que fueron escogidas segn la zona de la ciudad de Chiclayo.
Unidad de estudio
Variable de estudio
Poblacin
Muestra

CASO N 03
Un investigador de mercado quiere saber cul es la marca de detergente que ms se utiliza o ms
prefieren las amas de casa de la ciudad de Chiclayo. Para llevar a cabo esta investigacin
selecciona una muestra de 504 amas de casa que fueron escogidas segn zona o urbanizacin de
la ciudad de Chiclayo.
Unidad de estudio
Amas de casa
Variable de estudio
Marca de detergente (tipo cualitativa nominal)
Poblacin
Amas de casa de la ciudad de Chiclayo
Muestra
504 amas de casa
CASO N 04:
El Ingeniero de Produccin de Cerveza Cristal en Motupe, dentro de su evaluacin diaria, desea
saber si el brix (grado de azcar), porcentaje de alcohol, tiempo de maduracin, etc, han
cumplido con las parmetros de calidad en la produccin del fin de semana.
Unidad de estudio
Cerveza
Variable de estudio
Brix, porcentaje de alcohol, tiempo maduracin
(cuantitativa)
Poblacin
Produccin de cerveza del fin de semana
Muestra
Produccin de cerveza de un da

CASO N 05:
Un investigador social desea saber cules son las caractersticas socio demogrficas que influyen
en el rendimiento acadmico de los Estudiantes de la Universidad Seor de Sipan, de la
especialidad de Ingeniera Agroindustrial matriculados en el 2 Semestre-Ao 2006.
Unidad de estudio
Estudiante
Variable de estudio
Caractersticas socio demogrficas
Poblacin
Estudiantes matriculados de Ing. Agroindustrial de la USS
(cualitativa)
Muestra
Alumnos matriculados del 2 semestre
CASO N 06:
El gerente del Grifo San Luis ubicado en el ovalo est haciendo un estudio de factibilidad para
determinar si es conveniente la instalacin de un nuevo servidor de gasolina en dicho
establecimiento. Para realizar este estudio toma informacin sobre el tiempo que se demora en
dar el servicio y el tiempo que demora en llegar el usuario (automvil).
Unidad de estudio
Usuario de automvil
Variable de estudio
Tiempo en dar el servicio y tiempo llegar usuario
(cuantitativa)
Poblacin
Todos los clientes del grifo
Muestra
Algunos clientes del grifo
CASO N 07
Un investigador de mercado quiere saber cul es la marca de jabones que ms se utiliza o ms
prefieren las empleadas de casa de la ciudad de Tarapoto. Para llevar a cabo esta investigacin
selecciona una muestra de 610 empleadas que fueron escogidas segn zona o urbanizacin de la
ciudad de Tarapoto.
Unidad de estudio
Variable de estudio
Poblacin
Muestra

Semana 2

ORGANIZACIN DE DATOS Y DISTRIBUCIONES DE


FRECUENCIA
Frecuencia: (fi) Nmero de individuos o elementos que pertenecen o aparecen en cada
categora.
1. ORGANIZACIN DE VARIABLES CUALITATIVAS: Comprende la representacin
grfica de conceptos cualitativos y/o atributos que se registran para las unidades de anlisis.
Ejemplo:
El nmero de turistas que registraron su ingreso por el aeropuerto de Chiclayo el mes de
Febrero, se registra segn su nacionalidad
NACIONALIDAD
Argentina
Boliviana
Brasilea
Venezolana
TOTAL

Nmero de Turistas (fi)


20
10
5
15
50

2. ORGANIZACIN DE VARIABLES CUANTITATIVAS DISCRETAS: Comprende


clasificaciones de variables que slo toman valores enteros, por tanto las unidades de anlisis se
ordenan de acuerdo con sus propios valores. Ejm:
Las puntuaciones obtenidas por los 30 alumnos del curso de Fsica I, fueron:
[12,11,13,13,10,10,12,12,09,09,08,14,12,11,14,14,14,10,10,14,13,13,11,11,14,13,14,13,14,12]
Se consolida la informacin en una Tabla de Frecuencia:
Notas
Xi

Frecuencia
Absoluta ( fi )

Frecuencia
Relativa ( hi)

08
09
10
11
12
13
14
TOTAL

1
2
4
4
5
6
8
30

0.03
0.07
0.13
0.13
0.17
0.20
0.27
1.00

Frecuencia Acumulada
Absoluta
Relativa
(Fi)
(Hi)
1
0.03
3
0.10
7
0.23
11
0.36
16
0.53
22
0.73
30
1.00

El grfico que corresponde a esta tabla de frecuencia se denomina: Histograma


Histograma de frecuencias absolutas

Histograma de frecuencias absolutas acumuladas

3. ORGANIZACIN DE VARIABLES CUANTITATIVAS CONTINUAS: Comprende


clasificaciones de unidades de anlisis resultantes de una medicin, que en ocasiones toman
valores decimales. Ejemplo:
El Gran Hotel Chiclayo, durante los ltimos 32 das, el valor de las compras en revistas y
peridicos para la sala de recepcin fueron:

Esta informacin diaria y dispersa no permitir analizar su comportamiento, es necesario


resumirla en una tabla de frecuencia. Para organizar una tabla de frecuencia se deber seguir el
procedimiento siguiente:
* Elegir el nmero de intervalos de clase ( k )
Se puede utilizar la regla se Sturges:
Donde:k = nmero de intervalos
n = nmero de datos

k =

1 + 3.322 log n

En el ejemplo: k = 1 + 3.322 Log(32) = 5.967 = Aprox. 6 intervalos


* Determinar el Tamao del Intervalo de Clase ( c )
c = A/k
A= Amplitud de los datos = (Observacin mxima Observacin Mnima) = 10.2 5.2 =
5.0
k=6
Por tanto: c = 5.0 / 6 = 0.8333 = Aproximadamente = 0.9
* Realizar la clasificacin y el conteo de datos en cada clase construida

* Construir la Tabla de Frecuencia


Intervalo de clase
(escala de gasto)

Marca de Clase
Xi

[ 5.2 6.1 )
[ 6.1 7.0 )
[ 7.0 7.9 )
[ 7.9 8.8 )
[ 8.8 9.7 )
[ 9.7 10.6 )
TOTAL

5.65
6.55
7.45
8.35
9.25
10.15

Frecuencia
Absoluta
fi

Frecuencia
Relativa
hi

Frec. Acumul.
Absoluta
Fi

Frec. Acumul.
Relativa
Hi

3
5
9
7
5
3
32

0.094
0.156
0.281
0.219
0.156
0.094
1.000

3
8
17
24
29
32

0.094
0.250
0.531
0.750
0.906
1.000

Anlisis de la distribucin de frecuencias:


* Cuntos das el hotel gast de 7.0 a menos de 7.9 soles?
* Cuntos das el hotel gast menos de 7.9 soles?
* Cuntos das el hotel gast menos de 9.7 soles?
* Qu porcentaje de das el hotel gast menos de 7.9 soles?
* Qu porcentaje de das el hotel gast ms de 7.9 soles?

: 9 das
: 17 das
: 29 das
: 53.1%
: 46.9 %

Polgono de Frecuencias: Es la lnea que une los puntos medios de los lados superiores (marcas
de clase) de un histograma. Los puntos o vrtices del polgono de frecuencias estn situados, por
tanto, en las marcas de clase, ya que estos corresponden a los puntos medios de los intervalos.

Histograma y Polgono de Frecuencias

USO DE MS EXCEL
Construccin tablas tipo A en EXCEL: Para variables cualitativas y cuantitativas discretas

Color
Azul
Rojo
Verde
Negro
Blanco

f
F
=contar.si($B$2:$H$11;B14) 21
16
13
8
12

Construccin tablas tipo B en EXCEL: Para variables cuantitativas continuas


Las densidades de los materiales en estudio fueron:

n = contar (celda inicio: celda final)


K = numero de intervalos, con frmula
Xmin= Valor Mnimo = MIN (celda)
Xmax= Valor Mximo = MAX( celda)
Rango = Max Min
C = R/K
Intervalos

f
= Frecuencia (datos; grupos)
= Frecuencia (B2:H8; D22:D28)

B2:H8
Todos los datos
D22:D28 La columna de datos del lmite superior

PRESENTACIN DE DATOS MEDIANTE GRFICOS ESTADSTICOS

Los grficos son medios popularizados y a menudo los ms convenientes para presentar datos, se
emplean para tener una representacin visual de la totalidad de la informacin. Los grficos
estadsticos presentan los datos en forma de dibujo de tal modo que se pueda percibir fcilmente
los hechos esenciales y compararlos con otros.
TIPOS DE GRFICOS
Grficos de barras verticales
Representan valores usando trazos verticales, aislados o separados unos de otros, segn la
variable a graficar sea discreta o continua. Pueden usarse para comparar y representar: una serie;
dos o mas series

Grficos de barras horizontales


Representan valores discretos a base de trazos horizontales, aislados unos de otros. Se utilizan
cuando los textos correspondientes a cada categora son muy extensos. Pueden usarse para una
serie, dos o ms series.

Grficos de barras proporcionales


Se usan cuando lo que se busca es resaltar la representacin de los porcentajes de los datos que
componen un total. Las barras pueden ser: Verticales u Horizontales

Grficos de lneas
En este tipo de grfico se representan los valores de los datos en dos ejes cartesianos ortogonales
entre s. Estos grficos se utilizan para representar valores con grandes incrementos entre s. Se
pueden usar para representar una serie, dos o ms series.

Grficos circulares
Estos grficos nos permiten ver la distribucin interna de los datos que representan un hecho, en
forma de porcentajes sobre un total. Se suele separar el sector correspondiente al mayor o menor
valor, segn lo que se desee destacar. Pueden ser: En dos dimensiones o tres dimensiones

Grficos de reas
En estos tipos de grficos se busca mostrar la tendencia de la informacin generalmente en un
perodo de tiempo. Pueden ser para representar una, dos o ms series; en dos dimensiones o en tres
dimensiones.

PRACTICA CALIFICADA N 02
USANDO EL PAQUETE O SOFTWARE RESPECTIVO, RESOLVER LOS SIGUIENTES EJERCICIOS

1. Qu es frecuencia absoluta?
2. Cmo se obtiene:
2.1 La frecuencia acumulada?
2.2 La frecuencia relativa?
2.3 La frecuencia relativa acumulada
3. En una distribucin de frecuencias se pueden establecer conclusiones porcentuales,
utilizando solamente la frecuencia relativa? Por qu?
4. Por qu se recurre al agrupamiento en distribuciones de frecuencias por intervalos?
5. Cmo se determina el nmero de intervalos y la amplitud de ellos?
6. Qu es una marca de clase?
7. La siguiente tabla relaciona las ausencias al trabajo de 50 obreros, durante el mes de
octubre, en la fbrica de confecciones "La Unin".
1
3
1
4
2

0
2
1
0
4

2
4
0
2
2

1
2
1
3
1

3
0
0
2
3

1
3
0
0
1

4
1
1
0
2

3
2
2
2
1

2
0
1
5
0

5
2
3
2
2

7.1 Construir una distribucin de frecuencias simple.


7.2 Sacar 3 conclusiones.
8. Aos de experiencia de las 50 operarias de agro exportadora La Calidad

Ordenar la Informacin y responder:


8.1 Qu porcentaje de las obreras tiene experiencia inferior o igual a 6
aos?
8.2 Qu porcentaje tiene experiencia entre 5 y 7 aos (incluyendo los

extremos)?

9. Peso de los sacos de aj pprika que fueron cosechados en los primeros 50 das de
produccin de la empresa Exporta SAC

Construir una distribucin de frecuencias y resaltar 3 conclusiones


10. Consumo de agua, en m3de 184 familias n un barrio residencial de una ciudad
durante el mes de octubre:

Construir una distribucin de frecuencias por intervalos.


Comparar las distribuciones con intervalos y sin intervalos; y las conclusiones que de
ellas se deriven.

Semana 3

MTODOS ESTADSTICOS EN LA INVESTIGACION Y


RECOLECCIN DE LA INFORMACIN
El mtodo estadstico, parte de la observacin de un fenmeno, y como
no puede siempre mantener las mismas condiciones predeterminadas o a
voluntad del investigador, deja que acten libremente, pero se registran
las diferentes observaciones y se analizan sus variaciones.
Para el planeamiento de una investigacin, por norma general, se siguen
las siguientes etapas:
1. PLANTEAMIENTO DEL PROBLEMA
Al abordar una investigacin se debe tener bien definido qu se va a investigar y por qu se pretende
estudiar algo. Es decir, se debe establecer una delimitacin clara, concreta e inteligible sobre el o los
fenmenos que se pretenden estudiar, para lo cual se deben tener en cuenta, entre otras cosas, la
revisin bibliogrfica del tema, para ver su accesibilidad y consultar los resultados obtenidos por
investigaciones similares, someter nuestras proposiciones bsicas a un anlisis lgico; es decir, se
debe hacer una ubicacin histrica y terica del problema.
2. FIJACIN DE LOS OBJETIVOS
Luego de tener claro lo que se pretende investigar, debemos presupuestar hasta dnde queremos
llegar; en otras palabras, debemos fijar cules son nuestras metas y objetivos.
Estos deben plantearse de tal forma que no haya lugar a confusiones o ambigedades y debe,
adems, establecerse diferenciacin entre lo de corto, mediano y largo plazo, as como entre los
objetivos generales y los especficos.
3. FORMULACIN DE LAS HIPTESIS
Una hiptesis es ante todo, una explicacin provisional de los hechos objeto de estudio, y su
formulacin depende del conocimiento que el investigador posea sobre la poblacin investigada. Una
hiptesis estadstica debe ser susceptible de demostrar, esto es, debe poderse probar para su
aceptacin o rechazo.
Una hiptesis que se formula acerca de un parmetro (media, proporcin, varianza, etc.), con el
propsito de rechazarla, se llama Hiptesis de Nulidad y se representa por Ho; a su hiptesis
contraria se le llama Hiptesis Alternativa (H1).
4. DEFINICIN DE LA UNIDAD DE OBSERVACIN Y DE LA UNIDAD DE
MEDIDA
La Unidad de Observacin, entendida como cada uno de los elementos constituyentes de la
poblacin estudiada, debe definirse previamente, resaltando todas sus caractersticas; pues, al fin de
cuentas, es a ellas a las que se les har la medicin. La unidad de observacin puede estar constituida
por uno o varios individuos u objetos y denominarse respectivamente simple o compleja.
El criterio sobre la unidad de medicin debe ser previamente definido y unificado por todo el equipo
de investigacin. Si se trata de medidas de longitud, volumen, peso, etc., debe establecerse bajo qu
unidad se tomarn las observaciones ya sea en metros, pulgadas, libras, kilogramos, etc.

Asociado a la unidad de medida, deben establecerse los criterios sobre las condiciones en las cuales
se ha de efectuar la toma de la informacin.
5. DETERMINACIN DE LA POBLACIN Y DE LA MUESTRA
Estadsticamente, la poblacin se define como un conjunto de individuos o de objetos que poseen
una o varias caractersticas comunes. No se refiere esta definicin nicamente a los seres vivientes;
una poblacin puede estar constituida por los habitantes de un pas o por los peces de un estanque,
as como por los establecimientos comerciales de un barrio o las unidades de vivienda de una
ciudad.
Existen desde el punto de vista de su manejabilidad poblaciones finitas e infinitas. Aqu el trmino
infinito no est siendo tomado con el rigor semntico de la palabra; por ejemplo, los peces dentro de
un estanque son un conjunto finito; sin embargo, en trminos estadsticos, puede ser considerado
como infinito.
Muestra es un subconjunto de la poblacin a la cual se le efecta la medicin con el fin de estudiar
las propiedades del conjunto del cual es obtenida.
En la prctica, estudiar todos y cada uno de los elementos que conforman la poblacin no es
aconsejable, ya sea por la poca disponibilidad de recursos, por la homogeneidad de sus elementos,
porque a veces es necesario destruir lo que se est midiendo, por ser demasiado grande el nmero de
sus componentes o no se pueden controlar; por eso se recurre al anlisis de los elementos de una
muestra con el fin de hacer inferencias respecto al total de la poblacin.
Existen diversos mtodos para calcular el tamao de la muestra y tambin para tomar los elementos
que la conforman, pero no es el objetivo de este curso estudiarlos. Diremos solamente que la muestra
debe ser representativa de la poblacin y sus elementos escogidos al azar para asegurar la objetividad
de la investigacin.
6. LA RECOLECCIN
Una de las etapas ms importantes de la investigacin es la recoleccin de la informacin, la cual ha
de partir, a menos que se tenga experiencia con muestras anlogas, de una o varias muestras piloto en
las cuales se pondrn a prueba los cuestionarios y se obtendr una aproximacin de la variabilidad de
la poblacin, con el fin de calcular el tamao exacto de la muestra que conduzca a una estimacin de
los parmetros con la precisin establecida.
El establecimiento de las fuentes y cauces de informacin, as como la cantidad y complejidad de las
preguntas, de acuerdo con los objetivos de la investigacin son decisiones que se han de tomar
teniendo en cuenta la disponibilidad de los recursos financieros, humanos y de tiempo y las
limitaciones que se tengan en la zona geogrfica, el grado de desarrollo, la ausencia de tcnica, etc.
Es, entonces, descubrir dnde est la informacin y cmo y a qu "costo" se puede conseguir; es
determinar si la encuesta se debe aplicar por telfono, por correo, o si se necesitan agentes directos
que recojan la informacin; establecer su nmero ptimo y preparar su entrenamiento adecuado.
7. CRITICA, CLASIFICACIN Y ORDENACIN
Despus de haber reunido toda la informacin pertinente, se necesita la depuracin de los datos
recogidos. Para hacer la crtica de una informacin, es fundamental el conocimiento de la poblacin
por parte de quien depura para poder detectar falsedades en las respuestas, incomprensin a las

preguntas, respuestas al margen, amn de todas las posibles causas de nulidad de una pregunta o
nulidad de todo un cuestionario.
Separado el material de "desecho" con la informacin depurada se procede a establecer las
clasificaciones respectivas y con la ayuda de hojas de trabajo, en las que se establecen los cruces
necesarios entre las preguntas, se ordenan las respuestas y se preparan los modelos de tabulacin de
las diferentes variables que intervienen en la investigacin.
El avance tecnolgico y la popularizacin de los computadores hacen que estas tareas, manualmente
dispendiosas, puedan ser realizadas en corto tiempo.
8. LA TABULACIN
Una tabla es un resumen de informacin respecto a una o ms variables, que ofrece claridad al lector
sobre lo que se pretende describir; para su fcil interpretacin una tabla debe tener por lo menos: Un
titulo adecuado el cual debe ser claro y conciso.
La Tabla propiamente dicha con los correspondientes subttulos internos y la cuantificacin de los
diferentes tems de las variables, y las notas de pie de cuadro que hagan claridad sobre situaciones
especiales de la tabla, u otorguen los crditos a la fuente de la informacin.
9. LA PRESENTACIN
Una informacin estadstica adquiere ms claridad cuando se presenta en la forma adecuada. Los
cuadros, tablas y grficos facilitan el anlisis, pero se debe tener cuidado con las variables que se van
a presentar y la forma de hacerlo. No es aconsejable saturar un informe con tablas y grficos
redundantes que, antes que claridad, crean confusin.
Adems la eleccin de determinada tabla o grfico para mostrar los resultados, debe hacerse no slo
en funcin de las variables que relaciona, sino del lector a quien va dirigido el informe.
10. EL ANLISIS
La tcnica estadstica ofrece mtodos y procedimientos objetivos que convierten las especulaciones
de primera mano en aseveraciones cuya confiabilidad puede ser evaluada y ofrecer una premisa
medible en la toma de una decisin.
Es el anlisis donde se cristaliza la investigacin. Esta es la fase de la determinacin de los
parmetros y estadsticos muestrales para las estimaciones e inferencias respecto a la poblacin, el
ajuste de modelos y las pruebas de las hiptesis planteadas, con el fin de establecer y redactar las
conclusiones definitivas.
11. PUBLICACIN
Toda conclusin es digna de ser comunicada a un auditorio. Es ms, hay otros estudiosos del mismo
problema a quienes se les puede aportar informacin, conocimientos y otros puntos de vista acerca
de l.

MTODOS DE RECOLECCIN DE DATOS PARA UNA


INVESTIGACIN

En una investigacin cientfica se procede bsicamente por observacin, por


encuestas o entrevistas a los sujetos de estudio y por experimentacin.

FUENTES DE INFORMACIN
Unidades Estadsticas: Elementos componentes de la poblacin estudiada.
Ejemplo: personal de una empresa, habitantes del distrito de Oyotn, etc.
La poblacin en una investigacin debe ser definida con precisin.

FUENTES DE INFORMACIN

PRIMARIAS

Los datos provienen


directamente de la poblacin
o muestra de la poblacin

SECUNDARIAS

Los datos parten de datos preelaborados, ejemplo: anuarios


estadsticos, de Internet, de medios
de comunicacin.

Se subdividen
en:

Observacin Directa:
Cuando el investigador toma
directamente los datos de la poblacin.
Ejm: un cientfico realiza
un experimento.
Observacin Indirecta:
Cuando los datos no son obtenidos
directamente por el investigador.
Usa un cuestionario u otro medio
para obtener los datos.
Debe realizar una encuesta

Deben ser analizadas bajo 4 preguntas bsicas que son:

Es pertinente? cuando la informacin se adapta a los


objetivos
Es obsoleta? cuando ha perdido actualidad
Es Fidedigna cuando la veracidad de la fuente de
origen no es cuestionada
y Es digna de Confianza? si la informacin ha sido
obtenida con la metodologa adecuada y honestidad
necesaria, con objetividad, naturaleza continuada y
exactitud

Encuesta: Constituye el trmino medio entre la observacin y la experimentacin. En


ella se pueden registrar situaciones que pueden ser observadas y en ausencia de
poder recrear un experimento se cuestiona a la persona participante sobre ello.
La encuesta es un mtodo descriptivo con el que se pueden detectar ideas,
necesidades, preferencias, hbitos de uso, etc.

Codificacin. Una vez cumplimentados los cuestionarios, viene la fase de

recuento de las respuestas. Cuando estas son numricas no hay ninguna


dificultad, pero cuando las preguntas han tenido una contestacin no numrica, es
preciso traducir estas respuestas a nmeros.
Esto se conoce con el nombre de codificacin.

Por ejemplo:
Como ves el estado actual del Instituto?
Muy Bien

.. 5

Bien

.. 4

Regular

.. 3

Mal

.. 2

Muy Mal

.. 1

No sabe/No contesta .. 0

EJEMPLO
DE
CUESTIONARIO

REPASO:

En el siguiente blog www.ingenieriainvestigacazasi.blogspot.com


encontrar informacin adicional sobre los temas descritos, tales como:

Ficha Tcnica-Encuesta INEI 2007


Modelo de Encuesta INEI
Caso Preferencia por Leche Envasada
Encuesta Servicio PLAZA VEA
Estadstica en la Investigacin Cientfica
Resultado Encuesta (Modelo Computacional)

Se solicita organizarse en grupos y


presentar el resultado de un
cuestionario aplicado a determinada
poblacin sobre un tema libre.

Semana 4

MEDIDAS DE TENDENCIA CENTRAL


Las medidas de tendencia central,
llamadas as porque tienden a
localizarse en el centro de la
informacin, son de gran importancia
en el manejo de las tcnicas estadsticas,
sin embargo, su interpretacin no debe
hacerse aisladamente de las medidas de
dispersin, ya que la representatividad
de ellas est asociada con el grado de
concentracin de la informacin.

Las principales medidas de tendencia central son:

1. MEDIA ARITMETICA:
Se conoce comnmente como promedio. La media aritmtica se calcula como la suma de todos los
valores que toma la caracterstica en estudio dividida por el nmero total de unidades experimentales
observadas. En smbolos:

Como ejemplo, consideremos 10 pacientes de edades 21 aos, 32, 15, 59, 60, 61, 64, 60, 71, y 80.
_
x = 21+32+15+59+60+61+64+60+71+80 = 52.3 aos
10
Interpretacin: La edad media de estos pacientes es de: 52.3 aos

Si se trata de datos agrupados se utiliza para variables discretas:

Donde: Xi = valores que toma la variable, fi = Frecuencia absoluta, n = total de datos


Ejemplo:

Un investigador social est interesado en conocer el nmero promedio de hijos en una muestra de 10 familias
entrevistadas para una encuesta en particular. Luego de efectuar el trabajo de recoleccin de datos, el listado
de las familias con su correspondiente nmero de hijos se form la siguiente tabla:
Familia No
Nmero de Hijos
1
2
2
4
3
4
4
3
5
4
6
3
7
3
8
3
9
6
10
3
Con esta informacin se construye la tabla de frecuencias de la siguiente manera:
Nmero de Hijos (Xj)
Frecuencia (fj)
Xjfj
2
1
2
3
5
15
4
3
12
6
1
6
Total

10

35

_
Luego: x = 35 = 3.5
10
Interpretacin:
La familia promedio proporcionada por la encuesta es aquella que presenta entre 3 y 4 hijos; el valor 3,5 es el
resultado matemtico del clculo de la media aritmtica pero no es un valor posible de la variable por su
propia definicin.

En el caso de datos numricos continuos agrupados en intervalos de clase, el clculo de la media


aritmtica es similar al caso anterior, es decir :
_
Y = Yi fi
n

Cuando se agrupan datos continuos en intervalos de clase, se pierde la informacin original. Luego, para
solucionar este problema, Yi se calcula como el promedio entre los extremos de cada intervalo, es decir Yi
representa el punto medio del intervalo de clase.

Ejemplo:
Calcular la media aritmtica de la longitud de 100 tornillos fabricados por una mquina.(Tabla 1)

Luego:

_
Y = Yi fi = 1014,0 = 10,14 mm
N
100

Interpretacin : En promedio el proceso productivo fabrica tornillos de 10,14 mm de longitud

2. MEDIANA: (Md o Me)


Es el valor que ocupa la posicin central de un conjunto de observaciones ordenadas. El 50% de las
observaciones son mayores que este valor y el otro 50% son menores.
A continuacin se muestran los criterios para construir la mediana. Se puede construir los siguientes criterios:
Lo primero que se requiere es ordenar los datos en forma ascendente o descendente, cualquiera de los dos
criterios conduce al mismo resultado.
Si n (tamao de la muestra) es impar, entonces, la mediana coincide con el valor medio, el cual corresponde
al dato Xn/2.
Si n (tamao de la muestra) es par, no existe un solo valor medio, si no que existen dos valores medios, en
tal caso, la mediana es el promedio de esos valores, es decir, los sumamos y luego los dividimos por dos.

La Mediana para datos no agrupados


Ejemplo 1:
Dados los siguientes datos: 1, 2, 3, 4, 0, 1, 4, 3, 1, 1, 1, 1, 2, 1, 3 correspondientes al nmero de hijos de 15
empleados de una empresa. Para la obtencin de la mediana se debern de ordenar.
Tomemos el criterio de orden ascendente con lo que, tendremos:
0, 1, 1, 1, 1, 1, 1, 1, 2, 2, 3, 3, 3 4, 4

Por otro lado el nmero de datos n = 15, siendo el nmero de datos impar se elige el dato que se encuentra a
la mitad, una vez ordenados los datos, en este caso es 1.
0, 1, 1, 1, 1, 1, 1, 1, 2, 2, 3, 3, 3 4, 4
Mediana
Interpretacin: El nmero mediano de hijos para estos empleados es 1.
Ejemplo 2:
Las calderas de una planta de energa de vapor a alta presin tuvieron las siguientes eficiencias en porcentajes:
90,3 - 91,6 - 90,9 - 90,4 - 90,3 - 91,0 - 87,9 - 89,4
El tamao de la muestra, n=8, nmero par. Luego los ordenamos y la mediana es la semisuma de los valores
centrales o sea el promedio de esos valores.
87,9 - 89,4 - 90,3 - 90,3 - 90,4 - 90,9 - 91,0 - 91,6
Mediana = 90,3 + 90,4 = 90,35
2
Interpretacin: El nmero mediano de eficiencia en porcentaje de las calderas de una planta de energa es de
90,35 % aunque el mismo no sea un valor posible de la variable.

Hallar la mediana de los siguientes datos: 7,10,15,13,10,12

La Mediana para datos agrupados


Si tenemos datos agrupados en tablas simples de frecuencia, procedemos de la siguiente manera:
Calculamos el orden que ocupa la Mediana, lo llamaremos orden de la mediana, cuya frmula es:
Orden = n
(este valor lo observamos en la frecuencia acumulada)
2
Ejemplo 1:
Supongamos que el gerente de personal de una empresa obtuvo los siguientes datos, correspondientes al
nmero de das que 19 de sus empleados faltan por enfermedad en un ao.
Luego:
Orden = 19 = 9.5
(est contenido en Fj = 10)
2
Los datos se presentan en la siguiente tabla:

La mediana es 8
Interpretacin: El 50 % de los 19 empleados faltan menos de 8 das y el 50% restante ms de 8 das.

Ejemplo 2: Supongamos que la siguiente tabla corresponde a la vida til en horas de 100 vlvulas

Orden = 100 + 1 = 101 = 50,5


2
2

Esto nos indica que la mediana se encuentra entre el lugar 50 y el lugar 51. Pero, qu valores ocupan esos
lugares?
Por lo explicado anteriormente, desde el lugar 38 y hasta el lugar 57, hay valores 39. Luego el valor nmero
50 y el valor nmero 51 son 39. Entonces:
Mediana = 39 + 39 = 39
2
Si los datos estn agrupados en intervalo de clase, veamos cmo se calcula la mediana
Ejemplo: Tenemos los siguientes datos agrupados en una Tabla de Frecuencia que representan los montos de
40 prstamos personales, en dlares, en una compaa financiera de consumidores. (Tabla N 4)

En este caso se emplea la siguiente frmula:


Dnde:
Li = Lmite Inferior del intervalo que contiene a la Mediana
Fi-1 = Frecuencia Acumulada en la clase anterior i-sima
fi = Frecuencia en la clase que contiene a la mediana
Hi-1 = Frecuencia Relativa Acumulada en la clase anterior i-sima
hi = Frecuencia Relativa en la clase que contiene a la mediana
c =Tamao del intervalo de clase.
Mediana = 930.64

3. MODA: (Mo)
La moda es el valor que aparece con mayor frecuencia, es decir, el que ocurre ms frecuentemente.
Se dice que cuando un conjunto de datos tiene una moda la muestra es unimodal, cuando tiene dos modas
bimodal, cuando la muestra contiene ms de un dato repetido se dice que es multimodal y un ltimo caso es
cuando ningn dato tiene una frecuencia, en dicho caso se dice que la muestra es amodal.
Moda para datos no agrupados
Si tenemos datos sin agrupar, la encontramos fcilmente observando cul es el valor que ms se repite.
Ejemplos:
1.- Determinar la moda del siguiente conjunto de datos:
a).- 1, 2, 3, 3, 4 , 5, 6, 7, 7, 3, 1, 9, 3
Respuesta: La moda de este conjunto de datos es igual a 3 y si considera unimodal.
b).- 1, 2, 3, 4, 4, 5, 2, 1, 3, 4, 2, -3, 4, 6, 3, 3
Respuesta: Las modas de este conjunto de datos son 3 y 4 ya que ambas tienen la ms alta frecuencia, por lo
que la muestra es bimodal
c).- 1, 2, 3, 4, 5, 6, 7, 8, 9
Respuesta: La muestra no contiene ningn dato repetido por lo que se considera que la muestra es amodal.

Moda para datos agrupados

En datos agrupados en tablas simples de frecuencias, nos fijamos que valor corresponde a la
mayor frecuencia absoluta. En la siguiente tabla

En este ejemplo, la mayor frecuencia absoluta es 4, que corresponde al valor 10. Luego la Moda es
10.
Interpretacin: La cantidad de das ms frecuente que los empleados faltan por enfermedad es 10.

En datos agrupados en intervalos de clases, existen varios mtodos para calcular la Moda. Cada
mtodo puede darnos un valor diferente, pero aproximado, para un mismo conjunto de datos.
Se puede hallar de la siguiente manera:

Donde: Li= extremo inferior de la clase modal


d1= (fi fi-1), d2 = ( fi fi+1)
Ejemplo: Hallar la moda de la tabla N 4
Solucin: Mo = 685
Interpretacin: El monto de prstamos personales en dlares ms frecuente otorgados por una compaa
financiera de consumidores es de 685 dlares.

MEDIDAS DE POSICIN NO CENTRALES.


CUARTILES
Los cuarteles de una distribucin, como si nombre lo indica, son valores de la variable que dividen al
conjunto de datos (ordenados de menor a mayor) en cuatro subconjuntos que contienen la misma
cantidad de datos.
Para calcular los cuartiles de una distribucin de frecuencias se procede del mismo modo que en el
caso de la mediana, salvo que ahora dividiremos a la distribucin de la variable en cuatro partes
iguales en lugar de dos.
A partir de esta definicin es evidente que la mediana coincide con el segundo cuartil. Los cuarteles
se simbolizan con la letra Q.
Ejemplo:
Supongamos que un veterinario ha registrado los pesos de 8 pollos de seis semanas de vida y orden
de menor a mayor, obteniendo:
150 - 151 - 152 - 154 - 155 - 156 - 157 - 159 gramos.
La mediana de este conjunto de datos estar posicionada entre el 4 y 5 valor de la serie, siendo:
Mediana = Q2 = 154,5 gramos
El primer cuartel Q1, debe dividir a la primera mitad de la serie en dos partes iguales, por lo cual Q1
se ubicar entre el 2 y el 3 valor de la serie.
Luego:
Q1 = 151,5 gramos
Del mismo modo Q3, el tercer cuartel, divide a la segunda mitad de la serie en dos partes iguales.
Es decir:
Q3 = 156,5 gramos
Interpretacin:
Si Q1 = 151,5 gramos significa que el 25 % de los pollos tendrn un peso inferior a 151,5 gramos y
el 75 % un peso superior a ese valor.
Si Q2 = 154,5 gramos significa que el 50 % de los pollos tendrn un peso inferior a 154,5 gramos y
el 50% restante superior a ese peso.
Si Q3 = 156,5 gramos significa que el 75 % de los pollos tendrn un peso inferior a 156,5 y un 25%
ser superior a ese peso.

* Cuando se trata de cuartiles para datos agrupados continuos, se aplica la frmula de interpolacin:

Dnde: n/4: es el nmero total de observaciones dividido por 4


Fj-1 : es el mayor de las frecuencias acumuladas que no supera a n/4
Fj
: es la frecuencia acumulada que le sigue a Fj-1
Xj-1 : es el extremo inferior del intervalo que tiene como frecuencia acumulada F.
c h : amplitud de dicho intervalo
Para la tabla No 1 (longitud de los tornillos), calcular Q1 y Q3.
Respuestas: Q1= 8,36 mm
Q3= 11,57mm
Interpretacin: Q1= Este valor indica que el 25% de los tornillos miden menos de 8,36 mm mientras
que el 75% restante mide ms de 8,36mm
Q3 = Este valor indica que el 75% de los tornillos miden menos de 11,57 mm mientras que el 25%
restante mide ms de 11,57mm.

PERCENTILES:
Los percentiles de una distribucin, como su nombre lo indica, son valores de la variable, que
dividen al conjunto de datos (ordenados de menor a mayor) en cien partes iguales.
Los percentiles tienen el mismo significado y la misma forma de clculo que los cuartiles. As,
cuando se habla del percentil 15 se quiere expresar que es el valor de la variable que deja el 15% de
los datos a su izquierda y el 85 % de los mismos a su derecha o lo que es lo mismo decir que es el
valor de la variable que deja al 15 % de los datos por debajo de l y el 85% por encima.
Se puede emplear la siguiente frmula:

Li = Lmite Inferior del intervalo que contiene al Percentil


Fi-1 = Frecuencia Acumulada en la clase anterior k-sima
fi = Frecuencia en la clase que contiene al Percentil
c =Tamao del intervalo de clase.
k = 1%, 2%, 3%, ... , 97%, 98%, 99% Percentiles

Prctica Calificada N 04
1. Qu es una medida de tendencia central?
2. Cules son las principales medidas de tendencia central?
3. Defina: media aritmtica mediana y moda.
4. Cundo se utiliza la media aritmtica ponderada?
5. Enuncie las propiedades de la media aritmtica
6. Para cada informacin de los ejercicios del captulo 3, calcular e interpretar la media aritmtica, la
mediana y la moda.
7.

Elaborar la tabla de frecuencia y determinar las medidas de tendencia central


8. Los siguientes datos representan las temperaturas observadas al proceso de fermentacin en un da
cualquiera de produccin de cerveza ALE. Determine utilizando intervalos: la media, mediana y
moda a la siguiente tabla de frecuencia:
25 33 27 20 14 21 33 29 25 17
31 18 16 29 33 22 23 17 21 26
13 20 27 37 26 19 25 24 25 20
25 29 33 17 22 25 31 27 21 14
24 7 23 15 21 24 18 25 23 24
9. Los estadsticos del programa de Comida Sobre Ruedas, el cual lleva comidas calientes a
enfermos confinados en casa, desean evaluar sus servicios. El nmero de comidas diarias que
suministran aparece en la siguiente tabla de frecuencia. Calcular la media, mediana y la moda.
Nmero de
comidas por da

Nmero de
das

0-5
5 - 10
10 - 15
15 - 20
20 - 25
25 - 30

3
6
5
8
2
3

10. Las edades de 50 de los directores ejecutivos de las mejores corporaciones de la nacin reportadas
aparecen en la siguiente tabla de frecuencias. Calcule e interprete la media, la mediana y la moda.
Adems, calcule e interprete: Q1 y P15.
Edades
Frecuencias
50 y menos de 55
8
55 y menos de 60
13
60 y menos de 65
15
65 y menos de 70
70 y menos de 75
75 y menos de 80

10
3
1

11. Una granja ganadera registr durante febrero el nacimiento de 29 terneros, cuyos pesos al nacer
(en kilogramos) fue el siguiente:
22,31,33,34,35,36,37,38,38,39,40,40,40,41,41,42,42,42,42,42,43,43,44,45,46,46,46,46,50

12. Los datos anteriores al ser dispuestos en una tabla de distribucin de frecuencias se obtuvieron en
la siguiente tabla resultante.

Calcular la el promedio y la mediana para datos agrupados y no agrupados; y


comparar resultados

13. Ingresando a la biblioteca Digital E-libro , de la USS, busquen en el libro:


Ttulo
Autor:
Editorial:
Publicado:

Estadstica
Colegio24hs
Colegio24hs
2004

Y desarrollen los ejercicios 1 al 5, de la pgina 47 a la 49 segn corresponda a encontrar la media


aritmtica, la mediana, y la moda.

Semana 5

MEDIDAS DE DISPERSIN
Las medidas de dispersin muestran la variabilidad de una
distribucin, indicando por medio de un nmero la tendencia de
los datos a dispersarse respecto al valor central o media. Cuanto
mayor sea ese valor, mayor ser la variabilidad, cuanto menor sea,
ms homognea ser a la media. As se sabe si todos los casos son
parecidos o varan mucho entre ellos.

Las medidas de dispersin ms usuales son:

1.

RANGO ESTADSTICO, AMPLITUD RECORRIDO.

Es la medida de variabilidad ms fcil de calcular. Es la diferencia entre el valor mnimo y el valor


mximo en un grupo de nmeros. Para averiguar el rango de un grupo de nmeros:

Ordenamos los nmeros segn su tamao


Restamos el valor mnimo del valor mximo
R= Xmx.

Xmn.

Ejemplo:
a. Para una muestra (1, 45, 50, 55, 100), el dato menor es 1 y el dato mayor es 100. Sus valores se
encuentran en un rango de:
Rango = 100 1 = 99
b. Hallar el rango de los conjuntos: x= 12, 6, 7, 3, 15, 10, 18, 5
y= 9, 3, 8, 8, 9, 8, 9, 18
En ambos casos, rango: 18 3 = 15; sin embargo si ordenamos se ven como sigue:
x = 3, 5, 6, 7, 10, 12, 15, 18

y = 3, 8, 8, 8, 9, 9, 9, 18

hay mucha ms dispersin en x que en y, por lo que y consiste esencialmente en ochos y


nueves, pero en este caso el rango no indica diferencia entre ambos conjuntos, no es una buena
medida de la dispersin. Cuando hay valores muy extremos, el rango es una pobre medida de la
dispersin.

LA VARIANZA. (S2 2)

2.

Es una variable estadstica que mide la dispersin de los valores respecto a un valor central (media).
Especficamente, la varianza es una medida de que tan cerca o que tan lejos estn los diferentes
valores de su propia media aritmtica.
Cuando ms lejos estn las Xi de su propia media aritmtica, mayor es la varianza; cuando
ms cerca estn las Xi a su media menos es la varianza. La Varianza es el cuadrado de la
desviacin estndar

Para datos no agrupados

Para datos agrupados

La variancia de los valores: (x1 x2 xk) que ocurren con las frecuencias (f1 f2 fk) es:

3.

DESVIACION ESTANDAR (S ) . ( DESVIACIN TIPICA)

La varianza a veces no se interpreta claramente, ya que se mide en unidades cuadrticas. Para evitar
ese problema se define otra medida de dispersin, la desviacin estndar, que se halla como la raz
cuadrada de la varianza. La desviacin estndar o desviacin tpica nos informa sobre la dispersin
de los datos respecto al valor de la media; cuanto mayor sea su valor, ms dispersos estarn los datos.
Desviacin Estndar: S = S2 = 2
(Es la raz cuadrada de la varianza)

Propiedades de la Desviacin Estndar


A su vez la desviacin estndar, tambin tiene una serie de propiedades que se deducen fcilmente de
las de la varianza (ya que la desviacin tpica es la raz cuadrada positiva de la varianza):
1. La desviacin estndar es siempre un valor no negativo S
2. Es la medida de dispersin ptima por ser la ms pequea.
3. La desviacin estndar toma en cuenta las desviaciones de todos los valores de la variable
4. Si a todos los valores de la variable se le suma una misma constante la desviacin estndar no
vara.
5. Si a todos los valores de la variable se multiplican por una misma constante, la desviacin estndar
queda multiplicada por el valor absoluto de dicha constante.
Para el ejemplo anterior, la desviacin estndar es 1.293 soles.

4. COEFICIENTE DE VARIABILIDAD
Es una medida de variabilidad de los datos que se expresa en porcentaje, en la cual se compara la desviacin
estndar con el respectivo valor del promedio de los datos, se expresa en porcentaje:

Practica Calificada N 05
1. Cul es la utilidad de las medidas de dispersin?
2. Cules son las principales medidas de dispersin?
3. Cul es la medida adecuada para comparar la dispersin entre varias variables que posean
diferente magnitud o diferente unidad de medida?
4. Para cada una de las informaciones de las unidades 2 y 4 de las sesiones anteriores, calcular e
interpretar:
4.1 Rango
4.2 Desviacin media
4.3 Desviacin Estandar
4.4 Coeficiente de variabilidad
5. La tabla de frecuencias exhibe las edades de una muestra de 36 personas que asistieron a una pelcula:
Aos

8-13

14-19

20-25

13

26-31

32-37

Hallar:
a. La media
b. La varianza
c. La desviacin

6. La siguiente tabla muestra los coeficientes de inteligencia de 480 nios de una escuela elemental
C.I.
fi

70
4

74
9

78
16

82
28

86
45

90
66

94
85

98
72

102
54

106
38

110
27

114
18

118
11

122
5

126
2

Calcula:
a) El C.I. promedio de los nios estudiados
b) Su desviacin.

7. El entrenador de un equipo de baloncesto duda entre seleccionar a Elena o Mara. Los puntos
conseguidos por cada una, en una semana de entrenamiento fueron:
Elena

18

23

22

24

19

25

16

Mara

18

26

18

28

22

17

18

a. Cul de las dos tiene mejor media?


b. Calcula la desviacin tpica. Cul de las dos es ms regular?
c. Si t fueras el entrenador, a quin seleccionaras?

Semana 6

INTRODUCCIN A LAS PROBABILIDADES


Los planes corresponden al hombre,
las probabilidades a Dios.
Proverbio chino

1. EXPERIMENTO ALEATORIO:
Es cualquier hecho o fenmeno cuyo resultado no puede predecirse antes de que suceda.
Ejemplo:
- Rendir un examen y observar su resultado
- Tirar una moneda y observar cual de las caras queda hacia arriba
- El lanzamiento de 2 dados paralelamente y observar el puntaje obtenido
- Elegir un cliente del restaurante y preguntar su opinin sobre el servicio recibido.

2. ESPACIO MUESTRAL:
Es el conjunto de todos los resultados posibles de un experimento aleatorio. Se representa
comnmente con la letra S.
Ejemplos:
* En el experimento aleatorio de lanzar una moneda 3 veces

El espacio muestral es un conjunto formado por 8 elementos:

* En el experimento aleatorio de lanzar un par de dados, el espacio muestral es:

3. EVENTO O SUCESO:
Es un subconjunto de elementos que pertenecen al espacio muestral y que cumple una
caracterstica determinada. Ejemplos:
* Del espacio muestral, lanzamiento de un dado; el evento
A= puntaje obtenido es mayor de 3
A= [4,5,6]
* Al lanzar una moneda 3 veces, el evento de obtener por lo menos dos caras es:
E = [(C,C,C), (C,C,S), (C,S,C), (S,C,C)] ; tiene 4 elementos
* Al lanzar un par de dados, el evento la suma es igual a 7 ser:

4. PROBABILIDAD
Es una medida que expresa la tasa de ocurrencia de un evento a largo plazo. El valor de esta
medida est comprendido entre [0 y 1].
La probabilidad de que ocurra un evento A se define como el valor que corresponde al nmero de
casos favorables entre el nmero de casos posibles:

Ejemplos:
Si se lanza un dado, cual es la probabilidad de obtener un puntaje impar. Rpta. 0.5
De un juego de 52 naipes se extrae una carta al azar (aleatoria), cul es la probabilidad de obtener
un puntaje mayor de 9. Rpta. 0.3077
Si se lanza un dado 2 veces cul es la probabilidad de que:
- Se obtenga un puntaje igual a 8
- Se obtenga un puntaje <= a 4
- Se obtenga un puntaje < a 5 pero >= a 2

OPERACIONES CON PROBABILIDADES


1. Eventos Mutuamente Excluyentes
Dos eventos son mutuamente excluyentes cuando no pueden ocurrir los dos al mismo tiempo, es
decir la ocurrencia de uno de ellos impide automticamente la ocurrencia del otro. Por tanto, si 2
eventos son mutuamente excluyentes no habr interseccin entre ellos.
Si el evento A y el evento B son excluyentes:
AB = 0, Luego P(A) = 0
Ejemplo: Los clientes de una agencia de turismo se clasifican segn nacionalidad y edad:

Cul es la probabilidad de elegir un cliente joven o adulto?


P(J U A) = P(J) + P(A) = 130 + 40 = 170 = 0.85
200
200 200
2. Interseccin de Eventos: En el ejemplo anterior, calcular la probabilidad de que un cliente
elegido sea Joven o Extranjero:
P(J U E) = P(J) + P(E) P(JE) = 130 + 80 - 30 = 180 = 0.9
200 200 200 200
Si A y B son no excluyentes: P(A U B) = P(A) + P(B) P(AB)
o = unin

y = interseccin

Ejemplos:
1. De la urna que tienes a la derecha, sacamos una bola a azar y anotamos su nmero
a) Describe el espacio muestral. Cuntos casos tiene?
b) Describe los siguientes sucesos:
Bola Roja = A; Bola Verde = B; Bola Azul = C; Bola Roja con nmero
impar = D; Bola con nmero par = F
c) Calcula la probabilidad de cada uno de los sucesos anteriores
2. Cul es el espacio muestral correspondiente al lanzamiento de una moneda? Cul es la
probabilidad de cada una de las dos caras?
3. Si se lanza un dado, cul es la probabilidad de obtener un puntaje impar

4. Al extraerse una carta de un juego de 52 naipes, cual es la probabilidad de que sta sea de
color rojo o tenga un puntaje menor de 5.
5. En una encuesta aplicada a 50 estudiantes secundarios, 22 alumnos manifestaron inclinacin por la
Qumica, 28 por Estadstica y 10 alumnos por ambos cursos. Si se selecciona al azar a uno de estos
alumnos:
a) Cul es la probabilidad de que les guste Qumica o Estadstica?
b) De qu se incline por Qumica y Estadstica?
c) Qu no le guste ninguno de los 2 cursos?
6. En un saln de clase hay 15 alumnos y 24 alumnas, la tercera parte de los hombres y la mitad de
mujeres son de Chiclayo. Hallar la P[ ] de que sea alumno sea de Chiclayo; y de que sea alumna y
que haya nacido fuera de Trujillo.

TCNICAS DE CONTEO
Repaso de Factoriales
n! = 1x2x3x4xxn
0! = 1
1! = 1

PERMUTACIN Pn
Una permutacin es un conjunto de arreglos diferentes de n en n elementos de un total de n
Se lee: Pn = permutacin de n elementos.
Frmula:

Pn = n!

Ejemplo:
1. De cuntas formas diferentes se pueden sentar 3 personas ABC en 3 asientos consecutivos:
[ ABC, ACB, BAC, BCA, CAB, CBA ] P3 = 3! = 6
2. Cuntas juntas directivas diferentes se podran formar con las personas ABC y D, si dicha junta
tiene los cargos de Presidente, Vicepresidente, Secretario y Tesorero.
P4 = 4! = 24 juntas

COMBINACIN

m
C =
m!
n
(m-n)! n!

Se lee: combinacin de n en n elementos de un total de m


Son arreglos diferentes de n en n elementos de un total de m, en los cuales no interesa el orden en
que se presentan.
Ejm. Se desea elegir un comit de 3 personas entre 8 candidatos, cuantos comits diferentes pueden
formarse:

8
C3=

8! =
8!
(8-3)! 3! 5! 3!

VARIACIN

56 formas diferentes

m
V =
m!__
n
(m-n)!

Se lee: Variacin de n en n elementos de un total de m. S interesa el orden de los elementos.


Ejm. Se desea formar una junta directiva con los cargos de presidente, secretario y tesorero. Si hay 8
candidatos, cuantas juntas directivas diferentes se podra formar:
8! = 8! = 8x7x6x5! = 336 formas diferentes
(8-3)! 5!
5!

Ejemplos para el Aula:


1. Si un conjunto A tiene 5 elementos. Cuntas duplas se pueden formar con los elementos de
A?.
2. En el concurso de belleza de Miss Universo, se suelen elegir primero 15 semifinalistas, luego
se eligen 5 finalistas. De cuntas formas diferentes se pueden ocupar las 5 primeras
posiciones entre las 15 semifinalistas?
3. La junta directiva de la compaa ABC consta de 15 miembros. De cuntas formas se puede
elegir presidente, vicepresidente y secretario?
4. Cuntos equipos de basquet de cinco hombres se pueden formar de una escuadra de 12
hombres si no tienen en cuenta las posiciones de juego?
5. En una clase de estadstica hay 30 estudiantes 24 hombres y 6 mujeres. De cuntas formas
distintas se puede construir un comit de cuatro estudiantes?
De cuntas formas distintas se puede construir un comit de cuatro estudiantes si dos deben
ser mujeres?

Practica Calificada N 06
ACTIVIDAD N 1
A continuacin se describen varias situaciones. Contesta la pregunta, en cada caso, razonando las respuestas:
a) En una clase de 30 alumnos, 12 chicos y 18 chicas, cada uno escribe su nombre en una papeleta y la
introduce en una caja. Qu es ms probable que aparezca el nombre de una chica o de un chico?
b) Se lanza un dado cbico con las caras numeradas del 1 al 6. Qu es ms probable que salga el 5 o el 1?
c) Si lanzas una ficha cuyas caras son verde y rojo qu color esperas que salga?
ACTIVIDAD N 2
Indica el espacio muestral de los siguientes sucesos:
a) Obtener par, al lanzar un dado cbico con las caras numeradas del 1 al 6.
b) Lanzamos dos monedas al aire.
c) Obtener impar al lanzar un dado cbico.
ACTIVIDAD N 3
En cada uno de los siguientes experimentos aleatorios, diga cul es la probabilidad de que ocurra el suceso
que se indica:
a)
CESTA I
CESTA II
b) BOLSA I
BOLSA II

Se extrae una pieza de fruta


Suceso: OBTENER UNA PERA

Se extrae una bola


Suceso: OBTENER UNA BOLA VERDE

ACTIVIDAD N 4
Resolver:
1. Hallar la probabilidad de sacar por suma 4 o 11 al lanzar dos dados.
2. Una urna tiene 8 bolas rojas, 5 amarillas y 7 verdes. Se extrae una al azar, calcular la probabilidad de que:
Sea roja.
Sea verde.
Sea amarilla.
3. Se extrae aleatoriamente una baraja de un juego de 52 cartas. Cul es la probabilidad de que la carta
seleccionada?
a) Sea un as
b) Sea una carta negra un nmero menor de 5
c) Sea nmero 8 y de color rojo
4. De 100 personas que fueron consultadas sobre sus preferencias a la hora de realizar un deporte, 50
practicaban ftbol, 40 practicaban baloncesto y 30 practicaban ciclismo. Adems, 25 personas practicaban
futbol y baloncesto, 15 practicaban ftbol y ciclismo, y 12 practicaban baloncesto y ciclismo. Por ltimo, tan
slo 5 personas practicaban los tres deportes. El resto no sabe o no contesta.
a) Representa el diagrama de Venn correspondiente.
b) Calcula las siguientes probabilidades: P(practicar ftbol), P(practicar ftbol y baloncesto), P(practicar slo
ciclismo), P(practicar los tres deportes), P(practicar alguno de los tres deportes), P(no practicar ninguno de los
tres deportes.

Permutaciones, Combinaciones, Variaciones


1. De cuntas maneras se pueden colocar dos anillos diferentes en la misma mano, de
modo que no estn en el mismo dedo?
2. Al lanzar cinco dados de distintos colores cuntos resultados podemos obtener?
3. Con los nmeros 1,2,3,4,5 y 6:
3.1 Cuntos nmeros distintos de siete cifras podramos formar?
3.2 Podremos numerar a los 3224564 habitantes de una ciudad con esos
nmeros?
4. Se lanzan al aire uno tras otro cinco dados equilibrados de seis caras. Cul es el
nmero de casos posibles?
5. Cuntos nmeros de seis cifras existen que estn formados por cuatro nmeros dos
y por dos nmeros tres?
6. Lola tiene 25 bolitas (10 rojas, 8 azules y 7 blancas) para hacerse un collar.
Engarzando las 25 bolitas en un hilo, cuntos collares distintos podr realizar?
7. Cuntas palabras distintas, con o sin sentido, podremos formar con las letras de la
palabra educacin? y con la palabra vacaciones?
8. Un grupo de amigos formado por Ral, Sonia, Ricardo y Carmen organizan una
fiesta, acuerdan que dos de ellos se encargarn de comprar la comida y las bebidas
De cuntas formas posibles puede estar compuesta la pareja encargada de dicha
misin?
9. Una fbrica de helados dispone de cinco sabores distintos (vainilla, chocolate, nata,
fresa y cola) y quiere hacer helados de dos sabores Cuntos tipos de helado podrn
fabricar?
10. Un grupo de amigos y amigas se encuentran y se dan un beso para saludarse. Si se
han dado en total 21 besos, cuntas personas haba?
11. En una carrera de 500 metros participan doce corredores De cuntas maneras
pueden adjudicarse las medallas de oro, plata, bronce?
12. De cuntas formas pueden cubrirse los cargos de presidente, vicepresidente,
secretario y tesorero de un club deportivo sabiendo que hay 14 candidatos?

Semana 7

PROBABILIDADES CONDICIONALES

Hasta ahora se ha estudiado la probabilidad absoluta de un evento, es decir sin relacionarlo uno con
otro. Sin embargo pudiera ser de inters calcular la probabilidad de que ocurra un evento de cierto
espacio muestral S a la luz de que otro evento de ese mismo espacio S ocurra.
Sean A y B dos eventos de un mismo espacio muestral S. La probabilidad condicional de A, dado
que ha ocurrido B (o viceversa), est dado por:
P[ A/B ] = probabilidad de que ocurra A habiendo sucedido B
P[ A/B ] = P[AB]
P[B]

= n (AB)
n(B)

P[B/A] = probabilidad de que ocurra B habiendo sucedido A


P[ B/A ] = P[BA] = n (BA)
P[A]
n(A)

Ejemplos:
1. En una empresa el 50% de trabajadores trabaja por la maana, el 30% lo hace por las tardes y el 20% tanto
en la maana como por la tarde; si se escoge aleatoriamente a un trabajador cualquiera:
a) Cual es la probabilidad de que trabaje en la maana si se conoce que labora en la tarde
b) Cual es la probabilidad de que trabaje por las tardes si se conoce que labora por la maana
SOLUCIN
A= labora en la maana . 50%
B= labora en la tarde .. 30%
A B = labora en los dos turnos 20%
a)

P[A/B] = P[A B] = 20/30 = 2/3 66.67%


P[B]

b)

P[B/A] = P[B A] = 20/50 = 2/5 40%


P[A]

2. De todos los alumnos que el ciclo pasado llevaron los cursos de Estadstica Aplicada y Matemtica I, se
tienen los siguientes datos:
El 20% desaprobaron Matemtica I
El 35% desaprobaron Estadstica Aplicada
El 10% desaprobaron ambos cursos
Si se escoge aleatoriamente a un alumno que lleva estos cursos, cual es la probabilidad de que este:
a) Haya sido desaprobado en Matemtica I conocindose que fue desaprobado en Estadstica Aplicada
b) Haya sido desaprobado en Estadstica Aplicada conocindose que fue desaprobado en Matemtica I
c) De que haya sido desaprobado en Matemtica I Estadstica Aplicada
SOLUCIN:
M = desaprob Matemtica I =20%
E = desaprob Estad. Aplicada =35%
M E = desaprobaron ambos cursos = 10
a)

P[M/E] = 10/35 = 2/7 = 28,57%

b)

P[E/M] = 10/20 = = 50%

c) P[E UM] = P[E] + P[M] P[E M] = 35/100 + 20/100 10/100 = 9/20 = 45%
3. En la parte preferencial de un teatro solamente hay 120 asientos, los cuales son de 2 colores, azules o
negros; algunos son de madera y otros son metlicos. El resumen se presenta en el recuadro siguiente:
Asientos
Azul
Negro
Total

Metlicos
35
18
53

Madera
45
22
67

Total
80
40
120

Si se selecciona aleatoriamente uno de estos asientos, calcule la probabilidad de que este sea:
a) De color azul
b) De color negro metlico
c) El asiento elegido sea de madera
d) Sea de color azul si se sabe que es de metal
e) El asiento sea de madera si se sabe que es de color negro
f) El asiento no sea de color azul
SOLUCIN
A= Azul,

N=Negro,

M=Metlico,

Ma=Madera

a) P[A] = n(A)/n(S) = 80/120 = 2/3 = 66.47%


b) P[N M] = n(M N)/n(S) = 18/120 = 9/60 = 3/20 = 15%
c) P[Ma] = 67/120 = 55.83 %
d) P[A/M] = P[A M] / P[M] = n(A M) / n(M) = 35/53 = 66.04%
e) P[M/N] = P[Ma N]/ P[N] = n(Ma N)/n(N) = 22/40 = 11/20 = 55%

Complemento de un suceso=> P[M]= 1 P[M]


Sea de color azul: P[A], complemento = 1 P[A]
f) P[A] = 1 P[A] = 1 - 80/120 = 40/120 = 4/12 = 1/3 = 33.33%

TEOREMA DE BAYES
Es un caso particular de la probabilidad condicional.
Si A1, A2, A3, , An, son sucesos mutuamente excluyentes de los cuales al menos uno de los
sucesos Ai (i=1,2,3,,n) debe ocurrir y siendo B un suceso cualquiera del espacio muestral, la
probabilidad de que ocurra el suceso Ak habiendo ocurrido B se puede definir como:
P[Ak / B] = P[Ak] . P[B/Ak]
P[Ai] . P[B/Ai]
Ejemplo 1
1. En una empresa el 50% de trabajadores pertenecen al rea tcnica profesional, el 30% son
oficinistas y el 20% pertenecen al rea de personal de servicio; se sabe adems que el 8, 9 y 10% de
los tcnicos profesionales, oficinistas y personal de servicio respectivamente son provincianos.
a) Represente las condiciones enunciadas en un rbol de probabilidades
b) Si se selecciona al azar un trabajador, cual es la probabilidad de que este sea tcnico
profesional o personal de servicio.
c) Sea tcnico profesional si se conoce que es provinciano
d) Sea de personal de servicio si se sabe que es de la capital
SOLUCIN
T= tcnico profesional
O=oficinistas
S=personal servicio

P=provinciano
C=capital

a) rbol de probabilidades
b) P[T U S] = P[T] + P[S] P[T S] = 50/100 + 20/100 0 = 70/100 = 70%
c) P[T/P] = _________50/100 x 8/100_______________________
50/100x8/100 + 30/100x9/100 + 20/100x10/100
= 50 x 8_____________ = ___400
50x8 + 30x9 + 20x10 400+270+200
d) P[S/C] = P[S].P[C/S]
P[T].P[C/T] + P[O].P[C/O] + P[S].P[C/S]

= 400/870 = 40/87 45.98%

= 20/100 . 90/100
50/100x92/100 + 30/100x91/100 + 20/100x90/100
= 1800
= 1800 / 9130 = 180/913 19.72 %
4600 + 2730 + 1800
Ejemplo 2
El 70% de los pacientes de un hospital son mujeres y el 20% de ellas son fumadoras. Por otro lado el
40% de los pacientes hombres son fumadores. Se elige al azar un paciente del hospital. Cul es la
probabilidad de que sea fumador?
Solucin

Diagrama de rbol para el ejemplo:

Ejemplo 3
Consideremos un control de calidad de una empresa en el cual se desea saber la probabilidad de que
un determinado artefacto tenga una vida til superior a las 1200hs. Para ello el dpto. de Control de
Calidad separa 500 unidades de la produccin y mide la vida til de cada unidad. Los resultados de
observan en la siguiente tabla:
Duracin(en hs)
Menos de 800
800 a 899
900 a 999
1000 a 1099
1100 a 1199
1200 a 1299
1300 a 1399
1400 a ms
Total
P(A) = 115 + 84 +41
500

Frec. Abs.(fi)
10
40
55
70
85
115
84
41

Frec. Relat.
2%
8%
11%
14%
17%
23%
17%
8%

500

100%

= 23% + 17% + 8%
= 48%

Prctica Calificada N 07
Ejercicio 1:
Tres mquinas, A, B y C, producen el 45%, 30% y 25%, respectivamente, del total de las piezas
producidas en una fbrica. Los porcentajes de produccin defectuosa de estas mquinas son del 3%,
4% y 5%.
a. Seleccionamos una pieza al azar; calcula la probabilidad de que sea defectuosa.
b. Tomamos, al azar, una pieza y resulta ser defectuosa; calcula la probabilidad de haber sido
producida por la mquina B.
c. Qu mquina tiene la mayor probabilidad de haber producido la citada pieza

Ejercicio 2:
Tras un estudio estadstico en una ciudad se observa que el 70% de los motoristas son varones y, de
estos, el 60% llevan habitualmente casco. El porcentaje de mujeres que conducen habitualmente con
casco es del 40%. Se pide:
a. Calcular la probabilidad de que un motorista elegido al azar lleve casco.
b. Se elige un motorista al azar y se observa que lleva casco. Cul es la probabilidad de que sea
varn?

Ejercicio 3:
En una ciudad, el 35% vota al partido A, el 45% vota al partido B y el resto se abstiene. Se sabe
adems que el 20% de los votantes de A, el 30% de los de B y el 15% de los que se abstienen, son
mayores de 60 aos. Se pide:
a. Hallar la probabilidad de que un ciudadano elegido al azar sea mayor de 60 aos.
b. Hallar la probabilidad de que un ciudadano mayor de 60 aos se haya abstenido.

Ejercicio 4:
Los alumnos de Primero de Biologa tienen que realizar dos pruebas, una terica y otra prctica. La
probabilidad de que un estudiante apruebe la parte terica es de 0.6, la probabilidad de que apruebe
la parte prctica es de 0.8 y la probabilidad de que apruebe ambas pruebas es 0.5.
a.
b.
c.
d.

Son independientes los sucesos aprobar la parte terica y la parte prctica?


Cul es la probabilidad de que un alumno no apruebe ninguno de los dos exmenes?
Cul es la probabilidad de que un alumno apruebe solamente uno de los dos exmenes?
Se sabe que un alumno aprob la teora. Cul es la probabilidad de que apruebe tambin la
prctica?

Ejercicio 5:
El 35% de los crditos de un banco es para vivienda, el 50% para industrias y el 15% para consumo
diverso. Resultan fallidos el 20% de los crditos para vivienda, el 15% de los crditos para industrias

y el 70% de los crditos para consumo. Calcula la probabilidad de que se pague un crdito elegido al
azar.

Ejercicio 6:
El volumen de produccin en tres plantas diferentes de una fbrica es de 500 unidades en la primera,
1000 unidades en la segunda y 2000 en la tercera. Sabiendo que el porcentaje de unidades
defectuosas producidas en cada planta es del 1%, 0.8% y 2%, respectivamente, calcula la
probabilidad de que al seleccionar una unidad al azar sea defectuosa.

Ejercicio 7:
El 20% de los empleados de una empresa son ingenieros y otro 20% son economistas. El 75% de los
ingenieros ocupan un puesto directivo y el 50% de los economistas tambin, mientras que de los no
ingenieros y no economistas solamente el 20% ocupan un puesto directivo. Cul es la probabilidad
de que un empleado directivo elegido al azar sea ingeniero?

Semana 8

VARIABLES ALEATORIAS DISCRETAS Y CONTINUAS


DISTRIBUCIONES DE PROBABILIDADES
En el clculo de probabilidades, generalmente, es ms
sencillo identificar los eventos numricamente, y no con
la simple descripcin del suceso que pueda ocurrir, es
ms, en muchas ocasiones no podemos registrar todos los
sucesos inmersos en el espacio muestral del experimento.
Debemos recurrir a cuantificar esos smbolos iniciales en
nmeros reales que se puedan operar matemticamente.

Variable Aleatoria
Definicin: Una variable aleatoria es una funcin definida sobre un espacio muestral a los
nmeros reales. Si ese espacio muestral especificado como dominio es numerable, decimos
que la variable es de tipo discreto, en caso contrario diremos que es de tipo continuo.
En el experimento de lanzar una moneda, una vez, definimos la variable aleatoria X: el
nmero de sellos obtenido.

En la tirada de dos dados si X es la suma obtenida:

FUNCIN DE PROBABILIDAD
Las variables aleatorias, transforman eventos del espacio muestral en eventos numricos, los
cuales desde luego, tienen asociada una probabilidad de ocurrencia.
1. Funcin de Probabilidad f(x)=p(X=x): Es una funcin definida sobre una variable aleatoria a los
reales en el intervalo [0,1] que cumple con los axiomas de la teora de la probabilidad.

2. Funcin de Distribucin F(x)=p(X=x)


Es la acumulada de una funcin de probabilidad.

-: Limite inferior de la variable X

Ejemplo:
En el Lanzamiento de una Moneda,
X: Nmero de Sellos

Ejemplo:
X es la Suma Obtenida en el Lanzamiento de dos Dados:

Ejemplo: Cul es la probabilidad que un disparo impacte a menos de 15 cm del centro? a ms de


9 centmetros? Entre 7 y 14 centmetros?

CUESTIONARIO Y EJERCICIOS PROPUESTOS


1. Defina: Variable aleatoria, variable aleatoria discreta, variable aleatoria continua, funcin
de probabilidad y funcin de distribucin.
2. En el ejercicio de la ficha de domin, si X representa la diferencia absoluta entre los dos
nmeros, representar y calcular la probabilidad de ocurrencia de los siguientes eventos:
2.1 La diferencia sea menor o igual a 5
2.2 La diferencia sea mayor que 2
2.3 La diferencia sea mayor que 2 pero menor o igual 5
2.4 La diferencia sea mayor que 5 menor que 3

DISTRIBUCIN BINOMIAL

DISTRIBUCIN DE POISSON
La distribucin de Poisson es de gran utilidad cuando tenemos variables distribuidas a travs del
tiempo del espacio. Es el caso del nmero de llamadas que entran a una central telefnica en una
unidad de tiempo, la cantidad de personas que atiende un cajero en una hora, los baches por
kilmetro en una autopista, los artculos defectuosos que hay en un lote de produccin; amn de su
utilizacin como aproximacin binomial cuando p es muy cercano a cero, o n superior a 30. (p<0.1 ,
n>30).
La funcin de probabilidad de Poisson es:

Ejemplo:
Un cajero de un banco atiende en promedio 7 personas por hora, cual es la probabilidad de que un
una hora determinada:
1. Atienda menos de 5 personas
2. Atienda ms de 8 personas
3. Atienda ms de 5 pero menos de 8 personas
4. Atienda exactamente 7 personas
Consultando la tabla para la distribucin de Poisson:

Ejemplo:
En cierto ncleo poblacional, el 0.5% es portador del V.I.H. En una muestra de 80 personas, cual es
la probabilidad:
1. De que haya alguna persona portadora.
2. No haya personas portadoras.
Solucin:

DISTRIBUCIN NORMAL
Dada la caracterizacin propia de este modelo continuo, donde coinciden las medidas de tendencia
central, media, moda y mediana; la simetra respecto a estos parmetros y la facilidad de su
aplicacin hacen de la distribucin normal, una herramienta de uso comn, mxime que la mayora
de las variables econmicas y sociales se ajustan a una funcin normal.
La distribucin normal, tambin es til como aproximacin de los modelos binomial y poisson
expuestos anteriormente, y yendo un poco ms adelante, sustentados en el teorema del lmite
central podemos afirmar que, cuando el tamao de la muestra es lo suficientemente grande,
podemos asumir el supuesto de normalidad para una suma de variables.
La forma acampanada de la variable normal, resalta la perfeccin de esta curva definida por los
parmetros

Sin embargo, existen infinitas distribuciones normales, ya que por cada media aritmtica
varianza diferente se describe una funcin tambin diferente:

Normal Diferente Media Igual Varianza

Normal Diferente Varianza Igual Media

Las grficas de este tipo son muy corrientes: Hay pocos individuos en los
extremos y un aumento paulatino hasta llegar a la parte central del
recorrido, donde est la mayora de ellos.

DEFINICIN :
Es la distribucin ms importante en la estadstica.
Es una distribucin simtrica con respecto a su promedio, teniendo la media,
mediana y moda el mismo valor. El valor mximo ocurre cuando
U = Me = Mo

En el caso de la
Distribucin normal de
parmetros x y ,
dicha funcin viene dada
por:

<=

>=

Z=xu

Casos:
I.

P [xx] = P [ Z x u ]

II. P [xx] = 1 P[x x] = 1 P[ Z x u ]

III. P[a x b] = P[x b] P[x a]


= P[Z b u ] P[Z a u ]

a)

Tenga un contenido mayor a 1020 cm3


u = promedio = 1000 cm3
= 30 cm3
P [x > 1020]
= 1 P[ x 1020]
= 1 P[ z 1020 1000 ]
30
= 1 P [ z 0,67]

Buscar en tablas 0,67

= 1 0,74857 = 025143 25.14%


b)

Tenga un contenido menor a 975 cm3


P[ x < 975 ]
P [ z 975 1000 ]
30
P [ z -0.833] = 0,20327 20.33%

c)

Contenga entre 980 y 1030 cm3


P [980 x 1030]
P [ z 1030 1000 ] P[z 980 1000 ]
30
30
P [ z 1 ] P [z -0.666 ]
0.84134 - 0.25143
0.58991 58.99%

..

Ver en tablas

2. Una prueba acelerada de duracin en un gran nmero


de pilas alcalinas tipo D, revel que la duracin media
para un caso especfico antes que falle es 19 h. La
distribucin de las duraciones se aproxima a una
distribucin normal. La desviacin estndar de la
distribucin fue de 1.2 h.
Calcular:

a) Probabilidad que dure ms de 21 horas


b) Probabilidad que dure como mximo 17.8 horas
c) Probabilidad de que su duracin est comprendida
entre 18.7 y 19.3 h

Nota: Las tablas utilizadas en esta sesin, se encuentran


colgadas en el Aula Virtual de la USS y en el blog:
www.ingenieriainvestigacazasi.blogspot.com

Practica Calificada N 08
1. La probabilidad de que un visitante efecte una compra en un almacn, durante un
da dado es 0.8. Si al negocio entran 20 clientes, cul es la probabilidad de que el
almacn realice:
1.1 Exactamente 16 ventas?
1.2 Menos de 17 ventas?
1.3 Ms de 14 ventas?
1.4 Exactamente 5 ventas?
1.5 Cul es el nmero esperado de ventas?
2. Si un almacn tiene en promedio 5 ventas por hora. Cul es la probabilidad de que
en una hora determinada:
2.1 Haya exactamente 4 ventas?
2.2 Haya ms de 3 ventas?
2.3 No se efecten ventas?
3. Una de cada 10 personas mayores de 40 aos de una comunidad, sufren de
hipertensin. Se toma una muestra de 50 personas mayores de 40 aos.
Utilizando primero la distribucin binomial y luego la aproximacin a la distribucin
de Poisson, responder y comparar los resultados:
3.1 Cul es la probabilidad que haya ms de 4 hipertensos?
3.2 Cul es la probabilidad que haya exactamente 5hipertensos?
4. Un lote de arandelas tiene un dimetro normal con media 10 milmetros y
desviacin tpica 0.5 milmetros. Se toma una arandela al azar. Cul es la
probabilidad de que tenga un dimetro:
4.1 Superior a 10.5 milmetros?
4.2 Entre 9 y 11 milmetros?
4.3 Menos de 9 milmetros?

Semana 10

INTRODUCCIN A LA INFERENCIA ESTADSTICA

La preparacin de un proyecto de investigacin es una


tarea compleja, ya que se han de tener en cuenta multitud de
aspectos para que el documento final contemple todos los
apartados que cualquier estructura estndar considera y para
que todos los investigadores sepan con qu y cmo deben
proceder en todas las etapas de ejecucin del estudio planteado.
Uno de los dilemas que se presenta cuando se inicia la
elaboracin del proyecto es decidir sobre los individuos o
elementos que se incluirn en el estudio: qu caractersticas
tendrn criterios de inclusin y exclusin, a cuntos pacientes
se estudiar tamao de la muestra y cmo se elegirn para
que entren a formar parte del estudio tcnica de muestreo.
Estudiar a toda la poblacin, que sera la manera ms exacta de conocer lo que se pretende
estudiar, es casi imposible en la prctica. Entre los motivos que lo impiden se encuentran la falta de
tiempo, la escasez de recursos humanos y econmicos, la dificultad para acceder a todos los sujetos,
etc., por lo que se estudia slo a una parte de ellos, para, posteriormente, generalizar o inferir los
resultados obtenidos a toda la poblacin.
Por tanto, cuando se habla de sujetos de estudio, se ha de diferenciar claramente entre
poblacin, muestra e individuo.

TEOREMA DEL MUESTREO


DISEO DE MUESTRA
1. Definir la Poblacin Meta: Conjunto de Elementos que poseen la informacin
que se busca

2. Determinar el Marco de la Muestra: Lista o grupo de indicaciones para


identificar a la poblacin meta
Listas:
Directorio Telefnico de Organizaciones
Lista de correo

3. Seleccionar las Tcnicas de Muestreo

T E C N IC A S D E
MUESTREO

reas

Estratificado

Grupo

Por

Simple

Bola de Nieve

Por

Cuota

Por

Juicio

Por

Conveniencia

Por

Sistemtico

P ro b a b ils tic o

N o P r o b a b ils t ic o

TCNICAS NO PROBABILSTICAS:
Es aquella en la cual los elementos del conjunto poblacin no tienen la misma probabilidad
de ser seleccionado.
1. Por Conveniencia: Su principal debilidad es el nombre, ya que, para muchas personas el
nombre da a entender que se est haciendo la seleccin de las unidades de anlisis amaando
las respuestas, situacin que no es cierta, toma su nombre, debido a que se busca obtener una
representatividad de la poblacin consultando o midiendo unidades de anlisis que pueden ser
accesadas con relativa facilidad. Es uno de los muestreos con mayor uso, dado esa
particularidad.
2. Por Juicio: Se busca seleccionar a individuos que se juzga de antemano tienen un
conocimiento profundo del tema bajo estudio, por lo tanto, se considera que la informacin
aportada por esas personas es vital para la toma de decisiones. En el rea de vacunas
sintticas, el Dr. Patarroyo, es considerado una eminencia, luego sera un personaje ideal para
hablar sobre esa temtica. Si se utilizar un mtodo aleatorio, probablemente quedaran en la
muestra algunas personas con poco dominio sobre el tema en estudio.

3. Por Cuota: Se asemeja al muestreo estratificado en el sentido que busca representatividad


de diferentes categoras o estratos de la poblacin objeto de estudio, sin embargo, para la
seleccin de esas unidades no usa el azar: Es uno de los ms usados en la prctica.
4. Por Bola de Nieve: Este muestreo no es tan comn, pero que tiene su aplicabilidad en
diversos casos, se pretende localizar a algunos individuos, de tal manera que estos, lleven a
otros y as sucesivamente. Su aplicabilidad, esta mayoritariamente en estudios con
poblaciones de difcil ubicacin y/o identificacin, como es el caso de: drogadictos, enfermos
de VH Sida, personas son hbitos escasos etc.

TCNICAS PROBABILSTICA:
Es aquella mediante la cual cada uno de los elementos de la poblacin tienen la misma
oportunidad de ser seleccionados

Clases de Muestreo Probabilstico


1. Muestreo Aleatorio Simple: Es aquel en que cada uno de los elementos tiene la misma
oportunidad de ser seleccionados. Generalmente se realiza con la ayuda de nmeros
aleatorios.
2.Muestreo Sistemtico: Es aquella tcnica en la que despus de seleccionarse
aleatoriamente el 1er elemento de la muestra, el resto de elementos se selecciona mediante un
sistema particular, como por ejemplo de 10 en 10.
3.Muestreo Estratificado: Es aquel que divide a la poblacin en reas o estratos, despus de
lo cual considera a cada uno de ellos para sacar parte de la muestra total.
Generalmente este tipo de muestreo se efecta en forma proporcional al nmero de elementos
de cada estrato, es decir, en funcin a sus porcentajes con respecto al nmero total de
elementos de la poblacin.

Ejemplo Aplicativo
1. Una empresa decide premiar a sus trabajadores por el xito obtenido en la ltima campaa,
sorteando 10 pasajes entre ellos a la ciudad del Cuzco, incluyendo bolsa de viaje.
Haga la seleccin de los trabajadores favorecidos en forma aleatoria simple, utilizando una
tabla de nmeros aleatorios.
Punto de partida: Columna 8 y fila 5

Respuesta
Nmeros ledos en la tabla:

Los trabajadores seleccionados fueron:

2. Efecte la seleccin de los 10 trabajadores del ejemplo anterior mediante un muestreo aleatorio
sistemtico. Escoja aleatoriamente entre los 8 primeros trabajadores a uno y luego seleccione los
restantes de tres en tres (contando a partir del primer trabajador seleccionado).
Punto de partida para seleccionar al primero: Columna 3 y fila 7.
Primer trabajador seleccionado es el nmero: .
Trabajadores restantes:
3. Supongamos que el dueo de la Empresa decide premiar a slo 15 trabajadores, pero en la
premiacin deben estar trabajadores de todas las reas en forma proporcional a la cantidad que
aparece en la lista.
Solucin
Tenemos la siguiente distribucin de trabajadores por seccin:
Jefatura
Of. de Auditora Interna
Of. de Asesora Jurdica
Of. de Planeamiento y Desarrollo
Secretara General
Of. de Administracin

3
8
5
7
6
6

Total

35

Hacemos la siguiente tabla de distribucin


rea de Trabajo
Jefatura
Of. de Auditora Interna
Of. de Asesora Jurdica
Of. de Planeamiento y
Desarrollo
Secretara General
Of. de Administracin
Total

N Trabajadores

Porcentaje %

3
8
5
7

8.57
22.86
14.29
20.00

6
6
35

17.14
17.14
100

N Trabajador
Considerado
1
3
2
3
3
3
15

Se halla primero el porcentaje individual que representa cada trabajador en su rea


Ahora, en la nueva reparticin el total es 15 trabajadores, entonces para hallar la
cantidad de trabajadores por rea se calcula de la sgte. manera:
15 ------ 100%
X ------ 8.57%

X : 8.57 * 15
X = 1.29 trabajador, equivale a 1
100
Una vez determinado el nmero a seleccionar en cada estrato, en cada uno de ellos se aplica
muestreo aleatorio simple.

TAMAO DE LA MUESTRA
El tamao de la muestra es el nmero de sujetos que componen la muestra
extrada de una poblacin, necesarios para que los datos obtenidos sean
representativos de la poblacin
Conceptos:
Parmetro:
Estadstico:

Caracterstica de la Poblacin
Caracterstica de la Muestra

EL TAMAO DE LA MUESTRA DEPENDE DE TRES ASPECTOS:


1. NIVEL DE PRECISIN:

Error Muestral

El Error Muestral o Error de Estimacin es el error a causa de


observar una muestra en lugar de la poblacin completa, tambin es
la diferencia entre un estadstico y su parmetro correspondiente.
La estimacin de un valor de inters, como la media o el porcentaje, estar
generalmente sujeta a una variacin entre una muestra y otra.
Estas variaciones en las posibles muestras de una estadstica pueden,
tericamente, ser expresadas como errores muestrales, sin embargo,
normalmente, en la prctica el error exacto es desconocido. El error muestral
se refiere en trminos ms generales al fenmeno de la variacin entre
muestras.
2. NIVEL DE CONFIANZA ESTIMADO (z)
Probabilidad de que un intervalo de confianza incluya el parmetro de la
poblacin.
Ejemplo:
Si Confianza es de 99%, la desconfianza es 1%
= 0.99

= 0.01

/2

/2

0.99

F(z) = 0.995
z = 2.58

* Nivel de Confianza

99%
98%
97%
96%
95%
94%
93%
92%
91%
90%

z = 2.58
z = 2.33
z = 2.17
z = 2.05
z = 1.96
z = 1.88
z = 1.81
z = 1.75
z = 1.70
z = 1.64

El Intervalo de Confianza est compuesto por: Lmite Superior y Lmite


Inferior

3. CARCTER FINITO O INFINITO DE LA POBLACIN:


Se considera finita cuando se conoce la poblacin y es infinita cuando no se
conoce el total de la poblacin.

Clculo de n (Tamao de la muestra)

Caso I: Para proporciones o porcentajes (variable cualitativa)


~ Para poblacin infinita o
grande
(N desconocida)

~ Para poblacin finita (N conocida)

n = z2.p.q
Dnde:

N.z2.p.q

n=

(N-1).D2+z2.p.q

z: nivel de confianza
D: error aceptado/precisin requerida
p: probabilidad de xito que ocurra el suceso
q: probabilidad que no ocurra el suceso

NOTA1: Para poblacin finita, si el valor de n/N > 0.05; se debe corregir el tamao
de la muestra de la siguiente manera:
n = ____n____
(1 + n/N)
NOTA2: Si no se conoce el dato previo de p y q, se asume que cada uno de ellos vale
50%, es decir:
p = q = 0.50 = 50%
Cuando se supone p=q=0.50, se obtiene el mximo tamao de muestra, es
decir que para cualquier tamao de p y q, n sea menor.

Caso II: Para promedios (variable cuantitativa)


Para poblacin infinita o
grande (N desconocida)
~

~ Para poblacin finita (N conocida)

n=
n = (z . / D) 2

N.z2. 2

__

(N-1).D2 + z2. 2

Dnde 2 = varianza
NOTA1: Para poblacin finita, si el valor de n/N > 0.05; se debe corregir el
tamao de la muestra de la siguiente manera:
n = ____n____
(1 + n/N)
NOMENCLATURA
n = Nmero de elementos de la muestra
N = Nmero de elementos de la poblacin o universo
P/Q = Probabilidades con las que se presenta el fenmeno.
Cuando el valor de P y de Q sean desconocidos o cuando la encuesta abarque
diferentes aspectos en los que estos valores pueden ser desiguales, es conveniente
tomar el caso ms adecuado, es decir, aquel que necesite el mximo tamao de la
muestra, lo cual ocurre para P = Q = 50, luego, P = 50 y Q = 50.
Z = Valor crtico correspondiente al nivel de confianza elegido
E = Margen de error permitido (determinado por el responsable del estudio).

Ejercicios Resueltos de Tamao de Muestra


1.

Suponga que las estaturas de los hombres de cierto pas tienen distribucin normal con
desviacin estndar de 2.5 pulgadas. De qu tamao se debe tomar la muestra si se desea
determinar un intervalo de confianza del 95% para la media con un error de estimacin de
0.5?
Solucin
Datos:
= 2.5
n = (z. / D)2
z = 95% = 1.96
n = (1.96x2.5/0.5)2
D = 0.5
n = 96.04
n = 96 hombres

2.

Un analista desea estimar el salario promedio de los trabajadores de una compaa


determinada con un margen de error de $250 y una confianza del 90%. Se estima que la
desviacin estndar de los salarios no es mayor de $1000. Cul es el nmero de

expedientes que deben muestrearse


investigacin?
Solucin
Datos:
D = 250
z = 90% = 1.64
= 1000

3.

como mnimo para satisfacer este objetivo de

n = (z. /D)2
n = (1.64x1000/250)2
n = 43.03
n = 43 expedientes

El rector de una universidad particular desea estimar el costo promedio de un ao de


estudios con un error de estimacin menor a $500 y con una probabilidad del 95%. Suponga
que la universidad solo tiene 1500 alumnos y que el costo tiene una desviacin estndar
aproximada de $4000. Cuntos alumnos deben seleccionarse?
Solucin
Datos:
D = 500
n = _____N . z2 . 2____
z = 95% = 1.96
(N-1).D2 + z2. 2
N = 1500
= 4000
n = 1500 . (1.96) 2 . (4000)2
(1499)(500)2 + (1.96)2.(4000)2
n = 211.3597
n = 211 alumnos
En este caso se hace la comprobacin:
n = 211 = 0.14 > 0.05
N 1500
Se debe corregir a:
1 + n_
N

n _ = 211
1 + 211
1500

185 estudiantes

Interpretacin: Se debe tomar en cuenta a 185 estudiantes para que el resultado tenga una
confianza del 95% y una precisin de 500$ ( un error no mayor a $500)
4.

Se desea estimar el peso promedio de 800 naranjas. Para ello se va a escoger aleatoriamente
cierto # de ellas. Se desea que el erro de estimacin sea mximo de 3 gr con una confianza
del 90%. Cuntas naranjas deben seleccionarse?. Suponga que la varianza es
aproximadamente de 144 gramos al cuadrado.
Solucin
Datos:
N = 800
n = N . z2 . 2_____
D = 3 grs
(N-1).D2 + z2. 2
z = 1.64
2 = 1.44
n = 800 . (1.64) 2 . (144)
799.(3)2 + (1.64)2.144
n = 40.885
n = 41 naranjas

En este caso se hace la comprobacin:


n = 41 = 0.05125 > 0.05
N 800
Se debe corregir a:
n _ = 41
=
1 + n_
1 + 41
N
800

39 naranjas

Interpretacin: Se debe considerar a 39 naranjas para que el peso promedio calculado tenga
una confianza del 90%, con un error mximo de 3 gramos.
5.

Se desea estimar en cierta ciudad la proporcin de estudiantes que estn a favor de la


legalizacin de las drogas prohibidas. El error de estimacin que se requiere es del 1% y un
nivel de confianza del 99%. Cuntos estudiantes deben incluirse en la muestra?
Solucin
Datos:
D = 0.01
n = z 2 . p .q
z = 99% = 2.58
D2
p = q = 0.50
(no hay informacin previa )
n = (2.58)2.(0.5)(0.5)
(0.001)2
n = 16641 estudiantes
Interpretacin: Para que el % de estudiantes calculado tenga una confianza del 99% con un
error no mayor de 1% se debe encuestar a 16641 estudiantes.

6.

El jefe de personal de una empresa desea realizar una encuesta para determinar la
proporcin de trabajadores que est a favor de un cambio en el horario de trabajo. Como es
imposible consultar a los 500 trabajadores en un lapso razonable, procede a escoger
aleatoriamente cierto # de trabajadores para entrevistarlos; determine el nmero de
trabajadores que debe entrevistarse si desea que la proporcin estimada presente un error
mximo del 5% y un nivel de confianza del 95%.
Solucin
Datos:
N = 500
n = N. z2 . p.q__
D = 0.05
(N-1).D2 + z2.p.q
z = 95% = 1.96
p = q = 0.50
n = 500 . (1.96) 2 . (0.50)2
499.(0.05)2 + (1.96)2.(0.50)2
n = 217.49
n = 217 trabajadores
En este caso se hace la comprobacin:
n = 217 = 0.434 > 0.05
N 500

Se debe corregir a:
1 + n_
N

n _ = 217
1 + 217
500

151 trabajadores

Interpretacin: Para que el porcentaje de trabajadores que estn a favor del cambio de
horario calculado tenga una confianza del 95% y un error no mayor al 5%, se deben
considerar como muestra 151 trabajadores.
7.

Un prospecto de comprador desea estimar el promedio de ventas por cliente (en $) en una
tienda de juguetes ubicada en un aeropuerto. Con base en datos de otras tiendas similares, se
estima que la desviacin estndar de ese tipo de ventas es de aprox. $32. Qu tamao de
muestra se debe utilizar como mnimo, se desea estimar las ventas promedio con un margen
de error de $8 y un intervalo de confianza del 99%?
Solucin
Datos:
= $32
n = (z. /D)2
D=8
n = ( 2.58 x 32 )2
z = 99% = 2.58
8
n = 107
Interpretacin: Para que el promedio de ventas calculado sea aceptado con un 99% de
confianza y un error que no sobrepase los 8 dlares, el tamao a considerar debe ser de 107
ventas.
El error generalmente no debe sobrepasar a un cuarto de la desviacin estndar, si
sobrepasa la muestra es pequea.

8.

Un administrador universitario desea estimar la proporcin de estudiantes inscritos en


programas de postgrado en administracin de empresas, que tambin tienen licenciaturas en
la misma rea, con un margen de error del 0,05 y una confianza del 90%. Determine el
mnimo tamao de la muestra si:
a) No existe ninguna base para estimar el valor apropiado de la proporcin antes de tomar la
muestra
b) Si una informacin previa seala que la proporcin no es mayor de 30%
Solucin
a) Datos: D= 0.05
n = [ 1.64 x o.50]2
z = 90% = 1.64
0.05
p = q = 0.50
n = 268.96
n = 269
b) Datos:

p = 0.30
q = 0.70
D = 0.05
z = 1.64

n = (1.64)2 .(0.30).(0.70)
(0.05)2
n = 225.93
n = 226 estudiantes

Practica Calificada N 10
1. Queremos ajustar una mquina de refrescos de modo que el promedio del lquido dispensado quede
dentro de cierto rango. La cantidad de lquido vertido por la mquina sigue una distribucin normal con
desviacin estndar 015 decilitros. Deseamos que el valor estimado que se vaya a obtener comparado
con el verdadero no sea superior a 02 decilitros con una confianza del 95%.De qu tamao debemos
escoger la muestra?
2. Es necesario estimar entre 10.000 establos, el nmero de vacas lecheras por establo con un error de
estimacin de 4 y un nivel de confianza del 95%. Sabemos que la varianza es 1.000. Cuntos establos
deben visitarse para satisfacer estos requerimientos?
3. Una mquina llena cajas con cierto cereal. El supervisor desea conocer con un error de estimacin de
mximo 01 y un nivel de confianza del 90%, una media estimada del peso. Como la varianza era
desconocida se procedi a escoger una muestra piloto. Los resultados fueron los siguientes: 1102, 1114,
1078, 1159, 1158, 1119, 1171, 1127, 1093, 1094. Cuntas cajas debe escoger para que se cumplan
los requisitos propuestos?
4. Se desea conocer el peso promedio de una determinada clase de pescado con un error de estimacin de
002 y con un nivel de confianza del 99%. Por datos anteriores se sabe que el peso mnimo es 148 libras
y el mximo es de 247 libras.De qu tamao debe escoger la muestra? Suponga que los pesos de estos
pescados se distribuyen normalmente.
5. Se desea hacer una encuesta para determinar la proporcin de familias que carecen de medios
econmicos para atender los problemas de salud. Existe la impresin de que esta proporcin est prxima
a 035. Se desea determinar un intervalo de confianza del 95% con un error de estimacin de 005. De
qu tamao debe tomarse la muestra?
6. Un productor de semillas desea saber con un error de estimacin del 1% el porcentaje de semillas que
germinan en la granja de su competidor. Qu tamao de muestra debe tomarse para obtener un nivel de
confianza del 95
7. Se desea realizar una encuesta entre la poblacin juvenil de una determinada localidad para determinar
la proporcin de jvenes que estara a favor de una nueva zona de ocio. El nmero de jvenes de dicha
poblacin es N=2.000. Determinar el tamao de muestra necesario para estimar la proporcin de
estudiantes que estn a favor con un error de estimacin de 005 y un nivel de confianza del 95
8. Un bilogo quiere estimar el peso promedio de los ciervos cazados en el estado de Maryland. Un
estudio anterior de diez ciervos cazados mostr que la desviacin estndar de sus pesos es de 12.2
libras. Qu tan grande debe ser una muestra para que el bilogo tenga el 95% de confianza de que el
error de estimacin es a lo ms de 4 libras?
9. Una empresa elctrica fabrica focos que tienen una duracin aproximadamente normal con una
desviacin estndar de 40 horas. De qu tamao se necesita una muestra si se desea tener 96% de
confianza que la media real est dentro de 10 horas de la media real?
10. Suponga que en el ejercicio anterior se tiene una poblacin de 300 focos, y se desea saber de
que tamao debe de ser la muestra. El muestreo se realizar sin reemplazo.
11. En una muestra aleatoria de 500 familias que tienen televisores en la ciudad de Hamilton, Canad,
se encuentra que 340 estn suscritas a HBO. Qu tan grande se requiere que sea una muestra si se
quiere tener 95% de confianza de que la estimacin de P est dentro de 0.02?
12. Una legisladora estatal desea encuestar a los residentes de su distrito para conocer qu proporcin
del electorado conoce la opinin de ella, respecto al uso de fondos estatales para pagar abortos. Qu
tamao de muestra se necesita si se requiere un confianza del 95% y un error mximo de estimacin de
0.10?

Semana 11

TEORA DE LA ESTIMACIN ESTADSTICA

La inferencia estadstica es el proceso de usar resultados muestrales


para obtener conclusiones respecto a las caractersticas de una
poblacin.
En esta seccin estudiaremos los procedimientos estadsticos que
permitan estimar dos parmetros de una poblacin: la media y la
proporcin.

Razn para estimar


Los administradores utilizan las estimaciones porque se deben tomar decisiones racionales, sin
que tengan la informacin pertinente completa y con una gran incertidumbre acerca de lo que
pueda deparar el futuro, pero con la intencin de que las estimaciones constituyan una buena
aproximacin de los parmetros desconocidos de la poblacin.

Estimador
Es la regla o procedimiento, expresado en general por medio de una frmula, que se utiliza para
deducir la estimacin.

Estimacin
Es un valor especfico observado de un estimador, por lo que asigna uno o varios valores
numricos a un parmetro de una poblacin sobre la base de datos de muestra.

Tipos de estimacin
a) Estimacin puntual:
Consiste en un solo estadstico muestral que se usa para estimar el valor verdadero de un
parmetro de una poblacin que es desconocido.

Cuando usamos una estimacin puntual, sabemos que aunque usemos un mtodo bueno
de estimacin es prcticamente improbable que el valor de la estimacin coincida con el
verdadero valor del parmetro, as que sera conveniente acompaar nuestra estimacin
con alguna medida que nos permitiera expresar la cercana del estimador al parmetro.
Una solucin a ello no los brindan los estimadores por Intervalos de Confianza.

b) Estimacin por intervalo:


Es la estimacin de un parmetro de la poblacin dado por dos nmeros que forman un
intervalo que contiene al parmetro con una cierta probabilidad.

Conceptos bsicos
Nivel de Confianza
Est asociado con la probabilidad de que el intervalo de confianza contenga al parmetro de la
poblacin y es expresado en porcentaje. Los niveles de confianza que ms se utilizan son 90%,
95% y 99%.
Lo denotaremos por 1, donde es un valor tal que 0 1. Note que a medida que e
acerca a 0, 1se acerca a 1, sto significa que aumenta la probabilidad de que el intervalo
construido contenga al verdadero valor del parmetro que estamos estimando.
Nivel de Significacin:
Llamaremos as al valor de .
Lmites de Confianza
Son el lmite inferior y superior de un intervalo de confianza.

ESTIMACIN ESTADSTICA PARA MEDIAS MUESTRALES


CASO I

Muestra Grande: n 30

.z

Dnde:

z = distribucin normal

CASO II

Muestra Pequea: n < 30

.t

Dnde:

s = desviacin estndar
t = distribucin t-Student; se calcula usando el grado de confianza
y los grados de libertad.
Ejemplo:
Si = 95% (0.95) y n = 8
= 5% (0.05)
p = 0.95 + 0.025 = 0.975 (tambin se halla p = 1 - /2)
Grados de libertad: n-1 = 8 1 = 7
Con p = 0.975 y n =7 , se lleva a la tabla de la funcin de
distribucin t-Student, donde t = 2.447

Ejemplos de uso de la tabla:


Para = 90% y n = 25, calcular t-Student
Para p=0.95 y n=18, calcular t-Student

(1,711)
(1.740)

Ejemplo 1
Se desea estimar la experiencia docente promedio de los profesores de cierta universidad, y para
tal efecto se toma una muestra de 8 de ellos, siendo los resultados de experiencia medidos en
aos los siguientes: ( = 95%)
{11,9,7,13,10,5,7,12} aos

Solucin
Hallamos
= (11+9+7+13+10+5+7+12)/8 = 9.25
2
S = (xi - )2 =(11-9.25)2 + (9-9.25)2 + (7-9.25)2 + + (12-9.25)2
n-1
7
S = 7.62 = 2.76

= 9.25

Usando:

2.76 . 2.447
8
+,
-,

tenemos 11.56 aos


tenemos 6.94 aos

Entonces la estimacin queda:


= [6.94 aos 11.56 aos]
Interpretacin: La experiencia estimada promedio de los docentes de la universidad evaluada
est entre: 6.94 y 11.56 aos con una confianza del 95%.

+=1

Si tenemos que
Confianza
0.90 (90%)
0.95 (95%)
0.99 (99%)

0.10
0.05
0.01

/2
0.05
0.025
0.005

p= 1-/2
0.950
0.975
0.995

Ejemplo 2
Se tom una muestra aleatoria de 50 candidatos que se presentan a realizar la prueba de
suficiencia en el departamento de seleccin, donde se tiene una media de 150 puntos y una
desviacin de 63 puntos. Calcular el intervalo de confianza del 95%
Solucin

Se trata del caso I, dnde:

.z

n
= 150

= 63

Confianza 95% z = 1.96

= 150

63 . 1.96
50

150 + 14.369
164.369

150 14.369
135.631

Los lmites de confianza estn entre


135.631 164.369
Ejemplo 3
Se encuentra que la concentracin promedio de zinc que se saca del agua a partir de una muestra
de mediciones de zinc en 36 sitios diferentes es de 2.6 gramos por mililitro.
Encuentre los intervalos de confianza de 95% y 99% para la concentracin media de zinc en el
ro. Suponga que los datos siguen una distribucin normal con una desviacin estndar de 0.3.

Solucin
La estimacin puntual de es 2.6.
* El valor de z del 95% es 1.96, por lo tanto el intervalo lo calcularamos como:
2.6

y por tanto [2.5,2.7] con una confianza del 95%.


En otras palabras, la probabilidad de que la concentracin media de zinc est entre
2.5 y 2.7 gramos por mililitro es de 0.95.

* Para un nivel de confianza de 99% el valor de z es de 2.575 por lo que el


intervalo ser ms amplio:
2.6 2.575*0.3
36

[2.47,2.73]

la probabilidad de que la concentracin media de zinc est entre 2.47 y 2.73


gramos por mililitro es de 0.99.

Ejemplo 4
Extraemos una muestra de 61 estudiantes universitarios, ellos responden a una prueba de
inteligencia en la que alcanzan una media de 80 y una varianza de 100. Entre qu lmites se
hallar la verdadera inteligencia media de los estudiantes, a un nivel de confianza del 99%?

Solucin
1- = 0.99 = 0.01 1 - /2 = 0.995
2El tamao muestral es mayor que 30, por tanto buscamos en las tablas la
distribucin t de Student t0.995 (60) = 2.66
Sabemos que

= 80 y s = 10 . Sustituyendo en el intervalo de confianza tenemos:

[80 2.66 10 , 80 + 2.66


61

10
61

por tanto, [76.57,83.43] con un nivel de confianza del 99%.

Practica Calificada N 11
I.

ESTIMACION PUNTUAL
1.

2.

3.

4.
5.

II.

Los siguientes datos corresponden a los pesos (en kilogramos) de 15 hombres escogidos
al azar y que trabajan en una empresa: 72, 68, 63, 75, 84, 91, 66, 75, 86, 90, 62, 87, 77,
70,69. Estime el peso promedio y la desviacin estndar.
Entre los miembros de una comunidad se escogieron 150 personas al azar y se les
pregunt si estaban de acuerdo con los programas que el gobierno estaba desarrollando
para prevenir el consumo de drogas; la encuesta dio como resultado que 130 s estaban de
acuerdo. Estime la proporcin de los que estaban de acuerdo y el error estndar.
De las 50 aulas que tiene un edificio de la facultad de matemticas se escogieron al azar 5
y se determin el nmero de alumnos que haba en cada una de ellas en la primera hora
de clases. Estime el nmero de alumnos que hay en el edificio si todas las aulas se
encuentran ocupadas a esa hora, y si el numero de alumnos en cada una de las aulas
inspeccionadas fue: 24, 35, 16, 30, 28.
Teniendo en cuenta los datos del problema I, estime el error del peso promedio.
Teniendo en cuenta los datos del problema III, estime el error del nmero total de
estudiantes.
ESTIMACIN POR INTRVALOS
1. Una muestra aleatoria de 36 cigarrillos de una marca determinada dio un
contenido promedio de nicotina de 3 miligramos. Suponga que el contenido de
nicotina de estos cigarrillos sigue una distribucin normal con una desviacin
estndar de 1 miligramo.
a. Obtenga e interprete un intervalo de confianza del 95% para el verdadero
contenido promedio de nicotina en estos cigarrillos.
b. El fabricante garantiza que el contenido promedio de nicotina es de 2,9
miligramos, qu puede decirse de acuerdo con el intervalo hallado?
2. El tiempo(en minutos) que tardaron 15 operarios para familiarizarse con el manejo
de una mquina moderna adquirida por la empresa fue: 3,4, 2,8, 4,4, 2,5, 3,3, 4,
4,8, 2,9, 5,6, 5,2, 3,7, 3, 3,6, 2,8,4,8. Suponga que los tiempos se distribuyen
normalmente.
3. Determine e interprete un intervalo del 95% de confianza para el verdadero
tiempo promedio
4. el instructor considera que el tiempo promedio requerido por la poblacin de
trabajadores que recibe instruccin sobre esta m quina es superior a 5 minutos,
qu se puede decir de acuerdo con el intervalo hallado?
5. Se desea medir la diferencia entre dos categoras de empleados en la actividad de
seguros. Una est formada por personas con ttulo superior y la otra por personas
que slo tienen estudios secundarios. Tomamos una muestra de 45 empleados
entre los primeros y la media de ventas resulta ser 32. Tomamos 60 empleados del
segundo grupo y la media es 25. Suponga que las ventas de los dos grupos se
distribuyen normalmente con varianzas de 48 para los titulados superiores y 56
para los de estudios secundarios.
6. Calcule e interprete un intervalo del 90% de confianza para la verdadera
diferencia de las medias.

7. De acuerdo con el intervalo hallado, hay evidencia de que las medias sean
iguales?
8. Se registraron los siguientes datos, en minutos, que tardan algunos hombres y
mujeres en realizar cierta actividad en una empresa, los cuales fueron
seleccionados aleatoriamente.
HOMBRES MUJERES
n1=14
n2=25
Media=17
Media=19
Varianza=1,5 Varianza=1,8
9. Suponga que los tiempos para los dos grupos se distribuyen normalmente y que
las varianzas son iguales, aunque desconocidas.
10. Calcule e interprete un intervalo de confianza del 99% para la verdadera
diferencia de medias.
11. De acuerdo con el intervalo hallado, hay evidencia de que los dos tiempos
promedio son iguales?
12. Una fbrica desea saber la proporcin de amas de casa que preferiran una
aspiradora de su marca. Se toma al azar una muestra de 100 amas de casa y 20
dicen que les gustara la mquina. Calcule e interprete un intervalo del 95% de
confianza para la verdadera proporcin de amas de casa que preferiran dicha
aspiradora.
13. Se est considerando cambiar el procedimiento de manufactura de partes. Se
toman muestras del procedimiento actual as como del nuevo para determinar si
este ltimo resulta mejor. Si 75 de 1.000 artculos del procedimiento actual
presentaron defectos y lo mismo sucedi con 80 de 2.500 partes del nuevo,
determine un intervalo de confianza del 90% para la verdadera diferencia de
proporciones de partes defectuosas.
14. Un fabricante de bateras para automvil asegura que las bateras que produce
duran en promedio 2 aos con una desviacin estndar de 0,5 aos. Si cinco de
estas bateras tienen duracin 1,5, 2,5, 2,9, 3,2, 4 aos, determine un intervalo del
95% para la varianza e indique si es cierta la afirmacin del fabricante.
15. Tomando en cuenta los datos del problema IV, determine un intervalo del 90% de
confianza para el cociente de varianzas

Semana 12

TEORA ESTADSTICA DE LAS DECISIONES


PRUEBA DE COMPROBACIN DE HIPTESIS

Dentro del estudio de la inferencia estadstica, se describe como se puede tomar una muestra
aleatoria y a partir de esta muestra estimar el valor de un parmetro poblacional en la cual se
puede emplear el mtodo de muestreo y el teorema del valor central lo que permite explicar
como a partir de una muestra se puede inferir algo acerca de
una poblacin, lo cual nos lleva a definir y elaborar una
distribucin de muestreo de medias muestrales que nos permite
explicar el teorema del limite central y utilizar este teorema
para encontrar las probabilidades de obtener las distintas
medias maestrales de una poblacin.
Pero es necesario tener conocimiento de ciertos datos de la
poblacin como la media, la desviacin estndar o la forma de
la poblacin, pero a veces no se dispone de esta informacin.
En este caso es necesario hacer una estimacin puntual que es
un valor que se usa para estimar un valor poblacional. Pero una
estimacin puntual es un solo valor y se requiere un intervalo de valores a esto se denomina
intervalote confianza y se espera que dentro de este intervalo se encuentre el parmetro
poblacional buscado. Tambin se utiliza una estimacin mediante un intervalo, el cual es un
rango de valores en el que se espera se encuentre el parmetro poblacional
En nuestro caso se desarrolla un procedimiento para probar la validez de una aseveracin acerca
de un parmetro poblacional este mtodo es denominado Prueba de hiptesis para una muestra.

Definicin de HIPTESIS
Hiptesis es una aseveracin de una poblacin elaborado con el propsito de ponerla a prueba.
En el anlisis estadstico se hace una aseveracin, es decir, se plantea una hiptesis, despus se
hacen las pruebas para verificar la aseveracin o para determinar que no es verdadera.
Por tanto, la prueba de hiptesis es un procedimiento basado en la evidencia muestral y la teora
de probabilidad; se emplea para determinar si la hiptesis es una afirmacin razonable.

Las hiptesis estadsticas se establecen


entonces para tomar decisiones sobre el valor de algn parmetro poblacional.

A partir de las siguientes premisas, elaborar un planteamiento de Hiptesis:


un maestro parte de la premisa de que el estudiante asiste al curso con el deseo de
aprender.
un electricista debe partir de la premisa de que la conexin elctrica que va a revisar
est viva con corriente elctrica;
la sociedad parte de la premisa de que una persona es inocente hasta tanto se
pruebe lo contrario mas all de duda razonable;
dependiendo del lugar donde vivamos, podemos partir de la premisa de que la
persona que maneja el otro vehculo en la interseccin respetar la seal de Pare o
Alto;
un mdico investigador parte de la premisa de que el nuevo medicamento no surtir
efecto alguno;
un siclogo parte de la premisa de que dos grupos de individuos sometidos a
tratamientos distintos no mostrarn diferencias en su comportamiento.

Tipos de Hiptesis
La premisa de la cual se parte sobre el comportamiento de la poblacin se conoce como la
hiptesis nula. Se le llama nula pues la misma generalmente indica, por ejemplo, que la media
poblacional es cero; que no hay diferencia entre los parmetros asociados a grupos en la
poblacin; o que el medicamento no es efectivo en la poblacin de pacientes.
La hiptesis nula se denota usualmente en smbolos por H0. El cero nos recuerda que se parte de
la premisa de que el efecto es nulo o que las diferencias entre los grupos es cero.
Al hacer investigaciones es usual pensar en una hiptesis de investigacin, tal como: demostrar
que el medicamento es efectivo; demostrar que hay una diferencia significativa en la ejecucin
en una prueba entre individuos que durmieron toda la noche e individuos que no durmieron, o
que unas plantas tratadas con hormonas crecen ms que el grupo control. Esta hiptesis, lo que el
investigador desea demostrar sobre la poblacin, se conoce como la hiptesis alternativa y se
denota por Ha.
En conclusin

Lo que el investigador desea demostrar es parte de la hiptesis alternativa y no de la nula por


varias razones. Una razn es que partir de una premisa contraria a lo que deseamos demostrar, y
luego encontrar evidencia concreta que nos lleve a rechazarla es un argumento ms contundente
que presumir que lo queremos demostrar es cierto para luego encontrar evidencia que apoya
nuestro reclamo.
En este ltimo caso puede reclamarse que observamos esos resultados sencillamente porque de
acuerdo con nuestra premisa, esperbamos que as fuera. Otra razn es que de esta manera
podemos controlar matemticamente la probabilidad de cometer algunos tipos de error.

Ejemplo 1
Una persona es arrestada y se le acusa de cometer algn crimen. Inicialmente, esta persona es
considerada inocente. Usando los datos o evidencia disponible el fiscal debe demostrar que sin
duda razonable, la persona en efecto cometi el crimen.
En el caso de un acusado, la hiptesis nula es que el individuo es inocente. Sin embargo, para
decidir que un individuo no es culpable, no basta con observar muchas acciones o evidencia
consistentes con su inocencia, las que por s solas generalmente no demuestran su inocencia. Por
el otro lado, observar comportamiento culposo permite llegar eventualmente a la decisin de
encontrar al individuo culpable, rechazando la hiptesis nula.
Ejemplo 2
Una maestra desea investigar si el refuerzo positivo a sus estudiantes les ayuda a obtener un
mejor desempeo en el prximo examen. Para esto divide aleatoriamente a sus estudiantes en
dos grupos. Al grupo A les felicita cuando hacen algo bien y les refuerza positivamente, mientras
que al grupo B les trata neutralmente. La metodologa de enseanza es la misma para ambos
grupos.
La hiptesis nula en este caso es que no hay diferencia entre los grupos en la puntuacin
promedio en la prueba, es decir, ambas medias son iguales: H0: A = B, lo cual se puede
escribir en forma equivalente H0: A - B = 0. La hiptesis alternativa contiene el resultado que
el maestro desea probar, que la puntuacin promedio del grupo A es mayor que la obtenida por
los estudiantes del grupo B, H0: A > B.

Tipos de errores
Cualquiera sea la decisin tomada a partir de una prueba de hiptesis, ya sea de aceptacin del
Ho o de la Ha, puede incurrirse en error:
Un error tipo I se presenta si la hiptesis nula Ho es rechazada cuando es verdadera y deba ser
aceptada. La probabilidad de cometer un error tipo I se denomina con la letra alfa
Un error tipo II, se denota con la letra griega se presenta si la hiptesis nula es aceptada
cuando de hecho es falsa y deba ser rechazada.
En cualquiera de los dos casos se comete un error al tomar una decisin equivocada.
En la siguiente tabla se muestran las decisiones que pueden tomar el investigador y las
consecuencias posibles.

Para que cualquier ensayo de hiptesis sea bueno, debe disearse de forma que minimice los
errores de decisin. En la prctica un tipo de error puede tener ms importancia que el otro, y as
se tiene a conseguir poner una limitacin al error de mayor importancia. La nica forma de
reducir ambos tipos de errores es incrementar el tamao de la muestra, lo cual puede ser o no ser
posible.
La probabilidad de cometer un error de tipo II denotada con la letra griega beta , depende de la
diferencia entre los valores supuesto y real del parmetro de la poblacin. Como es ms fcil
encontrar diferencias grandes, si la diferencia entre la estadstica de muestra y el correspondiente
parmetro de poblacin es grande, la probabilidad de cometer un error de tipo II, probablemente
sea pequea.

El estudio y las conclusiones que obtengamos para una poblacin cualquiera, se habrn apoyado
exclusivamente en el anlisis de una parte de sta. De la probabilidad con la que estemos
dispuestos a asumir estos errores, depender, por ejemplo, el tamao de la muestra requerida.
Las contrastaciones se apoyan en que los datos de partida siguen una distribucin normal.

TEST DE HIPTESIS O CONTRASTE DE HIPTESIS


Es una prueba de decisin que se establece a partir de la hiptesis nula con el fin de
aceptarla o rechazarla.
Regin Crtica: Es la regin del espacio muestral que, de acuerdo con un determinado
test, obliga a rechazar la hiptesis nula si se encuentra en ella el estadstico de contraste.
Regin de Aceptacin: Es la regin del espacio muestral que, de acuerdo con un
determinado test, obliga a admitir la hiptesis nula, si se encuentra en ella el estadstico
de contraste.

La prueba de comprobacin de hiptesis se realiza mediante un procedimiento sistemtico de 5


pasos

Paso 1: Plantear la hiptesis nula Ho y la hiptesis alternativa H1.


Cualquier investigacin estadstica implica la existencia de hiptesis o afirmaciones acerca de las
poblaciones que se estudian.
La hiptesis nula (Ho) se refiere siempre a un valor especificado del parmetro de poblacin, no
a una estadstica de muestra. La letra H significa hiptesis y el subndice cero no hay diferencia.
Por lo general hay un "no" en la hiptesis nula que indica que "no hay cambio" Podemos
rechazar o aceptar Ho.
La hiptesis nula es una afirmacin que no se rechaza a menos que los datos maestrales
proporcionen evidencia convincente de que es falsa. El planteamiento de la hiptesis nula
siempre contiene un signo de igualdad con respecto al valor especificado del parmetro.
La hiptesis alternativa (H1) es cualquier hiptesis que difiera de la hiptesis nula. Es una
afirmacin que se acepta si los datos maestrales proporcionan evidencia suficiente de que la
hiptesis nula es falsa. Se le conoce tambin como la hiptesis de investigacin. El
planteamiento de la hiptesis alternativa nunca contiene un signo de igualdad con respecto al
valor especificado del parmetro.

Paso 2: Seleccionar el nivel de significancia.


Nivel de significancia: Probabilidad de rechazar la hiptesis nula cuando es verdadera. Se le
denota mediante la letra griega , tambin es denominada como nivel de riesgo, este termino es
mas adecuado ya que se corre el riesgo de rechazar la hiptesis nula, cuando en realidad es
verdadera. Este nivel esta bajo el control de la persona que realiza la prueba.
Si suponemos que la hiptesis planteada es verdadera, entonces, el nivel de significacin indicar
la probabilidad de no aceptarla, es decir, estn fuera de rea de aceptacin. El nivel de
confianza (1-), indica la probabilidad de aceptar la hiptesis planteada, cuando es verdadera en
la poblacin.

La distribucin de muestreo de la estadstica de prueba se divide en dos regiones, una regin de


rechazo (conocida como regin crtica) y una regin de no rechazo (aceptacin). Si la estadstica
de prueba cae dentro de la regin de aceptacin, no se puede rechazar la hiptesis nula.
La regin de rechazo puede considerarse como el conjunto de valores de la estadstica de prueba
que no tienen posibilidad de presentarse si la hiptesis nula es verdadera. Por otro lado, estos
valores no son tan improbables de presentarse si la hiptesis nula es falsa. El valor crtico separa
la regin de no rechazo de la de rechazo.

Paso 3: Clculo del valor estadstico de prueba


Valor determinado a partir de la informacin muestral, que se utiliza para determinar si se
rechaza la hiptesis nula., existen muchos estadsticos de prueba para nuestro caso utilizaremos
los estadsticos z y t. La eleccin de uno de estos depende de la cantidad de muestras que se
toman, si las muestras son de la prueba son iguales a 30 o ms se utiliza el estadstico z, en caso
contrario se utiliza el estadstico t.
Tipos de prueba
a) Prueba bilateral o de dos extremos: la hiptesis planteada se formula con la igualdad
Ejemplo
H0 : = 200
H1 : 200

b) Pruebas unilateral o de un extremo: la hiptesis planteada se formula con o


H0 : 200 H0 : 200
H1 : < 200 H1 : > 200

En las pruebas de hiptesis para la media (), cuando se conoce la desviacin estndar ()
poblacional, o cuando el valor de la muestra es grande (30 o ms), el valor estadstico de prueba
es z y se determina a partir de:

El valor estadstico z, para muestra grande y desviacin estndar poblacional desconocida se


determina por la ecuacin:

En la prueba para una media poblacional con muestra pequea y desviacin estndar poblacional
desconocida se utiliza el valor estadstico t.

Paso 4: Formular la regla de decisin


Se establece las condiciones especficas en la que se rechaza la hiptesis nula y las condiciones
en que no se rechaza la hiptesis nula. La regin de rechazo define la ubicacin de todos los
valores que son tan grandes o tan pequeos, que la probabilidad de que se presenten bajo la
suposicin de que la hiptesis nula es verdadera, es muy remota

Distribucin muestral del valor estadstico z, con prueba de una cola a la derecha
Valor critico: Es el punto de divisin entre la regin en la que se rechaza la hiptesis nula y la
regin en la que no se rechaza la hiptesis nula.

Paso 5: Tomar una decisin.


En este ltimo paso de la prueba de hiptesis, se calcula el estadstico de prueba, se compara con
el valor crtico y se toma la decisin de rechazar o no la hiptesis nula. Tenga presente que en
una prueba de hiptesis solo se puede tomar una de dos decisiones: aceptar o rechazar la
hiptesis nula. Debe subrayarse que siempre existe la posibilidad de rechazar la hiptesis nula
cuando no debera haberse rechazado (error tipo I). Tambin existe la posibilidad de que la
hiptesis nula se acepte cuando debera haberse rechazado (error de tipo II).

Importante!
Regin Crtica o de Rechazo:
Una regin crtica o de rechazo es una parte de la curva de z o de la curva t donde se
rechaza H0.
La regin puede ser de una cola o de dos dependiendo de la hiptesis alterna.

Ejemplos

Para H1: > valor aceptado, la regin de rechazo est dada por:

(cola derecha, z t)

Para H1 : < valor aceptado, la regin de rechazo est dada por:

(cola izquierda, z t)

Para H1 : valor aceptado, la regin de rechazo es de dos colas y est dada


por:
/2

/2

(2-colas, z t)

Ejemplo en la cual se indica el procedimiento para la prueba de


hiptesis
El jefe de la Biblioteca Especializada de la Facultad de Ingeniera Elctrica y Electrnica de la
UNAC manifiesta que el nmero promedio de lectores por da es de 350. Para confirmar o no
este supuesto se controla la cantidad de lectores que utilizaron la biblioteca durante 30 das. Se
considera el nivel de significancia de 0.05
Datos:
Da

Usuarios

Da

Usuarios Da

Usuario

356

11

305 21

429

427

12

413 22

376

387

13

391 23

328

510

14

380 24

411

288

15

382 25

397

290

16

389 26

365

320

17

405 27

405

350

18

293 28

369

403

19

276 29

429

10

329

20

417 30

364

Solucin: Se trata de un problema con una media poblacional: muestra grande y desviacin
estndar poblacional desconocida.
Paso 01: Seleccionamos la hiptesis nula y la hiptesis alternativa
Ho: 350
Ha: 350
Paso 02: Nivel de confianza o significancia 95%
0.05
Paso 03: Calculamos o determinamos el valor estadstico de prueba
De los datos determinamos: que el estadstico de prueba es t, debido a que el numero de muestras
es igual a 30, conocemos la media de la poblacin, pero la desviacin estndar de la poblacin es
desconocida, en este caso determinamos la desviacin estndar de la muestra y la utilizamos en
la formula reemplazando a la desviacin estndar de la poblacin.

Calculamos la desviacin estndar muestral y la media de la muestra empleando Excel, lo cual se


muestra en el cuadro que sigue.
Columna1
Media
Error tpico

372.8
9.56951578

Mediana

381

Moda

405

Desviacin estndar

52.4143965

Varianza de la muestra

2747.26897

Curtosis

0.36687081

Coeficiente de asimetra

0.04706877

Rango

234

Mnimo

276

Mximo

510

Suma
Cuenta
Nivel de confianza (95.0%)

11184
30
19.571868

Paso 04: Formulacin de la regla de decisin.


La regla de decisin la formulamos teniendo en cuenta que esta es una prueba de dos colas, la
mitad de 0.05, es decir 0.025, esta en cada cola. el rea en la que no se rechaza Ho esta entre las
dos colas, es por consiguiente 0.95. El valor critico para 0.05 da un valor de Zc = 1.96.

Por consiguiente la regla de decisin: es rechazar la hiptesis nula y aceptar la hiptesis


alternativa, si el valor Z calculado no queda en la regin comprendida entre -1.96 y +1.96. En
caso contrario no se rechaza la hiptesis nula si Z queda entre -1.96 y +1.96.
Paso 05: Toma de decisin.
En este ltimo paso comparamos el estadstico de prueba calculado mediante el Software
Minitab que es igual a Z = 2.38 y lo comparamos con el valor critico de Zc = 1.96. Como el
estadstico de prueba calculado cae a la derecha del valor critico de Z, se rechaza Ho. Por tanto
no se confirma el supuesto del Jefe de la Biblioteca.

Practica Calificada N 12
1. Una mquina llena botellas que contienen cierta vitamina; se supone que el peso promedio de
vitamina en cada botella es de 32 gramos, con desviacin estndar de 0,06 gramos. En una
comprobacin sistemtica para ver que la mquina funciona adecuadamente, se toman
aleatoriamente 46 botellas llenas y se advierte que contienen un promedio de 32,1 grs. A un nivel
de significacin de 0,05:
a) Se puede afirmar que la mquina funciona adecuadamente?
b) Se puede afirmar que la mquina est llenando un promedio mayor a 32 gramos con una
significacin de 1%?
2. Las cajas de cereal producidas en una fbrica deben contener un contenido de 16 onzas. Un
inspector tom una muestra que arroj los sgtes. pesos en onzas: 15.7, 15.7, 16.3, 15.8, 16.1,
15.9, 16.2, 15.9,15.8 y 15.6.
Indicar si es razonable que el inspector usando un nivel de significacin del 5%. Ordene se multe
al fabricante.
3. Los desechos industriales y la basura que se descargan en los ros absorben oxgeno y por lo
tanto reducen la cantidad de oxgeno disuelto disponible para los peces y otras formas de vida
acutica. El Ministerio del Ambiente requiere un mnimo de 5 partes por milln de oxgeno
disuelto para que el contenido de oxgeno sea suficiente para la vida acutica. Seis muestras de
oxgeno tomadas de un ro durante la estacin de poco agua tuvieron: 4.9, 5.1, 4.9, 5.0, 5.0 y 4.7
partes por milln de oxgeno disuelto (ppm) . Hay suficiente evidencia en los datos que
indiquen que el oxgeno disuelto es menor que 5 partes por milln? Haga la prueba usando una
significacin del 5%
4. Los desechos industriales y la basura que se descargan en los ros absorben oxgeno y por lo
tanto reducen la cantidad de oxgeno disuelto disponible por los peces y otras formas de vida
acutica. Un inspector de contaminacin sospecha que cierta comunidad est descargando
desperdicios semitratados en el ro. Para verificar su teora, obtuvo 5 muestras de agua del ro
seleccionadas al azar en una ubicacin anterior a la ciudad y otras 5 en una ubicacin posterior a
la ciudad. Las cantidades de oxgeno disuelto en partes por milln fueron:
Antes de la ciudad
4.8
5.2
5.0
4.9
5.1
Despus de la ciudad
5.0
4.7
4.9
4.8
4.9
Proporcionan los datos suficiente evidencia para concluir que el contenido medio de oxgeno en
las ubicaciones que estn despus de la ciudad es menor que el de las ubicaciones que estn antes
de la ciudad?. Use una significacin del 5%.
5. Dos mtodos para ensear a leer fueron aplicados a dos grupos de nios de escuela elemental
seleccionados al azar y se compararon sobre la base de una prueba de comprensin de lectura
administrada al final del perodo de aprendizaje. Las medias y varianzas muestrales calculadas a
partir de las puntaciones obtenidas en la prueba fueron:
Mtodo
N de nios en grupo
Promedio
Varianza
1
11
64
52
2
14
69
71
Con los datos proporcionados se podr afirmar que hay una diferencia significativa entre los
promedios obtenidos por cada mtodo?. Con el 5% de significacin

6. Se realiza un experimento para comparar los tiempos medios requeridos para la absorcin de
los medicamentos A y B. 10 personas seleccionadas al azar fueron asignadas a cada
medicamento. Cada persona recibi una dosis oral del medicamento correspondiente y se
observ el tiempo en minutos hasta que el medicamento lleg a un nivel especfico en la sangre.
Las medias y las varianzas para las dos muestras son los siguientes:
Medicamento A
Medicamento B
Xa = 27.2 min
Xb = 33.5 min
Sa = 16.36 min
Sb = 18.92 min
Proporcionan los datos suficiente evidencia para concluir que existe diferencia entre los tiempos
medios de absorcin para los 2 medicamentos?. Use significacin del 10%.
7. Los salarios en una industria particular tiene una distribucin normal con promedio de
$23.20 y una desviacin estndar de $4.5. Si una compaa en esta industria que emplea 40
trabajadores les paga en promedio $21.20, puede ser acusada esta compaa de pagar
salarios inferiores con un nivel de significacin del 1%?
8. Un fabricante de televisores afirma que en promedio el 90% de sus televisores de color no
necesita ninguna reparacin durante sus dos primeros aos funcionamiento. El IPC
selecciona una muestra aleatoria de 100 tv y encuentra que 15 de ellos necesitan alguna
reparacin durante sus 2 primeros aos de operacin. Presentan los datos evidencia
suficiente como para que el IPC pueda afirmar que el fabricante est mintiendo?. Considere
una significacin del 5%.
9. Un laboratorio farmacutico ha elaborado un medicamento para tratar la presin sangunea
alta. El laboratorio afirma que el medicamento efectivamente baja la presin en el 80% de los
casos. Si 175 de 225 pacientes tratados con el medicamento experimentaron una disminucin
sustancial de la presin sangunea. Concluira usted que el laboratorio ha exagerado a la
efectividad del medicamento?. Utilice un nivel de significacin de 0.01
10. El instituto de relaciones familiares informa que el 50% de los matrimonios que viven en la
localidad llegan a una corte de divorcios dentro de su primer ao de casados. Qu
conclusiones puede sacarse acerca de la valides de este informe si una muestra aleatoria de
400 matrimonios, solo 193 fueron a una corte de divorcios dentro de su primer ao de
casados?. Utilice una significacin del 1%.
11. Una firma de ventas con descuento est considerando la compra de una gran partida de
discos de un proveedor que afirma que en promedio, solo el 2% de losa discos tiene fallas. Al
examinar 400 de estos discos, la firma encuentra 15 imperfectos. Realizar la firma la
afirmacin del proveedor si exige una significacin del 5%?
12. Existe una diferencia en la proporcin de hombres universitarios versus mujeres
universitarias que fuman por lo menos una caja de cigarrillos al da? Una muestra de 500
alumnos de una universidad revel que 70 fumaban por lo menos una cajetilla por da. Una
muestra de 400 alumnas revel que 72 fumaban al menos una cajetilla de cigarros
diariamente. Al nivel de significacin de 0.05existe una diferencia entre la proporcin de
alumnos y alumnas que fuman por lo menos una cajetilla diaria, o la diferencia en las
proporciones puede ser atribuida a error de muestreo?

13.Se sabe que la desviacin tpica de las notas de cierto examen de Matemticas es 2,4. Para
una muestra de 36 estudiantes se obtuvo una nota media de 5,6. Sirven estos datos para

confirmar la hiptesis de que la nota media del examen fue de 6, con un nivel de confianza del
95%?
14. Un socilogo ha pronosticado, que en una determinada ciudad, el nivel de abstencin en las
prximas elecciones ser del 40% como mnimo. Se elige al azar una muestra aleatoria de 200
individuos, con derecho a voto, 75 de los cuales estaran dispuestos a votar. Determinar con
un nivel de significacin del 1%, si se puede admitir el pronstico.
15. Un informe indica que el precio medio del billete de avin entre Canarias y Madrid es, como
mximo, de 120 con una desviacin tpica de 40 . Se toma una muestra de 100 viajeros y
se obtiene que la media de los precios de sus billetes es de 128 .
Se puede aceptar, con un nivel de significacin igual a 0,1, la afirmacin de partida?
16. La duracin de las bombillas de 100 W que fabrica una empresa sigue una distribucin
normal con una desviacin tpica de 120 horas de duracin. Su vida media est garantizada
durante un mnimo de 800 horas. Se escoge al azar una muestra de 50 bombillas de un lote y,
despus de comprobarlas, se obtiene una vida media de 750 horas. Con un nivel de
significacin de 0,01, habra que rechazar el lote por no cumplir la garanta?
17. El control de calidad una fbrica de pilas y bateras sospecha que hubo defectos en la
produccin de un modelo de batera para telfonos mviles, bajando su tiempo de duracin.
Hasta ahora el tiempo de duracin en conversacin segua una distribucin normal con media
300 minutos y desviacin tpica 30 minutos. Sin embargo, en la inspeccin del ltimo lote
producido, antes de enviarlo al mercado, se obtuvo que de una muestra de 60 bateras el
medio de duracin en conversacin fue de 290 minutos. Suponiendo que ese tiempo sigue
siendo Normal con la misma desviacin tpica:
Se puede concluir que las sospechas del control de calidad son ciertas a un nivel de
significacin del 2%?
18. Se cree que el nivel medio de protombina en una poblacin normal es de 20 mg/100 ml de
plasma con una desviacin tpica de 4 miligramos/100 ml. Para comprobarlo, se toma una
muestra de 40 individuos en los que la media es de 18.5 mg/100 ml. Se puede aceptar la
hiptesis, con un nivel de significacin del 5%?
19. Las puntuaciones en un test que mide la variable creatividad siguen, en la poblacin general
de adolescentes, una distribucin Normal de media 11,5. En un centro escolar que ha
implantado un programa de estimulacin de la creatividad una muestra de 30 alumnos ha
proporcionado las siguientes puntuaciones:
11, 9, 12, 17, 8, 11, 9, 4, 5, 9, 14, 9, 17, 24, 19, 10, 17, 17, 8,
23, 8, 6, 14, 16, 6, 7, 15, 20, 14, 15.
A un nivel de confianza del 95% Puede afirmarse que el programa es efectivo?

Semana 13

SERIES TEMPORALES /
ANLISIS DE REGRESIN LINEAL
Toda institucin, ya sea la familia, la empresa o el
gobierno, necesita realizar planes para el futuro si
desea sobrevivir o progresar.
La planificacin racional exige prever los sucesos
del futuro que probablemente vayan a ocurrir.
La previsin se suele basar en lo ocurrido en el
pasado.
La tcnica estadstica utilizada para hacer
inferencias sobre el futuro teniendo en cuenta
lo ocurrido en el pasado es el ANLISIS DE
SERIES TEMPORALES.

SERIE TEMPORAL
Se define una serie temporal (tambin denominada histrica, cronolgica o de tiempo) como un
conjunto de datos, correspondientes a un fenmeno econmico, ordenados en el tiempo.
Ejemplos
N de accidentes laborales graves en las empresas de ms de 500 empleados de Lima, durante
los ltimos 5 aos.
Ventas de nuestra empresa en los ltimos 10 aos.
Cantidad de lluvia cada al da durante el ltimo trimestre.
Los datos son de la forma (yt, t) donde:
yt
Variable endgena o dependiente
t
Variable exgena o independiente
Nota: realmente slo hay una variable a estudiar que es yt. En el anlisis de regresin tenamos
dos variables (explicbamos una variable a partir de la otra). Aqu slo hay una variable
(explicamos una variable a partir de su pasado histrico).
Ejemplo
Los datos siguientes corresponden al nmero de contratos nuevos realizados por
las empresas de menos de 10 empleados, en Sevilla, durante el perodo 19962000.

Componentes de una serie temporal:


- La tendencia.
- Las variaciones cclicas.
- Las variaciones estacionales.
- Las variaciones accidentales.

LA TENDENCIA (T)
Es una componente de la serie temporal que refleja su evolucin a largo plazo.
Puede ser de naturaleza estacionaria o constante (se representa con una recta paralela al eje de
abscisas), de naturaleza lineal, de naturaleza parablica, de naturaleza exponencial, etc.
Ejemplo para la tendencia

LAS VARIACIONES CCLICAS (C)


Es una componente de la serie que recoge oscilaciones peridicas de amplitud superior a un ao.
Estas oscilaciones peridicas no son regulares y se presentan en los fenmenos econmicos
cuando se dan de forma alternativa etapas de prosperidad o de depresin.
Ejemplo para las variaciones cclicas
Supongamos que tenemos las ventas trimestrales de un supermercado en el perodo 1990-1994,
expresadas en millones de pesetas constantes del ao 1990.

LAS VARIACIONES ESTACIONALES (E)


Es una componente de la serie que recoge oscilaciones que se producen alrededor de la
tendencia, de forma repetitiva y en perodos iguales o inferiores a un ao.
Su nombre proviene de las estaciones climatolgicas: primavera, verano, otoo e invierno.
Ejemplos de variaciones estacionales
- En Navidad las ventas de establecimientos se suelen incrementar.
- El consumo de gasolina aumenta la primera decena del mes y disminuye en la ltima.
- El clima afecta a la venta de determinados productos: los helados se venden fundamentalmente
en verano y la ropa de abrigo en invierno.

LAS VARIACIONES ACCIDENTALES (A)


Es una componente de la serie que recoge movimientos provocados por factores imprevisibles
(un pedido inesperado a nuestra empresa, una huelga, una ola de calor, etc). Tambin reciben el
nombre de variaciones irregulares, residuales o errticas.

Cmo actan estas 4 componentes?


Manual de Estadstica Pag. 66
Modelo Aditivo :
yt=T+C+E+A
Modelo Multiplicativo:

yt=TCEA

Modelo Mixto :

yt=TCE+A

Cmo detectamos el modo en que interactan las componentes de una serie temporal?
Esquema aditivo o multiplicativo?
1) Calculamos 2 tipos de indicadores:
Ci= Y(i,t+1) / Y(i,t)
di=Y(i,t+1) / Y (i,t)
2) Calculamos los coeficientes de variacin para las series formadas por los dos
indicadores, y si:
CV Ci < CV di ------------- Esquema multiplicativo
CV di < CV Ci ------------- Esquema aditivo
EJEMPLO:
Segn la ECL, las horas no trabajadas por trimestre y trabajador entre 1992 y 1997
son:

Qu esquema de agregacin es el ms apropiado?

2) Calculamos los Coeficientes de variacin de ambas distribuciones:

INTRODUCCION AL ANLISIS DE REGRESIN LINEAL


Hasta ahora hemos hecho la
tabulacin y el anlisis para
una sola variable.
Pero los investigadores,
adems de analizar una
informacin en forma
individual, generalmente se
interesan en establecer
cruces y buscar relaciones
entre diferentes variables.

AJUSTE DE CURVAS Y EL MTODO DE MNIMOS CUADRADOS


Relaciones entre Variables: En la prctica encontramos a menudo que existen relaciones entre
dos(o ms) variables. Por ejemplo; los pesos de las personas dependen en cierta medida de sus
alturas, las circunferencias de los crculos dependen de los radios, el rendimiento de un atleta
depende de su edad, estatura y peso; la presin de una masa de gas dada depende de su volumen
y de su temperatura, etc.
Es deseable expresar tales relaciones en forma matemtica determinando una ecuacin que
conecte a las variables.

Ajuste de Curvas:
Para hallar una ecuacin que relacione las variables, el primer paso es recoger datos que
muestren valores correspondientes de las variables bajo consideracin. Supongamos que X e Y
denotan la altura y peso de personas adultas; entonces una muestra de N individuos revelara las
alturas X1, X2, , XN y los pesos correspondientes Y1, Y2, , YN.
El prximo paso es marcar los puntos (X1, Y1), (X2, Y2), , (XN, YN) sobre un sistema de
coordenadas rectangulares.El conjunto de puntos se llama un diagrama de dispersin. Ejemplos:

El problema general de hallar ecuaciones de curvas aproximantes que se ajusten a un conjunto de


datos se llama ajuste de curvas.
La herramienta de anlisis Regresin realiza un anlisis de regresin lineal utilizando el mtodo
de los "mnimos cuadrados" para ajustar una lnea a una serie de observaciones. Puede utilizar
esta herramienta para analizar la forma en que los valores de una o ms variables independientes
afectan a una variable dependiente.
Por ejemplo, puede analizar de qu modo inciden en el rendimiento de un atleta varios factores:
la edad, la estatura y el peso. Basndose en un conjunto de datos de rendimiento, la regresin
determinar la incidencia de cada uno de los factores en la medicin del rendimiento y podrn
utilizarse estos resultados para predecir el rendimiento de un atleta nuevo no sometido a ninguna
prueba.

Mnimos cuadrados
Es una tcnica de Anlisis numrico encuadrada dentro de la optimizacin matemtica, en la
que, dados un conjunto de pares se intenta encontrar la funcin que mejor se aproxime a los
datos (un "mejor ajuste"), de acuerdo con el criterio de mnimo error cuadrtico.
En su forma ms simple, intenta minimizar la suma de cuadrados de las diferencias ordenadas
(llamadas residuos) entre los puntos generados por la funcin y los correspondientes en los
datos.
Desde un punto de vista estadstico, un requisito implcito para que funcione el mtodo de
mnimos cuadrados es que los errores de cada medida estn distribuidos de forma aleatoria.
Tambin es importante que los datos recogidos estn bien escogidos, para que permitan
visibilidad en las variables que han de ser resueltas (para dar ms peso a un dato en particular,
vase mnimos cuadrados ponderados).
La tcnica de mnimos cuadrados se usa comnmente en el ajuste de curvas. Muchos otros
problemas de optimizacin pueden expresarse tambin en forma de mnimos cuadrados,
minimizando la energa o maximizando la entropa.

La recta de mnimos cuadrados que aproxima el conjunto de puntos


(X1, Y1), (X2, Y2), .,(XN, YN) tiene por ecuacin:

Y = ao + a1X
Al resolver simultneamente las ecuaciones, podemos hallar las constantes ao y a1 de las
frmulas:
2

ao = (Y)( X ) (X)( XY)


2

a1 = N XY (X)( Y)
N X2 ( X)2

N X ( X)
Ejercicios:

1. Para la siguiente tabla de datos, traza un diagrama de dispersin que te oriente


acerca de la ecuacin de regresin ms adecuada, y una vez elegida, procede al
ajuste de la recta mediante mnimo cuadrado.
X
Y

1.0 1.5
2.0
2.5
1.46 2.14 2.63 2.99

3.0
3.32

3.5
3.69

4.2
4.44

2. Para la siguiente tabla de datos, traza un diagrama de dispersin que te oriente


acerca de la ecuacin de regresin ms adecuada, y una vez elegida, procede al
ajuste de la recta mediante mnimo cuadrado.
x
2
3
6
10
20
30
y
126.1
141.5
170.1
193.2
228.0
250.3

Regresin Lineal
Teniendo ya conocimiento de la intensidad de la relacin entre las variables, manifestada a
travs del diagrama de dispersin, podemos ensayar el ajuste de un modelo estadstico que se
adapte mejor a las n observaciones; lo que lleva por nombre regresin.
Uno de los procedimientos muy comunes en el ajuste regresivo es el mtodo de los mnimos
cuadrados, que produce estimaciones con menor error cuadrtico promedio.
Ajuste Rectilneo (Mtodo de los Mnimos Cuadrados)
La forma general de una ecuacin de lnea recta es:

y = a + bx

donde:
X : Variable independiente
Y : Variable dependiente
a : Trmino independiente o intercepto
b : Coeficiente de X
Debemos establecer los parmetros a y b de la ecuacin para poder expresar los valores de
la variable Y en funcin de los valores de la variable X.

Ejemplo:
Se realiz un experimento con una balanza, colocando gradualmente peso en el platillo y
verificando la elongacin del resorte.
F

Se tomaron las siguientes mediciones


de elongacin para diferentes pesos,
obteniendo los siguientes resultados:

Se pide establecer la relacin entre las variables


participantes de este suceso.

SOLUCIN

1. Definimos las variables:


Peso: variable independiente (X)
Elongacin; variable dependiente (Y)

0
5
10
15
20
25
30
35
40
45
50
55
60
65
70
75
80
85
90
95
100
105

Elongacin

0
1,5575
1,2905
3,1539
4,2276
4,6604
5,2013
6,9964
7,0740
9,7069
10,4643
11,4457
11,8001
12,1885
14,7024
15,8981
15,0221
17,6232
18,9859
19,6699
19,7012
21,1213

2. Elaboramos el grfico de dispersin

De este grfico, podemos inferir que las variables tienen un comportamiento lineal.
Por lo tanto debemos encontrar la recta que mejor se ajuste a los datos.
Utilizamos el mtodo de los mnimos cuadrados para encontrar la recta.

3.

Elongacin

0
5
10
15
20
25
30
35
40
45
50
55
60
65
70
75
80
85
90
95
100
105

0
1,5575
1,2905
3,1539
4,2276
4,6604
5,2013
6,9964
7,0740
9,7069
10,4643
11,4457
11,8001
12,1885
14,7024
15,8981
15,0221
17,6232
18,9859
19,6699
19,7012
21,1213

X^2
0
25
100
225
400
625
900
1225
1600
2025
2500
3025
3600
4225
4900
5625
6400
7225
8100
9025
10000
11025

X*Y
0
7,7873
12,905
47,309
84,552
116,51
156,04
244,87
282,96
436,81
523,22
629,51
708,01
792,25
1029,2
1192,4
1201,8
1498
1708,7
1868,6
1970,1
2217,7

Obteniendo los valores de los coeficientes siguientes:


a = -0.15974784

b = 0.204333921

La ecuacin de la recta quedara:

Y = -0.1597 + 0.2043

Partiendo de esta ecuacin, vamos a inferir y hallar los valores de elongacin cuando el
peso es: 28, 72 y 110

Practica Calificada N 13
1. El crecimiento de los nios desde la infancia a la adolescencia generalmente sigue un patrn
lineal. Se calcul una recta de regresin mediante el mtodo de mnimos cuadrados con datos
de alturas de nias norteamericanas de 4 a 9 aos y el resultado fue: intercepto a=80 y
pendiente b=6. La variable dependiente y es la altura en cm y x es la edad en aos.
- Interprete los valores estimados del intercepto y de la pendiente.
- Cul ser la altura predicha de una nia de 8 aos.
- Cul ser la altura predicha de una mujer de 25 aos. Comente el resultado.
2. En 1991 se public un trabajo Diseando plantas en climas difciles en la revista Field
Crops Research, los datos usados en la investigacin son:
Duracin
92
Rendimiento 1,7

92
2,3

96
1,9

100
2,0

102
1,5

102
1,7

106
1,6

106
1,8

121
1,0

143
0,3

Con x = la duracin de la cosecha de porotos de soya en das, y = rendimiento de la cosecha en


toneladas por hectrea.
- Estime la recta de regresin mediante el mtodo de mnimos cuadrados. Interprete los
estimadores en el contexto de la pregunta.
- Existe una relacin lineal significativa entre la duracin y el rendimiento de la
cosecha?
- Verifique los supuestos.
- Estime el rendimiento si la duracin de la cosecha fue de 104 das
3. Un investigador cree que la inteligencia de los nios, medida a travs del coeficiente
intelectual (CI en puntos), depende del nmero de hermanos. Toma una muestra aleatoria de
15 nios y ajusta una regresin lineal simple. Los resultados aparecen en la salida adjunta.
CI
Hermanos

110 115 120 118 110 108 105 104 98 99 98 100 90 93 90


0
1
1
1
2
2
2
3
3 4 4 5
5 5 6

- Encuentre e interprete el coeficiente de correlacin r.


- D la ecuacin de la recta de regresin. Interprete los estimadores en el contexto de la
pregunta.
- Verifique los supuestos de regresin.
- Existe una relacin lineal significativa entre el nmero de hermanos y el coeficiente
intelectual?
4. Se desea saber si existe alguna relacin entre la ingestin y la absorcin de grasas en lactantes
desnutridos. Se realizan 20 determinaciones de ingestin y absorcin cuyos resultados se
muestran en la tabla que sigue:

Estime a y b mediante el mtodo de mnimos cuadrados. Interprete los coeficientes de


regresin.
Existe una relacin lineal significativa entre la ingestin y la absorcin de grasas?
Verifique los supuestos
Cunto vale la suma de los residuos calculados para las 20 determinaciones?

Conteste SI o NO a las siguientes preguntas:


- El grfico de residuos muestra que la relacin entre la ingestin y la absorcin de grasas es
lineal
- El grfico de residuos se puede usar para determinar si los residuos estn normalmente
distribuidos.
- El grfico de residuos se puede usar para verificar el supuesto de homocedasticidad.

5. La tabla ms abajo presenta los datos sobre el nmero de cambios de aceite al ao (x) y el
costo de la reparacin (y, en miles de pesos) de una muestra aleatoria de 10 autos de una
cierta marca y modelo.
# cambios aceite
3
5
2
3
1
4
6
4
costo en miles de peso
150 150 250 200 350 200 50
125
- Haga un grfico de dispersin con los datos, verifique el supuesto de linealidad y valores
extremos.
- Encuentre la recta de regresin de mnimos cuadrados.
- Interprete los valores estimados del intercepto y de la pendiente.
- Estima cul ser el costo de reparacin de un auto que ha tenido 4 cambios de aceite.
- Si cambia x por y, obtendr la misma recta de regresin?
- Calcule el residuo para la primera observacin (x=3, y=150).
- Verifique los supuestos de la regresin lineal.

Semana 14

ANLISIS DE CORRELACIN/
TASAS Y NMEROS INDICE

CORRELACIN
En el anlisis conjunto para dos o ms variables es bsica la bsqueda del tipo y grado de la
relacin que pueda existir entre ellas, o si por el contrario, las variables sean independientes entre
s y la relacin que puedan mostrar se debe nicamente al azar, o a travs de terceras variables.
El sondeo del tipo y grado de la correlacin, parte desde la misma presuncin del investigador,
teniendo presente que la bsqueda de relaciones entre variables debe ser lgica, es decir
relacionar lo que sea razonable y no datos cuya asociacin sea desde cualquier punto de vista
absurda.
Para fortalecer el indicio de correlacin inicial, se grafica cada uno de los pares ordenados de las
variables (xi,yj) en un plano cartesiano, para observar la nube de puntos o diagrama de
dispersin, donde se advierte la tendencia o no, de la informacin representada.

A pesar de la ilustracin visual que ofrecen las grficas, solo podemos percibir la tendencia, mas
no el grado o fortaleza de la relacin, entre la variable independiente X y la variable
dependiente Y.

Para cuantificar la calidad de la dependencia, entre las dos variables, el indicador ms


acostumbrado es el Coeficiente de correlacin, definido como:

, donde:

Algunas consideraciones importantes sobre el coeficiente de correlacin lineal:

Es una cantidad sin dimensiones, es decir no depende de las unidades empleadas. Por
ejemplo, si se est buscando hallar el coeficiente de correlacin entre el peso y la altura de los
nios en determinada ciudad, entonces el resultado ser el mismo independientemente de si el
peso de todos los nios se mide en Kilogramos o en gramos e independientemente de si la
altura de todos los nios se mide en metros o centmetros.

Se verifica siempre que:

Si el coeficiente de correlacin es igual a 1, entonces hay una correlacin lineal positiva


perfecta, es decir que los datos se ajustan perfectamente a una recta de pendiente positiva, es
decir una recta que crece, o sea que cuando x aumenta, entonces tambin lo hace y.

Si el coeficiente de correlacin es igual a -1, entonces hay una correlacin lineal negativa
perfecta, es decir que los datos se ajustan perfectamente a una recta de pendiente negativa, es
decir una recta que decrece, o sea que cuando x aumenta, entonces y disminuye.

En cualquier otro caso, para aceptar si hay una correlacin lineal aceptable, no hay ninguna
regla estricta. Normalmente, para aceptar la existencia de dicha correlacin, el coeficiente
debe ser mayor que 0,7 o menor que -0,7. En caso contrario, se suele rechazar la existencia de
correlacin lineal.

Qu puede deducirse si se rechaza la existencia de correlacin lineal si, por ejemplo, se


encuentra un coeficiente de correlacin lineal de 0,3 entre dos variables?

Lo nico que puede deducirse es que los datos no se ajustan a una recta.

Pero esto no significa que no haya relacin entre ellos dado que podran ajustarse a una
parbola o a cualquier otra curva. Slo se deduce que no hay correlacin lineal aunque
pudiera haber una correlacin no lineal.

Este es el gran inconveniente del coeficiente de correlacin lineal: no sirve para decidir si
hay o no una posible relacin entre dos variables, slo sirve para decidir si hay o no una
posible relacin lineal entre dos variables.

Ello hace que, definitivamente, la nica manera de decidir inicialmente si debe


sospecharse o no la existencia de relacin entre dos variables es estudiar detenidamente
el diagrama de dispersin correspondiente, o sea la nube de puntos.

Y, en su caso, slo despus habr que decidir con que curva se intentan ajustar los datos.

Para resolver
Usando los ejercicios de anlisis de regresin de la semana anterior, se pide
calcular el Coeficiente de Correlacin y determinar la fuerza de la correlacin entre
variables.

TASAS e INDICES
Como ya se dijo, el anlisis de un fenmeno basado en las cifras absolutas, ofrece una idea
general de su tendencia o comportamiento; pero para efectos de establecer comparaciones
adecuadas del mismo fenmeno con otra regin, o su ocurrencia a travs del tiempo, se
utilizan ciertos indicadores denominados tasas e ndices.

Tasa
Una tasa es la resultante de una fraccin, en donde el numerador est contenido dentro del
denominador:
Ejemplos:
D = R_ * 1000
M
D: Tasa de desercin escolar.
R: Nmero de retiros durante el ao.
M: Nmero total de matriculados durante el ao
TE = PEAO * 1000
PEA

TE: Tasa de empleo.


PEAO: Poblacin econmicamente activa ocupada.
PEA : Poblacin econmicamente activa.
Valga anotar que a las tasas se les debe multiplicar por una constante k, la cual generalmente es
100, 1000 o mltiplos de ellos, con el fin de convertirlos en porcentajes, por millares etc.
En demografa, las tasas son de uso frecuente, entre otras, mencionaremos las siguientes:
TM = D * 1000
P
Donde:
TM : Tasa de mortalidad.
D : Nmero de defunciones en un periodo y rea dada.
P : Poblacin total en esa rea a mitad del periodo.

TN = N * 1000
P
Donde
TN : Tasa de natalidad
N : Nmero de nacidos vivos ocurridos en un periodo y rea dada
P : Poblacin total del rea a mitad del periodo.

TC = M * 1000
P

Donde:
TC : Tasa de nupcialidad.
M : Nmero de matrimonios efectuados en un periodo y rea dada.
P : Total de la poblacin a mitad del periodo.
Ejemplo:
El siguiente cuadro muestra la evolucin de la tasa de desempleo en Colombia, resultados
obtenidos de la encuesta nacional de hogares para los periodos comprendidos entre los aos
1.990 2.000

ndice
Un nmero ndice, como comnmente se le llama, es un indicador de los cambios relativos
de una o ms variables a travs del tiempo.
Entre las principales aplicaciones de los nmeros ndice, est la de establecer comparaciones
entre los indicadores de las diferentes zonas geogrficas, profesiones , grupos tnicos etc.
Para la construccin de un nmero ndice, se procede ante todo, a fijar el periodo de referencia o
"periodo base" de la serie temporal, teniendo presente que debe ser un periodo normal, esto es,
que no se hayan presentado situaciones fortuitas (guerras, terremotos, incendios u otro tipo de
imprevisto), que incidan en el valor de la variable para ese periodo.
Adems debe considerarse un periodo reciente que haga comparables los diferentes valores
de las variables consideradas.
ndice Simple
Un nmero ndice simple, es aquel que se calcula para una sola variable, dividiendo cada uno de
los valores de la serie cronolgica, por el valor correspondiente al "periodo base" previamente
definido.
1 ndice de Base Fija
Ip = Pn * 100, si la variable se refiere a precios
Po
Iq = Qn * 100, si la variable se refiere a cantidades
Qo
Ip : ndice de precios
Pn: Precio del artculo en el periodo n
P0 : Precio del artculo en el periodo base
Iq : ndice de cantidades
Qn : Cantidad del artculo en el periodo n
Q0 : Cantidad del artculo en el periodo base

Consumo promedio de energa en la fbrica de confecciones La Textil

En la primera tabla hemos calculado los ndices de precios simples, con base en 1995 y 1998
respectivamente, pero no se han tenido en cuenta las cantidades, mientras que en la segunda tabla
se han calculado los ndices de cantidades sin considerar los precios.
Calculemos, ahora los ndices del valor relativo, que considere tanto los precios como las
cantidades:
Valor relativo = Pn * Qn * 100
Po * Qo

ndice de Base Mvil


Solo hemos considerado, los ndices simples de base fija, esto es, con un periodo base
determinado. Es comn que interese comparar un ndice con el ndice del periodo
inmediatamente anterior, en consecuencia se debe fijar el periodo base en el periodo anterior al
referenciado, y as sucesivamente hasta completar la serie, al cual se le nombra ndice de base
mvil.

CUESTIONARIO Y EJERCICIOS PROPUESTOS


1. Qu es una tasa?
2. Qu es un ndice?
3. Para qu se utilizan los nmeros ndices?
4. Cmo se construye un nmero ndice simple?
5. Cmo se construye un nmero ndice compuesto?
6. Los precios y las cantidades de un articulo X vienen dados en la siguiente tabla:

Tomando como ao base 1995, calcular para los otros aos:


6.1 Los ndices de precios.
6.2 Los ndices de cantidades.
6.3 Los ndices de valores.
7. A continuacin se relacionan los precios y las cantidades del ao base, de cuatro
artculos diferentes:

Semana 15

CONTROLES DE CALIDAD Y PROCESOS ESTADSTICOS

Orgenes y evolucin de la calidad


Previo a la conformacin de los primeros grupos humanos organizados de importancia, las
personas tenan pocas opciones para elegir lo que habran de comer, vestir, en donde vivir y
como vivir, todo dependa de sus habilidades en la cacera y en el manejo de herramientas, as
como de su fuerza y voluntad, el usuario y el primitivo fabricante eran, regularmente, el mismo
individuo.
La calidad era posible definirla como todo aquello que contribuyera a mejorar las precarias
condiciones de vida de la poca prehistrica, es decir, las cosas eran valiosas por el uso que se
les daba, lo que era acentuado por la dificultad de poseerlas.
Conforme el ser humano evoluciona culturalmente y se dinamiza el crecimiento de los
asentamientos humanos, la tcnica mejora y comienzan a darse los primeros esbozos de
manufactura; se da una separacin importante entre usuario o cliente y el fabricante o proveedor.
La calidad se determinaba a travs del contacto entre los compradores y lo vendedores, las
buenas relaciones mejoraban la posibilidad de hacerse de una mejor mercanca, sin embargo, no
existan garantas ni especificaciones, el cliente escoga dentro de las existencias disponibles.
Conforme la tcnica se perfecciona y las poblaciones se transforman poco a poco en pueblos y
luego en ciudades de tamao considerable, aparecen los talleres de artesanos dedicados a la
fabricacin de gran variedad de utensilios y mercancas, cada taller se dedicaba a la elaboracin

de un producto, eran especialistas en ello y basaban su prestigio en la alta calidad de sus


hechuras, las que correspondan a las necesidades particulares de sus clientes. En esta etapa
surge el comerciante, sirviendo de intermediario entre el cliente y el fabricante.

Los gurs de nuestros das


Los gurs de esta nueva etapa idealizan las funciones y dinmica de la organizacin para
insertarlas en un nuevo modelo de comportamiento, relaciones y disciplinas. Entre estos
tenemos:

W. EDWARDS DEMING (1900-1993)


William Edwards Deming naci en 1900 en Wyoming, E.U., se
dedic a trabajar sobre el control estadstico de la calidad. Japn
asumi y desarrollo los planteamientos de Deming, y los convirti en
el eje de su estrategia de desarrollo nacional. En 1950 W. Edward
Deming visit Japn, dando conferencias sobre Control de Calidad. A
dichas conferencias asistieron un grupo numeroso y seleccionado de
directivos de empresas para crear las bases sobre las que instaurar el
Premio Deming, premiando a aquellas instituciones o personas que se
caracterizaran por su inters en implantar la calidad.

JOSEPH MOSES JURAN (1904-199)


Nace en Rumania en 1904 y es otra de las grandes figuras de la
calidad. Se traslada a Minnesota en 1912. Es contemporneo de
Deming. Despus de la II Guerra Mundial trabaj como consultor.
Visita Japn en 1954 y convierte el Control de la Calidad en
instrumento de la direccin de la empresa. Imparte su conferencia
sobre: "Gestin Sistemtica del Control de Calidad". Se le descubre a
raz de la publicacin de su libro, desechado por otras editoriales:
"Manual de Control de Calidad". Su fundamento bsico de la calidad,
es que slo puede tener efecto en una empresa cuando sta aprende a
gestionar la calidad.

KAORU ISHIKAWA (1915-)


El representante emblemtico del movimiento del Control de Calidad
en Japn es el Dr. Kaoru Ishikawa. Nacido en 1915, se gradu en la
Universidad de Tokio el ao 1939 en Qumica Aplicada. Fue profesor
en la misma Universidad, donde comprendi la importancia de los
mtodos estadsticos, ante la dispersin de datos, para hallar
consecuencias. Desarrolla el Diagrama Causa-Efecto como
herramienta para el estudio de las causas de los problemas.
Parte de que los problemas no tienen causas nicas, sino que suelen
ser, segn su experiencia, un cmulo de causas. Slo hay que buscar
esta multiplicidad de causas, colocarlas en su diagrama.

Qu es Control Estadstico de la Calidad (CEC)?


Es una metodologa orientada a la mejora de procesos
productivos/servicios basada en la utilizacin de criterios estadsticos
Comenzando con la aportacin de Shewhart sobre reconocer que en todo proceso de produccin
existe variacin (Gutirrez:1992), puntualiz que no podan producirse dos partes con las
mismas especificaciones, pues era evidente que las diferencias en la materia prima e insumos y
los distintos grados de habilidad de los operadores provocaban variabilidad. Shewhart no
propona suprimir las variaciones, sino determinar cul era el rango tolerable de variacin que
evite que se originen problemas.
Para lograr lo anterior, desarroll las grficas de control al tiempo que Roming y Dodge
desarrollaban las tcnicas de muestreo adecuadas para solamente tener que verificar cierta
cantidad de productos en lugar de inspeccionar todas las unidades. Este periodo de la calidad
surge en la dcada de los 30s a raz de los trabajos de investigacin realizados por la Bell
Telephone Laboratories.
En su grupo de investigadores destacaron hombres como Walter A. Shewhart, Harry Roming y
Harold Dodge, incorporndose despus, como fuerte impulsor de las ideas de Shewhart, el Dr.
Edwards W. Deming (Cant:1997).
Estos investigadores cimentaron las bases de lo que hoy conocemos como Control Estadstico de
la Calidad (Statistical Quality Control, SQC), lo cual constituy un avance sin precedente en el
movimiento hacia la calidad.

Causas de variacin
Existen variaciones en todas las partes producidas en el proceso de manufactura. Hay dos fuentes
de variacin:
- variacin aleatoria se debe al azar y no se puede eliminar por completo.
- variacin asignable es no aleatoria y se puede reducir o eliminar.
Nota: la variacin puede cambiar y cambiar la forma, dispersin y tendencia central de la
distribucin de las caractersticas medidas del producto.
Diagramas de diagnstico
Controles o registros que podran llamarse "herramientas para asegurar la calidad de una
fbrica", esta son las siguientes:
o Hoja de control (Hoja de recogida de datos)
o Histograma
o Anlisis paretiano (Diagrama de pareto)
o Diagrama de Ishikawa: Diagrama de causa y efecto (Espina de Pescado)
o Estratificacin (Anlisis por Estratificacin)
o Diagrama de scadter (Diagrama de Dispersin)
o Grfica de control
La experiencia de los especialistas en la aplicacin de estos instrumentos o Herramientas
Estadsticas seala que bien aplicadas y utilizando un mtodo estandarizado de solucin de
problemas pueden ser capaces de resolver hasta el 95% de los problemas.
En la prctica estas herramientas requieren ser complementadas con otras tcnicas como son:
o La lluvia de ideas (Brainstorming)
o La Encuesta
o La Entrevista
o Diagrama de Flujo
o Matriz de Seleccin de Problemas, etc

QU PRETENDE EL CEC ?
REDUCIR LA VARIABILIDAD Y LA DISPERSIN
HACER LAS COSAS BIEN A LA PRIMERA
PREVENIENDO LOS FALLOS EN LUGAR DE CORREGIR SUS
EFECTOS.
LAS DECISIONES SE TOMAN EN FUNCIN DE DATOS Y NO DE
PERCEPCIONES SUBJETIVAS.
CORREGIR LOS PROCESOS DEFECTUOSOS EN VEZ DE LOS
PRODUCTOS/SERVICIOS DEFECTUOSOS

NATURALEZA DE LOS PROBLEMAS ESTADSTICOS

1. Problema con la tendencia central

2. Problema con las Medidas de Dispersin

TRABAJO FINAL:
Presentacin de Proyecto Integrador: Diagnstico de Caso de Estudio con
Aplicacin de Mtodos Estadsticos