Anda di halaman 1dari 429

Diseño y técnicas de

muestreo
Estadística Aplicada
Mg. Adiel Omar FLORES RAMOS

1
Propósito semanal
• Distingue los métodos de
muestreo.
• Identifica las distribuciones
muestrales.
Contenido
• Definiciones básicas.
• Muestreo
• Distribuciones muestrales
Definiciones básicas
Definiciones básicas
• Datos
• Unidad de análisis
• Estadística
• Población
• Muestra
• Parámetro
• Estadístico
• Tipos de datos
Población y muestra
8-3

¿Por qué obtener muestras de la población?


• Existe una imposibilidad física de verificar todos los elementos
de la población.
• El costo de estudiar todos los elementos de una población es
alto.
• Los resultados de la muestra suelen ser adecuados.
• Contactar a toda la población es tardado, por la naturaleza
destructiva de ciertas pruebas.

17/01/2018 Mag. Adiel Omar FLORES RAMOS 7


8-3

¿Por qué obtener muestras de la población?


• La inferencia estadística es un procedimiento mediante el cual se
estiman los parámetros (es decir las características) de la
población, a partir de las estadísticas o caracteres de las
muestras.
• El propósito de extraer una muestra de una población consiste en
obtener información acerca de esta última.
• Es muy importante que los individuos incluidos en la muestra
constituyan una sección representativa de los sujetos que
componen la población. “Las muestras deben ser representativas”.

17/01/2018 Mag. Adiel Omar FLORES RAMOS 8


Población y Muestra
ELEMENTOS BASICOS DE LA POBLACION

Población Unidad de Unidad de Marco


Muestra
objeto muestreo Análisis muestral
Número de
elementos Conjunto
Conjunto
de la de
de Objeto o Lista
población, Unidades
individuos Individuo de
que se van o
de los del que unidades
a estudiar. elementos
que se hay que o
Todo miembro De
quiere obtener Elementos
de la población análisis
obtener la de
pertenecerá Sacados
una información muestreo.
a una y sólo del
información
una unidad marco
de muestreo.

17/01/2018 Mag. Adiel Omar FLORES RAMOS 11


Sujetos u objetos de estudio
• Es necesario definir las unidades de análisis (personas,
organizaciones, etc.)
• Ejemplo: Alumnos de la Escuela de Postgrado de la UC que
ingresaron en el periodo 2010 al 2016.
• Determinar a los sujetos de estudio, depende de precisar
con claridad el problema y los objetivos de investigación.

17/01/2018 Mag. Adiel Omar FLORES RAMOS 12


DECISIONES DE M U E S T R E O
No. 1: ¿Debo tomar una muestra ?

Se quiere saber cómo se


comporta una cierta
característica en un
Universo particular Las observaciones
Hacer pueden
un Censo atribuirse a los
Sí miembros del
Universo

El Universo Sí Es posible
está bien observar todo el NO
definido Universo ?
Tomar Las observaciones
? solo pueden
una Muestra
No representativa atribuirse a la
NO muestra, NO a
NO
los miembros del
Se quiere Universo
Definir Observar inferir la medición
El una Muestra al Universo
Universo ?

Las observaciones
Sí Tomar pueden atribuirse a
una Muestra
los miembros del
Representativa
Universo
17/01/2018 Mag. Adiel Omar FLORES RAMOS 13
Delimitación de la población
• Una vez definida la unidad de análisis, se procede a delimitar
la población.
• Población Marco, es el conjunto de todos los casos que
concuerdan con una serie de especificaciones.
• Es necesario delimitar las características esenciales del marco
poblacional, (poblaciones de características).

17/01/2018 17/01/2018 Mag. Adiel Omar FLORES RAMOS 14


14
Definición y tipos de muestra
• Es un sub conjunto de elementos que tienen una característica
común capaz de ser evaluada y que pertenecen al conjunto
llamado población.
• Todas las muestra deben ser representativas.
• Tipos de muestra: Probabilísticas y no probabilísticas.

17/01/2018 17/01/2018 Mag. Adiel Omar FLORES RAMOS 15


15
Grado de error (imprecisión) de la inferencia
• Debido a la aleatoriedad, los valores de un mismo estadístico
difieren de una muestra a otra.
• Esta variabilidad introduce un error en la estimación (error
aleatorio).
• Este error puede medirse, pues las medias de los estimadores
siempre se distribuyen “normalmente” (Teorema del límite
central) aunque los mismos estimadores no lo hayan hecho.

17/01/2018 Mag. Adiel Omar FLORES RAMOS 16


ERROR ALEATORIO
Cuando se mide el estadístico en diferentes
muestras tomadas aleatoriamente los
resultados son variables. Esta variabilidad del
estadístico se denomina error aleatorio y es
causada por el azar.

s1 s2

s4
s3

17/01/2018 Mag. Adiel Omar FLORES RAMOS 17


Muestras Muestras no
probabilísticas probabilísticas
• Son aquellas donde ➢ La elección de los
todos los elementos de la elementos de la
población tienen la población no depende
misma posibilidad de ser de la probabilidad.
escogidos.
➢ Obedece a
• Se obtiene definiendo las características
características de la planteadas por el
población, el tamaño de investigador.
la muestra y a través de
una selección aleatoria. ➢ Están afectadas por
decisiones subjetivas y
pueden estar sesgadas.
17/01/2018 17/01/2018 Mag. Adiel Omar FLORES RAMOS
18
Muestreo
probabilístico
Tipos de muestreo probabilístico
• Muestreo aleatorio simple.
• Es el procedimiento de seleccionar muestras en el que al seleccionar
en forma aleatoria y sin reemplazo a “n” unidades de muestreo de
una población que contiene un total de N unidades, se garantiza que
cada una de las muestras posibles tiene la misma probabilidad de ser
elegida.
Tipo de muestreo probabilístico
• Muestreo aleatorio estratificado .
• Estratificar significa dividir a la población en varias partes de acuerdo
a ciertas características de sus elementos. El objetivo de estratificar la
población es buscar homogeneidad entre los estratos, a fin de
reducir el error estándar de los estimadores.
Tipo de muestreo probabilístico
• Muestreo sistemático.
• En el muestreo sistemático, se debe elegir un elemento del marco
muestral cada cierto intervalo. Este muestreo supone que se cuenta
con una enumeración completa de los elementos de la población. El
tamaño del intervalo (K), se calcula como el valor recíproco de la
fracción de muestreo.
Tipo de muestreo probabilístico.
• Muestreo por conglomerados.
• Este muestreo es útil cuando las unidades de análisis en la población
se consideran agrupadas en conglomerados. Cada conglomerado
constituirá una unidad de muestreo.
DECISIONES DE M U E S T R E O
No. 3: Selección de una Muestra Representativa

Se quiere estimar un
Parámetro del Universo
partiendo de una Muestra
Representativa

Variable Variable
Cualitativa ¿De qué
naturaleza es el Continua
Parámetro a
estimar?

Muestreo Muestreo
Representativo Representativo
para estimar para estimar
una Proporción una Media

17/01/2018 Mag. Adiel Omar FLORES RAMOS 24


Definición del Tamaño Muestral
La definición del tamaño muestral depende de los
siguientes factores

1 . Los objetivos del estudio.

2 . Los conocimientos previos sobre el comportamiento de


la característica en la población.

3 . Los recursos técnicos y financieros para obtener la


información.
4 . El error máximo que se permitirá el analista.

5 . La confiabilidad de la inferencia esperada por el analista.

17/01/2018 Mag. Adiel Omar FLORES RAMOS 25


DECISIONES DE M U E S T R E O
No. 4: Definicion Del Tamaño Muestral

La Variable de
muestreo es
CUALITATIVA

Intención de
describir la variable
(Estudios
descriptivos)

Se ha decidido La Variable de
tomar una muestreo es
muestra CONTINUA
representativa
del Universo

Estudio de
Seguimiento
Intención de
relacionar la
variable con otras
(Estudios
analíticos) Estudio de Casos
17/01/2018 Mag. Adiel Omar FLORES RAMOS 26
DECISIONES DE M U E S T R E O
Definición de
No. 4: Definicion Del Tamaño Muestral tamaño muestral
para una
Proporción
La Variable de conocida
muestreo es
CUALITATIVA
Definición de
tamaño muestral
Intención de para una
describir la variable Proporción
(Estudios desconocida
descriptivos)
Definición de
tamaño muestral
para una varianza
Se ha decidido La Variable de conocida
tomar una muestreo es
muestra CONTINUA
Definición de
representativa tamaño muestral
del Universo para una Varianza
desconocida

Estudio de
Seguimiento
Intención de
relacionar la
variable con otras
(Estudios
analíticos) Estudio de Casos
17/01/2018 Mag. Adiel Omar FLORES RAMOS 27
No. 5: Definición del tamaño muestral n para una Variable
Cualitativa cuyo comportamiento se conoce (p se conoce)

Se quiere medir una


variable CUALITATIVA
(proporción p) en una
Muestra Representativa

Definir la Definir el máximo


error aleatorio
confiabilidad de la
admisible (Error
medición () Estándar ES)

2 𝑝𝑞
𝑛 = 𝑍𝛼ൗ2
𝐸2
17/01/2018 Mag. Adiel Omar FLORES RAMOS 28
Ejercicio 1

La oficina de planificación familiar de cierto distrito desea


determinar la proporción de familias con un ingreso anual
de S/. 30 000. Estudios previos han indicado que esta
proporción era de 20%.
a. ¿Qué tamaño muestral se requiere para asegurar con una confianza
de 0,95 que el error en la estimación de esta proporción no
sobrepase a 0,05?
b. En qué forma variará el tamaño de la muestra si el máximo error
permisible es reducido a 0,01?

17/01/2018 Mag. Adiel Omar FLORES RAMOS 29


Ejercicio 1. Solución

(1.96) 2 (0.20) (0.80)


n  (0.05)2 = 245.86

• n = 246

(1.96) 2 (0.20) (0.80)


n  (0.01) 2 • = 6146.56

• n = 6147

17/01/2018 Mag. Adiel Omar FLORES RAMOS 30


No. 6: Definición del tamaño muestral n para una Variable
Cualitativa cuyo comportamiento se DESCONOCE (p desconocida)

Se quiere medir una variable


CUALITATIVA (proporción p) en
una Muestra Representativa

Definir la confiabilidad de Definir el máximo error


la medición () aleatorio admisible
(Error Muestral EM)

2 0.25
𝑛 = 𝑍𝛼ൗ2
𝐸2

Se asumen los valores máximos de P y Q: P=0.5 Q=0.5

17/01/2018 Mag. Adiel Omar FLORES RAMOS 31


No. 7: Definición del tamaño muestral n para una
Variable CONTINUA cuya variación se conoce

Se quiere medir una variable


CONTINUA (MEDIA X) en
una Muestra Representativa

Definir la Definir Definir


la Confiabilidad Z La Desviación el Error Estándar (ES)
Esperada Estándar (σ) Esperado
Conocida

σ2
n = Z2
ES2

17/01/2018 Mag. Adiel Omar FLORES RAMOS 32


Ejercicio 2

A fin de conocer el gasto mensual en medicinas por familia, el


Gerente de Marketing de un laboratorio farmacéutico desea
determinar el tamaño de la muestra que le proporcione un nivel
de confianza de 0,95.
Además conoce por estudios anteriores que las compras medias
por familia eran de S/. 120 mensuales, con una desviación
estándar de 30. El Gerente busca un tamaño de muestra que le
permita estimar el nivel de gasto con un error de 10

17/01/2018 Mag. Adiel Omar FLORES RAMOS 33


Ejercicio 2. Solución

Z2  2
n=
e2

n=
1,96  30  2 2

10 2

n = 36
17/01/2018 Mag. Adiel Omar FLORES RAMOS 34
No. 8: Definición del tamaño muestral n para una
Variable CONTINUA cuya variación se Desconoce

Se quiere medir una variable


CONTINUA (MEDIA X) en
una Muestra Representativa

Definir la Estimar o suponer Definir


la Confiabilidad Z La Desviación Estándar el Error Estándar (ES)
Esperada (S) Esperada Esperado

s2
n = Z2
ES2

17/01/2018 Mag. Adiel Omar FLORES RAMOS 35


Tamaño de la muestra (n) para poblaciones finitas

n
no * N
no  ( N  1)

17/01/2018 Mag. Adiel Omar FLORES RAMOS 36


Muestreo no
probabilístico
MUESTRAS NO PROBABILÍSTICAS
• Llamadas también muestra dirigidas, se determinan mediante
un procedimiento de selección informal y arbitrario.
• Selecciona sujetos “típicos” con la esperanza de que serán
casos respresentativos de una población determinada.

17/01/2018 17/01/2018 Mag. Adiel Omar FLORES RAMOS 38


38
MUESTRA NO PROBABILÍSTICAS

• Desventaja: No se puede calcular el error estándar, por tanto


no se conoce el nivel de confianza de la estimación.
• Ventaja: Es útil para diseñar estudios que no requieren
necesariamente “representatividad de elementos de la
población, sino una cuidadosa elección de sujetos con ciertas
características especificadas previamente en el planteamiento
del problema”.

17/01/2018 17/01/2018 Mag. Adiel Omar FLORES RAMOS 39


39
Clases de muestras dirigidas

• Muestra de sujetos voluntarios.


• Son frecuentes en ciencias sociales, ciencias de
la conducta, medicina, arqueología, etc.
Se usan en estudios de laboratorio, donde se
procura sean sujetos homogéneos en variables
como edad, sexo, inteligencia.

17/01/2018 17/01/2018 Mag. Adiel Omar FLORES RAMOS 40


40
Clases de muestras dirigidas

• Muestra a juicio de expertos.


• Son frecuentes en estudio cualitativos y
exploratorios.
• Son válidas y útiles cuando los objetivos del
estudio así requieren.

17/01/2018 17/01/2018 Mag. Adiel Omar FLORES RAMOS 41


41
Clases de muestras dirigidas

• Muestra de sujetos-tipo. Se utiliza en estudios exploratorios


de tipo cualitativo, donde el objetivo es la riqueza,
profundidad y calidad de la información y no la cantidad y la
estandarización. Se aplican en estudios motivacionales, o en
análisis de valores, ritos y significados de grupos sociales.

17/01/2018 17/01/2018 Mag. Adiel Omar FLORES RAMOS 42


42
Clases de muestras dirigidas

• Muestra por cuotas. Se utiliza en estudios de opinión y de


mercadotecnia.
Se aplican cuestionarios a sujetos que transitan en la calle y se
va llenando cuotas de acuerdo con la proporción de ciertas
variables demográficas en la población.

17/01/2018 17/01/2018 Mag. Adiel Omar FLORES RAMOS 43


43
Gracias por su atención

Recursos adicionales
https://1drv.ms/f/s!AnpbNMf4AA0wiEV5WjdZUy-Bf9p1

Mg. Adiel Omar FLORES RAMOS


aflores@continental.edu.pe
(#)964660405 - 964378423
Distribuciones muestrales
Estadística Aplicada
Mg. Adiel Omar FLORES RAMOS

1
Propósito semanal
• Reconocer como la distribución
muestral de un estadístico;
• Identificar el principio básico
acerca de la distribución
muestral de medias de muestra
y la distribución muestral de
proporciones de muestra.

Mg. Adiel Omar FLORES RAMOS


Contenido

• Distribuciones muestrales
• Distribución muestral de un
estadístico.
• Distribución muestral de medias
de muestra.
• Distribución muestral de
proporciones de muestra.

Mg. Adiel Omar FLORES RAMOS


Distribuciones
muestrales

Mg. Adiel Omar FLORES RAMOS


Distribuciones muestrales
• La distribución muestral de un
estadístico (como una porción
muestral o una media muestral),
es la distribución de todos los
valores del estadístico cuando se
obtienen todas las muestras
posibles del mismo tamaño n de
la misma población.

Mg. Adiel Omar FLORES RAMOS


Distribuciones
muestrales

Distribución muestral
de la media

MG. ADIEL OMAR FLORES RAMOS


Distribución muestral de la media

Mg. Adiel Omar FLORES RAMOS


Ejemplo
• Consideremos la población que consiste en los valores 1, 2, 5.
El McGwire Electronics Center estuvo abierto sólo durante tres
días, por un personal de ventas descortés, a un pobre plan de
negocios, publicidad ineficaz y a una ubicación inadecuada.
• Durante el primer día se vendió un teléfono celular, durante el
segundo día dos teléfonos celulares y sólo cinco durante el
tercer día.

Mg. Adiel Omar FLORES RAMOS


Ejemplo
• Ya que los valores 1, 2, 5 constituyen una
población completa, consideremos
muestras de tamaño 2. Con sólo tres
valores poblacionales, hay únicamente
nueve posibles muestras diferentes de
tamaño 2, suponiendo que el muestreo se
realiza con reemplazo. Es decir, se
reemplaza cada valor seleccionado antes
de realizar una nueva selección.

Mg. Adiel Omar FLORES RAMOS


EJEMPLO Distribución muestral de la media
• Una población se compone de los valores 1, 2, 5. Identifique la
distribución muestral específica de la media de las muestras
de tamaño n = 2, que se seleccionan aleatoriamente con
reemplazo, de la población 1, 2, 5.
• También, calcule la media de esta distribución muestral.
¿Coinciden las medias de muestra con el valor de la media
poblacional?

Mg. Adiel Omar FLORES RAMOS


Ejemplo

Mg. Adiel Omar FLORES RAMOS


Variabilidad de muestreo
• Las medias de muestra varían. Observe que las medias de
muestra son diferentes.
• La primera media de muestra es 1.0, la segunda media de
muestra es 1.5, etcétera. Esto nos conduce a la siguiente
definición.

Mg. Adiel Omar FLORES RAMOS


Distribuciones
muestrales

Distribución muestral
de proporciones

MG. ADIEL OMAR FLORES RAMOS


Distribución muestral de proporciones

Mg. Adiel Omar FLORES RAMOS


Distribución muestral de proporciones
• Uno de los usos clásicos de la estadística inferencial es el cálculo de
alguna proporción muestral y su aplicación para hacer una
inferencia acerca de la proporción poblacional.
• Encuestadores de la organización Gallup le preguntaron a 491
adultos que se seleccionaron al azar si estaban a favor de la pena
de muerte para una persona que sentenciaron por homicidio.
• Los resultados mostraron que 319 individuos (o el 65% de ellos) se
manifestaron a favor. El resultado muestral conduce a la inferencia
de que “el 65% de todos los adultos están a favor de la pena de
muerte para una persona sentenciada por homicidio”.

Mg. Adiel Omar FLORES RAMOS


Ejemplo: Distribución muestral de
proporciones
• Una población se compone de los valores 1, 2, 5. Para cada
muestra de tamaño n = 2, considere la proporción de números
impares.
• Identifique la distribución muestral para la proporción de
números impares y después calcule su media. ¿Coinciden las
proporciones muestrales con el valor de la proporción
poblacional?

Mg. Adiel Omar FLORES RAMOS


Solución

Mg. Adiel Omar FLORES RAMOS


Propiedades de la distribución de
proporciones muestrales
• Las proporciones muestrales tienden a coincidir con el valor
de la proporción poblacional.
• En ciertas condiciones, la distribución de proporciones
muestrales se aproxima a una distribución normal.

Mg. Adiel Omar FLORES RAMOS


Distribuciones
muestrales

Estimadores de
parámetros

MG. ADIEL OMAR FLORES RAMOS


¿Cuáles estadísticos son buenos
estimadores de parámetros?
• La Estadística Inferencial, estudia métodos formales para el
uso de estadísticos muestrales que nos permitirán hacer
estimaciones de los valores de parámetros de población.
• Algunos estadísticos funcionan mucho mejor que otros, por lo
cual es posible juzgar su valor examinando sus distribuciones
muestrales.

Mg. Adiel Omar FLORES RAMOS


Ejemplo: Distribuciones muestrales
• Una población se compone de los valores 1, 2, 5. Seleccione
aleatoriamente muestras de tamaño 2 con reemplazo.
a) Para cada muestra calcule la media, mediana, rango, varianza,
desviación estándar y la proporción de valores muestrales impares.
b) Para cada estadístico, calcule la media de los resultados del inciso a.
c) Compare las medias del inciso b con los parámetros de población
correspondientes; después, determine si cada estadístico coincide
con el valor del parámetro poblacional.

Mg. Adiel Omar FLORES RAMOS


Ejemplo: Distribuciones muestrales

Mg. Adiel Omar FLORES RAMOS


Interpretación
• Con base en los resultados, observamos que cuando se utiliza
un estadístico muestral para estimar un parámetro de
población, algunos estadísticos son buenos porque coinciden
con el parámetro poblacional y, por lo tanto, tienden a
producir buenos resultados.
• Estadísticos como éstos se denominan estimadores sin sesgo.
Otros estadísticos no son tan buenos (ya que son estimadores
sesgados).
• Estadísticos que coinciden con los parámetros poblacionales:
media, varianza, proporción
• Estadísticos que no coinciden con los parámetros poblacionales:
mediana, rango, desviación estándar

Mg. Adiel Omar FLORES RAMOS


Interpretación
• Aunque la desviación estándar muestral no coincide con la
desviación estándar poblacional, el sesgo es relativamente
pequeño en muestras grandes, de manera que con frecuencia
utiliza s para estimar σ.
• Por consiguiente, a medias, proporciones, varianza y
desviaciones estándar se les considerará importantes, pero la
mediana y el rango se utilizarán en pocas ocasiones.

Mg. Adiel Omar FLORES RAMOS


Gracias por su atención

Recursos adicionales
https://1drv.ms/f/s!AnpbNMf4AA0wiEV5WjdZUy-Bf9p1

Mg. Adiel Omar FLORES RAMOS


aflores@continental.edu.pe
(#)964660405 - 964378423

Mg. Adiel Omar FLORES RAMOS


Mg. Adiel Omar FLORES RAMOS
Estimaciones y
tamaños de muestra
Estadística Aplicada
Mg. Adiel Omar FLORES RAMOS

2
Propósito semanal
• Realiza inferencias estadísticas
basados en el cálculo de
parámetros.
Contenido
• Distribuciones muestrales
• Estimadores
• Intervalo de confianza para un
parámetro
• Intervalos de confianza para dos
parámetros
Estimadores
Estimador
• Un estimador es un estadístico usado para estimar un
parámetro desconocido de la población.
• Por ejemplo, si se desea conocer el precio medio de un
artículo (el parámetro desconocido) se recogerán
observaciones del precio de dicho artículo en diversos
establecimientos (la muestra) y la media aritmética de las
observaciones puede utilizarse como estimador del precio
medio.
Ejemplo

Inferencia

ഥ =240 cc
× µ
Estimador
• Para cada parámetro pueden existir varios estimadores
diferentes. En general, escogeremos el estimador que posea
mejores propiedades que los restantes, como insesgadez,
eficiencia, convergencia y robustez.
• El valor de un estimador proporciona una estimación
puntual del valor del parámetro en estudio.
• En general, se suele preferir realizar una estimación mediante
un intervalo, esto es, obtener un intervalo [a,b] dentro del
cual se espera esté el valor real del parámetro con un
cierto nivel de confianza.
Ejemplo

Inferencia

[235;245] µ
Estimación puntual
Intervalos de
confianza para un
parámetro
Intervalos
• Un intervalo, significa sustituir la estimación puntual, por un
intervalo de posibles valores.
• Esto es una estimación por intervalo o intervalo de confianza,
es decir, un intervalo de valores posibles para el parámetro
que se estima.
• El grado de posibilidades se especifica por un nivel de
confianza, de modo que hablaremos de un intervalo de
confianza de 95% (nivel de confianza de 95%) o intervalo al
99%.
Intervalos de
confianza para una
proporción
¿Funciona la terapia de contacto? (Triola, p.319)
• Ensayos realizados: 280
• Aciertos (éxitos): 123
• Estimador puntual (éxitos):
123
𝑝Ƹ = = 0.439285 = 44%
280

𝑞ො = 56%
Intervalo de confianza
• Nivel de confianza: 95%

0,381 < p < 0,497

“Tenemos una confianza de 95% de que el intervalo


de 0,381 a 0,497 realmente contiene el valor de p”

“Existe un 95% de probabilidad de que el valor real de p


esté entre 0,381 y 0,497”.
Cálculo del intervalo de confianza

𝑝Ƹ − 𝐸 < 𝑝 < 𝑝Ƹ + 𝐸

• Donde
E : Margen de error
Margen de Error
• El margen de error E también se denomina error máximo del
estimado y se calcula como se indica en la fórmula:

• Donde:
Zα/2 es el valor crítico
Valor crítico
Ejemplo: cálculo del valor crítico
• Nos proponemos un nivel de confianza del 95%
1. Hallamos la diferencia respecto al 100% expresado en decimales
100%-95%=5% = 0.05
α = 0.05
2. Dividimos entre 2 para obtener la proporción en cada cola:
α/2 = 0.05/2 = 0.025
3. Calculamos z de acuerdo al área:
Área a la izquierda: 0.025  de la tabla A-2 hallamos Z=-1.96
Área a la derecha: 1-0.025=0.975  de la tabla A-2 hallamos Z=1.96
Valor crítico

=INV.NORM.ESTAND(0.025)
=INV.NORM.ESTAND(0.975)
Intervalo y nivel de confianza
Calculando el intervalo

𝑝Ƹ − 𝐸 < 𝑝 < 𝑝Ƹ + 𝐸

𝑝Ƹ = 0.439285
𝑞ො = 0.560712
n = 280
𝑍α/2 = 1.96
Solución
Requisitos
1. La muestra es aleatoria simple.
2. Las condiciones para la distribución binomial se satisfacen.
Esto es, hay un número fijo de ensayos, los ensayos son
independientes, hay dos categorías de resultados y las
probabilidades permanecen constantes para cada ensayo.
3. Existen al menos 5 éxitos y al menos 5 fracasos. (Cuando p y
q se desconocen, estimamos sus valores utilizando la
proporción muestral, de manera que este requisito es una
forma de verificar que np >= 5 y nq >= 5 se cumplan para
que la distribución normal sea una aproximación adecuada
para la distribución binomial.
Determinación del
tamaño muestral para
la proporción
Determinación del tamaño muestral
• Suponga que queremos reunir datos muestrales con el
objetivo de estimar alguna proporción de la población. ¿Cómo
sabemos cuántos elementos muestrales deben obtenerse?
Ejemplo: Tamaño muestral para una
encuesta por correo electrónico
• Las formas en las que nos comunicamos se han visto afectadas
drásticamente por el uso de máquinas contestadoras
telefónicas, máquinas de fax, correo de voz y correo
electrónico. Suponga que un sociólogo quiere determinar el
porcentaje actual de hogares en Estados Unidos que utilizan el
correo electrónico.
• ¿Cuántos hogares deben encuestarse para tener una confianza
del 95% de que el porcentaje muestral es erróneo por no más
de 4 puntos porcentuales?
Ejemplo: Tamaño muestral para una
encuesta por correo electrónico
• a. Utilice el siguiente resultado de un estudio pionero: en
1997, el 16.9% de los hogares estadounidenses usaban correo
electrónico (según datos de The World Almanac and Book of
Facts).
• b. Suponga que no tenemos información previa que sugiera un
posible valor de p’
Solución
Intervalos de
confianza para dos
parámetros
Intervalos de
confianza para dos
medias
El caso de estudio
• Se lleva a cabo un estudio para comparar el tiempo que tardan
hombres y mujeres para realizar determinada tarea. Las
experiencias anteriores indican que la distribución de tiempos
tanto para hombres como para mujeres es normal con varianzas
diferentes. Una muestra aleatoria de 9 hombres y 8 mujeres han
dado los siguientes tiempos en minutos:
Hombres 12 28 10 25 24 19 22 33 17
Mujeres 16 20 16 20 16 17 15 21
• Mediante un intervalo de confianza del 95% para la verdadera
diferencia de los promedios de tiempos de hombres y mujeres,
¿se puede concluir que los hombres emplean mayor tiempo que
las mujeres para hacer la tarea?.
Intervalo de confianza
−2.681 < 𝜇1 − 𝜇2 < 9.653

Tenemos una confianza del 95% de que los límites de -2.681 min y 9.653
min realmente contienen la diferencia entre las dos medias
poblacionales. Puesto que esos límites contienen a 0, este intervalo de
confianza sugiere que es muy posible que las medias de las dos
poblaciones sean iguales. No existe una diferencia significativa entre las
dos medias.
Cálculo del intervalo de confianza

𝑥1 − 𝑥2 − 𝐸 < 𝜇1 − 𝜇2 < 𝑥1 − 𝑥2 + 𝐸

• Donde
E : Margen de error

• Además, de los datos muestrales obtenemos:


• nh: 9 xh: 21.111 sh: 7.4237
• nm: 8 xm: 17.625 sm: 2.3261
Margen de Error
• Varianza poblacional conocida

𝜎12 𝜎22
𝐸 = 𝑧𝛼/2 +
𝑛1 𝑛2

• Varianza poblacional desconocida

𝑠12 𝑠22
𝐸 = 𝑡𝛼/2 +
𝑛1 𝑛2
Valor crítico tα/2
• Para un intervalo de confianza del 95%
Calcular 100% - 95% = 5% = 0.05
• Grados de libertad:
nh: 9  gl=9-1=8
nm: 8  gl=8-1=7
• Para 7 grados de libertad a 2 colas:
• De la tabla A-3 se obtiene que tα/2=2.365 =INV.T.2C(0.05;7)
Solución

𝑠12 𝑠22 7.42372 2.32612


𝐸 = 𝑡𝛼/2 + 𝐸 = 2.365 + = 6.167
𝑛1 𝑛2 9 8

3.486 − 6.167 < 𝜇1 − 𝜇2 < 3.486 + 6.167

−2.681 < 𝜇1 − 𝜇2 < 9.653


Gracias por su atención

Recursos adicionales
https://1drv.ms/f/s!AnpbNMf4AA0wiEV5WjdZUy-Bf9p1

Mg. Adiel Omar FLORES RAMOS


aflores@continental.edu.pe
(#)964660405 - 964378423
Prueba de Hipótesis
Estadística Aplicada
Mg. Adiel Omar FLORES RAMOS

1
Propósito semanal
• Dada una aseveración, identificar la
hipótesis nula y la hipótesis alternativa, y
expresar ambas de forma simbólica.
• Dados una aseveración y datos muestrales,
calcular el valor del estadístico de prueba.
• Plantear la conclusión de una prueba de
hipótesis en términos sencillos y sin
tecnicismos.

28/01/2018 Adiel Omar FLORES RAMOS 2


Contenido

• Hipótesis nula y la hipótesis


alternativa.
• Calcular el valor del estadístico
de prueba.
• Redactar la conclusión de una
prueba de hipótesis.

28/01/2018 Adiel Omar FLORES RAMOS 3


Prueba de Hipótesis
Fundamentos

28/01/2018 Adiel Omar FLORES RAMOS 4


HIPÓTESIS

Cualquier afirmación o conjetura que


se hace acerca de algo

28/01/2018 Adiel Omar FLORES RAMOS 5


Hipótesis Estadística

Cualquier afirmación o aseveración acerca de


una propiedad de la población.
Ejemplo:
El promedio ponderado de los alumnos de la UC en el
semestre 2017-1 es superior a 14

28/01/2018 Adiel Omar FLORES RAMOS 6


Prueba de hipótesis estadística

• Es un procedimiento estándar para probar una


aseveración acerca de una propiedad de la
población.
• Llamado también prueba de significancia

28/01/2018 Adiel Omar FLORES RAMOS 7


Hipótesis Nula (H0)
Es la afirmación de que el valor de un parámetro
de la población es igual a un valor aseverado.
Es la hipótesis que es aceptada provisionalmente
como verdadera y cuya validez será sometida a
comprobación

28/01/2018 Adiel Omar FLORES RAMOS 8


Hipótesis Alternativa (H1, Ha, HA)

Es una hipótesis contraria a la hipótesis nula, se


acepta en caso que la hipótesis nula sea
rechazada.

28/01/2018 Adiel Omar FLORES RAMOS 9


Planteamiento de hipótesis

1)H0:  = 0 y H1 :  ≠ 0
2)H0:  ≤ 0 y H1 :  > 0
3)H0:  ≥ 0 y H1 :  < 0
0 es el valor del parámetro
desconocido 

28/01/2018 Adiel Omar FLORES RAMOS 10


Identificación
de H0 y H1

28/01/2018 Adiel Omar FLORES RAMOS 11


Ejemplo: Identificación de las hipótesis nula
y alternativa
a) La proporción de conductores que admiten pasarse la luz
roja es mayor que 0.5.
b) El peso medio de los pasajeros de avión, con su equipaje de
mano, es a lo sumo de 195 libras (la cifra que la Federal
Aviation Administration difunde actualmente).
c) La desviación estándar de las puntuaciones de CI de actores
es igual a 15.

28/01/2018 Adiel Omar FLORES RAMOS 12


SOLUCIÓN

a) H1: p > 0.5,


H0: p = 0.5.
b) H1: µ > 195
H0: µ = 195.
c) H1: σ ≠ 15
H0: σ = 15.

28/01/2018 Adiel Omar FLORES RAMOS 13


TIPOS DE PRUEBAS DE HIPÓTESIS

Depende de la hipótesis alternativa

Prueba de Hipótesis unilateral o Prueba de


una cola
H0:  = 0 y H1 :  > 0
H0:  = 0 y H1 :  < 0

28/01/2018 Adiel Omar FLORES RAMOS 14


TIPOS DE PRUEBAS DE HIPÓTESIS

Prueba de Hipótesis Bilateral o Prueba de dos


cola

H0:  = 0 y H1 :  ≠ 0

28/01/2018 Adiel Omar FLORES RAMOS 15


ESTADÍSTICO DE PRUEBA

• En un valor que se utiliza para tomar la decisión


sobre la hipótesis nula
• Se calcula convirtiendo al estadístico muestral
en una puntuación de una distribución de
probabilidad

28/01/2018 Adiel Omar FLORES RAMOS 16


ESTADÍSTICO DE PRUEBA
Se utiliza la distribución muestral del estadístico de la
prueba a realizar:

28/01/2018 Adiel Omar FLORES RAMOS 17


Herramientas para evaluar
el estadístico de prueba H1 : Ɵ < Ɵ0

• La región crítica (o región de RC


rechazo) es el conjunto de
todos los valores del estadístico
de prueba que pueden H1 : Ɵ > Ɵ0
provocar que rechacemos la
hipótesis nula. RC

H1 : Ɵ ≠ Ɵ0

RC RC

28/01/2018 Adiel Omar FLORES RAMOS 18


Herramientas para evaluar H1 : Ɵ < Ɵ0
el estadístico de prueba
• El nivel de significancia (denotado α
con α) es la probabilidad de que el
estadístico de prueba caiga en la H1 : Ɵ > Ɵ0
región crítica, cuando la hipótesis
nula es verdadera. Si el estadístico
de prueba cae en la región crítica, α
rechazamos la hipótesis nula
H1 : Ɵ ≠ Ɵ0
• Las opciones comunes para a son
0.05, 0.01 y 0.10, aunque la más
común es 0.05.
α/2 α/2
28/01/2018 Adiel Omar FLORES RAMOS 19
Herramientas para evaluar
el estadístico de prueba H1 : Ɵ < Ɵ0

• El valor crítico, es cualquier valor


que separa la región crítica (donde
rechazamos la hipótesis nula) de VC
los valores del estadístico de H1 : Ɵ > Ɵ0
prueba que no conducen al
rechazo de la hipótesis nula.
• Los valores críticos dependen de
la naturaleza de la hipótesis nula, VC
de la distribución muestral que se H1 : Ɵ ≠ Ɵ0
aplique y del nivel de significancia
α.

VC VC 20
28/01/2018 Adiel Omar FLORES RAMOS
EJEMPLO: Cálculo de valores críticos
• Con un nivel de significancia de α=0.05, calcule los valores z
críticos para cada una de las siguientes hipótesis alternativas
(suponiendo que la distribución normal puede emplearse
como aproximación de la distribución binomial):
a) p < 0.5 (de manera que la región crítica está en la cola izquierda de
la distribución normal)
b) p > 0.5 (de manera que la región crítica está en la cola derecha de
la distribución normal)
c) p ≠ 0.5 (de manera que la región crítica está en ambas colas de la
distribución normal)

28/01/2018 Adiel Omar FLORES RAMOS 21


Solución
• Cuando α=0.05 (cola izquierda)
de la tabla A-2  z=-1.645
=INV.NORM.ESTAND(0.05)
• Cuando α=0.05 (cola derecha)
1-0.05=0.95
de la tabla A-2  z=1.645
=INV.NORM.ESTAND(0.95)
• Cuando α=0.05 (cola bilateral)
α/2=0.05/2=0.025
0.025 de la tabla A-2  z=-1.96
=INV.NORM.ESTAND(0.025)
1-0.025=0.975
de la tabla A-2  z=1.96
=INV.NORM.ESTAND(0.975)
28/01/2018 Adiel Omar FLORES RAMOS 22
REGLA DE DECISIÓN
Es la división de la distribución muestral del estadístico de la
prueba en dos partes mutuamente excluyentes:
Región Crítica (RC) : región de rechazo de H0
Región de Aceptación (RA) : región de no rechazo de H0
Depende de la hipótesis alternativa H1 del nivel de significación
y la distribución muestral del estadístico
Valor crítico: es cualquier valor que separa la región crítica y la
región de aceptación

28/01/2018 Adiel Omar FLORES RAMOS 23


Método tradicional
• Rechace H0 si el estadístico de prueba cae dentro de la región
crítica.
• No rechace H0 si el estadístico de prueba no cae dentro de la
región crítica.

28/01/2018 Adiel Omar FLORES RAMOS 24


REGLA DE DECISIÓN: Método tradicional
Prueba de Hipótesis Bilateral o Prueba de dos colas
H0:  = 0 y H1 :  ≠ 0

Prueba de Hipótesis unilateral o Prueba de una cola


a la izquierda
H0:  = 0 y H1 :  < 0

Prueba de Hipótesis unilateral o Prueba de una cola


a la derecha
H0:  = 0 y H1 :  > 0

28/01/2018 Adiel Omar FLORES RAMOS 25


Redacción de la conclusión

28/01/2018 Adiel Omar FLORES RAMOS 26


Ejemplo
• Suponga que un reportero asevera que “más de la mitad”
(más del 50%) de los empleados consiguen trabajo por medio
de redes de contactos.
• Esta aseveración de p > 0.5 se convierte en la hipótesis
alternativa, mientras que p =0.5 se convierte en la hipótesis
nula.
• Además, suponga que la evidencia muestral hace que
rechacemos la hipótesis nula de p = 0.5.
• Enuncie la conclusión en términos sencillos y sin tecnicismos.

28/01/2018 Adiel Omar FLORES RAMOS 27


Solución
• La aseveración original no incluye la condición de igualdad, y
rechazamos la hipótesis nula. Por lo tanto, la redacción de la
conclusión final debe ser la siguiente:
• “Los datos muestrales sustentan la aseveración de que la
mayoría de los empleados consiguen trabajo por medio de
redes de contactos”.

28/01/2018 Adiel Omar FLORES RAMOS 28


Ejercicios

28/01/2018 Adiel Omar FLORES RAMOS 29


Pasos para realizar la prueba de hipótesis
• Plantear la hipótesis nula H0 y alternativa H1
• Elegir el nivel de significación ()
• Elegir y estimar el estadístico de prueba
• Establecer la regla de decisión
• Tomar la decisión
• Redactar la conclusión

28/01/2018 Adiel Omar FLORES RAMOS 30


Gracias por su atención

Recursos adicionales
https://1drv.ms/f/s!AnpbNMf4AA0wiEV5WjdZUy-Bf9p1

Mg. Adiel Omar FLORES RAMOS


aflores@continental.edu.pe
(#)964660405 - 964378423
Prueba de Hipótesis
Estadística Aplicada
Mg. Adiel Omar FLORES RAMOS

1
Propósito semanal
• Dada una aseveración, identificar la
hipótesis nula y la hipótesis alternativa, y
expresar ambas de forma simbólica.
• Dados una aseveración y datos muestrales,
calcular el valor del estadístico de prueba.
• Plantear la conclusión de una prueba de
hipótesis en términos sencillos y sin
tecnicismos.

28/01/2018 Adiel Omar FLORES RAMOS 2


Contenido

• Hipótesis nula y la hipótesis


alternativa.
• Calcular el valor del estadístico
de prueba.
• Redactar la conclusión de una
prueba de hipótesis.

28/01/2018 Adiel Omar FLORES RAMOS 3


Prueba de Hipótesis
Fundamentos

28/01/2018 Adiel Omar FLORES RAMOS 4


HIPÓTESIS

Cualquier afirmación o conjetura que


se hace acerca de algo

28/01/2018 Adiel Omar FLORES RAMOS 5


Hipótesis Estadística

Cualquier afirmación o aseveración acerca de


una propiedad de la población.
Ejemplo:
El promedio ponderado de los alumnos de la UC en el
semestre 2017-1 es superior a 14

28/01/2018 Adiel Omar FLORES RAMOS 6


Prueba de hipótesis estadística

• Es un procedimiento estándar para probar una


aseveración acerca de una propiedad de la
población.
• Llamado también prueba de significancia

28/01/2018 Adiel Omar FLORES RAMOS 7


Hipótesis Nula (H0)
Es la afirmación de que el valor de un parámetro
de la población es igual a un valor aseverado.
Es la hipótesis que es aceptada provisionalmente
como verdadera y cuya validez será sometida a
comprobación

28/01/2018 Adiel Omar FLORES RAMOS 8


Hipótesis Alternativa (H1, Ha, HA)

Es una hipótesis contraria a la hipótesis nula, se


acepta en caso que la hipótesis nula sea
rechazada.

28/01/2018 Adiel Omar FLORES RAMOS 9


Planteamiento de hipótesis

1)H0:  = 0 y H1 :  ≠ 0
2)H0:  ≤ 0 y H1 :  > 0
3)H0:  ≥ 0 y H1 :  < 0
0 es el valor del parámetro
desconocido 

28/01/2018 Adiel Omar FLORES RAMOS 10


Identificación
de H0 y H1

28/01/2018 Adiel Omar FLORES RAMOS 11


Ejemplo: Identificación de las hipótesis nula
y alternativa
a) La proporción de conductores que admiten pasarse la luz
roja es mayor que 0.5.
b) El peso medio de los pasajeros de avión, con su equipaje de
mano, es a lo sumo de 195 libras (la cifra que la Federal
Aviation Administration difunde actualmente).
c) La desviación estándar de las puntuaciones de CI de actores
es igual a 15.

28/01/2018 Adiel Omar FLORES RAMOS 12


SOLUCIÓN

a) H1: p > 0.5,


H0: p = 0.5.
b) H1: µ > 195
H0: µ = 195.
c) H1: σ ≠ 15
H0: σ = 15.

28/01/2018 Adiel Omar FLORES RAMOS 13


TIPOS DE PRUEBAS DE HIPÓTESIS

Depende de la hipótesis alternativa

Prueba de Hipótesis unilateral o Prueba de


una cola
H0:  = 0 y H1 :  > 0
H0:  = 0 y H1 :  < 0

28/01/2018 Adiel Omar FLORES RAMOS 14


TIPOS DE PRUEBAS DE HIPÓTESIS

Prueba de Hipótesis Bilateral o Prueba de dos


cola

H0:  = 0 y H1 :  ≠ 0

28/01/2018 Adiel Omar FLORES RAMOS 15


ESTADÍSTICO DE PRUEBA

• En un valor que se utiliza para tomar la decisión


sobre la hipótesis nula
• Se calcula convirtiendo al estadístico muestral
en una puntuación de una distribución de
probabilidad

28/01/2018 Adiel Omar FLORES RAMOS 16


ESTADÍSTICO DE PRUEBA
Se utiliza la distribución muestral del estadístico de la
prueba a realizar:

28/01/2018 Adiel Omar FLORES RAMOS 17


Herramientas para evaluar
el estadístico de prueba H1 : Ɵ < Ɵ0

• La región crítica (o región de RC


rechazo) es el conjunto de
todos los valores del estadístico
de prueba que pueden H1 : Ɵ > Ɵ0
provocar que rechacemos la
hipótesis nula. RC

H1 : Ɵ ≠ Ɵ0

RC RC

28/01/2018 Adiel Omar FLORES RAMOS 18


Herramientas para evaluar H1 : Ɵ < Ɵ0
el estadístico de prueba
• El nivel de significancia (denotado α
con α) es la probabilidad de que el
estadístico de prueba caiga en la H1 : Ɵ > Ɵ0
región crítica, cuando la hipótesis
nula es verdadera. Si el estadístico
de prueba cae en la región crítica, α
rechazamos la hipótesis nula
H1 : Ɵ ≠ Ɵ0
• Las opciones comunes para a son
0.05, 0.01 y 0.10, aunque la más
común es 0.05.
α/2 α/2
28/01/2018 Adiel Omar FLORES RAMOS 19
Herramientas para evaluar
el estadístico de prueba H1 : Ɵ < Ɵ0

• El valor crítico, es cualquier valor


que separa la región crítica (donde
rechazamos la hipótesis nula) de VC
los valores del estadístico de H1 : Ɵ > Ɵ0
prueba que no conducen al
rechazo de la hipótesis nula.
• Los valores críticos dependen de
la naturaleza de la hipótesis nula, VC
de la distribución muestral que se H1 : Ɵ ≠ Ɵ0
aplique y del nivel de significancia
α.

VC VC 20
28/01/2018 Adiel Omar FLORES RAMOS
EJEMPLO: Cálculo de valores críticos
• Con un nivel de significancia de α=0.05, calcule los valores z
críticos para cada una de las siguientes hipótesis alternativas
(suponiendo que la distribución normal puede emplearse
como aproximación de la distribución binomial):
a) p < 0.5 (de manera que la región crítica está en la cola izquierda de
la distribución normal)
b) p > 0.5 (de manera que la región crítica está en la cola derecha de
la distribución normal)
c) p ≠ 0.5 (de manera que la región crítica está en ambas colas de la
distribución normal)

28/01/2018 Adiel Omar FLORES RAMOS 21


Solución
• Cuando α=0.05 (cola izquierda)
de la tabla A-2  z=-1.645
=INV.NORM.ESTAND(0.05)
• Cuando α=0.05 (cola derecha)
1-0.05=0.95
de la tabla A-2  z=1.645
=INV.NORM.ESTAND(0.95)
• Cuando α=0.05 (cola bilateral)
α/2=0.05/2=0.025
0.025 de la tabla A-2  z=-1.96
=INV.NORM.ESTAND(0.025)
1-0.025=0.975
de la tabla A-2  z=1.96
=INV.NORM.ESTAND(0.975)
28/01/2018 Adiel Omar FLORES RAMOS 22
REGLA DE DECISIÓN
Es la división de la distribución muestral del estadístico de la
prueba en dos partes mutuamente excluyentes:
Región Crítica (RC) : región de rechazo de H0
Región de Aceptación (RA) : región de no rechazo de H0
Depende de la hipótesis alternativa H1 del nivel de significación
y la distribución muestral del estadístico
Valor crítico: es cualquier valor que separa la región crítica y la
región de aceptación

28/01/2018 Adiel Omar FLORES RAMOS 23


Método tradicional
• Rechace H0 si el estadístico de prueba cae dentro de la región
crítica.
• No rechace H0 si el estadístico de prueba no cae dentro de la
región crítica.

28/01/2018 Adiel Omar FLORES RAMOS 24


REGLA DE DECISIÓN: Método tradicional
Prueba de Hipótesis Bilateral o Prueba de dos colas
H0:  = 0 y H1 :  ≠ 0

Prueba de Hipótesis unilateral o Prueba de una cola


a la izquierda
H0:  = 0 y H1 :  < 0

Prueba de Hipótesis unilateral o Prueba de una cola


a la derecha
H0:  = 0 y H1 :  > 0

28/01/2018 Adiel Omar FLORES RAMOS 25


Redacción de la conclusión

28/01/2018 Adiel Omar FLORES RAMOS 26


Ejemplo
• Suponga que un reportero asevera que “más de la mitad”
(más del 50%) de los empleados consiguen trabajo por medio
de redes de contactos.
• Esta aseveración de p > 0.5 se convierte en la hipótesis
alternativa, mientras que p =0.5 se convierte en la hipótesis
nula.
• Además, suponga que la evidencia muestral hace que
rechacemos la hipótesis nula de p = 0.5.
• Enuncie la conclusión en términos sencillos y sin tecnicismos.

28/01/2018 Adiel Omar FLORES RAMOS 27


Solución
• La aseveración original no incluye la condición de igualdad, y
rechazamos la hipótesis nula. Por lo tanto, la redacción de la
conclusión final debe ser la siguiente:
• “Los datos muestrales sustentan la aseveración de que la
mayoría de los empleados consiguen trabajo por medio de
redes de contactos”.

28/01/2018 Adiel Omar FLORES RAMOS 28


Ejercicios

28/01/2018 Adiel Omar FLORES RAMOS 29


Pasos para realizar la prueba de hipótesis
• Plantear la hipótesis nula H0 y alternativa H1
• Elegir el nivel de significación ()
• Elegir y estimar el estadístico de prueba
• Establecer la regla de decisión
• Tomar la decisión
• Redactar la conclusión

28/01/2018 Adiel Omar FLORES RAMOS 30


Gracias por su atención

Recursos adicionales
https://1drv.ms/f/s!AnpbNMf4AA0wiEV5WjdZUy-Bf9p1

Mg. Adiel Omar FLORES RAMOS


aflores@continental.edu.pe
(#)964660405 - 964378423
Inferencia a partir de dos
muestras
Estadística Aplicada
Mg. Adiel Omar FLORES RAMOS

2
Propósito semanal
• Construir un estimado de un intervalo de
confianza de la diferencia entre las
proporciones poblacionales
correspondientes.
• Probar una aseveración acerca de dos
proporciones poblacionales
Contenido

• Inferencia a partir de dos


muestras.
• ANOVA.
Inferencias a partir de
dos poblaciones
Introducción
• Existen muchas situaciones importantes y significativas en las
que es necesario comparar dos conjuntos de datos
muestrales.
• Poner a prueba la aseveración de que, cuando se trata el síndrome
del túnel carpiano, la cirugía es más exitosa que la aplicación de un
entablillado.
• Cuando se prueba la eficacia de la vacuna de Salk en la prevención de
la poliomielitis paralítica, determinar si el grupo de tratamiento tiene
una menor incidencia de poliomielitis que el grupo al que se
administró un placebo.
Introducción
• Cuando se prueba la eficacia del Lipitor, determinar si los sujetos
tienen niveles más bajos de colesterol después de tomar el fármaco.
• Dados dos grupos similares de sujetos con depresión bipolar,
determinar si el grupo tratado con paroxetina obtiene puntuaciones
más bajas en la escala de depresión Hamilton que el grupo que
recibió un placebo.
Requisitos
1. Tenemos proporciones de dos muestras aleatorias simples
que son independientes. (Las muestras son independientes
si los valores muestrales seleccionados de una población no
están relacionados ni apareados de alguna forma con los
valores muestrales seleccionados de la otra población).
2. Para ambas muestras, el número de éxitos es de al menos 5
y el número de fracasos es de al menos 5.
Notación para dos proporciones
Proporción muestral agrupada
Estadístico de prueba para dos proporciones
(con H0: p1 = p2)
Prueba de Hipótesis
• Ahora consideraremos pruebas de hipótesis acerca de dos
proporciones poblacionales, pero sólo nos ocuparemos de
pruebas que tienen la hipótesis nula p1 = p2.
• En específico, usted debe reconocer que bajo el supuesto de
igualdad de proporciones, el mejor estimado de la proporción
común se obtiene al combinar ambas muestras en una
muestra grande, de manera que p es el estimador de la
proporción poblacional común.
Ejemplo: ¿La cirugía es mejor que el
entablillado?
• Se incluye los resultados de una prueba clínica en la que se dio
tratamiento a pacientes con síndrome de túnel carpiano, los
resultados se resumen en la tabla:
Ejemplo: ¿La cirugía es mejor que el
entablillado?
• Utilice los datos muestrales de la tabla, con un nivel de
significancia de 0.05 para probar la aseveración de que la tasa
de éxito de la cirugía es mejor que la tasa de éxito del
entablillado.
Solución
• Paso 1:
La aseveración de una mayor proporción de éxitos en el grupo de tratamiento
con cirugía se expresa como p1 > p2.
• Paso 2:
Si p1 > p2 es falso, entonces p1 ≤ p2.
• Paso 3:
• Puesto que nuestra aseveración de p1> p2 no contiene igualdad, se
convierte en la hipótesis alternativa. La hipótesis nula es la afirmación de
igualdad, entonces tenemos:
H0: p1 = p2
H1: p1 > p2 (aseveración original)
Solución
• Paso 4:
• El nivel de significancia es a 0.05.
• Paso 5:
• Utilizaremos la distribución normal (con el estadístico de prueba)
como una aproximación de la distribución binomial.
• Estimamos el valor común de p1 y p2 con el estimado de la muestra
agrupada p
Solución
• Paso 6
Estadístico de prueba
Solución
Solución
Inferencias acerca de
dos medias:
Muestras
independientes
Muestras independientes con σ1 y σ2
desconocidas y sin suposición de igualdad
• Dos muestras son independientes si los valores muestrales
seleccionados a partir de una población no están relacionados,
apareados o asociados de alguna manera con los valores
muestrales seleccionados a partir de la otra población. Si
existe alguna relación, de modo que cada valor en una
muestra esté apareado con un valor correspondiente en la
otra muestra, las muestras son dependientes.
• Las muestras dependientes se conocen con frecuencia como
datos apareados o muestras equiparadas.
Supuestos
1. Las dos muestras son independientes.
2. Ambas muestras son muestras aleatorias simples.
3. Cualquiera o ambas de estas condiciones se satisfacen:
• los dos tamaños de muestra son grandes (con n1 > 30 y n2 > 30) o
• ambas muestras provienen de poblaciones que tienen distribuciones
normales.
Estadístico de prueba de hipótesis para dos
medias: muestras independientes
EJEMPLO: Discriminación por edad
• Los Revenue Commissioners de Irlanda realizaron un concurso de
promoción. A continuación se muestran las edades de los
solicitantes que tuvieron éxito y de los que no tuvieron éxito.
• Algunos de los solicitantes que no tuvieron éxito para obtener la
promoción se quejaron de que hubo discriminación por edad en la
competencia.
• Maneje los datos como muestras de poblaciones más grandes y
utilice un nivel de significancia de 0.05 para poner a prueba la
aseveración de que los solicitantes sin éxito provienen de una
población con una edad media mayor que la de los solicitantes
exitosos.
• Con base en el resultado, ¿parece haber discriminación por la
edad?
EJEMPLO: Discriminación por edad
Prueba de Hipótesis
• Paso 1:
La aseveración de que en los solicitantes sin éxito tienen una edad
media mayor que la edad media de los solicitantes con éxito se expresa
simbólicamente como µ1 > µ2.
• Paso 2:
Si la aseveración original es falsa, entonces µ1 ≤ µ2 .
Prueba de Hipótesis
• Paso 3:
La hipótesis alternativa es la expresión que no contiene igualdad, y la
hipótesis nula es una expresión de igualdad, de manera que tenemos
H0: µ1 = µ2 H1: µ1 > µ2 (aseveración original)
0 2 1 2

Ahora procedemos con la suposición de que µ1 = µ2 o µ1 - µ2 = 0


Prueba de Hipótesis
• Paso 4:
El nivel de significancia es a 0.05.
• Paso 5:
Puesto que tenemos dos muestras independientes y estamos
probando una aseveración acerca de dos medias poblacionales,
utilizamos una distribución t con el estadístico de prueba dado.
Prueba de Hipótesis
• Paso 6:
El estadístico de prueba se calcula como sigue:

Como estamos utilizando una distribución t, los valores críticos de t =


1.717 se encuentran en la tabla A-3. El estadístico de prueba, el valor
crítico y la región crítica se muestran en la figura.
Prueba de hipótesis

• Paso 7:
• Puesto que el estadístico de prueba no se ubica dentro de la región
crítica, no se rechaza la hipótesis nula µ1 = µ2 (o µ1 - µ2 =0).
Interpretación
• No existe evidencia suficiente para sustentar la aseveración de que
la edad media de los solicitantes sin éxito es mayor que la edad
media de los solicitantes con éxito. Con base en esta prueba de
hipótesis, no parece existir discriminación por edad.
• Sin embargo, la prueba de hipótesis toma en cuenta una faceta de
la situación general, y existen otros factores que podríamos
considerar. Por ejemplo, podríamos comparar la proporción de
solicitantes mayores de 50 años que tuvieron éxito con la
proporción de solicitantes menores de 50 años que tuvieron éxito.
• Dos especialistas en estadística presentaron evidencias en el juicio
y llegaron a conclusiones diferentes. La corte determinó que había
“un vínculo entre la edad de los candidatos y su éxito o fracaso en
la competencia”.
Análisis de varianza
ANOVA
¿Por qué ANOVA?

Es un método de prueba de igualdad de


tres o más medias poblacionales, por
medio del análisis de varianzas muestrales
DISTRIBUCIÓN F

Como se van a comparar


varianzas, entonces se utiliza
la distribución F
ANOVA DE UN
FACTOR
ANOVA DE UN FACTOR

Llamado también ANOVA de una vía


o una entrada
Se emplea una sola propiedad o
característica para categorizar las
poblaciones
DEFINICIONES

Unidades Experimentales : Objetos que reciben el


tratamiento
Tratamientos o factor: Es una propiedad o
característica que nos permite distinguir entre si a
las distintas poblaciones
SUPUESTOS ESENCIALES

1. Todas las poblaciones involucradas son normales


2. Todas las poblaciones tienen la misma varianza
3. Las muestras son aleatorias simples
4. Las muestras son independientes
5. Las muestras provienen de poblaciones que están
categorizadas de una sola forma
HIPÓTESIS

H 0 : 1   2  ...   k
Al menos una de las medias
H1 : poblacionales es diferente a
las otras
ESTADISICO DE PRUEBA

varianza entre las muestras


F
varianza dentro de las muestras
REGLA DE DECISIÓN

Si F > Fc Rechazar la hipótesis Nula


Cálculos con tamaños muestrales iguales

2
ns
F 2
x
s p
Grados de Libertad:
gl del numerador = k – 1
gl del denominador = k(n - 1)
Calculo con tamaños muestrales Desiguales

Suma de cuadrados total



SC(total)   x  x  2

Suma de cuadrados entre tratamientos

SC(tratamiento)   ni x i  x 
2

Suma de cuadrados del error


SC(error)   (ni  1) s2
i
CUADRADOS MEDIOS

Cuadrado Medio del Tratamiento


SC (tratamiento)
CM (tratamiento) 
k 1
Cuadrado Medio del Error
SC(error)
CM (error) 
nk
Cuadrado Medio Total
SC (total)
CM (total) 
n 1
ESTADÍSTICO DE PRUEBA

CM (tratamiento)
F
CM (error)

Grados de liberad:
gl del numerador = k - 1
gl del denominador = n - k
TABLA ANOVA

Fuente de Suma de Grados de Cuadrado medio Valor F


variación cuadrados libertad
Tratamiento SC(tratamiento) k -1 CM (tratamiento)
CM(tratamiento)
F
Error SC(error) n–k CM(error) CM(error)

Total SCT n–1


PRUEBA DE COMPARACIÓN MÚLTIPLE
DE BONFERRONI
• Paso 1: Realice una prueba t separada para cada par de muestras,
haciendo los ajustes de los siguientes pasos
• Paso 2; Calcule para cada par de muestras el valor de t
• Paso 3: Calcule el valor t crítico o el valor de P
xi  x j
t
1 1
CM (error).  
n n 
 i j 

➢ Valor de P: elegir t con gl=n-k y ajuste el valor de P multiplicándolo


por el número de pares de muestras diferentes posibles
➢ Valor Crítico: ajuste el nivel de significancia α dividiéndolo entre el
número de pares de muestras posibles
Ejemplo: ¿Tratamientos diferentes afectan
los pesos de álamos?
• El conjunto de datos incluye los pesos (en kilogramos) de álamos
que recibieron distintos tratamientos en terrenos diferentes. Sólo
consideraremos los pesos del año 1 en el terreno 1, el cual tiene un
suelo fértil y húmedo, y se localiza cerca de un arroyo.
Ejemplo: Pesos de álamos
• Dados los pesos de álamos listados en la tabla anterior, y un
nivel de significancia de a 0.05, pruebe la aseveración de que
las cuatro muestras provienen de poblaciones con medias
diferentes.
Solución
• Paso 1:
Las hipótesis son:
Ho: µ1 = µ2 = µ3 = µ4
H1: Por lo menos una de las medias poblacionales de los bloques no es
igual las otras.
• Paso 2:
Calcular las medias de cada bloque y la media global.
• Paso 3
Obtener la suma de los cuadrados totales  SCT
Solución
• Paso 4:
Obtener la suma de los cuadrados de las variaciones entre los
tratamientos  SCTR
• Paso 5
Calcular la suma de cuadrados de la variación aleatoria, también
llamada suma de cuadrados del error, y es la variación dentro del
tratamiento  SCE
Solución
• Paso 6
Verificar la igualdad
SCT = SCTR + SCE
• Paso 7
Se obtiene el promedio de los cuadrados entre tratamientos PCTR,
para ello se divide SCTR entre los grados de libertad de los
tratamientos gtratamientos. Éste es el primer promedio de cuadrados
(varianza).
Solución
• Paso 8
Se obtienen la media de los cuadrados del error PCE, para ello se divide
SCE entre los grados de libertad totales gtotales. Éste es el segundo
promedio de cuadrados.
• Paso 9
Se obtiene el valor empírico de F, o sea el F calculado, que es el
cociente de estos dos últimos promedios de cuadrados.
Solución
• Paso 10
El valor F crítico se busca en la tabla correspondiente a la distribución F,
para el nivel de significancia correspondiente 0.05 con 3 grados de
libertad para el numerador y 16 grados de libertad para el
denominador.
• Paso 11
La regla de decisión: se rechaza la Ho si el Fcalculado es mayor que el
Fcrítico.
ANOVA DE DOS
FACTORES
¿CUÁNDO SE UTILIZA?

El ANOVA de dos vías se utiliza cuando


existe influencia de dos factores en las
unidades experimentales.
Requiere que se haga una prueba de iteración
entre los dos factores, para verificar si el
efecto de uno de los factores cambia en las
diferentes categorías del otro factor.
REQUISITOS
• Los valores muestrales provienen de una población con una
distribución que es aproximadamente normal.
• Las poblaciones tienen la misma varianza o desviación
estándar
• Las muestras son aleatorias simples
• Las muestras son independientes entre si
• Los valores muestrales se categorizan en dos factores
• Todas las celdas tienen mismo número de valores muestrales
PROCEDIMIENTO DEL ANOVA DE DOS
FACTORES

Paso 1: Efecto de interacciones: se debe probar la


hipótesis nula de que no existe interacciones entre los dos
factores.
Paso 2: Efectos renglón/columna:
➢ Si rechazamos la hipótesis nula no se debe seguir con
las pruebas adicionales.
➢ Si no rechazamos la hipótesis nula entonces
procedemos a probar las siguientes dos hipótesis:
PLANTEAMIENTO DE HIPÓTESIS

Hipótesis con respecto a los bloques


H 0 : 1   2  ...   r No existe efectos del factor de renglón = las
medias de la fila o renglón son iguales
H1 : No todas las medias de la filas o renglón son iguales

Hipótesis con respecto a los tratamientos


H 0 : 1   2  ...   c No existe efectos del factor de columna= las
medias de la columnas son iguales

H1 : No todas las medias de las columnas son iguales


SUMA DE CUADRADOS

Suma de Cuadrados del Total

SCT = SCTR + SCE + SCBL

Donde :
SCT y SCTR se calculan de la misma manera que ANOVA de
una vía
SUMA DE CUADRADOS

y la SCBL (Suma de cuadrados de bloques)


está dado por:

SCBL   ci ( xi  x) 2

Suma de Cuadrados del Error

SCE = SCT - SCTR - SCBL


CUADRADOS MEDIOS

CUADRADO MEDIO DEL TOTAL


SCT
CMT 
n 1
CUADRADO MEDIO DEL TRATAMIENTO

SCTR
CMTR 
c 1
CUADRADOS MEDIOS

CUADRADO MEDIO DEL ERROR


SCE
CME 
(r  1)(c  1)
CUADRADO MEDIO DEL BLOQUE
SCBL
CMBL 
r 1
Donde : r es el número de bloques
VALOR DE F

Determinar la diferencia significativa entre las medias


de los tratamientos
CMTR
F
CME
Determinar si los bloques se realizaron de manera
efectiva o si loa bloques afectar a los tratamientos

CMBL
F
CME
EJEMPLO
Una empresa de contabilidad grande trata de
seleccionar un sistema de computación integrado
a la oficina, entre los tres modelos que están
actualmente en estudio. La selección final
dependerá de la productividad de los sistemas.
Se seleccionan aleatoriamente 5 operadores para
manejar cada sistema. Es importante tener en
cuenta que el nivel de experiencia que tienen los
empleados en el manejo de computadoras puede
afectar el resultado de la prueba.
EJEMPLO - continuación

Por tanto, existe la necesidad de justificar el


impacto de la experiencia al determinar los
meritos relativos de los sistemas de
computación. Los niveles resultantes de
producción medidos en unidades por hora se
muestran a continuación
EJEMPLO - Continuación
Niveles de producción para los sistemas de
computación
Nivel de Sistemas
Experiencia 1 2 3
1 27 21 25
2 31 33 35
3 42 39 39
4 38 41 37
5 45 46 45
EJEMPLO - Continuación

Hipótesis con respecto a los bloques


H 0 : 1   2  3   4  5
El nivel promedio de producción para cada
nivel de experiencia es el mismo
H1 : Al menos una de las medias de producción
para cada nivel de experiencia (las filas) no
son iguales
EJEMPLO - Continuación

Hipótesis con respecto a los tratamientos


H 0 : 1   2  3
La producción promedio de los sistemas de
computación son iguales

H1 : Al menos una de las medias de los sistemas


de computación (las columnas) no son
iguales
Gracias por su atención

Recursos adicionales
https://1drv.ms/f/s!AnpbNMf4AA0wiEV5WjdZUy-Bf9p1

Mg. Adiel Omar FLORES RAMOS


aflores@continental.edu.pe
(#)964660405 - 964378423
Análisis de correlación y
regresión lineal
Estadística Aplicada
Mg. Adiel Omar FLORES RAMOS

1y2
Propósito de la
• Interpreta los
resultados gráficos

sesión
y numéricos de la
correlación y
regresión de dos
variables.
Contenido
• Introducción
• Diagramas de Dispersión
• Coeficiente de Correlación
• Regresión lineal
• Prueba de Hipótesis de
Correlación
Introducción
Introducción
• Mediante la correlación y regresión, analizaremos el análisis
de situaciones que se presentan en una distribución que
contienen dos variables X y Y.
• El espacio muestral de un experimento con dos variables es
cierto conjunto de pares ordenados de medidas, es decir, dos
observaciones por cada prueba.

03/03/2018
Mag. Adiel Omar FLORES RAMOS 5
Introducción
• Nuestro principal objetivo, al analizar las dos variables X y Y, es
el poder determinar la relación entre éstas dos variables, es
decir como se comportan las dos variables una con respecto a
la otra.
• También nos interesa encontrar una ecuación, de tal manera
que basándonos en una determinada cantidad X podamos
estimar el promedio de cantidad Y.

03/03/2018
Mag. Adiel Omar FLORES RAMOS 6
Introducción
• Así, una ecuación de éste tipo que relaciona las dos variables,
una dependiente de la otra se puede considerar como una
relación de estimación.
• La ecuación que relaciona éstas dos variables se llama
ecuación de Regresión de Y respecto a X.

03/03/2018
Mag. Adiel Omar FLORES RAMOS 7
Diagramas de
dispersión
DIAGRAMAS DE DISPERSION
• Un diagrama de dispersión es
una gráfica en la que cada
punto trazado representa un
par de valores observados de
las variables independientes y
dependientes.

03/03/2018 Mag. Adiel Omar FLORES RAMOS 9


DIAGRAMAS DE DISPERSION
• El valor de la variable independiente X se ubica en el eje
horizontal mientras que el valor de la variable dependiente Y
se ubica en el eje vertical, una vez ubicados en un plano
cartesiano podemos obtener una imagen de como está
distribuida la muestra bien sea (línea positiva, línea inversa o
no hay relación, entre otras).

03/03/2018
Mag. Adiel Omar FLORES RAMOS 10
Correlación Positiva Perfecta

03/03/2018
Mag. Adiel Omar FLORES RAMOS 11
Correlación negativa Perfecta

03/03/2018
Mag. Adiel Omar FLORES RAMOS 12
Correlación positiva estrecha

03/03/2018
Mag. Adiel Omar FLORES RAMOS 13
Correlación negativa moderada

03/03/2018
Mag. Adiel Omar FLORES RAMOS 14
Correlación positiva moderada

03/03/2018
Mag. Adiel Omar FLORES RAMOS 15
Correlación nula

03/03/2018
Mag. Adiel Omar FLORES RAMOS 16
Coeficiente de
correlación
Coeficiente de correlación de Pearson
• En la mayoría de los casos el principal interés del investigador
no solamente está en poder medir la relación que puede
existir, entre las dos variables, directa e inversa , sino que
además se concentra en determinar si están o no
correlacionadas, y en caso afirmativo, en hallar que tan fuerte
es éste grado de relación.

03/03/2018
Mag. Adiel Omar FLORES RAMOS 18
Coeficiente de correlación de Pearson
• Esta técnica analítica que se utiliza en hallar este grado de
relación, recibe el nombre de análisis de correlación.
• El valor del coeficiente de correlación puede ir de -1.00 a
+1.00.
• El signo aritmético asociado con el coeficiente de correlación
indica la dirección de la relación entre X y Y (positivo igual a
directa; negativo igual inversa).

03/03/2018
Mag. Adiel Omar FLORES RAMOS 19
Coeficiente de correlación de Pearson
• Cuando las dos variables no están correlacionadas el
coeficiente de correlación es 0 o muy cercano a 0.
• Con base a éstos hechos, podemos deducir que mientras más
cerca esté el valor numérico del coeficiente de correlación a
+1 o -1, entonces más estrecho será el grado de relación de las
variables estudiadas.

03/03/2018
Mag. Adiel Omar FLORES RAMOS 20
Coeficiente de correlación de Pearson

03/03/2018 Mag. Adiel Omar FLORES RAMOS 21


Interpretación
Valor Significado
-1 Correlación negativa grande y perfecta
-0,9 a -0,99 Correlación negativa muy alta
-0,7 a -0,89 Correlación negativa alta
-0,4 a -0,69 Correlación negativa moderada
-0,2 a -0,39 Correlación negativa baja
-0,01 a -0,19 Correlación negativa muy baja
0 Correlación nula

03/03/2018
Mag. Adiel Omar FLORES RAMOS 22
Interpretación
Valor Significado
0 Correlación nula
0,01 a 0,19 Correlación positiva muy baja
0,2 a 0,39 Correlación positiva baja
0,4 a 0,69 Correlación positiva moderada
0,7 a 0,89 Correlación positiva alta
0,9 a 0,99 Correlación positiva muy alta
1 Correlación positiva grande y perfecta

03/03/2018
Mag. Adiel Omar FLORES RAMOS 23
Ejemplo ilustrativo:
• La tabla presenta el peso y la presión sanguínea de una
muestra aleatoria de 7 universitarios.

a) Halle e interprete el coeficiente de correlación de Pearson y


grafique el diagrama de dispersión.
b) Halle e interprete el coeficiente de determinación.
c) Realice la prueba de significancia para α=0,02.
Solución

El coeficiente de correlación
indica que entre el peso y la
presión sanguínea de los 7
universitarios existe una
correlación positiva baja.
Solución: Coeficiente de determinación
• El coeficiente de determinación: cd= r2, entonces:
cd= (0,34)2= 0,1156≈11,56%
• Interpretación: Existe una baja asociación entre las variables.
La variación de cerca del 11,56% de las presiones sanguíneas
se explica por la variación de los pesos de los 7 universitarios.
Prueba de Hipótesis
de correlación
Introducción
• Cuando se prueban hipótesis o cuando se hacen inferencias
sobre una correlación, se deben cumplir las siguientes
condiciones:
• La muestra de datos apareados (x; y) es una muestra aleatoria de
datos cuantitativos.
• El diagrama de dispersión debe confirmar que los puntos se
aproximan al patrón de una línea recta.
• Es conveniente eliminar los valores extremos, si existieran, ya que es
muy probable que sea producto de algún error.
• En la prueba de hipótesis se formulan las siguientes hipótesis:
• H0: ρ=0 (No existe una correlación lineal entre las variables)
• H1: ρ≠0 (Existe una correlación lineal entre las variables)
El estadístico de prueba
• El estadístico de prueba es la t de Student, para n-2 grados de
libertad:

• Conclusión
• Si │t│> tα/2 (valor crítico de la tabla A-3), rechace H0 y concluya que
existe una correlación lineal.
• Si │t│≤ tα/2, no rechace H0 y concluya que no hay evidencia suficiente
para afirmar que existe una correlación lineal.
Ejemplo
• La tabla presenta el peso y la presión sanguínea de una
muestra aleatoria de 7 universitarios.

• Realice la prueba de significancia para α=0,02.


Prueba de Hipótesis
• Paso 1: Formulación de H0 y H1
• H0: No existe una correlación significativa entre el peso y la presión
sanguínea
• H1: Si existe una correlación significativa entre el peso y la presión
sanguínea.
• Paso 2: Nivel de significancia α=0,02
• Paso 3: Se utiliza la prueba t de Student para la correlación de
Pearson.
• Paso 4: Para los grados de libertad: g.l.=7-2=5; α=0,02 se tiene
en la tabla A-3: tα/2=3,365
Prueba de Hipótesis
• Paso 4:
• Para los grados de libertad: g.l.=7-2=5;
• α=0,02
• se tiene en la tabla A-3: tα/2=3,365
• Paso 5: Hallamos el valor de la t de Student calculado (tc)

• Regla de decisión: Se rechaza H0 si ocurre que │0,808│>3,365


Prueba de Hipótesis
• Paso 6:
• Para un 98% de nivel de confianza no es posible rechazar H0, por lo
que se asevera que:
No existe una correlación significativa entre el peso y la presión
sanguínea de los 7 universitarios que participan en la investigación.
Regresión lineal
Ecuación de regresión lineal
• Es necesario definir una recta de tal manera que las suma de
los cuadrados entre las diferencia de los valores de Y y los
correspondiente valores calculados por medio de la recta para
cada valor de X sea el más pequeño.
• Este método conocido como el método de los mínimos
cuadrados es el más comúnmente usado en estadística para
obtener la recta de mejor ajuste.

03/03/2018
Mag. Adiel Omar FLORES RAMOS 35
Regresión Lineal
• Recordemos que la forma general de la ecuación de la línea
recta es Y = mX + b, que es la ecuación que queremos estimar
y la llamaremos:
Y = mX + b
• Para encontrar esta ecuación utilizamos las siguientes
fórmulas:

03/03/2018
Mag. Adiel Omar FLORES RAMOS 36
Pendiente e intercepto
• Pendiente de la recta • Intercepto o corte con el
eje Y
n __ __
 X iYi  n X Y __ __
m i 1 bYmX
n __
 Xi  n( X )
2 2

i 1

03/03/2018 Mag. Adiel Omar FLORES RAMOS 37


EJEMPLO PRACTICO X= cantidad de agua lluvia Y= cosechas de maíz
(metros cúbicos) mill. De libras

• Supóngase que se desea 45 6,53


determinar la posible relación 42 6,3
existente entre la cantidad de 56 9,52
agua lluvia en una región, y la 48 7,5
cantidad de maíz recolectada 42 6,99
en 10 haciendas diferentes,
35 5,9
durante un cierto periodo de
tiempo: 58 9,49
40 6,2
39 6,55
50 8,72
03/03/2018
Mag. Adiel Omar FLORES RAMOS 38
Ejemplo
• Estimar cuantos mill. de libras produciría cuando hay una
precipitación pluvial de 40 m3.
• Cuántos m3 de agua lluvia se necesitaría para producir una
cosecha de 9 mill. Lib. De maíz.

03/03/2018
Mag. Adiel Omar FLORES RAMOS 39
Ecuación de Regresión

X= cantidad de agua Y= cosechas de maíz X*Y X2 Y2


45 6,53 293,85 2025 42,641
n
42 6,3 264,6 1764 39,69
X i
455
56 9,52 533,12 3136 90,63 X i 1
  45.50
48 7,5 360 2304 56,25
n 10
42 6,99 293,58 1764 48,86
35 5,9 206,5 1225 34,81
58 9,49 550,42 3364 90,06 n

40 6,2 248 1600 38,44 Y i


73.70
39 6,55 255,45 1521 42,903 Y i 1
  7.37
n 10
50 8,72 436 2500 76,038
455 73.70 3441.52 21203 560.3224

03/03/2018 Mag. Adiel Omar FLORES RAMOS 40


Tenemos que:
n __ __
 X iYi nX Y
i 1
m __ __
n __
b Ym X
 i 
2 2
X n ( X )
i 1

∑xy=3441.52 m=
n=10 𝑥ҧ = 45.50
𝑥ҧ = 45.50 𝑦ത = 7.37
𝑦ത = 7.37
∑x2=21203

03/03/2018 Mag. Adiel Omar FLORES RAMOS 41


Tenemos que:
n __ __
 X iYi  n X Y b Ym X
__ __
i 1
m n __
 i 
2 2
X n ( X )
i 1

3441.52  10(45.50)(7.37) 88.17


m   0.176
21203  10(45.50) 2
500.50

b  7.37  0.176(45.50)  7.37  8.01  0.64

03/03/2018 Mag. Adiel Omar FLORES RAMOS 42


Solución
• Así que la ecuación de la recta de regresión de Y con
respecto a X será:

Y = mX + b
Solución
• Así que la ecuación de la recta de regresión de Y con
respecto a X será:

Y = mX + b
Y = 0.176 (X) – 0.64
Predicción de otros valores

• Para un supuesto de 40 m3 de precipitación lluviosa, ¿cuánta


cosecha se espera?
• Si X= 40 Y=?

03/03/2018
Mag. Adiel Omar FLORES RAMOS 45
Predicción de otros valores

• Si X= 40 Y=?
Y* = 0.176 (40) – 0.64= 6.4
Lo que significa que para un supuesto de 40 met. Cub. de
precipitación de agua lluvia se espera una cosecha de 6.4 mill.
de lib. de maíz.

03/03/2018
Mag. Adiel Omar FLORES RAMOS 46
- Si Y = 9 X=?

Y  0.64 9  0.64
X*    54.77
0.176 0.176

Lo que significa que para obtener una cosecha de 9 mill. Lib. De


maiz deben precipitarse 54.77 met. Cub. de agua lluvia.

03/03/2018
Mag. Adiel Omar FLORES RAMOS 47
Gracias por su atención

Recursos adicionales
https://1drv.ms/f/s!AnpbNMf4AA0wiEV5WjdZUy-Bf9p1

Mg. Adiel Omar FLORES RAMOS


aflores@continental.edu.pe
(#)964660405 - 964378423
Análisis de correlación y
regresión lineal
Estadística Aplicada
Mg. Adiel Omar FLORES RAMOS

1y2
Propósito de la
• Interpretar
pronósticos

sesión
utilizando el análisis
de correlación,
regresión y modelos
de series de tiempo.
Contenido

• Regresión múltiple. Análisis


de mullticolinealidad.
• Validación de modelos.
• Modelos de series de
tiempo.
Regresión
múltiple
Introducción
• En este capítulo se amplía el estudio de la correlación y de la
regresión, analizando la influencia de dos o más variables
independientes sobre la variable dependiente, al cual se
denomina análisis de regresión y correlación múltiples.
• Una ecuación de regresión múltiple expresa una relación lineal
entre una variable de respuesta y dos o más variables de
predicción (x1; x2;….xk)

29/05/2017
Mag. Adiel Omar FLORES RAMOS 5
Ecuación de regresión
• La forma general de la ecuación de regresión múltiple estimada:

• Donde:
• n: tamaño de la muestra
• k: número de variables de predicción o variables independientes.
• y: valor predicho de y
• x1; x2; … ; xk: son las variables de predicción
• β0: intercepto y, o el valor de y cuando todas las variables de predicción son
0 (este valor es un parámetro poblacional)
• b0: estimado de β0 basado en los datos muestrales (b0 es un estadístico
muestral)
• β1; β2;…; βk: son los coeficientes de las variables de predicción: x1; x2;…; xk
• b1; b2;…; bk: son estimados muestrales de los coeficientes:β1; β2;…; βk
Estadísticos de la regresión
• Matriz de correlación: Es una matriz que contiene los
coeficientes de correlación entre todos los pares de variables,
la cual ayuda a identificar cuáles son las variables
relativamente más importantes.
• Coeficiente múltiple de determinación (R2): Es una medida
que denota lo bien que se ajusta la ecuación de regresión
múltiple a los datos muestrales si se tiene la matriz de
correlación de las variables de la ecuación de regresión
múltiple: ŷ = b0 + b1x1+ b2x2
DEMO
Análisis de
multicolinealidad
Multicolinealidad
• Es la correlación que existe entre las variables independientes,
las que se deben analizar mediante el uso de una matriz de
correlación entre las variables.
• Las variables independientes correlacionadas dificultan las
inferencias acerca de los coeficientes de regresión individuales
y sus efectos individuales sobre la variable dependiente.
• En la práctica, es casi imposible seleccionar variables que
carezcan por completo de alguna relación.
Multicolinealidad
• Primero, se debe destacar que la multicolinealidad no afecta la
capacidad de una ecuación de regresión múltiple para
predecir la variable dependiente.
• No obstante, cuando se tenga interés en evaluar la relación
entre cada variable independiente y la variable dependiente,
la multicolinealidad puede presentar resultados inesperados.
Multicolinealidad
• Una segunda razón para evitar variables independientes
correlacionadas es que pueden generar resultados erróneos en las
pruebas de hipótesis para las variables independientes
individuales. Esto se debe a la inestabilidad del error estándar de
estimación.
• Varias pistas que indican problemas con la multicolinealidad
incluyen lo siguiente:
1. Una variable independiente conocida como anticipador importante
resulta con un coeficiente de regresión que no es significativo.
2. Un coeficiente de regresión que debiera tener un signo positivo resulta
negativo, o lo contrario.
3. Cuando se agrega o elimina una variable independiente, hay un cambio
drástico en los valores de los coeficientes de regresión restantes.
Multicolinealidad
• Un método práctico que se utiliza es que las correlaciones
entre variables independientes, cuyo valor está comprendido
entre -0,70 y 0,70, no ocasionan dificultades.
• Una prueba mas precisa es utilizar el factor de inflación de la
varianza, el cual por lo general se escribe VIF. El valor de VIF
se determina como sigue:
1
𝑉𝐼𝐹 =
1 − 𝑅2
Multicolinealidad
• El termino R2 se refiere al coeficiente de determinación, donde
la variable independiente seleccionada sirve como una
variable dependiente, y las variables independientes
restantes, como variables independientes.
• Un VIF mayor que 10 se considera insatisfactorio, e indica que
la variable independiente se deberá eliminar del análisis.
Ejemplo
• Salsberry Realty vende casas en la costa este de Estados Unidos. Una de
las preguntas mas frecuentes de los compradores potenciales es: si
compramos esta casa, ¿cuanto gastaremos en calefacción durante el
invierno?
• Al departamento de investigación de Salsberry se le pidió desarrollar
algunas directrices respecto de los costos de calefacción de casas
unifamiliares. Se considera que tres variables se relacionan con los costos
de calefacción:
1) la temperatura externa diaria media,
2) el numero de pulgadas de aislamiento en el atico y
3) la antigüedad en años del calentador.
• Para el estudio, el departamento de investigación de Salsberry selecciono
una muestra aleatoria de 20 casas de venta reciente. Determino el costo
de calefacción de cada casa en enero pasado, asi como la temperatura
externa en enero en la región, el numero de pulgadas de aislamiento en el
ático y la edad del calentador.
DEMO
Validación de
Modelos
Introducción
• Un Modelo matemático es una función matemática que se
“ajusta” o describe datos del mundo real.
• Algunos modelos genéricos que aparecen en la calculadora
científica:

29/05/2017
Mag. Adiel Omar FLORES RAMOS 18
Modelos matemáticos
• El modelo que se
seleccione dependerá de
las características de los
datos muestrales y una
herramienta necesaria es
la elaboración de un
diagrama de dispersión
para decidir el modelo
adecuado.
Reglas para la creación de un modelo
matemático
• Elabore el gráfico de puntos y elija el modelo que visualmente
más se ajuste a los puntos observados, es decir a un modelo
lineal, cuadrático, exponencial, potencial, etc.
• Con la calculadora halle los coeficientes de determinación (r2)
de cada modelo y elija el modelo que tenga el mayor
coeficiente de determinación, ya que éste será el mejor
modelo
• Si trabaja con un software estadístico (como el SPSS) elija el
modelo que tenga el menor p-valor.
Ejemplo
• Un ingeniero descubrió que, al incluir pequeñas cantidades de
un compuesto en baterías recargables para computadoras
portátiles, podría extender su tiempo de vida.
• Experimentó con diferentes cantidades de aditivo y los datos
fueron:
DEMO
Evaluamos el modelo
Conclusión
• De los resultados se observa que el modelo lineal presenta el
mayor coeficiente de determinación (r2=87,10%), seguido del
modelo exponencial (r2=78,55%).
• Por lo tanto se concluye que la ecuación: y=1,2 + 1,8x describe
mejor la relación entre la cantidad de aditivo y el tiempo de
vida adicional de las baterías.
Series
temporales
Serie Temporal Y

• Se llama Series de
Tiempo a un
conjunto de
observaciones
sobre valores que
toma una variable
(cuantitativa) en
diferentes
momentos del
1 2 3 4 5 6 7 8 t
tiempo.

Ing. Sergio Jurado


Utilidad
• Una serie temporal (también denominada histórica,
cronológica o de tiempo) se define como un conjunto de
datos, correspondientes a un fenómeno, ordenados en el
tiempo.

Producto Interno Bruto Cantidad de lluvia caída al


Año a Año. día durante el último
Ventas de nuestra trimestre.
empresa en los últimos 10
años.
Serie Temporal

Estacional Cíclica

Tendencia
Irregular
Secular
Compo
nentes

Ing. Sergio Jurado


Componentes de una Serie Temporal
Secular

Estacional

Cíclica

Irregular
Serie Temporal
Modelo Aditivo
𝑌෠ T E C I

Modelo Multiplicativo
𝑌෠ T E C I

Ing. Sergio Jurado


Métodos de suavizamiento de la serie
• Una forma de visualizar la tendencia, es mediante
suavizamiento de la serie. La finalidad es definir a partir de la
serie observada una nueva serie que suaviza los efectos ajenos
a la tendencia (estacional, efectos aleatorios), de manera que
podamos determinar la dirección de la tendencia.
• Se revisan tres casos:
• Promedio Móvil
• Promedios móviles ponderados.
• Suavizamiento exponencial
Promedio Móvil
• El método promedio móvil emplea el promedio de los n
valores más recientes de datos en la serie de tiempos como
pronósticos para el siguiente periodo. Es uno de los
indicadores más versátiles y de mayor uso dentro de todos los
indicadores.
• La utilización de un promedio móvil muestra la dirección y la
duración de una tendencia, el propósito es ilustrar la
tendencia, de una manera más suavizada.
Promedio Móvil
• Se construye sustituyendo cada valor de una serie por la
media obtenida con esa observación y algunos de los valores
inmediatamente anteriores y posteriores.
• A continuación se presenta la fórmula:

σ(𝑛 𝑣𝑎𝑙𝑜𝑟𝑒𝑠 𝑚á𝑠 𝑟𝑒𝑐𝑖𝑒𝑛𝑡𝑒𝑠)


𝑃𝑟𝑜𝑚𝑒𝑑𝑖𝑜 𝑀ó𝑣𝑖𝑙 =
𝑛
DEMO
Promedio móviles ponderados
• Este método consiste en asignar un factor de ponderación
distinto para cada dato.
• Generalmente, a la observación o dato más reciente a partir
del cual se quiere hacer el pronóstico, se le asigna el mayor
peso, y este peso disminuye en los valores de datos más
antiguos.
• La suma de los factores de ponderación siempre debe ser igual
a 1.
DEMO
Suavizamiento exponencial
• Este método emplea el promedio ponderado de la serie de
tiempo pasado como pronóstico, es un caso especial del
método de promedios móviles ponderados en el cual sólo se
selecciona el peso o factor de ponderación más reciente. El
siguiente modelo corresponde al método de suavizamiento
exponencial:
𝐹𝑡+1 =∝ 𝑌𝑡 + (1 −∝)𝐹𝑡
• Donde
• Ft+1= pronóstico de la serie de tiempo para el periodo t+1
• Yt = valor real de la serie de tiempo en el periodo t
• Ft= pronóstico de la serie de tiempo para el periodo t
• ∝ = constante de suavizamiento, 0≤ ∝ ≤1
DEMO
Gracias por su atención

Recursos adicionales
https://1drv.ms/f/s!AnpbNMf4AA0wiEV5WjdZUy-Bf9p1

Mg. Adiel Omar FLORES RAMOS


aflores@continental.edu.pe
(#)964660405 - 964378423
Diseños experimentales
Estadística Aplicada
Mg. Adiel Omar FLORES RAMOS

1, 2 y 3
Propósito de la semana
• Identifica los elementos de
diseño experimental.
• Realiza la prueba de hipótesis
para la diferencia de medias y
luego interpreta los
resultados.
• Aplica experimentos de dos
factores y realiza la prueba
de hipótesis para
experimentos factoriales.
Contenido

• Diseño de experimentos.
• Prueba para la diferencia de
medias.
• Experimento factorial A x B
ANOVA.
Diseño de
experimentos
Introducción
• En los métodos
estadísticos, por lo
general se toman datos
que se obtienen de dos
fuentes distintas:
• las investigaciones
observacionales y
• los experimentos.

03/03/2018
Mag. Adiel Omar FLORES RAMOS 5
DISEÑOS EXPERIMENTALES
• El diseño de experimentos es un conjunto de técnicas que
permiten manipular un proceso para inducirlo a proporcionar
la información que se requiere para mejorarlo mediante
cambios en sus variables y su interacción o secuencia de
ejecución. En suma, es la aplicación del método científico para
generar conocimiento acerca de un proceso o sistema.
Tipos de diseños
Objetivo de un diseño de experimentos
• El objetivo de un diseño de experimentos es proporcionar la
mayor cantidad de información para responder el problema
planteado en la investigación, con un mínimo costo y máxima
eficiencia.
• Los principios básicos del diseño de experimentos es que se
cumplan con la reproducción, aleatorización y control.
Ejemplo
• Un investigador está interesado en estudiar el efecto de los
contenidos televisivos antisociales sobre la conducta agresiva de
los niños, para lo cual establece dos grupos de niños, uno que ven
solo programas televisivos con contenidos antisociales y otro grupo
que ven solo programas televisivos con contenidos prosociales.
• Al finalizar la experiencia se observará cuál de los dos grupos
muestra una mayor conducta agresiva, si ocurriera que el grupo de
niños que vieron programas antisociales muestran mayor conducta
agresiva, frente a los niños que vieron programas prosociales, y si
no hay otra causa posible que hubiera afectado a los grupos de
niños se comprobaría la hipótesis.
Ejemplo
• Hipótesis de investigación: Los programas televisivos con
contenidos antisociales influyen sobre la conducta agresiva de los
niños.
• Variable independiente: Programas televisivos antisociales.
• Variable dependiente: Conducta agresiva de los niños.
• Diseño de investigación: El diseño es cuasi experimental,
pudiéndose utilizar de dos maneras, así:
Diseño experimental completamente
aleatorio
• Es el diseño más simple y sencillo de realizar, en el cual los
tratamientos se asignan entre las unidades experimentales. Este
diseño tiene una amplia aplicación cuando las unidades
experimentales son muy homogéneas, es decir, la mayoría de los
factores actúan por igual entre las unidades.
• El diseño completamente al azar es una prueba basada en el
análisis de varianza, en donde la varianza total se descompone en
“la varianza de los tratamientos” y la “varianza del error”.
• El objetivo es determinar si existe una diferencia significativa entre
los tratamientos, para lo cual se compara si la “varianza del
tratamiento” contra la “varianza del error” y se determina si la
primera es lo suficientemente alta.
Características
a) Se definen los tratamientos que se van aplicar a las n
unidades experimentales, de tal forma que a r unidades
experimentales les va a corresponder un tipo de
tratamiento.
b) Las unidades experimentales se sortean para la asignación a
cada tratamiento.
c) Se define la variable a medir.
Ventajas
a) Es flexible, el número de observaciones puede variar de un
tratamiento para otro.
b) El análisis estadístico es simple, aunque se tengan
tratamientos con diferente número de observaciones.
c) El análisis no se complica cuando se pierde algún dato o
todo un tratamiento.
d) Los grados de libertad son máximos y en experimentos
pequeños con pocos tratamientos y repeticiones
representan una ventaja.
Hipótesis de un diseño completamente al
azar
• En este diseño la hipótesis nula (H0) es que los efectos del
tratamiento son todos iguales, lo que se expresa por:
H0: β1= β2= β3=……
• La hipótesis alterna es que hay al menos un efecto de
tratamiento que es diferente a los demás. Para probar esta
hipótesis se hace uso de la prueba ANOVA.
Prueba para la
diferencia de
medias
Introducción
• El análisis de varianza (ANOVA) de un factor sirve para
comparar varios grupos en una variable cuantitativa. Se trata,
por lo tanto, de una generalización de la prueba “t” de
Student para dos muestras independientes al caso de diseños
con más de dos muestras.
• El análisis de la varianza permite contrastar la hipótesis nula
de que las medias de K poblaciones (K>2) son iguales, frente a
la hipótesis alternativa de que por lo menos una de las
poblaciones difiere de las demás en cuanto a su valor
esperado.
Introducción
• El análisis de varianza es un método de prueba de igualdad de
tres o más medias poblacionales, por medio del análisis de las
varianzas muestrales.
• Formulación de la hipótesis nula (H0) y la hipótesis alterna (H1)
• H0: μ1=μ2=μ3= μ4=….
• H1: No todas las medias son iguales
Estadístico de prueba
• Si el valor estadístico de prueba (ANOVA) nos impulsa a
aceptar la hipótesis nula (H0), se concluye que las diferencias
observadas entre las medias muestrales se deben a la
variación casual en el muestreo (por lo que se asevera que los
valores medios de la población son iguales).
• Si se rechaza la hipótesis nula (H0), se concluye que las
diferencias entre los valores medios de la muestra son
demasiado grandes como para deberse únicamente a la
casualidad (por lo que se asevera que, no todas las medias de
la población son iguales)
ANOVA
• El análisis de varianza requiere el cumplimiento de los
siguientes supuestos:
• Las poblaciones (distribuciones de probabilidad de la variable
dependiente correspondiente a cada factor) son normales.
• Las K muestras sobre las que se aplican los tratamientos son
independientes.
• Las poblaciones tienen todas igual varianza (homocedasticidad).
Análisis de varianza de un factor
• Se utiliza para probar la hipótesis de que tres o más medias
poblacionales son iguales y porque se emplea una sola
propiedad o característica para categorizar las poblaciones.
DEMO
Ejemplo
• Se tiene un nuevo limpiador de uso múltiple cuya demanda se
prueba exhibiéndolo en tres lugares diferentes dentro de
diversos supermercados.
• La tabla muestra el número de botellas de 12 onzas de “Clean
All” que se vendieron en cada ubicación. Al nivel de
significancia del 0,025 ¿existe una diferencia en el número
medio de botellas vendidas según el punto de venta?
Solución
1. Formulación de la hipótesis nula (H0) y la hipótesis alterna
(H1)
• H0: La media del número de botellas vendidas no difieren según el
punto de venta. H0: μ1 = μ2 = μ3
• H1: No todas las medias del número de botellas vendidas en los
puntos de ventas son iguales.
2. Nivel de significación α=0,025
3. Prueba análisis de varianza de un factor (ANOVA).
Solución

• Regla de decisión:
Se rechaza H0 si Fc > F(2; 9)
19,5203 >5,7147
• Conclusión: Se rechaza la hipótesis
nula (H0) y se acepta la hipótesis
alterna (H1), por tanto, se afirma que
el número medio de botellas
vendidas de “Clean All” difieren
según el punto de venta donde se
ubicó el producto, para un nivel de
confianza del 97,5%.
Experimento
factorial AxB
(ANOVA en dos
direcciones)
Introducción
• En un análisis de varianza en dos direcciones se considera una
segunda variable de tratamiento. La segunda variable de
tratamiento se denomina la variable de bloqueo.
• La ventaja de considerar otros factores reside en que se puede
reducir la varianza del error.

03/03/2018 Mag. Adiel Omar FLORES RAMOS 26


DEMO
Ejemplo
• Una empresa de transportes realiza una ampliación de
autobuses desde un punto de la ciudad hasta el centro de la
ciudad. Hay cuatro rutas: A; B; C y D. Se sabe que la empresa
realizó varios recorridos de prueba para determinar si existe
diferencia entre los tiempos utilizados al recorrer las cuatro
rutas. Como hay una gran número de conductores, la prueba
se realizó de manera que cada uno de los conductores
recorriera cada una de las cuatro rutas.
Ejemplo
• A continuación se muestran los tiempos del recorrido, en
minutos de cada combinación conductor-ruta.

• A nivel de significación de 0,05. ¿Existirá alguna diferencia en


el tiempo promedio de viaje en las cuatro rutas y los cinco
conductores elegidos aleatoriamente?
Solución: Tratamientos
• Formulación de la hipótesis nula (H0) y la hipótesis alterna (H1)
• H0: Las medias de las columnas son iguales.
• H1: Las medias de las columnas no son iguales.
• Luego: Fc=4.5378
• Se rechaza H0 si Fc > F(3; 12)  4,5378>3,4903 ………... (V)
• Se rechaza H0 para un 95% de confianza, es decir se asevera
que el tiempo medio de viaje no es el mismo en las cuatro
rutas.
Solución: Bloques
• Formulación de la hipótesis nula (H0) y la hipótesis alterna
(H1)
• H0: Las medias de las filas son iguales.
• H1: Las medias de las filas no son iguales.
• Luego: Fc = 8.2143
• Se rechaza H0 si Fc > F(4; 12)  8,2143>3,2592 ………... (V)
• Se rechaza H0 para un 95% de confianza, es decir se asevera
que el tiempo medio de viaje no es el mismo para los cinco
conductores.
Conclusión
• Finalmente se asevera que
hay diferencia en el tiempo
utilizado en las cuatro rutas y
con los cinco conductores,
para un 95% de nivel de
confianza.
Gracias por su atención

Recursos adicionales
https://1drv.ms/f/s!AnpbNMf4AA0wiEV5WjdZUy-Bf9p1

Mg. Adiel Omar FLORES RAMOS


aflores@continental.edu.pe
(#)964660405 - 964378423
Gráficos de control para la
variación, media y atributos
Estadística Aplicada
Mg. Adiel Omar FLORES RAMOS

4y5
Propósito de la
•Realiza el

semana
control
estadístico de
procesos.
Contenido

• Gráficos de control para la


variación y media.
• Gráficas de control para
atributos.
Gráficos de
control para la
variación y
media
Datos de proceso
• Son datos ordenados de acuerdo con alguna secuencia de
tiempo.
• Son mediciones de una característica de bienes o servicios que
resultan de alguna combinación de equipo, personas,
materiales, métodos y condiciones.
Gráfica de rachas
• Es una gráfica secuencial de valores de datos individuales a lo largo
del tiempo.
• Un eje (generalmente el eje vertical) se utiliza para los valores de
los datos y el otro eje (generalmente el eje horizontal) se emplea
para la secuencia de tiempo).
Interpretación de una gráfica de rachas
• Un proceso es estadísticamente estable o se encuentra bajo
control estadístico si sólo varía de forma natural, sin patrones,
sin ciclos o puntos fuera de lo común.
• Gráfica 𝒙
• Es una gráfica de control que permite realizar el seguimiento
de media del proceso.
DEMO
Ejemplo 1
• Una empresa ofrece un servicio telefónico gratuito para
asesorar a sus clientes respecto a problemas con el uso de sus
productos, desde las 8:00 a.m. hasta las 5:00 p.m. todos los
días. Es imposible que un representante técnico conteste
inmediatamente a cada llamada, por lo que se presenta un
malestar en los clientes. La empresa decide elaborar un
diagrama de control que describa el tiempo (en minutos) que
transcurre desde que se recibe una llamada hasta que un
representante responda al cliente.
Ejemplo 1
• Cierto día se tomó una muestra de cinco llamadas cada hora,
el resultado se muestra a continuación:
Interpretación:
• El proceso se encuentra
bajo control estadístico.
• Existe cierta variación en
la duración de las
llamadas telefónicas, pero
todas las medias
muestrales se encuentran
dentro de los límites de
control.
Fuera de control
1. Hay un patrón, una tendencia o un ciclo que evidentemente
no es aleatorio.
2. Hay un punto que está fuera de la región entre los límites
superior e inferior.
3. Si cumplen una de las siguientes rachas:
• Existen ocho puntos consecutivos, todos por encima o por debajo de
la línea central (Regla de racha de 8).
• Existen seis puntos consecutivos, todos crecientes o decrecientes.
Fuera de control
• Hay 14 puntos consecutivos alternantes que se incrementan o
disminuyen sucesivamente.
• Dos de cada tres puntos consecutivos están más allá de los límites de
control que se encuentran a dos desviaciones estándar de la línea
central.
• Cuatro de cada cinco puntos consecutivos están más allá de los
límites de control que están a una desviación estándar de la línea
central.
Fuentes de variación
• Variación aleatoria: se debe al azar, este tipo de variación
inherente a cualquier proceso que no es capaz de producir un
bien o servicio exactamente de la misma forma cada vez.
• Variación asignable: Resulta de causas identificables como
maquinaria defectuosa, empleados sin capacitación adecuada,
entre otros.
Gráfica R
• Es una gráfica de control para supervisar la variación.
• Una gráfica de control de una característica de proceso (como la
media o la variación) consiste en valores graficados en secuencia a
lo largo del tiempo e incluye una línea central, así como un límite
de control inferior (LCI) y un límite de control superior (LCS).
• Notación:
• n: tamaño de cada muestra o subgrupo.
• Puntos graficados son los rangos muestrales.
• Línea central: R̅
• Límite de control superior: LCS=D4R̅
• Límite de control inferior: LCI=D3R̅
Ejemplo
• Elabore un gráfico de control para amplitudes de variación
(gráfica R) del ejemplo 1, ¿parece que hay momentos en los
que se presenta demasiada variación en la operación?
• Formule su conclusión.
Solución
• De la tabla 14-2 hallamos el valor D3=0,000 y D4=2,114
• Del ejemplo 1 ya se conoce que R̅= 6,2 𝑚𝑖𝑛𝑢𝑡𝑜𝑠
• Hallamos los límites de control:
• LCS=2,114(6,2)=13,11
• LCI= 0,000(6,2)=0,00
Conclusión
• Al observar el gráfico se concluye
que:
• El gráfico muestra que todas las
amplitudes se encuentran dentro
de los límites de control.
• La variación en el tiempo de
atención a las llamadas de los
clientes están dentro de los límites
normales, es decir el tiempo de
atención a la llamadas se
encuentran bajo control
estadístico.
Gráficos de
control para
atributos
Gráfica de Control de p
• Es una gráfica de se dibuja en secuencia en función del paso
del tiempo y que incluye una línea central, un límite de control
inferior (LCI) y un límite de control superior (LCS).
• Notación:
• El estimado agrupado de la proporción de artículos defectuosos en el
proceso se simboliza por ̅ y el estimado agrupado de la proporción
de artículos del proceso que no son defectuosos se simboliza por 𝑞
Notación

• Nota: Si el valor del límite de control inferior saliera negativo, utilice 0 en su


lugar.
• Si el valor del límite de control superior excediera a 1, utilice 1 en su lugar.
DEMO
Ejemplo
• El departamento de crédito de un banco se encarga de
ingresar cada transacción al estado de cuenta mensual del
cliente. La exactitud es decisiva y los errores causarían el
descontento de los clientes.
• Para evitar equivocaciones, cada empleado que ingresa los
datos teclea una muestra de 1500 de su lote de trabajo una
segunda vez, y un programa de computación verifica que los
números concuerden.
• El programa imprime además un informe acerca del número y
tamaño de cualquier discrepancia.
Ejemplo
• Siete personas trabajaron
durante la última hora y los
siguientes son los resultados:
a) Elabore un diagrama de
porcentaje de defectuosos para
este proceso ¿Cuáles son los
límites de control superior e
inferior? Interprete los datos.
b) ¿Parecería que algunos de los
encargados de ingresar los datos
están “fuera de control”?
Conclusión
• Si la proporción de defectos se encuentran entre los límites
0,0000 y 0,0087, se dice que el proceso está bajo control.
• Se observa que el desempeño del empleado 5 está fuera de
control estadístico, debido a que la proporción de defectos
que él muestra es de 0,0100 o 1% cifra que se encuentra fuera
del límite superior de control, por lo que se sugiere un
entrenamiento o capacitación adicional o debe ser transferido
a otra área de trabajo en el banco.
Diagrama de c con barra
• El diagrama llamado c con barra representa gráficamente el
número de defectos o fallas por unidad.
• Límites de control para el número de defectos por unidad:

• Donde ̅ es el número medio de defectos por unidad.


Ejemplo
• El director de un periódico de Huancayo está interesado en
determinar el número de palabras mal escritas que se
publican en ese diario. Para controlar el problema y promover
la necesidad de una escritura correcta, se utilizará un
diagrama de control.
• El número de palabras con errores en la edición final del diario
durante los últimos 10 es días es: 9; 10; 7; 4; 8; 9; 5; 6; 11; y 9.
• Determine los límites de control adecuados e interprete el
diagrama. ¿Hubo algunos días en ese periódico en los que el
número de palabras mal escritas haya estado fuera de control?
Solución
Conclusión
• Al comparar cada punto de los datos con el valor 16,18 se
observa que todos ellos son menores que el límite superior de
control, de manera que el número de palabras más escrita en
el diario huancaíno se encuentra “bajo control”.
Gracias por su atención

Recursos adicionales
https://1drv.ms/f/s!AnpbNMf4AA0wiEV5WjdZUy-Bf9p1

Mg. Adiel Omar FLORES RAMOS


aflores@continental.edu.pe
(#)964660405 - 964378423
CALCULO III
BALOTARIO PARA EXAMEN FINAL

MASA-RESORTE-AMORTIGUADO Y FORZADO

Problemas propuestos:
APLICACIONES DE LA EDL EN CIRCUITO ELÉCTRICOS RLC

Problemass propuestos:

PLANTEA Y RESUELVE SEDL - MEZCLAS

1. Dos grandes tanques, cada uno con 100 litros de agua se encuentran interconectados
por medio de tubos. El agua fluye del tanque A al B a 3 L/m y de B al A a 1 L/m. Una
solución de salmuera con concentración de 2 Kg/L fluye hacia el tanque A a 6 L/m. La
solución diluida sale del tanque A a 4L/m y del tanque B a 2L/m. El tanque A contenía
agua pura y el tanque B 200 kg de sal. Se pide hallar la variación de sal en los tanques
A y B.

2. Dos tanques que contienen cada uno 50 litros de líquido se encuentran


interconectados por medio de dos tubos. El líquido fluye del tanque A hacia el tanque
B a razón de 4 litros por minuto y del tanque B al tanque A a 1 litro por minuto. El líquido
contenido en cada tanque se mantiene perfectamente agitado. Hacia el tanque A
entra del exterior agua a razón de 3 litros por minuto y la solución fluye hacia el exterior
por el tanque B a la misma velocidad. Si inicialmente el tanque A contiene 25 kilos de
sal y el tanque B no contiene nada de sal, determinar la cantidad de sal en cada
instante de tiempo.
3. Dos grandes tanques, cada uno de 50 litros se encuentran interconectados por un
tubo. El líquido fluye del tanque A hacia el B a razón de 5 litros por minuto. El líquido
contenido en el interior de cada tanque se mantiene bien agitado. Una salmuera con
concentración de 3 kilos por litro fluye del exterior hacia el tanque A a razón de 5 litros
por minuto, saliendo hacia el exterior a la misma velocidad por un tubo situado en el
tanque B. Si el tanque A contiene inicialmente 50 kilos de sal y el tanque B contiene 100
kilos, determinar la cantidad de sal en cada instante.

4. Consideremos dos tanques, A y B, conteniendo 1000 litros de agua cada uno de ellos
e interconectados. El líquido fluye del tanque A hacia el tanque B a razón de 30 l/min
y del tanque B hacia el A a razón de 10 l/min. Una solución de salmuera con una
concentración de 2 kg/l de sal fluye hacia el tanque A a razón de 60 l/min,
manteniéndose bien agitado el líquido contenido en el interior de cada tanque. La
solución diluida fluye hacia el exterior del sistema, desde el tanque A a razón de 40
l/min y desde B a razón de 20 l/min. Si inicialmente el tanque A solo contiene agua y el
tanque B contiene 200 kg de sal, calcula qué cantidad de sal habría en cada tanque
al cabo de 10 min.

ECUACION DIFERENCIAL LINEAL CON COEFICIENTES CONSTANTES CON


TRANSFORMADA DE LAPLACE

En los ejercicios del 31 al 34, resuelva el problema de valores iniciales que se proporciona
en cada caso.
ECUACION DIFERENCIAL LINEAL CON COEFICIENTES VARIABLES CON
TRANSFORMADA DE LAPLACE
}
Explicaion del profesor
7
CAPÍTULO

3
Aplicaciones de primer orden

3.4 Ley de Enfriamiento de Newton


Si un cuerpo u objeto que tiene una temperatura T0 es depositado en un medio ambiente que se mantiene a
una temperatura Ta constante, con Ta ¤ T0 , la experiencia nos dice que, al paso del tiempo, la temperatura
del cuerpo tiende a ser igual a la del medio circundante. Es decir, si T .t/ es la temperatura del cuerpo en el
tiempo t, entonces T .t/ ! Ta cuando t crece. Es posible representar esto en un diagrama como sigue:

En t D 0 En t > 0 En t D periodo largo

T0 T .t / T .t /  Ta

Ta Ta Ta

Para modelar la temperatura del objeto utilizamos la ley de Enfriamiento de Newton; ésta afirma que la
rapidez de cambio de la temperatura de un cuerpo es directamente proporcional a la diferencia de tempera-
turas entre el cuerpo y el medio circundante. Esto es,

T 0 .t/ D kŒT .t/ Ta I

donde k es la constante de proporcionalidad.


Notemos aquí dos situaciones:

1. Cuando T0 > Ta , y por lo mismo T .t/ > Ta , en el cuerpo ocurre un enfriamiento y se tiene que T .t/
d d
decrece y que T .t/ Ta > 0, es decir, T .t/ < 0 y T .t/ Ta > 0, por lo que T .t/ D kŒT .t/ Ta  )
dt dt
k < 0.
1. canek.azc.uam.mx: 22/ 9/ 2010

1
2 Ecuaciones diferenciales ordinarias

2. Cuando T0 < Ta , y por lo mismo T .t/ < Ta , en el cuerpo ocurre un calentamiento y se tiene que T .t/
d d
crece y que T .t/ Ta < 0, es decir, T .t/ > 0 y T .t/ Ta < 0, por lo que T .t/ D kŒT .t/ Ta  )
dt dt
k < 0.
d
Concretando: sea enfriamiento o calentamiento, la ecuación diferencial T .t/ D kŒT .t/ Ta  tiene sentido
dt
siempre y cuando k sea negativa (k < 0).
Tenemos entonces que la temperatura T .t/ del cuerpo en el instante t  0 está determinada por el PVI:

T 0 .t/ D kŒT .t/ Ta ; con la condición inicial T .0/ D T0 :

Resolvemos la ecuación diferencial, que es claramente de variables separables:

dT
D kdt ) T > Ta ) T Ta > 0 )
T Ta
Z
dT
Z ) j T Ta j D T Ta :
) D k dt )
T Ta
Obtenemos lo mismo si:
) ln j T Ta j D kt C C1 )
T < Ta ) T Ta < 0 )
) jT Ta j D e k t CC1 D e k t e C1 D Ce k t )
) jT Ta j D Ce k t )
) jT Ta j D Ce k t )
) .T Ta / D Ce k t )
) T Ta D Ce k t )
)T Ta D Ce k t ) T Ta D Ce k t :
) T .t/ D Ta C Ce k t

que es la temperatura del cuerpo en el instante t  0.


Para tener bien determinada la temperatura T .t/, son necesarias dos condiciones adicionales que permitan
calcular valores únicos para las constantes C y k. Estas condiciones podrían ser las temperaturas del cuerpo
en dos instantes cualesquiera y una de ellas podría ser la temperatura inicial T0 .

Ejemplo 3.4.1 Un cuerpo que tiene una temperatura de 70 ı F es depositado (en el tiempo t D 0) en un lugar donde
la temperatura se mantiene a 40 ı F. Después de 3 min, la temperatura del cuerpo ha disminuido a 60 ı F.
1. ¿Cúal es la temperatura del cuerpo después de 5 min?
2. ¿Cuánto tiempo pasará para que el cuerpo tenga 50 ı F?

H Si T .t/ es la temperatura del cuerpo en ı F después de t minutos, entonces la ecuación diferencial que
modela a T .t/ es
T 0 .t/ D kŒT .t/ Ta ;
donde Ta D 40 ı F es la temperatura fija del medio circundante.
Las condiciones adicionales son T .0/ D 70 y T .3/ D 60.
Luego, la temperatura T .t/ está dada por la solución del PVI:

T 0 .t/ D kŒT .t/ 40; con T .0/ D 70 y además T .3/ D 60:

Resolvamos este problema:


dT dT dT
Z Z
D k.T 40/ ) D kdt ) D k dt ) ln.T 40/ D kt C C )
dt T 40 T 40
) T 40 D e k t CC ) T .t/ D Ce k t C 40:

Ahora,
T .0/ D 70 , T .0/ D Ce k0 C 40 D 70 , C C 40 D 70 , C D 30I
3.4 Ley de Enfriamiento de Newton 3

por lo que, T .t/ D 30e k t C 40, entonces:


60 40 20 2
T .3/ D 60 ) 30e k3 C 40 D 60 ) e 3k D D D )
  30   30 3
2 1 2
) ln e 3k D 3k D ln ) k D ln  0:1352 :
3 3 3
Luego,
0:1352 t
T .t/ D 30e C 40:
1. ¿Cuál es la temperatura del cuerpo después de 5 min?
0:1352 .5/
T .5/ D 30e C 40 D 55:2594 ) T .5/  55:26 ı F.

2. ¿Cuánto tiempo pasará para que el cuerpo tenga 50 ı F?

0:1352 t 50 40 10 1
T .t/ D 50 ) 30e C 40 D 50 ) e 0:1352 t D D D )
30 30 3
ln 3
 
1 1:0986
) 0:1352 t D ln D ln 3 ) t D D  8:1258 min.
3 0:1352 0:1352
Entonces el cuerpo tendrá una temperatura de 50 ı F después de t  8 minutos, 8 segundos.


Ejemplo 3.4.2 Un objeto que tiene una temperatura 50 ı F se coloca a las 10:00 horas en un horno que se mantiene a
375 ı F. A las 11:15 horas su temperatura era 125 ı F. ¿A qué hora estará el objeto a 150 ı F?

H La ecuación diferencial que modela el problema es

d
T .t/ D kŒT .t/ Ta I
dt
donde Ta D 375 ı F es la temperatura constante del medio circundante.
Puesto que de 10 am a 11:15 am transcurren 75 min, las condiciones adicionales son

T .0/ D 50 y T .75/ D 125:

Luego la temperatura T .t/ del objeto está dada por la solución del PVI:

T 0 .t/ D kŒT .t/ 375; con T .0/ D 50 y además T .75/ D 125:

Sabemos que:
T .t/ D Ta C Ce k t ) T .t/ D 375 C Ce k t :
Ahora, usando la condición inicial:

T .0/ D 50 ) 375 C Ce 0 D 50 ) C D 50 375 ) C D 325:

Por lo que,
T .t/ D 375 325e k t :
Usando la segunda condición:
125 375 250 10
T .75/ D 125 ) 375 325e k75 D 125 ) e 75k D D D )
    325 325 13
10 1 10
) 75k D ln ) kD ln D 0:0034982  0:0035 :
13 75 13
4 Ecuaciones diferenciales ordinarias

Luego,
0:0035t
T .t/ D 375 325e :

El objeto alcanzará la temperatura de T D 150 ı F cuando:

0:0035t 150 375 225 9


T .t/ D 150 ) 375 325e D 150 ) e 0:0035t D D D )
  325 325 13
9 0:367725
) 0:0035t D ln D 0:367725 ) t D  105:06 min.
13 0:0035

Es decir, la temperatura del objeto será T D 150 ı F después de t D 105 min, a partir de las 10 de la mañana.
Por lo tanto, la temperatura será 150 ı F aproximadamente a las 11:45 horas.


Ejemplo 3.4.3 Una taza de café cuya temperatura es 190 ı F se coloca en un cuarto cuya temperatura es 65 ı F. Dos
minutos más tarde la temperatura del café es 175 ı F. ¿Después de cuánto tiempo la temperatura del café será 150 ı F?

H Sea T .t/ la temperatura (en ı F) del café en el instante t  0 min. Observamos que

T .0/ D 190; Ta D 65 y T .2/ D 175:

El PVI por resolver es

dT
D k.T 65/; con T .0/ D 190 y además T .2/ D 175;
dt
para determinar la temperatura del café en cualquier instante t  0 min. Sabemos que

T .t/ D Ta C Ce k t ) T D 65 C Ce k t :

Usando la condición inicial, tenemos:

T .0/ D 190 ) T .0/ D 65 C Ce k0 D 190 ) C D 125 ) T .t/ D 65 C 125e k t :

Ahora usamos la segunda condición:


 
k2 2k 110 22 22
T .2/ D 175 ) T .2/ D 65 C 125e D 175 ) e D D ) 2k D ln )
125 25 25
 
1 22
) k D ln  0:0639 ) k  0:0639 :
2 25

Entonces:
0:0639t
T .t/ D 65 C 125e ;

que es la temperatura (en ı F) del café en el minuto t  0.


Sea t1 el instante en que T .t1 / D 150. Tenemos entonces:
0:0639t1 0:0639t1
T .t1 / D 65 C 125e D 150 ) e D 0:68 ) 0:0639t1 D ln 0:68 )
ln 0:68
) t1 D  6:0354 min.
0:0639
Por lo tanto deben transcurrir t1  6 min, 2 s para que la temperatura del café sea de 150 ı F.

3.4 Ley de Enfriamiento de Newton 5

Ejemplo 3.4.4 Un termómetro en el que se lee 70 ı F se coloca en un lugar donde la temperatura es 10 ı F. Cinco
minutos más tarde el termómetro marca 40 ı F. ¿Qué tiempo debe transcurrir para que el termómetro marque medio
grado maś que la temperatura del medio ambiente?

H Sea T .t/ la temperatura (en ı F) del termómetro en el instante t  0 min. Observamos que

T .0/ D 70; Ta D 10 y T .5/ D 40:

El PVI por resolver es

dT
D k.T 10/; con T .0/ D 70 y además T .5/ D 40:
dt
La solución es
T .t/ D Ta C Ce k t ) T .t/ D 10 C Ce k t :
Utilizamos la condición inicial:

T .0/ D 70 ) T .0/ D 10 C Ce k.0/ D 70 ) C D 60 ) T .t/ D 10 C 60e k t :

La segunda condición nos permite calcular k:

ln 0:5
T .5/ D 40 ) T .5/ D 10 C 60e 5k D 40 ) e 5k D 0:5 ) D ln.0:5/ ) k D  0:1386 :
5
En conclusión:
0:1386t
T .t/ D 10 C 60e :
Sea t1 el minuto en que T .t1 / D 10:5 F: ı

0:1386t1 0:1386t1 0:5


T .t1 / D 10 C 60e D 10:5 ) e D )
60
ln 0:0083
) .0:1386/t1 D ln.0:0083/ ) t1 D  34:57 min.
0:1386
Por lo tanto, el tiempo que debe transcurrir para que el termómetro marque medio grado más que la tem-
peratura ambiente es t1  34 minutos, 34 segundos.


Ejemplo 3.4.5 Un termómetro que está en el interior de una habitación se lleva al exterior donde la temperatura es
5 ı F. Después de 1 min el termómetro marca 55 ı F y después de 5 min marca 30 ı F. ¿Cuál era la temperatura del
termómetro en la habitación?

H Sea T .t/ la temperatura (en ı F) del termómetro en el instante t  0 min. Tenemos:

Ta D 5; T .1/ D 55; T .5/ D 30 & T .0/ D T0 , que es la temperatura a determinar.

Al resolver la ED, resulta:


T .t/ D Ta C Ce k t ) T .t/ D 5 C Ce k t :
Usando la condición inicial:

T .0/ D T0 ) 5 C Ce k0 D T0 ) C D T0 5 ) T .t/ D 5 C .T0 5/e k t :

Usando ahora las dos condiciones dadas:

T .1/ D 55 ) 5 C .T0 5/e k D 55 ) .T0 5/e k D 50 ) T0 5 D 50e k


: (3.1)
T .5/ D 30 ) 5 C .T0 5/e 5k D 30 ) .T0 5/e 5k D 25 ) T0 5 D 25e 5k
: (3.2)
6 Ecuaciones diferenciales ordinarias

Las expresiones (3.1) y (3.2) conforman un sistema de dos ecuaciones con dos incógnitas (T0 y k). Entonces,
por igualación:
k
50e D 25e 5k ; (multiplicando por e 5k ) ) 50e 4k D 25 ) e 4k D 0:5 ) 4k D ln.0:5/ )
ln.0:5/
) kD D 0:1733 ) k  0:1733 :
4
Utilizando el valor de k en (3.1):
k
T0 5 D 50e ) T0 D 5 C 50e 0:1733 ) T0 D 64:46 ı F:

Es la temperatura que marcaba el termómetro en la habitación.



ı
Ejemplo 3.4.6 En una habitación la temperatura que marca un termómetro clínico es 20 C. Para detectar si un
paciente tiene fiebre (definida como temperatura corporal de 38 ı C o más) se coloca un termómetro en la axila del
paciente. Si al cabo de un minuto el termómetro marca 27 ı C en una persona sana (con temperatura de 36 ı C),
¿cuánto tiempo se debe dejar en una persona con fiebre para detectarla con un error no mayor que 0:2 ı C?
H Si T .t/ es la temperatura que marca el termómetro a los t minutos, entonces:

T .0/ D 20 ı C; T .1/ D 27 ı C & Ta D 36 ı C:

Con estos datos podemos obtener el valor de k, que en cierta forma mide la sensibilidad del termómetro.
El PVI es
dT
D k.T 36/; con T .0/ D 20 y además T .1/ D 27:
dt
Sabemos que
T .t/ D Ta C Ce k t ) T .t/ D 36 C Ce k t :
Usando la condición inicial:

T .0/ D 20 D 36 C Ce k0 ) C D 20 36 D 16 ) T .t/ D 36 16e k t :

Usamos ahora la segunda condición:


 
9 9
T .1/ D 27 D 36 16e k1 ) 16e k D 36 27 D 9 ) e k D ) k D ln D 0:57536 :
16 16
Como se dijo, este valor de k es una constante del termómetro. Si ese mismo termómetro se usa en un
paciente que tal vez tenga fiebre (Ta  38 ı C ahora, con Ta no conocida), entonces resolvemos el PVI:
dT
D 0:57536.T Ta /; con T .0/ D 20;
dt
y hallamos el valor de t de modo que T .t/  Ta 0:2. Tendremos T .t/ D Ta C Ce 0:57536t
, pero aquí

T .0/ D 20 ) Ta C C D 20 ) C D 20 Ta ;

así que la temperatura marcada por el termómetro para el tiempo t  0 es


0:57536t
T .t/ D Ta C .20 Ta /e :

Es preciso comparar esta expresión con Ta 0:2 y resolver para t:


0:57536t 0:57536t
T
T .t/ D a C .20 Ta /e T
a 0:2 ) .Ta 20/e
 0:2 )
 
0:2
  ln
0:57536t 0:2 0:2 Ta 20
) e  ) 0:57536t  ln ) t
Ta 20 Ta 20 0:57536
3.4 Ley de Enfriamiento de Newton 7

(se invirtió la desigualdad por dividir entre un número negativo). Es decir,


ln 0:2 ln.Ta 20/ ln.Ta 20/
t D 2:7973 C :
0:57536 0:57536 0:57536
El último término está en función de la temperatura Ta del paciente, que no se conoce en principio; sin em-
bargo podemos hacer una estimación, pues en seres humanos Ta es cuando mucho 42 ı C en casos extremos.
ln 22
El valor del último término sería entonces cuando mucho D 5:3724, y esto sumado al primer tér-
0:57536
mino daría un total de t  8:17 min, alrededor 8 min 10 s. Por lo tanto, para detectar una Ta D 38 ı C se
ln 18
requerirían 2:7973 C D 7:82 min, o sea, alrededor de 7 min 50 s.
0:57536

Un caso de aplicación de la ley de Enfriamiento de Newton en medicina, relacionado con lo anterior, con-
siste en determinar la hora en que falleció una persona cuyo cadáver se encuentra en un medio ambiente
frío. La homeostasis, o conjunto de funciones vitales de un individuo, regula su temperatura corporal (en
condiciones normales, sin enfermedad) entre 36 y 36:5 ı C; sin embargo al morir, el cadáver del individuo se
comporta como un cuerpo caliente en un medio frío (puesto que su organismo ya no produce calor), como
nos lo ilustra el siguiente ejemplo:

Ejemplo 3.4.7 Un ganadero salió una tarde a cazar un lobo solitario que estaba diezmando su rebaño. El cuerpo del
ganadero fue encontrado sin vida por un campesino, en un cerro cerca del rancho junto al animal cazado, a las 6:00 h
del día siguiente. Un médico forense llegó a las 7:00 y tomó la temperatura del cadáver, a esa hora anotó 23 ı C; una
hora más tarde, al darse cuenta de que en la noche, y aún a esas horas, la temperatura ambiente era aproximadamente
de 5 ı C, el médico volvió a medir la temperatura corporal del cadáver y observó que era de 18:5 ı C. ¿A qué hora murió
el ganadero aproximadamente?

H Podemos suponer por la información proporcionada, que la temperatura ambiente se mantuvo casi
constante como Ta D 5 ı C y también que hasta el instante de su muerte, cuyo momento desconocemos, la
temperatura corporal del ganadero fue de 36 ı C.
Tiene mucho sentido que el forense haya tomado dos mediciones de la temperatura del cuerpo, para deter-
minar el valor de k. Podemos denotar por T .t/ la temperatura del cuerpo al tiempo t, medido en horas; por
comodidad, hagamos t D 0 a las 7:00 h y t D 1 a las 8:00 h, así que tenemos el PVI:
dT
D k.T Ta /; con T .0/ D 23 ı C y además T .1/ D 18:5 ı C;
dt
con Ta D 5 ı C. Se busca determinar el tiempo (negativo) t0 en el que T .t0 / D 36 ı C. Al resolver la ED
sabemos que:
T .t/ D Ta C Ce k t ) T D 5 C Ce k t ) T .t/ 5 D Ce k t :
Al usar las condiciones resulta

T .0/ D 23 ) 23 5 D 18 D Ce k0 ) C D 18 ) T 5 D 18e k t I


 
13:5 13:5
T .1/ D 18:5 ) 18:5 5 D 13:5 D 18e k ) ek D ) k D ln D 0:2877:
18 18

En síntesis, por lo anterior: T .t/ D 5 C 18e 0:2877t es la solución del PVI.


Para determinar t0 , consideramos T .t0 / D 36 y resolvemos:

0:2877t0 0:2877t0 31
36 D 5 C 18e ) 18e D 36 5 ) e 0:2877t0 D )
18
ln.31=18/
 
31
) 0:2877t0 D ln ) t0 D D 1:8895  1 h 53 min.
18 0:2877
Comprobamos que el deceso ocurrió aproximadamente 1 h y 53 min antes de las 7:00 (hora de la primer
toma de temperatura), esto es, alrededor de las 5:07 horas.

8 Ecuaciones diferenciales ordinarias

Ejercicios 3.4.1 Ley de Enfriamiento de Newton. Soluciones en la página 9

1. La temperatura de un motor en el momento en que se apaga es de 200 ı C y la temperatura del aire


que lo rodea es de 30 ı C. Después de 10 min la temperatura del motor ha bajado a 180 ı C. ¿Cuánto
tiempo transcurrirá para que la temperatura del motor disminuya hasta 40 ı C?
2. Un recipiente con agua a una temperatura de 100 ı C se coloca en una habitación que se mantiene a una
temperatura constante de 25 ıC. Después de 3 min la temperatura del agua es de 90 ıC. Determinar la
temperatura del agua después de 15 min. ¿Cuánto tiempo deberá transcurrir para que la temperatura
del agua sea de 40 ı C?
3. Un termómetro se saca de una habitación –donde la temperatura del aire es de 70 ı F– al exterior donde
la temperatura es de 10 ı F. Después de medio minuto el termómetro marca 50 ı F. ¿Cuánto marca el
termómetro cuando t D 1 min? ¿Cuánto tiempo deberá transcurrir para que la temperatura marcada
por el termómetro sea de 15 ı F?
4. Una taza de café caliente, inicialmente a 95 ı C, al estar en una habitación que tiene una temperatura
constante de 21 ı C, se enfría hasta 80 ı C en 5 min. Determinar la temperatura del café después de
10 min. ¿Cuánto tiempo deberá transcurrir para que el café tenga una temperatura de 50 ı C?
5. Una barra metálica, cuya temperatura inicial es de 20 ı C, se deja caer en un recipiente que contiene
agua hirviendo (a 100 ı C) y su temperatura aumenta 2 ı C después de 1 s. Determinar la temperatura
de la barra metálica después de 10 s. ¿Cuánto tiempo deberá transcurrir para que la temperatura de
la barra sea de 60 ı C?
6. Un termómetro que indica 70 ı F se coloca en un horno precalentado y mantenido a temperatura
constante. A través de una ventana de vidrio del horno, un observador registra que la temperatura
marcada por el termómetro es de 110 ı F después de medio minuto y de 145 ı F después de 1 min. ¿A
qué temperatura está el horno?
7. Un termómetro en el que se lee 80 ı F se lleva al exterior. Cinco minutos más tarde el termómetro
indica 60 ı F. Después de otros 5 min el termómetro señala 50 ı F. ¿Cuál es la temperatura del exterior?
8. Un material cerámico se saca en cierto momento de un horno cuya temperatura es de 750 ı C, para
llevarlo a una segunda etapa de un proceso que requiere que el material se encuentre a una tempera-
tura de cuando mucho 200 ı C. Suponga que la temperatura de una sala de enfriamiento donde se
colocará este cerámico es de 5 ı C y que, después de 15 min, la temperatura del material es de 600 ı C.
¿En cuánto tiempo el material cerámico estará listo para entrar a la segunda etapa de su proceso?
9. A las 13:00 horas un termómetro que indica 10 ı F se retira de un congelador y se coloca en un cuarto
cuya temperatura es de 66 ı F. A las 13:05, el termómetro indica 25 ı F. Más tarde, el termómetro se
coloca nuevamente en el congelador. A las 13:30 el termómetro da una lectura de 32 ı F. ¿Cuándo se
regresó el termómetro al congelador?; ¿cuál era la lectura del termómetro en ese momento?
10. Luis invitó a Blanca a tomar café en la mañana. Él sirvió dos tazas de café. Blanca le agregó crema sufi-
ciente como para bajar la temperatura de su café 1 ı F. Después de 5 min, Luis agregó suficiente crema
a su café como para disminuir su temperatura en 1 ı F. Por fin, tanto Luis como Blanca empezaron a
tomar su café. ¿Quién tenía el café más frío?
3.4 Ley de Enfriamiento de Newton 9

Ejercicios 3.4.1 Ley de Newton de cambio de temperaturas. Página 8

1. 3 h, 46 min, 18 s. 6. 390 ı F.
2. 61:67 ı C; 33 min, 44 s. 7. 40 ı F.
3. 36:7 ı F; 3 min, 4 s. 8. 1 h, 29 min, 22 s.
4. 68 ı C; 20 min, 41 s. 9. 13:20:19; 50:22 ı F.
5. 37:9 ı C; 27:38 s. 10. Luis.
1

Ley de Newton de cambio de temperaturas.

E: Un material cerámico se saca en cierto momento de un horno cuya temperatura es de 750 ı C,


para llevarlo a una segunda etapa de un proceso que requiere que el material se encuentre a una
temperatura de cuando mucho 200 ı C. Suponga que la temperatura de una sala de enfriamiento
donde se colocará este cerámico es de 5ı C y que, después de 15 min, la temperatura del material
es de 600 ı C. ¿En cuánto tiempo el material cerámico estará listo para entrar a la segunda etapa
de su proceso?

D: H La temperatura T .t/, en ı C, del material cerámico al cabo de t minutos, está dada por la
solución del PVI:

T 0 .t/ D kŒT .t/ 5; con T .0/ D 750 y además T .15/ D 600:

Resolvemos la ED:
Z Z
dT dT dT
D k.T 5/ ) D k dt ) Dk dt )
dt T 5 T 5
) ln.T 5/ D k t C C ) T 5 D e ktCC D e kt e C D e kt C )
) T 5 D C e kt ) T .t/ D 5 C C e kt :

Hemos encontrado la solución general de la ED. Considerando que

T .0/ D 750 ) 5 C C e 0 D 750 ) C D 745 ) T .t/ D 5 C 745e kt I


600 5 119
T .15/ D 600 ) 5 C 745e 15k D 600 ) e 15k D D )
    745 149
119 1 119 .0:015/t
) 15k D ln ) kD ln D 0:015 ) T .t/ D 5 C 745e :
149 15 149
La expresión anterior es la solución del PVI. El material cerámico estará listo para entrar a la
segunda etapa del proceso cuando T .t/ D 200 ı C, lo cual sucederá cuando:
.0:015/t
T .t/ D 200 ) 5 C 745e D 200 )
 
.0:015/t 200 5 39 39
) e D D ) .0:015/t D ln )
745 149 149
 
1 39
) tD ln D 89:36 min  1 h, 29 min, 22 s.
0:015 149


3. canek.azc.uam.mx: 29/ 11/ 2010

Anda mungkin juga menyukai