ESTADISTICA INFERENCIAL
22 de septiembre del 2016
Presentan:
Delgado Díaz Alondra
Flores Román Leslie Zareth
Mateos Castro Roxane Vianey
Ocampo Fitz Anyeli
Valladares Arroyo Julio Cesar
Objetivo:
Conocer y aplicar los fundamentos de la estadística inferencial enfocados en la
construcción e interpretación de intervalos de confianza para la media y la
proporción, así como el análisis de regresión lineal simple con el fin de solucionar
problemas enfocados a mejorar la calidad de los productos o procesos.
Resumen:
El cálculo de intervalos de confianza para la estimación de parámetros son técnicas
que nos permiten hacer declaraciones sobre que valores podemos esperar de un
parámetro. Dicho intervalo depende de: la estimación de la muestra, el tamaño de
la muestra y la probabilidad o nivel de confianza. Se puede decir que un intervalo
de confianza es un rango de valores (calculado en una muestra) en el cual se
encuentra el verdadero valor del parámetro, con una probabilidad (nivel de
confianza) determinada. El análisis de regresión involucra el estudio la relación entre
dos variables. En el presente reporte se darán a conocer los fundamentos de los
intervalos de confianza y del análisis de regresión simple.
Mano de obra
Maquinas
Material
Método
Mantenimiento
Para CONOCIDA
𝜎
𝑥̅ ± Z
√𝑛
𝜎 𝜎
𝑥̅ - Z ≤ µ ≤ 𝑥̅ + Z
√𝑛 √𝑛
𝜎
𝑥̅ ± Z
√𝑛
𝜎 𝜎
𝑥̅ - Z ≤ µ ≤ 𝑥̅ + Z
√𝑛 √𝑛
𝜎 0.02
𝑥̅ ± Z = 10.998 ± (1.96)
√𝑛 √100
= 10.998 ± 0.00392
= 10.99408 ≤ µ ≤ 11.00192
Así, con un 95% de confianza, usted concluye que la media poblacional está entre
10.99408 y 11.00192 pulgadas. Como el intervalo incluye al 11, valor que indica que
el proceso de producción funciona adecuadamente, no hay razón para creer que
algo está mal con el proceso de fabricación.” (Levine, 2006)
Para DESCONOCIDA
Fórmula:
𝑠
𝑥̅ ± tn-1
√𝑛
𝑠 𝑠
𝑥̅ – tn-1 ≤ µ ≤ 𝑥̅ + tn-1
√𝑛 √𝑛
Ejemplo:
Un fabricante de llantas desea investigar la durabilidad de sus productos. Una
muestra de 10 llantas que recorrieron 50 000 millas reveló una media muestral de
0.32 pulgadas de cuerda restante con una desviación estándar de 0.09 pulgadas.
Construya un intervalo de confianza de 95% de la media poblacional. ¿Sería
razonable que el fabricante concluyera que después de 50 000 millas la cantidad
media poblacional de cuerda restante es de 0.30 pulgadas?}
Para comenzar, se supone que la distribución de la población es normal. En este
caso no hay muchas evidencias, pero tal vez la suposición sea razonable. No se
conoce la desviación estándar de la población, pero sí la desviación estándar de la
muestra, que es de 0.09 pulgadas.
Se aplica la fórmula anterior.
De acuerdo con la información dada, 𝑥̅ = 0.32 s = 0.09 y n= 10. Para hallar el valor
de t, utilice la tabla de distribución de t.
El primer paso para localizar t consiste es desplazarse a lo largo de las columnas
identificadas como “Intervalos de confianza” hasta el nivel de confianza que se
requiere. En este caso, desea el nivel de confianza de 95%, así que vaya a la
columna con el encabezamiento “95%”. La columna del margen izquierdo se
identifica como “gl”. Estas palabras se refieren al número de grados de libertad, esto
es, el número de observaciones incluidas en la muestra menos el número de
muestras, el cual se escribe n= 1. En este caso es de 10 -1 = 9.
En el caso de un nivel de confianza de 95% y 9 grados de libertad, seleccione la fila
0.05
con 9 grados de libertad. Con t α/2= 1-0.9 5= = .025
2
El valor de t es 2.262.
𝑠 𝑠
𝑥̅ – tn-1 ≤ µ ≤ 𝑥̅ + tn-1
√𝑛 √𝑛
0.09 0.09
= 0.32 – 2.262
√10
≤ µ ≤ 0.32 + 2.262 √10
= 0.32 ± 0.064
= 0.256 ≤ µ ≤ 0.384
Interpretación de un intervalo
“En general, la correcta interpretación de un intervalo de confianza es de la siguiente
manera: si se obtuvieran 100 muestras independientes de la misma población o
proceso, cada una dc tamaño n y para cada muestra se calculará el intervalo de
confianza a 95% para el mismo parámetro, entonces se espera que 95 de los 100
intervalos contengan el verdadero valor de dicho parámetro.
La longitud del intervalo de confianza es una medida de la precisión de la
estimación; por ello, es deseable que la longitud de los intervalos sea pequeña. Pero
esta longitud depende de tres aspectos de la varianza de la población, que
dependerá de los datos; del tamaño de muestra y por último del nivel de confianza
de la estimación. En particular, la persona decide este último aspecto cuando hace
el estudio. Mientras que la amplitud del intervalo en una aplicación específica se
reduce conforme se incrementa el tamaño de la muestra.” (Gutiérrez, 2009)
INTERVALO DE CONFIANZA PARA UNA PROPORCIÓN
Existen muchos problemas en los cuales debemos obtener ya sea proporciones,
probabilidades, porcentajes, o índices (también llamadas tasas), por ejemplo; la
probabilidad de que un automóvil detenido en una inspección tendrá las luces
descompuestas, o el porcentaje de alumnos con coeficiente intelectual arriba de
115, o incluso el índice o tasa de mortalidad que provoca una enfermedad así como
también podemos enfocarnos hacia la calidad etc.
Cuando hacemos un test de hipótesis decidimos sobre un valor hipotético del
parámetro.
• ¿Qué proporción de artículos defectuosos genera la máquina A?
• ¿Qué proporción de empresas automotrices tienen mala administración?
“La estimación puntual para µ es la proporción de la muestra, p = X/n, donde n es
el tamaño de la muestra y X es el número de elementos en la muestra que tienen la
característica de interés. La ecuación siguiente define la estimación del intervalo de
confianza para la proporción de la población.” (Levine, 2006)
Utilizamos el hecho que para valores grandes de n la distribución binomial puede
obtenerse aproximadamente con una distribución normal es decir que la variable
aleatoria.
𝑝(1 − 𝑝)
𝑝±𝑍√
𝑛
𝑝(1 − 𝑝) 𝑝(1 − 𝑝)
𝑝−𝑍√ ≤ µ ≤ 𝑝+𝑍√
𝑛 𝑛
Donde:
𝑋 número de elementos con característica
p= proporción de la muestra = =
𝑛 tamaño de la muestra
µ= proporción de la población
Z= valor crítico para la distribución normal estandarizada.
Donde Z α/2 es el valor de una distribución Normal estándar que deja a su derecha una
probabilidad de α/2 para un intervalo de confianza de (1 − α) · 100 %.
n= tamaño de la muestra
Suponiendo que tanto X como n – X son mayores que 5.
Ejemplo: estimación de la proporción de periódicos defectuosos impresos
𝑝(1 − 𝑝) 𝑝(1 − 𝑝)
𝑝−𝑍√ ≤ µ ≤ 𝑝+𝑍√
𝑛 𝑛
𝑋 35
𝑝= = = 0.175 𝑦 𝑐𝑜𝑛 𝑢𝑛 𝑛𝑖𝑣𝑒𝑙 𝑑𝑒 𝑐𝑜𝑛𝑓𝑖𝑎𝑛𝑧𝑎 𝑑𝑒𝑙 90%
𝑛 200
1- α = 1- .90 = .10
Z α/2 = .10/2 = 0.05
1-.05 = .95 (se busca el valor en la tabla de Z)
𝑝(1 − 𝑝)
𝑝±𝑍√
𝑛
(0.175)(1−0.175)
= 0.175 ± (1.645) √
200
“El análisis de regresión permite desarrollar un modelo para predecir los valores de
una variable numérica con base en los valores de una o más variables diferentes.
En el análisis de regresión, la variable dependiente es la variable que se desea
predecir. Las variables utilizadas para hacer una predicción son las variables
independientes. Además de predecir los valores de la variable dependiente, el
análisis de regresión también permite identificar el tipo de relación matemática que
existe entre la variable dependiente y la independiente, para cuantificar el efecto
que los cambios en la variable independiente tienen sobre la variable dependiente,
así como para identificar las observaciones inusuales.” (Levine, 2006)
En general interesa:
Investigar si existe una asociación entre las dos variables testeando la
hipótesis de independencia estadística.
Estudiar la fuerza de la asociación, a través de una medida de asociación
denominada coeficiente de correlación.
Estudiar la forma de la relación. Usando los datos propondremos un modelo
para la relación y a partir de ella será posible predecir el valor de una variable
a partir de la otra.
Ecuación. Regresión Lineal Simple
Con esta expresión se hace referencia al proceso matemático que sirve para ajustar
una línea recta a través de un conjunto de datos bivariables asentados en una
gráfica de dispersión. Dicha línea se conoce como línea de regresión simple. El
primer paso es recoger datos experimentales correspondientes a n individuos con
información de dos variables cuantitativas: una de ellas se considera variable
explicativa (Variable x) y la otra se considera variable respuesta (Variable y).
Mínimos cuadrados
𝑦̂ = a + bx
Donde:
b: pendiente de la recta de regresión.
∑: signo de suma.
x: valores conocidos de variable independiente.
y: valores conocidos de la variable dependiente
𝑥̅ : promedio de valor de las x
𝑦̅:: promedio de las y
n: número de datos puntuales u observaciones
Graficas:
Ejemplo
A continuación se muestra la demanda de energía eléctrica en N.Y. Edison durante
el periodo de 1997 a 2003, en megawatts. Pronostique la demanda para 2004
ajustando una recta de tendencia a estos datos.
Con una serie de datos en función del tiempo podemos minimizar los calculas
transformando los valores de x (tiempo) en números más sencillos. En este caso
podemos designar 1997 como año 1, 1998 como año 2, etcétera.
∑x ∑y
x̅ = = 28
7
=4 y̅ = = 692
7
= 98.86
n n
∑ xy−nx̅y
̅ 3063−(7)(4)(98.86) 295
b= = = = 10.54
∑ x2 −nx̅2 140−(7)(4 2 ) 28
Para DESCONOCIDA
𝑠
𝑥̅ ± tn-1
√𝑛
𝑠 𝑠
𝑥̅ – tn-1 ≤ µ ≤ 𝑥̅ + tn-1
√𝑛 √𝑛
Para proporciones
𝑝(1 − 𝑝)
𝑝±𝑍√
𝑛
𝑝(1 − 𝑝) 𝑝(1 − 𝑝)
𝑝−𝑍√ ≤ µ ≤ 𝑝+𝑍√
𝑛 𝑛
Donde:
𝑋 número de elementos con característica
p= proporción de la muestra = =
𝑛 tamaño de la muestra
Mínimos cuadrados:
𝑦̂ = a + bx
∑xy − n𝑥̅ 𝑦̅
𝑏=
∑𝑥 2 − 𝑛𝑥̅ 2
̅ + (−𝒃) 𝒙
a=𝒚 ̅
Lebih dari sekadar dokumen.
Temukan segala yang ditawarkan Scribd, termasuk buku dan buku audio dari penerbit-penerbit terkemuka.
Batalkan kapan saja.