1
¿Qué es ADEI?
2
¿Qué es ADEI?
1.- Descripción de conjuntos de datos
3
¿Qué es ADEI?
1.- Descripción de conjuntos de datos
5
Poseen el mismo promedio y rango de variación, sin embargo están distribuidos de
distinta manera.
¿Qué es ADEI?
1.- Descripción de conjuntos de datos
6
¿Qué es ADEI?
2.- Diseño de experimentos
Obtener de manera eficiente y útil los datos sobre los que se concluirá.
7
¿Qué es ADEI?
2.- Diseño de experimentos
y
¿Cuál es la ecuación que describe los puntos?
x 9
¿Qué es ADEI?
3.- Ajuste de modelos
y
¿Es una recta?
y=a*x + b
x
x 10
¿Qué es ADEI?
3.- Ajuste de modelos
y
¿Es una cuadrática?
y=ax2+bx + c
11
¿Qué es ADEI?
3.- Ajuste de modelos
y
¿Es una cúbica?
Y=ax3+bx2+cx+d
x
12
¿Qué es ADEI?
3.- Ajuste de modelos
x
13
¿Qué es ADEI?
3.- Ajuste de modelos
x
14
¿Qué es ADEI?
3.- Ajuste de modelos
x
15
¿Qué es ADEI?
3.- Ajuste de modelos
x
16
¿Qué es ADEI?
3.- Ajuste de modelos
x
17
Ejemplos de aplicación
18
Ejemplo de aplicación: Descripción.
Una fábrica de barras de cereal imprime en las etiquetas de sus productos que estos
contienen un 4% de fibra.
Sus maquinarias, que no son perfectas, añaden una cantidad de fibra con una
variabilidad de ±2%. Por lo que está obligada añadir una cantidad de fibra promedio
de 6%, para asegurar que sus productos cumplan con lo indicado en la etiqueta
%Fibra
8%
6%±2%
4% 4%
Tiempo
19
Ejemplo de aplicación: Descripción.
Una fábrica de barras de cereal imprime en las etiquetas de sus productos que estos
contienen un 4% de fibra.
Sus maquinarias, que no son perfectas, añaden una cantidad de fibra con una
variabilidad de ±2%. Por lo que está obligada añadir una cantidad de fibra promedio
de 6%, para asegurar que sus productos cumplan con lo indicado en la etiqueta
20
Ejemplo de aplicación: Descripción.
Suponiendo que cada barra de cereal pesa 100 [g], y que la fábrica solo cuenta con
100 [kg] de fibra por día ¿Cuánto fue posible aumentar la producción de barras de
cereal por día gracias a las mejoras hechas por el joven ingeniero?
4% a 8%
4% a 6%
6% AUMENTO DEL 17%
5%
4% EN LA PRODUCCIÓN
Tiempo
21
Ejemplo de aplicación: Optimización
Supongamos que tenemos un proceso químico en donde se sintetiza un valioso producto B.
De acuerdo a la cinética de formación de B, mientras más alta esté la temperatura del
reactor, mayor será la cantidad de producto obtenida (mayores ingresos).
22
Ejemplo de aplicación: Optimización
Supongamos que tenemos un proceso químico en donde se sintetiza un valioso producto B.
De acuerdo a la cinética de formación de B, mientras más alta esté la temperatura del
reactor, mayor será la cantidad de producto obtenida (mayores ingresos).
23
Ejemplo de aplicación: Optimización
Supongamos que tenemos un proceso químico en donde se sintetiza un valioso producto B.
De acuerdo a la cinética de formación de B, mientras más alta esté la temperatura del
reactor, mayor será la cantidad de producto obtenida (mayores ingresos).
24
Ejemplo de aplicación: Detección de anomalías.
Es una aplicación de los clasificadores. Supongamos el caso de un motor, el cual mientras a más
RPM se mueve, más vibraciones genera.
Frontera de normalidad
RPM
25
Ejemplo de aplicación: Detección de anomalías.
Es una aplicación de los clasificadores. Supongamos el caso de un motor, el cual mientras a más
RPM se mueve, más vibraciones genera.
Frontera de normalidad
RPM
26
Rol del diseño de experimento
Descriptiva: Resumir, organizar y simplificar.
28
Tipos de variables
Se clasifican según su medición y dependencia.
29
Tipos de variables
Se clasifican según su medición, dependencia e influencia.
Dependencia
Independientes: No depende de otro valor, el investigador
puede fijarlas arbitrariamente. Ej: reactivo adicionado.
30
Organización de datos
31
Organización de datos
Si tenemos una muestra de pocos datos y los graficamos, podemos extraer de forma fácil
información a partir de ellos.
x x x xx x x x x
2 3 4 5 6 7 8
Aquella representación podría ser útil, pero ¿qué pasa si aumenta la cantidad de datos?
Ciertamente los datos se hacen indistinguibles. Es por esto que es necesario generar un
arreglo ordenado de tal forma que muestre de forma simplificada las características
fundamentales de los datos.
32
Organización de datos
1.- Tabla de Frecuencia
𝐹𝑖 = 𝑓𝑖 Cuando 𝑖 = 𝑛, 𝐹𝑖 = 1
33
𝑖=1
Organización de datos
Ejemplo: Tabla de frecuencia, datos discretos
=2/34
Frecuencia Fabs_ Frecuencia Frel_
Clase
absoluta acumulada relativa acumulada
1 2 2 0,06 0,06
2 1 3 0,03 0,09
3 3 6 0,09 0,18
4 5 11 0,15 0,32
5 7 18 0,21 0,53
6 6 24 0,18 0,71
7 3 27 0,09 0,79
8 4 31 0,12 0,91
9 2 33 0,06 0,97
10 1 34 0,03 1,00
TOTAL 34 1,00
34
Organización de datos
Ejemplo: Tabla de frecuencia, datos continuos
Datos Paso 1: Determinar número de clases
29,57 39,64 50,9
37,77 36,81 32,38 - Regla de Sturges:
36,67 51,21 34,05 𝑘 = 1 + 3,322 log 𝑛
50,73 45,43 42,41
- Regla de Fisher:
37,83 26,99 50,05
38,45 33,16 32,89 𝑘= 𝑛
33,64 41,63 64,68 Para este caso:
35,04 47,17 33 𝑘 = 50 = 7,07~8
33,7 40,56 33,74
63,47 44,95 48,53
60,29 44,48 56,8 Paso 2: Determinar amplitud de la clase
31,34 49,1 36,55 𝑅𝑑 + 𝑙
46,15 41,84 40,09 𝑎=
𝑘
52,49 30,81 45,53 Donde
25,43 30,28 33,9 𝑅𝑑 = 𝑅𝑎𝑛𝑔𝑜 𝑑𝑒 𝑙𝑜𝑠 𝑑𝑎𝑡𝑜𝑠 = 𝑣𝑎𝑙𝑜𝑟 𝑚𝑎𝑦𝑜𝑟 − 𝑣𝑎𝑙𝑜𝑟 𝑚𝑒𝑛𝑜𝑟
33,65 28,99 38,86 𝑙 = 𝑈𝑛𝑖𝑑𝑎𝑑 𝑑𝑒 𝑎𝑑𝑖𝑐𝑖ó𝑛.
34,01 50,86
𝑙 = 1 𝑝𝑎𝑟𝑎 𝑣𝑎𝑙𝑜𝑟𝑒𝑠 𝑑𝑖𝑠𝑐𝑟𝑒𝑡𝑜𝑠
𝑙 = 0.1 𝑝𝑎𝑟𝑎 𝑣𝑎𝑙𝑜𝑟𝑒𝑠 𝑐𝑜𝑛𝑡𝑖𝑛𝑢𝑜𝑠
En este caso:
𝑎 = 4,9~5
35
Organización de datos
Ejemplo: Tabla de frecuencia, datos continuos
Datos Paso 3: Determinar el rango de la tabla y diferencial
29,57 39,64 50,9
37,77 36,81 32,38 𝑅𝑇 = 𝑘 ∙ 𝑎 > 𝑅𝑑
36,67 51,21 34,05
50,73 45,43 42,41
𝐷 = 𝑅𝑇 − 𝑅𝑑 > 0
37,83 26,99 50,05
38,45 33,16 32,89 Para este caso:
33,64 41,63 64,68 𝑅𝑇 = 40
35,04 47,17 33 𝑅𝑑 = 39,25
33,7 40,56 33,74 Y finalmente
63,47 44,95 48,53
𝐷 = 0,75
60,29 44,48 56,8
31,34 49,1 36,55
46,15 41,84 40,09
Paso 4: Construcción de los intervalos de clase
52,49 30,81 45,53
𝐷
25,43 30,28 33,9 𝐿í𝑚𝑖𝑡𝑒 𝑖𝑛𝑓𝑒𝑟𝑖𝑜𝑟 1 𝐿𝐼1 = 𝑚í𝑛 𝑥𝑖 −
33,65 28,99 38,86 2
34,01 50,86
𝐿í𝑚𝑖𝑡𝑒 𝑠𝑢𝑝𝑒𝑟𝑖𝑜𝑟 1 𝐿𝑆1 = 𝐿𝐼1 + 𝑎
𝐿í𝑚𝑖𝑡𝑒 𝑖𝑛𝑓𝑒𝑟𝑖𝑜𝑟 2 𝐿𝐼2 = 𝐿𝑆1
𝐿í𝑚𝑖𝑡𝑒 𝑠𝑢𝑝𝑒𝑟𝑖𝑜𝑟 2 𝐿𝑆2 = 𝐿𝐼2 + 𝑎
36
Organización de datos
Ejemplo: Tabla de frecuencia, datos continuos
Datos Paso 4: Construcción de los intervalos de clase
29,57 39,64 50,9
37,77 36,81 32,38
36,67 51,21 34,05 Finalmente el intervalo es,
50,73 45,43 42,41 [𝐿𝐼1 − 𝐿𝑆1 [
37,83 26,99 50,05 [𝐿𝐼2 − 𝐿𝑆2 [
38,45 33,16 32,89 El valor numérico que caracteriza a este intervalo se
33,64 41,63 64,68
denomina marca de clase.
35,04 47,17 33
33,7 40,56 33,74
𝐿𝐼𝑖 + 𝐿𝑆𝑖
𝑚𝑖 =
63,47 44,95 48,53 2
60,29 44,48 56,8
Límite inferior Límite superior Marca de clase Fabs Facc
31,34 49,1 36,55
25,055 30,055 27,56 5 5
46,15 41,84 40,09
30,055 35,055 32,56 14 19
52,49 30,81 45,53
35,055 40,055 37,56 9 28
25,43 30,28 33,9
40,055 45,055 42,56 8 36
33,65 28,99 38,86 45,055 50,055 47,56 5 41
34,01 50,86 50,055 55,055 52,56 5 46
55,055 60,055 57,56 2 48
60,055 65,055 62,56 2 50
TOTAL 50
37
Gráficos de datos
Ejemplo: Tabla de frecuencia, datos continuos
Límite inferior Límite superior Marca de clase Fabs Facc
25,055 30,055 27,56 5 5
30,055 35,055 32,56 14 19
35,055 40,055 37,56 9 28
40,055 45,055 42,56 8 36
45,055 50,055 47,56 5 41
50,055 55,055 52,56 5 46
55,055 60,055 57,56 2 48
60,055 65,055 62,56 2 50
TOTAL 50
38
Descripción de series de datos
39
Descripción de series de datos
Índices de localización (posición)
1.- Tendencia central
- Media
- Mediana
- Moda
2.- Cuantiles
40
Descripción de series de datos
Índices de localización
1.- Tendencia Central: Busca un representante de lo más común.
- Media o promedio:
𝑛
1 (Datos dispersos)
𝑥ҧ = 𝑥𝑖
𝑛
𝑖=1
𝑥ҧ = 𝑓𝑖 ∙ 𝑚𝑖 (Datos agrupados)
𝑖=1
41
Descripción de series de datos
Índices de localización
1.- Tendencia Central:
𝑛 𝑛
Me 𝑥 2 +𝑥 2+1 (Datos dispersos, nº par)
2
𝑛 𝑎𝑖
𝐿𝐼 50% + − 𝑁𝑖−1 ∙ (Datos agrupados)
2 𝑛𝑖
𝑑1
𝐿𝐼 {𝑚á𝑥 𝑓 } + 𝑎
𝑖 𝑑1 + 𝑑2 𝑖
𝑑1 = 𝑛𝑖 − 𝑛𝑖−1
𝑑2 = 𝑛𝑖 − 𝑛𝑖+1
43
Descripción de series de datos
Índices de localización
2.- Cuantiles: Buscan un representante en los extremos.
Q1 Q2 Q3 Q4
IQR
Se define el Rango Inter Cuartil (IQR) como el lugar donde habitan el 50% de los datos
centrales. 44
Descripción de series de datos
Índices de localización
2.- Cuantiles
𝑗(𝑛 + 1)
𝑃𝑗 = 𝑥 Datos dispersos
100
𝑛∙𝑗 𝑎𝑗
𝑃𝑗 = 𝐿𝐼𝑗 + − 𝑁𝑗−1 Datos agrupados
100 𝑛𝑗
45
Descripción de series de datos
Índices de dispersión
1.- Rango
𝑅𝑎𝑛𝑔𝑜 = 𝑚á𝑥 𝑥 − 𝑚í𝑛 𝑥
2.- Rango inter cuartil (IQR): Elimina datos extremos que pueden ser anómalos.
46
Descripción de series de datos
Índices de dispersión
3.- Desviación estándar y varianza
Dato
5
4
3
2
0 1 2 3 4 5 6 7 8 9 10 11
Tiempo
σ 𝑥𝑖 − 𝑥ҧ 2
𝑠𝑥2 = (si se cuenta con pocos datos, la división es por n-1 en vez de n)
𝑛
48
Descripción de series de datos
Índices de dispersión
Notaremos que si los datos están, por ejemplo, en metros [m], la varianza está en [m2] .
Definimos a la desviación estándar (típica o esperada) como la raíz de la varianza.
σ 𝑥𝑖 − 𝑥ҧ 2
𝑠𝑥 = 𝑠𝑥2 = (si se cuenta con pocos datos, la división es por n-1 en vez de n)
𝑛
La desviación estándar si tiene las mismas unidades del conjunto de datos, y es una medida
de cual es la distancia estándar (típica o esperada) a la que se encuentra un dato del centro
de la serie.
49
Descripción de series de datos
Índices de forma
1.- Asimetría o sesgo: Indica la tendencia que muestran los datos al agruparse.
Frecuencia
Frecuencia
Uniforme Normal
Clase Clase
Frecuencia
Clase Clase
Descripción de series de datos
Índices de forma
52
Gráficos de datos: Boxplot.
Una forma alternativa de representar los datos es a través de un gráfico de cajas o Boxplot.
Recordemos el set de datos y los cuartiles analizados:
min P 25 mediana P 75 max
Datos (ord) 2,9 3,2 4,2 4,7 4,8 5,1 5,4 5,4 7,6 7,9 8,2 8,5
Q1 Q2 Q3 Q4
IQR
Q4 max
Q3 P 75
Q2 mediana
Q1 P 25
Q0 min
53
Robustez
La robustez es la medida en que se ve afectado un indicador por una medición “anómala”.
Por ejemplo fijémosnos en los siguiente set de datos, en donde en uno de ellos se digitó
mal la coma de una cierta medición.
Vemos que tanto el promedio, como la varianza de la distribución se ven afectadas por el
dato anómalo, perdiendo representatividad, es decir, no son indicadores robustos.
Por otro lado, la mediana e IQR no se vieron afectadas, es decir, si resultan ser robustas.
Frecuencia relativa
Frecuencia relativa
54
Anómalos u outliers
Las mediciones anómalas, fallas o no representativas, pueden ser muy comunes y afectar
significativamente las características del set de datos, así que deben ser descartadas
oportunamente antes de hacer un análisis más acabado.
55
Reconocimiento de anómalos
Método 1: Mediante indicadores no robustos
• Se determina un límite superior e inferior de la siguiente forma: 𝐿𝑖𝑚𝑖𝑡𝑒𝑠 = 𝑥ҧ ± 2𝑠
• Todo lo que esté fuera de esos límites se considera anómalo. Consideremos el siguiente
conjunto de datos.
Datos 5,9 3,6 4,7 57 4,8 4,5 4,0 4,4 4,1 2,8
IndicadoresCon
antes:indicadores no robustos, quitar outliersdespués:
Indicadores modifica
Promedio=los10,1límites inferior y superior, los Promedio=
cuales deben
4,4 ser re
Desviación= 17,6 Desviación= 1,0
calculados
Limite inferior = -25,0
y re crear los límites hasta que ya no se
Limite inferior = 2,4
vean= 45,3
Límite superior outliers. Límite superior = 6,4
• Todo lo que esté fuera de esos límites se considera anómalo. Consideremos el siguiente
conjunto de datos.
Datos 5,9 3,6 4,7 57 4,8 4,5 4,0 4,4 4,1 2,8
Indicadores:
57
Min = 2,8 Hay que notar que el quitar
P25 = 3,8 . los outliers del set de datos
Med = 4,45 . no modifica ni el centro ni la
P75 = 4,75 . dispersión al usar indicadores
Max = 57 6,2
robustos.
IQR = 0,95
4,8
Frontera inferior:
4,4
3,8-1,5*0,95 = 2,375
58
Aleatoriedad
Aleatoriedad
Se dice que una variable es muestreada de manera aleatoria cuando cada elemento
de la población tiene la misma chance de ser seleccionada.
Repetitividad:
Cuando una operación es repetida los resultados observados rara vez son idénticos,
pueden existir fluctuaciones.
Fluctuaciones:
60
Error vs número de datos
Media poblacional n % Error % Error
10 9,949 0,324 0,2714 11,3
𝑛 𝑁 100 9,96 0,2097 0,2506 2,77
1 1 500 9,981 0,006 0,2495 2,315
η = lim 𝑥𝑖 = 𝑥𝑖
𝑛→∞ 𝑛 𝑁 1000 9,981 0 0,2439 0
𝑛 𝑖=1
Varianza poblacional
𝑁
2
1
𝜎 = (𝑥𝑖 −η)
𝑁
𝑖=1
61
Histograma y PDF
Dado un conjunto de datos obtenidos a partir de un experimento: Qué pasa si aumenta el
número de datos?
𝑛→∞ Población
Función de densidad de
probabilidad (PDF): describe
𝑓𝑖 𝑥 el comportamiento probable
𝐹𝑥 𝑥 =
∆𝑥 de una población (variable
aleatoria continua).
62
Histograma y PDF
Función de densidad de probabilidades para variables continuas:
𝐹𝑥 𝑥 ≥ 0, ∀ 𝑥 ∈ 𝑆
+∞
Pr 𝑆 = න 𝐹𝑥 𝑥 𝑑𝑥 = 1
−∞
𝑏
Existen distintas
Distribución de
Pr 𝑎 ≤ 𝑥 ≤ 𝑏 = න 𝐹𝑥 𝑥 𝑑𝑥 funciones de densidad
probabilidades
𝑎 de probabilidad.
Media
+∞
η=𝐸 𝑥 =න 𝑥𝐹 𝑥 𝑑𝑥
−∞
Varianza
+∞
σ2 =𝑉 𝑥 =න 𝑥 − η 2 𝐹 𝑥 𝑑𝑥
−∞
63
Probabilidad
La Probabilidad de un evento (Pr(E)) se puede definir como la medida cuantitativa de la
posibilidad de ocurrencia de un determinado evento.
Se le asigna un valor entre 0-1 (y/o entre 0-100%). Cuando su valor se acerca a cero es menos
probable y cuando es cercano a uno es más probable.
La gráfica de la función de densidad para una distribución normal tiene una forma acampanada
y es simétrica respecto a un determinado parámetro estadístico (media, modo y mediana) y su
función de densidad de probabilidad es la siguiente:
1 𝑋−η 2
−
𝐹𝑥 𝑋, η, 𝜎 = 𝑒 2𝜎 2
𝜎𝑥 2𝜋
65
Distribución normal
La función de distribución de probabilidad normal (CDF) es :
𝑏 𝑏
1 𝑋−η 2
−
Pr(𝑎 ≤ 𝑥 ≤ 𝑏) = න 𝐹𝑥 𝑋, η, 𝜎 = න 𝑒 2𝜎2
𝑎 𝑎 𝜎𝑥 2𝜋
Si la distribución es similar a una normal, es usual aproximar a que todos los datos se
hallan entre ±3 desviaciones estándar. Es decir, se toma el máximo y mínimo y en base a
aquello se estima la desviación (sobretodo en control de calidad). 66
PDF y CDF normal
PDF
La media determina la ubicación del centro
de la distribución
CDF
67
CDF normal
Lamentablemente no hay una expresión analítica para calcular de forma exacta el valor de la
integral correspondiente a la CDF. Sin embargo, existen varias formas de calcularla
aproximadamente.
𝑏 𝑏
1 𝑋−η 2
−
Pr(𝑎 ≤ 𝑥 ≤ 𝑏) = න 𝐹𝑥 𝑋, η, 𝜎 = න 𝑒 2𝜎2
𝑎 𝑎 𝜎𝑥 2𝜋
Utilizar la aproximación numérica del En el pasado, otros estadísticos Obtener el valor de alguna
área bajo la curva a una serie de tabularon el valor de la integral aplicación como Excel, Matlab o
tetraedros (es una curva suave). para límites conocidos. webapp.
68
Distribución normal tipificada
Tablas tipificadas
1 𝑋2
−2
𝐹𝑥 𝑋, η, 𝜎 = 𝑒
𝜎𝑥 2𝜋
69
Distribución normal tipificada
Para utilizar las tablas es necesario transformar cualquier variable que se distribuya como
una normal en una normal tipificada. Para hacer este cambio, se crea una nueva variable Z
que será igual a la anterior X menos su media y dividida por su desviación estándar.
𝑋−η
𝑋 → 𝑁(η, 𝜎) 𝑍= → 𝑁(0,1)
𝜎
𝑋−η 𝑎−η
Pr 𝑋 ≤ 𝑎 = Pr ≤ = Pr 𝑍 ≤ 𝑧𝑎
𝜎 𝜎
70
Tabla de probabilidad normal
71
Ejemplos
1) Pr 𝑍 < −0,86 = ?
2) Pr 𝑍 > 1,26 = ?
3) Pr 𝑍 > −1,37 = ?
72
Ejemplos
1) Pr 𝑍 < −0,86 = ?
73
Ejemplos
2) Pr 𝑍 > 1,26 = ?
74
Ejemplos
1) Pr 𝑍 > 1,26 = ?
75
Ejemplos
3) Pr 𝑍 > −1,37 = ?
76
Ejemplos
4) Pr −1,25 < 𝑍 < 0,37 = ?
Aplicando la idea de que la integral debe ser igual a 1 para Z Є [−∞, ∞], el área bajo la
curva se puede obtener como:
77
Ejemplos
78
Ejercicios de estadística
1) Determinar la conductividad eléctrica promedio y su desviación estándar para la
producción de cobre utilizando los datos registrados cada 2 horas.
Conductividad (S/mx10^7)
Respuesta
6,229
= 𝟔, 𝟗
6,877
= 𝟎, 𝟗𝟑𝟕
4,831
6,391
5,306
5,743
6,131
7,749
7,345
79
Ejercicios de estadística
2) La tabla de frecuencias exhibe las edades de una muestra de 36 personas que asistieron
a una película:
Años Frecuencia
8-13 2 a. Hallar el promedio
14-19 7
b. Hallar la varianza
20-25 13
26-31 5 c. Hallar la desviación estándar
32-37 9
Respuesta
a) = 𝟒, 𝟓
b) = 𝟓 𝒂ñ𝒐
c) = 𝟕, [𝒂𝒏𝒐 ]
80
Ejercicios de estadística
3) La tabla muestra una distribución de frecuencias de la duración de 400 tubos de radio
comprados en la L & M Tube Company
81
Ejercicios de estadística
3) La tabla muestra una distribución de frecuencias de la duración de 400 tubos de radio
comprados en la L & M Tube Company
Respuesta
a. 800
Duración [h] N° de tubos (N=400) b. 1000
300-400 14 c. 950
400-500 46 d. 100
500-600 58 e. 76
f. 0,1555
600-700 76
g. 29,5%
700-800 68 h. 19%
800-900 62 i. 78%
900-1000 48 j. _
1000-1100 22 k. _
l. _
1100-1200 6
m. 23,7%
n. 10,6%
o. 46,15%
82
Ejercicios de estadística
83
Ejercicios de estadística
4) Si x es una variable aleatoria de distribución normar N(,) hallar:
𝑃(η − 𝑎𝜎 ≤ 𝑥 ≤ η + 𝑎𝜎)
Respuesta
La distribución es simétrica
a a y es común que las tablas
p z solo informen valores
positivos.
p(a z a) p( z a) p( z a) 1 p( z a)
84
Ejercicios de estadística
5) Si x es una variable aleatoria de distribución normar N(,) hallar:
𝑃(η − 3𝜎 ≤ 𝑥 ≤ η + 3𝜎)
Respuesta: 99,74%
Respuesta: 1,66
7) En una ciudad se estima que la temperatura máxima en el mes de junio sigue una
distribución normal, con media 23° y desviación típica 5°. Calcular el número de días del
mes en los que se espera alcanzar máximas entre 21° y 27°.
Respuesta: 13 días
85
Inferencia Estadística
86
Inferencia estadística
El objetivo de la inferencia estadística es obtener conclusiones relativas a la población a
partir de los datos muestrales.
Conclusiones
Población Datos Muestra Inferencia respecto a la
población!
87
Inferencia estadística
Para que la inferencia estadística sea válida la toma de muestras debe ser adecuada para
que sea representativa.
Existen variados desaciertos que pueden invalidar el resultado de nuestro análisis. Por
ejemplo:
• Efectuar un muestreo que no sea aleatorio
• Definir una independencia estadística donde no la hay
• Datos poco representativos.
Para combatir esas y otras deficiencias nacen las 3 herramientas fundamentales del diseño
de experimento:
1. Bloqueo
2. Randomizado
3. Réplicas
88
Estimación de parámetros
η
𝝈
Estimadores
Varianza poblacional
𝑁
2
1
𝜎 = (𝑥𝑖 −η)
𝑁
𝑖=1
90
Estimación de parámetros
Al ser el parámetro poblacional un estimador muestral de una variable que es aleatoria, el
mismo también se convertirá en una variable aleatoria.
Muestra 𝑥ҧ1
aleatoria
91
Estimación de parámetros
Dispersión de los promedios poblacionales:
Recordamos que la varianza de los datos de una población se puede calcular por:
V ( xa ) 2
Sin embargo si en vez de todos los datos consideramos solo los promedios de ciertos
intervalos tenemos que:
2
x2 V ( xa ) Donde na representa el numero de elementos en cada intervalo.
a
na
Evidentemente la variabilidad de los promedios será menor o igual a la variabilidad del set de
datos completo.
1
x Error estándar de la media poblacional
a
na
92
Estimación de parámetros
Si no se conoce ? Se puede estimar la dispersión de los promedios muestrales a partir
de la varianza muestral, de la siguiente manera.
𝑠
𝑠𝑥ҧ 𝑎 = Error estándar de la media muestral
𝑛𝑎
Ejemplo: Un artículo describe un nuevo método para medir conductividades térmicas de
un determinado acero, utilizando como método experimental un fluido a 100[°F] y una
fuente de poder de 550[W]. Los datos obtenidos se presentan a continuación. Indicar el
estimador de la media poblacional y su error estándar.
Datos
41,6
41,48 𝑥ҧ10 = 41,924
42,34
41,95 𝑠 0,2841
41,86 𝑠𝑥ҧ 𝑎 = = = 0,0898
𝑛𝑎 10
42,18
41,72
42,26
41,81
42,04 93
Estimación de parámetros
n=50
η =?
= 𝟏𝟎, 𝟓
𝝈 =?
s= 𝟎, 𝟓
n=50
η =?
= 𝟏𝟎, 𝟓
𝝈 =?
s= 𝟎, 𝟓
96
Estimación de parámetros
Si considero que la variable es aleatoria y sigue una distribución normal.
¿Entre qué rangos voy a encontrar la mayoría del tiempo el promedio?
Caso 1: Si se conoce σ, el rango del promedio muestral con un 95% de certeza es:
𝜎
𝑥ҧ ± 1,96 ∙ Error de estimación
𝑛 97
Estimación de parámetros
¿Entre qué rangos voy a encontrar la mayoría del tiempo el promedio?
𝜎 𝜎 𝜎
𝐼95% 𝐶(𝜇) = 𝑥ҧ ± 1,96 ∙ = [𝑥ҧ − 1,96 ; 𝑥ҧ + 1,96 ]
𝑛 𝑛 𝑛
Intervalo de confianza
Se abrevia: 𝑰𝟗𝟓% 𝑪
Escrito de forma más general para cualquier nivel de confianza, el intervalo para la
media poblacional cuando se conoce σ, es:
𝜎
𝐼𝛾% 𝐶(𝜇) = 𝑥ҧ ± 𝑍1−𝛼 ∙
2 𝑛
98
Por qué?
Estimación de parámetros
¿Entre qué rangos voy a encontrar la mayoría del tiempo el promedio?
Queremos encontrar los valores entre los que se mueve la media (T1 y T2) con un
𝛾% de confianza, escrito de otra forma :
Pr 𝑇1 ≤ 𝜇 ≤ 𝑇2 = 𝛾
Estandarizando:
𝜇 − 𝑥ҧ
Pr 𝑞1 ≤ 𝜎 ≤ 𝑞2 = 𝛾 = 1 − 𝛼 (∗)
𝑛
99
Estimación de parámetros
Para encontrar q1 y q2, suponga la campana de gauss:
𝑞1 = 𝑍𝛼 y 𝑞2 = 𝑍𝛾+𝛼
2 2
Considerando 𝛾 =1−𝛼
α/2 % Ƴ% α/2 %
𝑞2 = 𝑍1−𝛼 Por simetría:
2
𝑞1 = −𝑞2 𝑞1 = −𝑍1−𝛼
2
q1 q2
𝜎 𝜎
Pr 𝑥ҧ − 𝑍1−𝛼 ∙ ≤ 𝜇 ≤ 𝑥ҧ + 𝑍1−𝛼 ∙ =𝛾 =1−𝛼
2 𝑛 2 𝑛
𝜎
𝐼𝛾% 𝐶 = 𝑥ҧ ± 𝑍1−𝛼 ∙ Error de estimación
2 𝑛
100
Estimación de parámetros
¿Entre qué rangos voy a encontrar la mayoría del tiempo el promedio?
Caso 2: Si no se conoce σ, el rango de la media poblacional debería ser algo así:
𝑠
𝜇 = 𝑥ҧ ± ? ∙
𝑛
El rango o la amplitud del error ya no es el mismo.
¿Cómo será el error de estimación, mayor o menor a cuando se conoce la varianza
poblacional?
Respuesta: El error de estimación será mayor, debido a que tengo menor certeza de
asegurar que el promedio se encuentre dentro de ese rango, por ende el ancho del
intervalo de confianza será mayor.
𝑠
𝜇 = 𝑥ҧ ± 𝑡1−𝛾%,𝑣
𝑛
T-student
102
T-Student
Distribución t-student:
Es una función de densidad de probabilidad cuya función es:
Lamentablemente no hay una expresión analítica para calcular de forma exacta el valor de la
integral correspondiente a la CDF. Sin embargo, existen varias formas de calcularla
aproximadamente.
Utilizar la aproximación numérica del En el pasado, otros estadísticos Obtener el valor de alguna
área bajo la curva a una serie de tabularon el valor de la integral aplicación como Excel, Matlab o
tetraedros (es una curva suave). para límites conocidos. webapp.
104
T-Student
Tablas tipificadas
Datos tabulados: Una sola tabla:
Una tabla para Distribución t-student
Adimensionalizar!!
cada y s
Para utilizar las tablas es necesario transformar cualquier variable que se distribuya como
una t-student en una variable estándar. Para hacer este cambio, se crea una nueva variable
“t” que será igual a la anterior X menos su media y dividida por su desviación estándar
muestral.
𝑥−𝜇
𝑋 → 𝑡(𝜇, 𝑠) 𝑡 =
𝑠
Mediante esta
𝑋 − 𝜇ҧ 𝑎 − 𝜇 transformación es posible
Pr 𝑋 ≤ 𝑎 = Pr ≤ = Pr 𝑡 ≤ 𝑡𝑎
𝑠 𝑠 utilizar una sola tabla.
𝑥ҧ − 𝜇
μ→ 𝑡(𝜇, 𝑠) 𝑡= 𝑠
𝑛
𝑥ҧ − 𝜇 𝑎 − 𝜇
Pr 𝑥ҧ ≤ 𝑎 = Pr 𝑠 ≤ 𝑠 = Pr 𝑡 ≤ 𝑡𝑎
𝑛 𝑛
Sobre la base de un intervalo del 95% de confianza ¿Estaría inclinado a sostener que los
contenidos promedios de fósforo de las estaciones son significativamente distintos?.
108
Ejemplo: Comparación de dos tratamientos
EXPERIMENTO MÉTODO RESULTADO
Ejemplo industrial: 1 A 89,7
2 A 81,4
En una planta química el porcentaje de conversión 3 A 84,5
de cierto elemento depende de las condiciones de 4 A 84,8
reacción. El método habitual es el llevado a cabo 5 A 87,3
con las condiciones A. Sin embargo se ha propuesto 6 A 79,7
un nuevo método según un conjunto de 7 A 85,1
condiciones B. Los resultados obtenidos son los 8 A 81,7
siguientes: 9 A 83,7
10 A 84,5
11 B 84,7
12 B 86,1
¿Es el método modificado mejor 13 B 83,2
14 B 91,9
que el método oficial? 15 B 86,3
16 B 79,3
17 B 82,6
18 B 89,1
19 B 83,7
109
20 B 88,5
Aplicación: Comparación de dos tratamientos
EXPERIMENTO MÉTODO RESULTADO Indicadores:
1 A 89,7 Promedio del método A: 84,24
2 A 81,4 Promedio del método B: 85,54
3 A 84,5
4 A 84,8 Gráficamente:
5 A 87,3
6 A 79,7 Comparación de dos tratamientos
7 A 85,1 Método A Método B
94
8 A 81,7
92
9 A 83,7 90
10 A 84,5
Conversión
88
11 B 84,7 86
12 B 86,1 84
13 B 83,2 82
14 B 91,9 80
78
15 B 86,3 0 5 10 15 20
16 B 79,3 Número de experimento
17 B 82,6
18 B 89,1 ¿Es el método modificado mejor que el
19 B 83,7 110
20 B 88,5 método oficial?
Aplicación: Comparación de dos tratamientos
Haciendo un acercamiento podemos notar que a instantes el promedio de la muestra
puede variar considerablemente dentro de un intervalo de tiempo preestablecido. Entonces
Comparación de dos tratamientos
¿como estamos seguros que el promedio obtenido por el método B realmente representa una
mejora en el proceso? Método A Método B
94 Comparación de dos tratamientos
92 Método A Método B
94
90
92
Conversión
88 90
Conversión
86 88
86
84
84
82 82
80 80
78
78
0 5 10 15 20
0 2 4 6 8 10 12 14 16 18 20
Número de experimento
Número de experimento
2
s A / nA
2
2
s B / nB
2
15
16
B
B
86,3
79,3
nA 1 nB 1 17 B 82,6
18 B 89,1
A pesar que esa es la formalidad, lo que hemos utilizado es una 19 B 83,7
20 B 117
88,5
buena aproximación trabajando con datos imperfectos reales.
Intervalo de confianza de la varianza
Hasta el momento nos hemos centrado en comparar estadísticamente los promedios de los
datos muestreados, para comparar los rendimientos medios de alternativas de tratamientos o
métodos.
Algunas veces es de vital importancia el grado de variación de los datos. Tal es el caso de las
variables que indican cierto nivel de calidad, plantas que no pueden exceder cierto nivel de
emisiones, equipos con control de temperatura, acidez, o similares donde una variación excesiva
de alguna propiedad puede afectar los equipos, el medio ambiente o elevar los costos de
producción.
Supongamos que Z1, Z2,… Zv son un conjunto de observaciones independientes entre si, con
distribución N(0,1), luego:
D
Tiene una distribución 2, donde es el número de
u
Z 2
u 1
grados de libertad.
118
Distribución Chi2 (2)
u u Z
Para todo x > 0. ( representa una función gamma)
21
2 2
* Z *e 2
f (Z , u)
u 2
Cuando u=k , 2 N (v>50)
Su media es: u
119
Distribución Chi2 (2)
y0 y 0
2
Z0
N (0,1) Y 2
n2
Factor común
120
Distribución Chi2 (2)
y0 y 0
2
Z0
N (0,1) Y 2
n2
s*2
y 0
2
ns*2
2 s*2
v2 (escalada)
2 n 2
n v
121
Distribución Chi2 (2)
Lo más común es que la media sea desconocido, con lo que:
s 2
y u y 2
o y u y
2
n21
n 1 2
s2 2
(n 1) * 2
n 1
o s
2
* n21
2 n 1
123
Distribución Chi2 (2)
124
Distribución Chi2 (2)
n 1 s 2 n 1 s 2
P 2 2 2 1
/ 2, n 1
1 / 2 , n 1
125
Test de hipótesis
126
Prueba de Hipótesis
Definiciones generales
Hipótesis estadística: Es una conjetura o suposición que se realiza respecto a una población,
más específicamente, a un parámetro de la población (media, varianza, asimetría...etc).
En una investigación se plantean generalmente dos hipótesis mutuamente excluyente, en
esta metodología se definen como hipótesis nula e hipótesis alternativa.
Hipótesis Estadística
𝐻𝑜 : 𝜇 = 𝑎 𝐻𝑜 : 𝜇 = 𝑎 𝐻𝑜 : 𝜇 = 𝑎
𝐻1 : 𝜇 ≠ 𝑎 𝐻1 : 𝜇 < 𝑎 𝐻1 : 𝜇 > 𝑎
128
Prueba de Hipótesis
Que decisión tomo?
Test de Hipótesis
Toma de decisión:
¿Acepto o rechazo
la hipótesis nula?
129
Prueba de Hipótesis
𝑯𝟎 𝑯𝟏
Toma de decisión:
¿Acepto o rechazo la hipótesis nula?
Región de aceptación: Son los valores de los estadísticos que son compatibles con la
hipótesis nula. Generalmente corresponde a la región donde la probabilidad de
encontrar un cierto parámetro estadístico sea mayor a 𝛼%.
Región de rechazo: Son los valores de los estadísticos que son incompatibles con la
hipótesis nula. Generalmente corresponde a la región donde la probabilidad de
encontrar la un cierto parámetro estadístico sea menor a un 𝛼%.
131
Prueba de Hipótesis
Valor crítico: Es el valor del estadístico de prueba en su correspondiente distribución (Z,
T…etc.) que divide dicha distribución en dos regiones: una de aceptación y otra de rechazo.
Error tipo I: ocurre cuando la hipótesis nula es rechazada cuando realmente es cierta. La
probabilidad máxima de que ocurra un error tipo I es 𝛼%.
Error tipo II: ocurre cuando la hipótesis nula es aceptada cuando realmente no es falsa. La
probabilidad máxima de que ocurra un error tipo II es 𝛽%.
133
Prueba de Hipótesis
Pasos para realizar un test de hipótesis:
Paso 1: Planteamiento de la hipótesis nula y alternativa
134
Prueba de Hipótesis
Ejemplo Caso 1:
Un reactor químico fue diseñado para que bajo ciertas condiciones de operación la
conversión promedio de éste sea de un 90%. Un grupo de ingenieros sospechan que debido
al desgaste que ha sufrido el reactor y el cambio en las condiciones de operación, la
conversión debe haber cambiado. Para comprobar esta suposición toman 10 muestras del
producto de reacción y obtienen que la conversión promedio es de un 85% y la desviación
estándar del set de datos es de 2%. Usted aceptaría o rechazaría la hipótesis propuesta por
los ingenieros?
𝛼 = 0,05
135
Prueba de Hipótesis
Paso 3: Definir región de aceptación y rechazo
𝑥ҧ − 𝜇
𝑡= 𝑠
𝑛
𝑥ҧ − 𝜇 85 − 90
𝑡= 𝑠 = = −7,905
2
𝑛 10
Prueba de Hipótesis
Paso 5: Ubicar valor obtenido de la función pivotal en la función de probabilidad
Un reactor químico fue diseñado para que bajo ciertas condiciones de operación la
conversión promedio de éste sea de un 90%. Un grupo de ingenieros sospechan que debido
al desgaste que ha sufrido el reactor la conversión debe haber disminuido. Para comprobar
esta suposición toman 10 muestras del producto de reacción y obtienen que la conversión
promedio es de un 85% y la desviación estándar es de 2%. Usted aceptaría o rechazaría la
hipótesis propuesta por los ingenieros?
𝛼 = 0,05
138
Prueba de Hipótesis
Paso 3: Definir región de aceptación y rechazo
𝑥ҧ − 𝜇
𝑡= 𝑠
𝑛 Región de rechazo
α
1- α
𝑥ҧ − 𝜇 85 − 90
𝑡= 𝑠 = = −7,905
2
𝑛 10
Prueba de Hipótesis
Paso 5: Ubicar valor obtenido de la función pivotal en la función de probabilidad
Región de rechazo
α
1- α
-7.905 -1.833