Clase 1: Estadística
Programa
• Unidad 1
– Estadística descriptiva y probabilidades
• Unidad 2
– Variables aleatorias y funciones de distribución
• Unidad 3
– Inferencia Estadística
Resultado de aprendizaje
Aplica los métodos estadísticos a muestras de datos y distribuciones de
probabilidad, para obtener información respecto de problemáticas de
ingeniería.
Introducción
Los ingenieros son tomadores de decisión, pero… ¿cómo puedo tomar una
buena decisión? ¿Cómo selecciono la mejor alternativa?¿Con que argumento
puedo justificar mi decisión?
CUALITATIVAS CUANTITATIVAS
Son valores
Sus valores
categóricos
son
(Cualidades,
cantidades
atributos,
numéricas
conceptos,
etc.)
Estadística Descriptiva
Dentro de cada tipo de variable se encuentra una sub-clasificación:
CUALITATIVAS CUANTITATIVAS
Media muestral
𝑥ҧ = 𝑥𝑖
𝑖=1
𝑛
Características de los datos
➢ Variabilidad o dispersión
Varianza muestral
𝑛
2
2 𝑥𝑖 − 𝑥ҧ
𝑠 =
𝑖=1
𝑛 −1
𝑟 = max 𝑥𝑖 − min 𝑥𝑖
n: 25
n: 25
3 6* | 134
6 6 | 134556 6 6. | 556
(9) 7 | 011357889 10 7* | 0113
10 8 | 1344788 (5) 7. | 57889
3 9 | 235 10 8* | 1344
6 8. | 788
A veces es conveniente incluir mas 3 9* | 23
tallos o clases, como dividir la mitad 1 9. |5
de cada clase en dos diferentes.
Diagramas de tallo y Hoja: Ejemplo
n: 80
1 7|6
2 8|7
3 9|7
5 10 | 15
8 11 | 058
• Los software de estadística cómo 11 12 | 013
R agregan una columna a la 17 13 | 133455
25 14 | 12356899
izquierda en la cual se
37 15 | 001344678888
proporciona el conteo de datos, (10) 16 | 0003357789
lo que facilita determinar 33 17 | 0112445668
23 18 | 0011346
características como percentiles,
16 19 | 034699
mediana y moda 10 20 | 0178
6 21 | 8
5 22 | 189
2 23 | 7
1 24 | 5
Características de los datos
La Mediana muestral es una medida de tendencia central, que divide los
datos en dos parte iguales.
160 + 163
𝑀𝑒𝑑𝑖𝑎𝑛𝑎 = = 161,5
2
Características de los datos
La moda muestral es el valor que ocurre con mayor frecuencia, para el problema
de las resistencias con la ayuda del diagrama es fácil determinar que el valor que
más se repite es 158.
Cuartiles
– El primer cuartil 𝒒𝟏 es aquel que deja aproximadamente un 25% de los
datos bajo y un 75% sobre
– El segundo cuartil 𝒒𝟐 es aquel que deja el 50% de las observaciones bajo
y el 50% sobre y es exactamente igual a la mediana.
– El tercer cuartil 𝒒𝟑 es aquel que deja aproximadamente el 75% de los
datos bajo y un 25% sobre.
Características de los datos
Dependiendo el software la posición de los cuartiles se puede determinar de
diferentes maneras, según R la posición de los cuartiles se obtiene ordenando
las observaciones, la ubicación del primer y tercer cuartil
𝑛−1 3 𝑛−1
+1 y +1
4 4
80 − 1 3 80 − 1
+ 1 = 20,75 y + 1 = 60,25
4 4
Características de los datos
– Como 𝒒𝟏 está en la ubicación 20,75 y las observaciones ordenadas 20 y 21
son 143 y 145, haciendo interpolación queda 𝒒𝟏 = 𝟏𝟒𝟒, 𝟓
𝑘 𝑛−1
+1
100
Si el valor no es entero se debe interpolar. En el ejemplo de las resistencias el
percentil 95 se ubica en la posición 76,05.
Como en la posición 76 está el dato 221 y en la posición 77 el dato 228, el
percentil 95 es 221,35.
Quintiles: Ejemplo
Distribución de ingresos en Chile por Quintiles (Mayol, 2011)
Deciles: Ejemplo
Distribución de ingresos en Chile por Deciles (Mayol, 2011)
Percentiles: Ejemplo
Distribución de ingresos en Chile por Percentiles (Mayol, 2011)
Distribuciones de frecuencia e
histogramas
Una distribución de frecuencia es un resumen de datos más
compacto que el diagrama de tallo y hoja.
Los datos ubicados después de los bigotes pero a menos de 3 𝐼𝑄𝑅 (puntos
atípicos)se representan por puntos.
Gráficas de cajas y bigote
Gráficas de caja y bigotes
Caja y bigotes para el problema de las resistencias.
250
200
X0
150
100
Resumen
• El resumen de los datos entrega una buena información de éstos,
principalmente de su variabilidad y tendencia central.