Anda di halaman 1dari 32

Curso: Matemáticas para Ingeniería Civil

Clase 1: Estadística
Programa
• Unidad 1
– Estadística descriptiva y probabilidades
• Unidad 2
– Variables aleatorias y funciones de distribución
• Unidad 3
– Inferencia Estadística

Resultado de aprendizaje
Aplica los métodos estadísticos a muestras de datos y distribuciones de
probabilidad, para obtener información respecto de problemáticas de
ingeniería.
Introducción
Los ingenieros son tomadores de decisión, pero… ¿cómo puedo tomar una
buena decisión? ¿Cómo selecciono la mejor alternativa?¿Con que argumento
puedo justificar mi decisión?

Suponga la siguiente situación:


“Usted debe entregar a su cliente un cierto lote de producto, el cliente le
pregunta para cuando debiese estar el pedido, usted no sabe lo que pasará en
el futuro pero maneja la información suficiente para indicarle con cierta
certeza la fecha de entrega” ¿Cómo pudo dar esa información?
¿Qué es la estadística?
Estadística Descriptiva
• La estadística trata de la recolección, presentación, análisis y uso de los
datos para la toma de decisiones (Montgomery y Runger, 2010)

• Los métodos estadísticos se utilizan para describir y entender la


variabilidad.

– ¿Cuál es el rendimiento de su automóvil?


Estadística Descriptiva
Conceptos básicos de estadística:

• Población: El concepto de población en estadística va más allá de lo que


comúnmente se conoce como tal. Una población se precisa como un
conjunto finito o infinito de elementos (personas, cosas o eventos) que
poseen alguna característica común, de interés para un estudio.

• Muestra: Es un subconjunto representativo de la población.

• Tipos de variables: Existen dos grandes grupos de clasificación, las


variables cualitativas y las variables cuantitativas.
Estadística Descriptiva
Tipos de variables

CUALITATIVAS CUANTITATIVAS

Son valores
Sus valores
categóricos
son
(Cualidades,
cantidades
atributos,
numéricas
conceptos,
etc.)
Estadística Descriptiva
Dentro de cada tipo de variable se encuentra una sub-clasificación:

CUALITATIVAS CUANTITATIVAS

Nominal Ordinal Discreta Continua


Ej. Ej. Ej. Ej.
Género, Alfabeto, Cantidad de Estatura,
tipo de nivel de hijos, número temperatura.
contrato. estudios. de sillas.
Características de los datos
Los datos presentan características como:

➢ Localización o parte central.

Media muestral

𝑥ҧ = ෍ 𝑥𝑖
𝑖=1
𝑛
Características de los datos
➢ Variabilidad o dispersión

Varianza muestral

𝑛
2
2 ෍ 𝑥𝑖 − 𝑥ҧ
𝑠 =
𝑖=1
𝑛 −1

Observación: La desviación estándar es la raíz de 𝑠 2


Características de los datos
Rango muestral

𝑟 = max 𝑥𝑖 − min 𝑥𝑖

El rango se recomienda usar para una muestra pequeña, entre 𝑛 <


8 𝑜 10, debido a que pierde información.
Se utiliza generalmente para el control de calidad, debido a que en esos
casos las muestras son pequeñas.
Ejercicio
Suponga que un ingeniero está diseñando un conector de nylon para un motor
de un automóvil, se hacen 8 prototipos y se mide la fuerza de desconexión,
arrojando los siguientes datos en (libras-pie):
Así:

12,6 12,9 13,4 12,3 13,6 13,5 12,6 13,1

12,6 + 12,9 + ⋯ + 13,1


𝑥ҧ = = 13,0
8
2
12,6 − 13,0 + ⋯ + 13,1 − 13,0 2
2
𝑠 = = 0,2286
8−1

𝑠 = 0,48 𝑙𝑖𝑏𝑟𝑎𝑠 − 𝑝𝑖𝑒


𝑟 = 13,6 − 12,3 = 1,3
Resumen y presentación de datos
Los diagramas de tallo y hoja es una forma adecuada de representar la
información de manera visual de un conjunto de datos 𝑥1 , 𝑥2 , … , 𝑥1 .

Para construir el diagrama el dato 𝑥𝑖 debe dividirse en 2 partes:


– Tallo: compuesta por los primeros dígitos
– Hoja: compuesta por los dígitos restantes
Suponga que tiene como datos el 151, 163 y 168, en el tallo estaría el
número 15 y 16, en la hoja el número 1, 3 y 8.
Tallo | hoja
15 |1
16 |38
Ejemplo prototipo
Se midió la resistencia a la compresión de 80 muestras de prueba de aleación
Aluminio-Litio

105 221 183 186 121 181 180 143


97 154 153 174 120 168 167 141
245 228 174 199 181 158 176 110
163 131 154 115 160 208 158 133
207 180 190 193 194 133 156 123
134 178 76 167 184 135 229 146
218 157 101 171 165 172 158 169
199 151 142 163 145 171 148 158
160 175 149 87 160 237 150 135
196 201 200 176 150 170 118 149
Diagramas de tallo y Hoja: Ejemplo
• Se seleccionan los números del 7 n: 80
7 |6
al 24 para ser tallo. 8 |7
9 |7
10 | 15
• Es conveniente usar entre 5 y 20 11 | 058
tallos 12 | 013
13 | 133455
14 | 12356899
15 | 001344678888
• El diagrama de tallos y hojas hace 16 | 0003357789
relativamente sencillo analizar la 17 | 0112445668
característica de los datos. 18 | 0011346
19 | 034699
20 | 0178
21 | 8
22 | 189
23 | 7
24 | 5
Diagramas de tallo y Hoja:
Otro ejemplo
Se toman 25 observaciones de un proceso productivo, el cual arroja los
siguientes diagramas

Tallos 6,7,8,9 Cada Tallo se divide en dos partes

n: 25
n: 25
3 6* | 134
6 6 | 134556 6 6. | 556
(9) 7 | 011357889 10 7* | 0113
10 8 | 1344788 (5) 7. | 57889
3 9 | 235 10 8* | 1344
6 8. | 788
A veces es conveniente incluir mas 3 9* | 23
tallos o clases, como dividir la mitad 1 9. |5
de cada clase en dos diferentes.
Diagramas de tallo y Hoja: Ejemplo
n: 80
1 7|6
2 8|7
3 9|7
5 10 | 15
8 11 | 058
• Los software de estadística cómo 11 12 | 013
R agregan una columna a la 17 13 | 133455
25 14 | 12356899
izquierda en la cual se
37 15 | 001344678888
proporciona el conteo de datos, (10) 16 | 0003357789
lo que facilita determinar 33 17 | 0112445668
23 18 | 0011346
características como percentiles,
16 19 | 034699
mediana y moda 10 20 | 0178
6 21 | 8
5 22 | 189
2 23 | 7
1 24 | 5
Características de los datos
La Mediana muestral es una medida de tendencia central, que divide los
datos en dos parte iguales.

– Una mitad queda bajo la mediana y la otra mitad arriba de ella.


– Si la cantidad de datos es par, la mediana está en la mitad de los dos
valores centrales, siguiendo el ejemplo de la resistencia, los valores 40
y 41 son 160 y 163.

160 + 163
𝑀𝑒𝑑𝑖𝑎𝑛𝑎 = = 161,5
2
Características de los datos
La moda muestral es el valor que ocurre con mayor frecuencia, para el problema
de las resistencias con la ayuda del diagrama es fácil determinar que el valor que
más se repite es 158.

Cuando un conjunto de datos se divide en 4 partes iguales, los puntos de división


se denominan cuartiles.

Cuartiles
– El primer cuartil 𝒒𝟏 es aquel que deja aproximadamente un 25% de los
datos bajo y un 75% sobre
– El segundo cuartil 𝒒𝟐 es aquel que deja el 50% de las observaciones bajo
y el 50% sobre y es exactamente igual a la mediana.
– El tercer cuartil 𝒒𝟑 es aquel que deja aproximadamente el 75% de los
datos bajo y un 25% sobre.
Características de los datos
Dependiendo el software la posición de los cuartiles se puede determinar de
diferentes maneras, según R la posición de los cuartiles se obtiene ordenando
las observaciones, la ubicación del primer y tercer cuartil

𝑛−1 3 𝑛−1
+1 y +1
4 4

Siguiendo con el ejemplo de las resistencias a la compresión, en la cual 𝑛 =


80

80 − 1 3 80 − 1
+ 1 = 20,75 y + 1 = 60,25
4 4
Características de los datos
– Como 𝒒𝟏 está en la ubicación 20,75 y las observaciones ordenadas 20 y 21
son 143 y 145, haciendo interpolación queda 𝒒𝟏 = 𝟏𝟒𝟒, 𝟓

– Como 𝒒𝟑 está en la ubicación 60,25 y las observaciones ordenadas 60 y 61


son 181 y 181, así 𝒒𝟑 = 𝟏𝟖𝟏

– Una medida de variabilidad puede ser el rango intercuartílico, el cual es


menos sensible a valores extremos.
𝐼𝑄𝑅 = 𝒒𝟑 − 𝒒𝟏
Percentiles
En Chile para temas sociales se habla de quintiles como grupo, pero el primer
quintil se refiere al punto que deja aproximadamente el 20% de los datos bajo
y aproximadamente el 80% sobre.
El percentil 100𝑘 − é𝑠𝑖𝑚𝑜 es un valor de los datos tal que aproximadamente
el 100𝑘% de los datos está bajo el valor y el 100 1 − 𝑘 % de los datos está
por arriba.
La ubicación del percentil está dada por:

𝑘 𝑛−1
+1
100
Si el valor no es entero se debe interpolar. En el ejemplo de las resistencias el
percentil 95 se ubica en la posición 76,05.
Como en la posición 76 está el dato 221 y en la posición 77 el dato 228, el
percentil 95 es 221,35.
Quintiles: Ejemplo
Distribución de ingresos en Chile por Quintiles (Mayol, 2011)
Deciles: Ejemplo
Distribución de ingresos en Chile por Deciles (Mayol, 2011)
Percentiles: Ejemplo
Distribución de ingresos en Chile por Percentiles (Mayol, 2011)
Distribuciones de frecuencia e
histogramas
Una distribución de frecuencia es un resumen de datos más
compacto que el diagrama de tallo y hoja.

Se debe dividir en intervalos de clase o celda, y por esta razón,


resulta conveniente representar la distribución de frecuencias en
un histograma.
Histograma

Histograma para el ejemplo de la


resistencia
Gráficas de caja y bigote
La gráfica de caja es una representación gráfica que describe
simultáneamente varias características importantes de los datos
En éstas se puede identificar: centro, dispersión, simetría y los datos que caen
fuera del grueso de los datos (puntos atípicos).
Esta gráfica se representan los 3 cuartiles, en una caja rectangular

La caja abarca el rango intercuartílico, en el borde inferior o izquierdo el


primer cuartil 𝑞1 y en el superior o derecho el tercer cuartil 𝑞3 , y se traza una
línea en el segundo cuartil 𝑞2 (mediana).
Los bigotes se extienden 1,5 rangos intercuartílicos a la derecha o sobre 𝑞3 y
1,5 rangos intercuartílicos a la izquierda o bajo 𝑞1

Los datos ubicados después de los bigotes pero a menos de 3 𝐼𝑄𝑅 (puntos
atípicos)se representan por puntos.
Gráficas de cajas y bigote
Gráficas de caja y bigotes
Caja y bigotes para el problema de las resistencias.
250
200
X0

150
100
Resumen
• El resumen de los datos entrega una buena información de éstos,
principalmente de su variabilidad y tendencia central.

• Cuando se tiene un grupo importante de información y no se procesa, no


sirve de nada, las representaciones gráficas entregan una importante
información.
Referencias
Mayol, A. (2011). Presentación ENADE

Montgomery, D. y Runger, D. (2007). Probabilidad y estadística aplicadas a la


ingeniería. (2da ed.). México: Limusa

Walpole, R., Myers, S. y Myers R. (2007) Probabilidad y estadística para


Ingeniería. (8va ed.). México: Pearson Education.

Anda mungkin juga menyukai