Anda di halaman 1dari 7

PROBABILIDADES INFORME:

PREGUNTA 1:
a) Hallar los indicadores (medidas de tendencia central, posicin y dispersin) que considere
convenientes para una buena descripcin de las variables registradas.

Las medidas de tendencia central apropiadas para describir la variable del Valor de la
Resistencia son: Media y Mediana. Se emplea estas medidas debido a que estamos trabajando
con una variable cuantitativa y requerimos valores como un promedio simple de nuestros datos
(media) o el valor que divide los datos en 2 partes iguales (mediana).

La medida de posicin que mejor describe nuestra variable del valor de resistencia es el cuartil
porque gracias a los valores que dividen al conjunto de datos ordenados en 4 partes iguales
podemos ver la posicin de la mediana respecto a los valores mnimo y mximo.

Las medidas de dispersin que describen correctamente el valor de la resistencia son: Rango,
con el fin de saber entre qu valores puede variar el valor de la resistencia, as como el Mnimo
y el Mximo, que definen el mismo rango.

Tambin empleamos la Varianza, con la cual podemos medir la dispersin de los valores de
resistencia alrededor de la media y la Desviacin Estndar que nos simplifica el hecho de tener
dimensiones diferentes.

b) Realizar el o los grficos ms adecuados. Comente sus caractersticas ms relevantes.

Grfico de sectores

Se elige un grfico de sectores porque se desea representar las frecuencias relativas de variables
cualitativas, es decir, aquellas variables que expresan una cualidad o caracterstica.
En el primer caso la variable cualitativa indica si est presente o no el nuevo componente en
nuestra resistencia. La variable puede tomar cualquiera de estos dos valores y segn nuestro
conjunto de datos se obtiene la siguiente grfica.

En la segunda grfica tambin tratamos con una variable cualitativa que representa el tipo de
falla en el formato final de la pieza, cuyos valores pueden ser: ninguna falla, fallas leves, fallas
graves.

Se prefiere el uso de grfico de sectores porque existen pocas categoras a los que pueda
pertenecer la variable cualitativa y acompaado del porcentaje de frecuencia relativa facilita la
visualizacin de datos.
Diagrama de Cajas (Boxplot)

Se escoge el diagrama de cajas, ya que permite visualizar varios elementos de un conjunto de


datos, tales como la tendencia central, la dispersin mediante el Rango Intercuartil y datos
atpicos, si es que existen.

Con este grfico podemos obtener fcilmente el valor de la mediana, valores atpicos en caso
que existan, los valores mnimo y mximo que puede tomar la resistencia y los cuartiles en los
que est dividido nuestro conjunto de datos.

c) Entre qu valores podemos decir que se encuentran los datos no atpicos de la resistencia?
Existen datos que puedan considerarse atpicos? Comente

Los datos no atpicos se encuentran entre el mnimo y el mximo valor que puede tomar la
resistencia, es decir, entre 14,77 y 27,00 . No existen datos que puedan considerarse atpicos,
ya que, ningn valor:

Es inferior a 1 1,5 , ni superior a 3 + 1,5 .

Segn el diagrama de cajas (Boxplot) y habiendo obtenido los cuartiles, tenemos:

1 = 17,17 3 = 22.0725 = 3 1 = 4,9025


1 = 17,17 1 1,5 = 9,82 . No existen valores menores a 9,82.

3 = 22,0725 3 + 1,5 = 29,43 . No existen valores mayores a 29,43


d) Elabore una tabla de frecuencias agrupadas de la resistencia, estableciendo (y justificando)
los intervalos que considere ms adecuado y efectuando la recodificacin correspondiente en
la base de datos

En este ejercicio se tienen 510 datos, por tanto para hallar el nmero de intervalos se tiene:

# 510 = 22.5 => # = 23


Luego, el rango de del conjunto de datos, seria:

Rx=12.23

Entonces, el ancho del intervalo sera:


12.23
# = 23
= 0.53 => 0.56

Frecuencias Agrupadas
Porcentaje Porcentaje
Frecuencia Porcentaje vlido acumulado
Vlido [14.77,15,32[ 6 1,2 1,2 1,2
[15.32,15,87[ 29 5,7 5,7 6,9
[15.87,16,42[ 29 5,7 5,7 12,5
[16.42,16,97[ 41 8,0 8,0 20,6
[16.97,17,52[ 42 8,2 8,2 28,8
[17.52,18,07[ 46 9,0 9,0 37,8
[18.07,18.62[ 12 2,4 2,4 40,2
[18.62,19.17[ 31 6,1 6,1 46,3
[19.17,19.72[ 12 2,4 2,4 48,6
[19.72,20.27[ 23 4,5 4,5 53,1
[20.27,20.82[ 28 5,5 5,5 58,6
[20.82,21.37[ 47 9,2 9,2 67,8
[21.37,21.92[ 21 4,1 4,1 72,0
[21.92,22.47[ 46 9,0 9,0 81,0
[22.47,23.02[ 22 4,3 4,3 85,3
[23.02,23.57[ 4 ,8 ,8 86,1
[23.57,24.12[ 5 1,0 1,0 87,1
[24.12,24.67[ 19 3,7 3,7 90,8
[24.67,25.22[ 11 2,2 2,2 92,9
[25.22,25.77[ 7 1,4 1,4 94,3
[25.77,26.32[ 10 2,0 2,0 96,3
[26.32,26,87[ 18 3,5 3,5 99,8
[26.87,27] 1 ,2 ,2 100,0
Total 510 100,0 100,0
e) Qu piensa acerca de la influencia del nuevo componente en la resistencia? Para responder
esta pregunta, halle los indicadores y graficos que considere convenientes para una buena
comparacin y luego de un comentario interpretativo.

Para este nuevo tipo de dato(nominal), el indicador a estudiar ser la moda, donde:

= [20.82, 21.37[ = 12

Este grfico muestra que con los nuevos intervalos, la cantidad de casos segn el tipo de falla
vara segn el intervalo en el que se encuentre. Adems, se muestra que en el rango 12 ([20.81,
21.37]), se encuentran la mayor cantidad de datos, lo que demuestra que ese rango es la moda.
f) Efecte los clculos para hallar los elementos principales de los diagramas de cajas hallados
en el punto anterior.

Los elementos principales de un diagrama de cajas son: la mediana, los cuartiles, el mximo y el
minimo.

Para este caso, existen distintos valores de los elementos principales dependiendo del rango en
el que nos encontremos, por tanto la cantidad de datos (n) variar segn el intervalo.

En este caso, la mediana depende del rango en el que se va a calcular, donde:



= 2

Los cuartiles, Q1 Y Q3, se definen como:


3
1 = 4 3 = 4

Adems, el rango intercuartil (RIC), ser:

= 3 1

El mximo(M) y el mnimo(m) se definen como:

3 + 1.5 1 1.5
Para cada caso, los valores atpicos se encontrarn fuera de los intervalos establecidos por el
mnimo y el mximo.

Anda mungkin juga menyukai