ESTADISTICA DESCRIPTIVA
SECCION B:
En este caso llamaremos al banco de datos del ambiente R “Orange”, se trata de un banco de datos que
básicamente el crecimiento de árboles de naranjas, para los cuales se toman 3 variables:
- Tree: indica el árbol en el cual se realiza la medicion, el orden es de acuerdo al aumento del diámetro.
- Age: la edad en días que tiene cada árbol desde el 31 de diciembre de 1968.
- Circumference: es un vector de circunferencias en milímetros (mm) de los árboles.
Tree:
Tree indica el árbol en el cual se realiza la medicion, el orden es de acuerdo al aumento del diámetro.
A continuación se muestra su tabla de frecuencias:
Tree ni Ni hi Hi porcentaje
3 7 7 0,2 0,2 20%
1 7 14 0,2 0,4 20%
5 7 21 0,2 0,6 20%
2 7 28 0,2 0,8 20%
4 7 35 0,2 1 20%
35 1 100%
1
5
3
4
absoluta
5
2
4
1
0
2
3 1 5 2 4
Tree
ALEJANDRO MARTINEZ CASTAÑO 1015032
UNIVERSIDAD NACIONAL DE COLOMBIA SEDE MANIZALES
INGENIERIA FISICA
PROBABLIDAD Y ESTADISTICA
2019-1
Age:
Age representa la edad en días que tiene cada árbol desde el 31 de diciembre de 1968. A continuación
se muestra la tabla de frecuencias:
Age ni Ni hi Hi porcentaje
118 5 5 0,142857 0,1429 14,28571
484 5 10 0,142857 0,2857 14,28571
664 5 15 0,142857 0,4286 14,28571
1004 5 20 0,142857 0,5714 14,28571
1231 5 25 0,142857 0,7143 14,28571
1372 5 30 0,142857 0,8571 14,28571
1582 5 35 0,142857 1,0000 14,28571
35 1,0000 100%
histograma
boxplot
10
1500
8
6
Frequency
1000
4
2
500
0
age
Promedio: 922.1
Desviación estándar: 491.8645
Mediana: 1004.0
Coeficiente de variación: 53.3393
ALEJANDRO MARTINEZ CASTAÑO 1015032
UNIVERSIDAD NACIONAL DE COLOMBIA SEDE MANIZALES
INGENIERIA FISICA
PROBABLIDAD Y ESTADISTICA
2019-1
Cuartiles de distribución:
- límite inferior= 118
-cuartil 1 (Q1)= 484
-cuartil 2 (Q2)= 1004
-cuartil 3 (Q3)= 1372
-límite superior= 1582
Circumference
Circumference ni Ni hi Hi porcentaje
30 3 3 0.08571429 0.08571429 8,57
32 1 4 0.02857143 0.11428571 2,86
33 1 5 0.02857143 0.14285714 2,86
49 1 6 0.02857143 0.17142857 2,86
51 1 7 0.02857143 0.20000000 2,86
58 1 8 0.02857143 0.22857143 2,86
62 1 9 0.02857143 0.25714286 2,86
69 1 10 0.02857143 0.28571429 2,86
75 1 11 0.02857143 0.31428571 2,86
81 1 12 0.02857143 0.34285714 2,86
87 1 13 0.02857143 0.37142857 2,86
108 1 14 0.02857143 0.40000000 2,86
111 1 15 0.02857143 0.42857143 2,86
112 1 16 0.02857143 0.45714286 2,86
115 2 18 0.05714286 0.51428571 5,71
120 1 19 0.02857143 0.54285714 2,86
125 1 20 0.02857143 0.57142857 2,86
139 1 21 0.02857143 0.60000000 2,86
140 1 22 0.02857143 0.62857143 2,86
142 2 24 0.05714286 0.68571429 5,71
145 1 25 0.02857143 0.71428571 2,86
156 1 26 0.02857143 0.74285714 2,86
167 1 27 0.02857143 0.77142857 2,86
172 1 28 0.02857143 0.80000000 2,86
174 1 29 0.02857143 0.82857143 2,86
177 1 30 0.02857143 0.85714286 2,86
ALEJANDRO MARTINEZ CASTAÑO 1015032
UNIVERSIDAD NACIONAL DE COLOMBIA SEDE MANIZALES
INGENIERIA FISICA
PROBABLIDAD Y ESTADISTICA
2019-1
histograma boxplot
6
200
5
4
150
Frequency
3
2
100
1
0
50
circumference
Promedio: 115.8571
Desviación estándar: 57.48818
Mediana: 115
Coeficiente de variación: 49.61988
Cuartiles de distribución:
- límite inferior= 30.0
-cuartil 1 (Q1)= 65.5
-cuartil 2 (Q2)= 115.0
-cuartil 3 (Q3)= 161.5
-límite superior= 214.0
ALEJANDRO MARTINEZ CASTAÑO 1015032
UNIVERSIDAD NACIONAL DE COLOMBIA SEDE MANIZALES
INGENIERIA FISICA
PROBABLIDAD Y ESTADISTICA
2019-1
- CONCLUSIONES
Como se puede observar en la variable Tree, los arboles de naranjas están ordenados por su
diámetro, y se tomaron los diámetro de 7 árboles por grupo, es decir hay 5 grupos de diámetro, es
por esto que se deduce que hay 20% de cada grupo de diámetro y la gráfica de una manera tan
simétrica.
Para la variable de la edad (Age) se tiene una distribución parecida a la de Tree, ya que se tiene
registro de 7 edades distintas, para las cuales se tienen datos de 5 árboles por edad, así que no se
puede concluir que hay más arboles por cierta edad que por otra, como se mencionó
anteriormente por edad hay exactamente 5 árboles.
Se puede resaltar que los rangos de edad son bastante amplios, es decir, el mínimo es de 118, y el
máximo es de más de 1500 días.
Para la circunferencia del tronco de estos árboles si se tiene datos un poco más variados, como se
observa en el histograma, la mayoría de troncos tiene una circunferencia de alrededor de 100cm, y
cabe resaltar que los datos van desde 30cm hasta 214cm, un rango bastante amplio.
SECCION C:
Para la mayoría de personas el vino es simplemente el fermento de un destilado que se hace a partir de las
uvas y dependiendo el nivel de alcohol y la manera de fermentación y destilación se derivan muchos tipos de
vino, pero en realidad el vino es mucho más que eso, tiene varias componentes y propiedades tanto químicas
como físicas que las hace diferenciar entre ellos; a continuación se realiza un análisis de dos de esas
propiedades en función de la calidad del mismo, tomando como referencia un banco de datos de muestras de
cientos de vino:
Calidad :
La calidad del vino depende de muchos factores, en este caso se calificaron de 1 a 10 al menos
1599 vinos y se hizo el análisis correspondiente:
calidad ni Ni hi Hi pc
3 10 10 0.006253909 0.006253909 0,6250
4 53 63 0.033145716 0.039399625 3,3140
5 681 744 0.425891182 0.465290807 42,5890
6 638 1382 0.398999375 0.864290181 39,8990
7 199 1581 0.124452783 0.988742964 12,4480
8 18 1599 0.011257036 1 1,1250
1599 1 100
ALEJANDRO MARTINEZ CASTAÑO 1015032
UNIVERSIDAD NACIONAL DE COLOMBIA SEDE MANIZALES
INGENIERIA FISICA
PROBABLIDAD Y ESTADISTICA
2019-1
% alcohol:
Se trata de una medida de concentración porcentual en volumen. A cada unidad de porcentaje
de alcohol en el volumen total le corresponde un grado de graduación alcohólica. Así, se habla
de un vino con una graduación de 13,5° cuando tiene un 13,5% de alcohol, o sea, 135 ml de
etanol por litro.
intervalos mc ni Ni hi Hi porcentaje
1 8,864 194 194 0.121325829 0.1213258 12,13
2 9,793 648 842 0.405253283 0.5265791 40,53
3 10,721 377 1219 0.235772358 0.7623515 23,58
4 11,650 252 1471 0.157598499 0.9199500 15,76
5 12,579 105 1576 0.065666041 0.9856160 6,57
6 13,507 15 1591 0.009380863 0.9949969 0,94
7 14,436 8 1599 0.005003127 1 0,50
1599 1 100
Promedio: 10.42298
Mediana: 10.2
ALEJANDRO MARTINEZ CASTAÑO 1015032
UNIVERSIDAD NACIONAL DE COLOMBIA SEDE MANIZALES
INGENIERIA FISICA
PROBABLIDAD Y ESTADISTICA
2019-1
600
500
500
Frecuencia Acumulada
Frecuencia Absoluta
400
400
300
300
200
200
100
100
0
9 10 11 12 13 14 15 9 10 11 12 13 14 15
% de alcohol % de alcohol
ALEJANDRO MARTINEZ CASTAÑO 1015032
UNIVERSIDAD NACIONAL DE COLOMBIA SEDE MANIZALES
INGENIERIA FISICA
PROBABLIDAD Y ESTADISTICA
2019-1
Densidad:
La densidad relativa a 20ºC se obtiene multiplicando la masa volúmica por el factor 1,0018. Se
expresa con cuatro decimales y es adimensional. Los valores habituales de la masa volúmica a
20ºC para cada tipo de muestra son: -Vino blanco seco: 0,9880-0,9930 g/mL. -Vinos tinto seco:
0,9910-0,9950 g/mL.
intervalos mc ni Ni hi Hi pc
1 0,990751 8 8 0.005003127 0.005003127 0,5003
2 0,992113 27 35 0.016885553 0.021888680 1,6886
3 0,993475 90 125 0.056285178 0.078173859 5,6285
4 0,994837 250 375 0.156347717 0.234521576 15,6348
5 0,996199 487 862 0.304565353 0.539086929 30,4565
6 0,997561 448 1310 0.280175109 0.819262039 28,0175
7 0,998923 185 1495 0.115697311 0.934959350 11,5697
8 1,0003 74 1569 0.046278924 0.981238274 4,6279
9 1,0016 19 1588 0.011882427 0.993120700 1,1882
10 1,0030 11 1599 0.006879300 1 0,6879
1599 1 100
Promedio: 0.9967467
Mediana: 0.99675
Desviación estándar: 0.001887334
Coeficiente de variación: 0.01810743
ALEJANDRO MARTINEZ CASTAÑO 1015032
UNIVERSIDAD NACIONAL DE COLOMBIA SEDE MANIZALES
INGENIERIA FISICA
PROBABLIDAD Y ESTADISTICA
2019-1
- CONCLUSIONES
Teniendo en cuenta que las calificaciones de calidad se dan de 1 a 10, se puede deducir que son
muy pocas los vinos que tiene una calidad distinta de 5 o 6, estos dos números representan más
del 80% de todos los datos, es decir que el otro 20% aproximado está repartido entre los
valores de calidad de 1, 2, 3, 4, 7, 8, 9,10; por cierto, no hay vinos con una calidad de 1, 2, 9 y
10.
ALEJANDRO MARTINEZ CASTAÑO 1015032
UNIVERSIDAD NACIONAL DE COLOMBIA SEDE MANIZALES
INGENIERIA FISICA
PROBABLIDAD Y ESTADISTICA
2019-1
El promedio del porcentaje de alcohol en los vinos de esta muestra (y en general) es de 10%,
que representan este banco de datos alrededor del 40% de muestras, que es considerable
teniendo en cuenta que los rangos de estudio van desde 8 a 14% aproximadamente.
A partir del 10% de alcohol empieza a decaer el número de muestras que contienen más
porcentaje, es decir hay menos con 12% y muchas menos con 14%, las cuales significan tan solo
el 0,5% de la muestra, esto ya que son solo 8 vinos en medio de 1599 muestras.
Los valores de la densidad del vino son muy parecidos a las del agua, y varían muy poco entre
muestras, tanto asi que las muestras que superan 1g/ml de densidad representan solo el 6% de
todos los vinos, mientras que las que tienen 0,99g/ml aproximadamente son el 95% de los 1599
vinos.
SECCIÓN D:
Los datos a seguir fueron tomados de un hospital con el fin de mejorar algunos servicios y sobre todo conocer
la opinión de los pacientes en relación con algunas variables:
En relación con estos datos, analizar las variables y responder cada una de las siguientes preguntas,
sustentando su respuesta ya sea con una tabla o simplemente con un gráfico:
1. En proporción, se puede decir que los pacientes atendidos son iguales, aunque tiene una leve diferencia
del 2% que se le suma a las pacientes mujeres, es decir que el 48% de los pacientes son hombres.
personas atendidas
h 48%
m 52%
2. El rango de edad más frecuente en el hospital son pacientes entre los 40 y 50 años, seguido por personas
de 30 y 40, una población con edad entre 70 y 80.
ALEJANDRO MARTINEZ CASTAÑO 1015032
UNIVERSIDAD NACIONAL DE COLOMBIA SEDE MANIZALES
INGENIERIA FISICA
PROBABLIDAD Y ESTADISTICA
2019-1
El punto en el que se tiene el 60% de los datos tomados, después de tener en orden de edad, los pacientes tienen 58,4
años, o menos, así mismo, en el punto en el que ya se tiene un 90% de investigación se dice que la población tiene
alrededor de 77 años.
Así que se puede decir que el 10% de los pacientes son personas de más de 77 años, y que entre 80 y 90 años es donde
menos población hay.
3. Como se muestra en la gráfica la gran mayoría de personas fueron hospitalizadas entre 2 y 10 días; también se
muestra que dentro de toda la muestra no hubo hospitalizados entre 10 y 20 días, y tampoco entre 40 y 70 días.
ALEJANDRO MARTINEZ CASTAÑO 1015032
UNIVERSIDAD NACIONAL DE COLOMBIA SEDE MANIZALES
INGENIERIA FISICA
PROBABLIDAD Y ESTADISTICA
2019-1
4. En el diagrama circular se ve claramente que no es mucha la variación entre los pacientes que requirieron
cirugía y los que no, solo los diferencia un 8%, que están a favor de los que NO les realizaron operación,
con un porcentaje total de 58% y por ende un 42% a los que SI se les hizo.
cirugia
NO 58%
SI 42%
5. Según el flujo de pacientes que se observan en el diagrama de barras, es fácil concluir que la dependencia
donde se necesita mayor número de médicos especialistas es en la número 2, es decir, en traumatología;
sin embargo no es mucha la diferencia de pacientes que entran a la dependencia 1: medicina interna.
ESPECIALIDAD
6. Según las opiniones de los pacientes (diferenciando cada tipo de atención) se obtuvieron los siguientes resultados
basados en los numerales de acuerdo y desacuerdo:
ALEJANDRO MARTINEZ CASTAÑO 1015032
UNIVERSIDAD NACIONAL DE COLOMBIA SEDE MANIZALES
INGENIERIA FISICA
PROBABLIDAD Y ESTADISTICA
2019-1
1- Totalmente en desacuerdo.
2- En desacuerdo.
3- Ni de acuerdo ni en desacuerdo.
4- De acuerdo.
5- Totalmente de acuerdo.
habitaciones comida
25
20
Frecuencias
Frecuencias
15
5 10
0 5
0
1 2 3 4 5 2 3 4 5
AtencionEnfe InfRecibida
40
25
30
Frecuencias
Frecuencias
20
15
10
5
0
2 3 4 5 1 2 3 4
7. Según los resultados de cada análisis, y principalmente basados en las opiniones de los pacientes que
finalmente son lo primordial dentro del hospital se plantean algunas sugerencias de mejora al hospital:
- Aunque los pacientes no tienen una buena opinión de las habitaciones, ya que hay un gran porcentaje
que se dirige al numeral de desacuerdo, hay una mayoría de opiniones con el totalmente de acuerdo,
así que se debe mejorar la calidad de habitaciones, pero por el momento hay que darle prioridad a
otros aspectos
- Es preocupante con la mayoría de personas están en desacuerdo con la comida del hospital, sin duda
es un aspecto que se debe mejorar inmediatamente, ya aunque no se tenga registro de que alguien
esté en absoluto desacuerdo tampoco son muchas las personas que estén en total acuerdo.
ALEJANDRO MARTINEZ CASTAÑO 1015032
UNIVERSIDAD NACIONAL DE COLOMBIA SEDE MANIZALES
INGENIERIA FISICA
PROBABLIDAD Y ESTADISTICA
2019-1