Anda di halaman 1dari 27

ESTADSTICA DESCRIPTIVA

TRABAJO COLABORATIVO MOMENTO 3

INTEGRANTES
KATIA MENDOZA BOLIVAR
CRISTIAN JOSE REYES
JESUS MIGUEL VEGA
JOHN ELKIN QUINTERO

GRUPO: 100105_51

FRANCISCO CABRERA DAS


(TUTOR)

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA


MAYO 2015
MOMENTO 1 CARACTERIZACIN DE VARIABLES CUALITATIVAS
TABLA DE FRECUENCIA HOSPITAL FEDERICO LLERAS

CALIFICACIO
N DEL
SERVICIO
PRESTADO
EXCELENTE
BUENO
REGULAR
MALO
Total
ANALISIS

Frecuenci
a
absoluta
4
27
44
45
120

Frecuenci
a relativa

0,033
0,225
0.366
0,375
1

Frecuenci
a
acumulad
a
4
31
75
120

Frecuenci
a%

3,33%
22,5%
36,6%
37,5%
100%

Frecuenci
a
acumulad
a relativa
0,033
0,258
0,624
1

Del anlisis de la tabla de frecuencias podemos interpretar que la mayora


de las personas correspondiente al 37,5% considera que la atencin
suministrada por el Hospital Federico Lleras es mala.
El 59,1% de la poblacin considera que el servici est entre lo regular y lo
bueno.
Solo el 3,33% de la poblacin considera que el servicio prestado por el
hospital Federico Lleras es excelente.

Frecuenci
a
acumulad
a%
3,33%
25,83%
62,5%
100%

REPRESENTACIONES GRAFICAS

CALIFICACION DEL SERVICIO PRESTADO


40.00%
35.00%
30.00%
25.00%

CALIFICACION DEL
SERVICIO PRESTADO

20.00%
15.00%
10.00%
5.00%
0.00%
EXCELENTE

BUENO

REGULAR

MALO

MODA
El dato con mayor frecuencia y tendencia a la hora de que la poblacin de
120 personas que respondieron como era la calificacin que le asignaba al
servicio prestado por el hospital Federico lleras es la de mala siendo la
moda con una frecuencia de 45 personas, siendo este el dato que ms se
repite.

TABLA DE CONTINGENCIA HOSPITAL FEDERICO LLERAS

CALIFICACIO
N DEL
SERVICIO

EXCELENTE
BUENO
REGULAR
MALO

HOMBRE
3
16
22
26

SEXO
MUJER
1
11
22
19

MARGINAL
4
27
44
45

PRESTADO

MARGINAL

67

53

120

Segn la tabla de contingencia podemos decir que de los 120 individuos de


los cuales obtenemos la informacin podemos afirmar que 67 son hombres
y 53 mujeres.
En general de las 4 personas que considera que el servici ofrecido por el
hospital Federico Lleras 3 son hombres y 1 una mujer.
De la calificacin bueno 16 corresponden al gnero masculino y 11 al
femenino.
En la calificacin regular la segunda con ms frecuencia se puede observar
que hay igual cantidad de individuos en ambos gneros siendo 22 para
cada lado.
La moda en este estudio fue obtenida por la calificacin malo con un saldo
de 45 siendo los mayor la cantidad de hombres con un saldo de 26.

MOMENTO 2
DESARROLLO
MEDIDAS UNIVARIANTES DE TENDENCIA CENTRAL
1) Identificar las variables discretas dentro del problema de estudio y calcular las medidas
univariantes de tendencia central ms adecuadas, a aquellas que consideren sean relevantes
para el problema de estudio.
Segn el video observado, vamos a trabajar sobre variables cuantitativas discretas, por lo
tanto es necesario definir el concepto para variable discreta:
Variable discreta: se considera una variable discreta aquella que slo puede tener un
valor de entre cierta cantidad de valores dados.
Las variables discretas que se van a calcular son las siguientes:
VARIABLES DISCRETAS DENTRO DEL
PROBLEMA
VARIABLE N
NOMBRE DE LA VARIABLE
1
EDAD
2
N DE VISITAS
A continuacin con estas variables vamos a calcular:

Moda
Media
Mediana

En la siguiente tabla se presentan las variables discretas que se consideran ms importantes


para el problema de estudio:
EDAD

N VISITAS
ULTIMO
TRIMESTRE

Moda

23

Media

34.025

1.35

26

Mediana

Nota: para ver todos los datos revisar el archivo llamado base

Medidas de tendencia central

MEDIA: Corresponde a la sumatoria de los datos recolectados por el


nmero total de datos recolectados en este caso la sumatoria de las
edades de los pacientes es de 4083 y el nmero total de paciente es de
120.
4083/120= 34.025
La media es de 34.025 aos.

MEDIANA: como trabajamos con un total de datos par (120) utilizamos


la formula n/2 y (n/2)+1 para promediar as los nmeros que se
encuentra en esa posicin.
Entonces n/2= 120/2= 60 y (n/2)= (120/2)+1= 61, es decir que los
nmeros que ocupen las posicin 60 y 61 sumados y divididos entre dos
ser la mediana.
(26+26)/2= 52/2= 26
La mediana es de 26 aos.

MODA. Es el dato que ms repite en una recoleccin de datos por lo


cual la edad que ms se repite es la de 23 aos con una frecuencia de 7

2) Elegir una variable discreta que sea representativa y elaborar una tabla de frecuencias
para datos NO agrupados, calcular las medidas de tendencia central: media, mediana,
moda, los cuartiles, deciles 5 y 7; percentiles 30, 50 e interpretar sus resultados.
1

Tabla de frecuencia edad de los pacientes del hospital Federico lleras de


la ciudad de Ibagu

CLASE

EDAD

4
5

3
4

3
2

h
H
0,0416666 0,0416666
5
7
7
0,0666666
8
0,025
7
0,0166666 0,0833333
10
7
3
0,1083333
13
0,025
3
15 0,0166666
0,125

19

20

21

13

22

10

16

24

11

17

28

12

18

29

13

19

34

14

20

37

15

21

40

16

22

42

17

23

49

18
19

24
25

5
3

54
57

20

26

61

21

31

63

22

33

65

23

34

67

24

35

68

25

36

69

26

37

71

27

39

74

28

40

76

7
0,0333333
3
0,0083333
3
0,0083333
3
0,0083333
3
0,0166666
7
0,0333333
3
0,0083333
3
0,0416666
7

0,1583333
3
0,1666666
7
0,175
0,1833333
3

0,2
0,2333333
3
0,2416666
7
0,2833333
3
0,3083333
0,025
3
0,3333333
0,025
3
0,0166666
7
0,35
0,0583333 0,4083333
3
3
0,0416666
7
0,45
0,025
0,475
0,0333333 0,5083333
3
3
0,0166666
7
0,525
0,0166666 0,5416666
7
7
0,0166666 0,5583333
7
3
0,0083333 0,5666666
3
7
0,0083333
3
0,575
0,0166666 0,5916666
7
7
0,6166666
0,025
7
0,0166666 0,6333333
7
3

29

42

77

30

43

78

31

44

80

32

45

81

33

47

82

34

48

84

35

49

85

36

50

86

37

51

88

38

52

90

39

53

91

40

54

95

41

55

98

42

56

99

43

57

100

44

58

101

45

59

103

46

60

104

47

61

105

48

62

106

49

64

107

108

110

50
51

65
68

0,0083333
3
0,0083333
3
0,0166666
7
0,0083333
3
0,0083333
3
0,0166666
7
0,0083333
3
0,0083333
3
0,0166666
7
0,0166666
7
0,0083333
3
0,0333333
3

0,6416666
7
0,65
0,6666666
7
0,675
0,6833333
3
0,7
0,7083333
3
0,7166666
7
0,7333333
3

0,75
0,7583333
3
0,7916666
7
0,8166666
0,025
7
0,0083333
3
0,825
0,0083333 0,8333333
3
3
0,0083333 0,8416666
3
7
0,0166666 0,8583333
7
3
0,0083333 0,8666666
3
7
0,0083333
3
0,875
0,0083333 0,8833333
3
3
0,0083333 0,8916666
3
7
0,0083333
3
0,9
0,0166666 0,9166666
7
7

52

71

111

53

73

113

54

75

115

55

81

116

56

82

117

57

85

118

58

87

119

1
120

120

59

94
TOTAL

0,0083333
3
0,0166666
7
0,0166666
7
0,0083333
3
0,0083333
3
0,0083333
3
0,0083333
3
0,0083333
3
1

0,925
0,9416666
7
0,9583333
3
0,9666666
7
0,975
0,9833333
3
0,9916666
7
1

Medidas de tendencia central

MEDIA: Es igual a la sumatoria de los datos recolectados por el nmero


total de datos recolectados en este caso la sumatoria de las edades de
los pacientes es de 4083 y el nmero total de paciente es de 120.
4083/120= 34.025
La media es de 34.025 aos.

MEDIANA: como trabajamos con un total de dato par (120) utilizamos la


formula n/2 y (n/2)+1 para promediar as los nmeros que se encuentra
en esa posicin.
Entonces n/2= 120/2= 60 y (n/2)= (120/2)+1= 61, es decir que los
nmeros que ocupen las posicin 60 y 61 sumados y divididos entre dos
ser la mediana.
(26+26)/2= 52/2= 26
La mediana es de 26 aos.

MODA. Es el dato que ms repite en una recoleccin de datos por lo


cual la edad que ms se repite es la de 23 aos con una frecuencia de 7

Rango: el rango se halla en la resta del mximo valor de la variable


menos el mnimo valor que toma la variable.

Varianza: se realiza: se resta la media a cada valor de que toma la


variable y la diferencia se eleva al cuadrado y por ltimo se calcula la
media de esa diferencia al cuadrado.

Desviacin tpica o estndar: se consigue hallando la raz cuadrada


de la varianza.

Coeficiente de variacin: es la divisin entre la desviacin estndar y


la media.

RANGO

94

VARIANZA

538,71

DESVIACIN TPICA

23,21

COEFICIENTE DE VARIACIN

cuartil
Q1
Q2
Q3

decil
D1
D2
D3
D4
D5
D6
D7
D8
D9

CUARTIL

posicin

valor
30
60
90

19
26
52,5

DECIL

posicin

valor

60

26

84

48,5

PERCENTILES

0,68

Percentiles posicin

valor

P1
P30

36

20

60

26

P
P50
P99
3) Elegir una variable Continua que sea representativa y siguiendo los lineamientos,
disear una tabla de frecuencia para datos agrupados, calcular las medidas de tendencia
central, los cuartiles , deciles 3 y 7 ; percentiles 25, 75 ( Interpretar sus resultados).
VARIABLES CUANTITATIVAS CONTINUAS PARA EL CASO DEL HOSPITAL
FEDERICO LLERAS ACOSTA
Identificar como variables continuas el peso en kilogramos de hombres y mujeres que
llegaron a Saludcoop, los das domingo y lunes primero y dos de junio del ao 2014.
Los pesos de ellos fueron:
78.6 - 56 - 60.5 - 45.9 - 65.8 - 75.8 - 78.6 - 79.5 - 58.2
Organizo de mayor a menor la medida del peso de los pacientes
45.9 - 55.2 - 56 - 58.2 - 60.5 - 65.8 - 70.6 - 78.5 - 97.5
Calcular varianza, desviacin tpica y coeficientes de variacin.

TABLA DE FRECUENCIA
X1

F1

45.9
55.2
56
60.5
66
65.8
78.6
79.5

1
1
1
1
1
1
2
1
N=9

X1 F1
45.9
55
56
58.2
60.5
65.8
157.2
79.5
578.1

)2

X1-

(x-

-18.3
-9
-8.2
-6
-37
1.6
14.4
15.3

334.89
81
67.24
36
13.69
2.56
207.36
234.09

(X1- )2 *
F1
334.89
81
67.24
36
13.69
2.56
414.72
234.09
1184.19

Para obtener el valor de X -

debo sacar

la media de los datos

Media

X1 F1
n

578.1
9

64.2

---> MEDIA

RANGO = Dato mayor- Dato menor


Rango= 79.5- 45.9
Rango= 33.6
VARIANZA
2=

( X i X ) Fi
n

2=

2=131.58

1184.19
9

---> VARIANZA

DESVIACION TIPICA
= 2
= 131.58

=11.47

==>

Datos Dispersos
Desviacin Tpica.

COEFICIENTE DE VARIANZA
CV =

CV =

100

11.47
100
64.2

CV = 17.86

Que existe un 17.86 % de variacin de los datos con respecto a la media.


MEDIDAS UNIVARIANTES DE DISPERSION.
Las medidas de dispersin cuantifican la variabilidad de las caractersticas bajo
estudio. La variacin es la diferencia que existe entre las unidades de estudio
respecto a la variable analizada. Las medidas de dispersin incluyen:

Rango: Es la diferencia entre la observacin ms grande y la ms pequea


de un conjunto de datos. Rango = Valor mximo de la serie de datos Valor
mnimo de la serie de datos.

Rango intercuartil: El rango intercuartil, R.I, es tambin llamado dispersin


media. Es la diferencia entre el primer y tercer cuartil en un conjunto de
datos.

Varianza: La varianza es el promedio de los cuadrados de las diferencias


entre cada observacin en un conjunto de datos y medidas.

Desviacin estndar: Es la medida de dispersin ms comn, que indica


cuan separados de la media estn los datos. La desviacin estndar estima

aproximadamente la distancia promedio de las observaciones individuales


con respecto a la media. Mientras mayor sea la desviacin estndar, mayor
ser la dispersin de datos.

MOMENTO 3
ANALISIS DE VARIABLES

1. Determinar la relacin entre dos variables cuantitativas del problema de estudio:

-Identificar dos
relacionadas.

variables

cuantitativas

del

problema

que

puedan

estar

- Realizar el diagrama de dispersin de dichas variables.


- calcular la recta de regresin y el coeficiente de correlacin para probar
estadsticamente su relacin.

Desarrollo: Tomo dos variables del ejercicio que hemos desarrollados desde el
inicio, para este caso escojo la edad y el peso como variables cuantitativas como
lo podemos observar en el siguiente cuadro donde realizo los valores a utilizar ,
luego realizo el diagrama de dispersin tal como se evidencia

Promedi
o

X (Edad)

Y (peso)

XY

X2

Y2

12,5

37,5

156,25

31

60

1860

961

3600

62

72,5

4495

3844

5256,25

16,5

66

16

272,25

65

57,6

3744

4225

3317,76

55

78,6

4323

3025

6177,96

5,2

5,2

27,04

12081

18807,5
1

221

302,9

31,5

43,2

14530,7

DIAGRAMA DE DISPERSIN

Edad y Peso
80
70
60
Edad y Peso

50

Linear (Edad y Peso)

40
30
20
10
0
-8

12

22

32

42

52

62

Para calcular la recta de regresin, coeficiente de correlacin utilizo l mtodo de


los mnimos cuadrados, de esta manera determinar la ecuaciones que ms se
ajustan a la recta

Y= a+bx

n_ xy-_x
y_______

b=

nX2-(x)2

a=

y-bX
n

Remplazo los datos

b=

7*14530.7-(221)(302.9)

7(12081)-(221) 2
b=

34774
39926
b=

0.87

a= 302.9-(0.87)(221)
7
a=2.25
La ecuacin de la recta est dada por:

Y=0.87X+2.25
Contino buscando el coeficiente de correlacin

Para conocerlo es necesario conocer el error estndar del estimado de la


recta ajustada

Se=

14530.7
188072.25 ( 382.9 ) 0.87

7-2

Se=32.57

Ahora consigo el coeficiente de determinacin


R 2 =1 - Se
Sy
Entonces
Sy= y_ -y
n

Sy = 18807 - (43.2)

Sy = 820

R = 1 Se

R =

0.961

Sy

r= 0.961

r= 0.98

Con el resultado obtenido se puede asegurar que la ecuacin de la recta es una


muy buena estimacin de la relacin entre las dos variables estudiadas (edad y
peso)

El valor de r confirma que el grado de relacin entre la variable, es decir el peso de


las personas est directamente relacionado con su edad, esta relacin se da
enun98%

2. Determinar la relacin entre una variable dependiente y varias variables


independientes; si es el caso:

- Identificar una variable dependiente y varias variables independientes del estudio


de investigacin.
- Realizar el diagrama de dispersin de dichas variables.
- Calcular la recta de regresin y el coeficiente de correlacin para probar
estadsticamente su relacin.

DESARROLLO
Como variable independiente tomamos la estatura de las personas y como
variable dependiente tomamos el peso de cada uno de los pacientes.
X

Promedio

Y
0,96
1,67
1,7
1,68
1,62
0,53
1,59
1,56
1,65
1,68
1,56
16,2
1,4

Diagrama de dispersin.

15,3
65,2
65,6
78,4
57,9
3,4
58,3
56,8
60
72
58,6
591,5
53,7

X*Y
14.688
108.884
111.52
127.008
93.798
1,802
92.697
88.608
99
120.96
91.416
617.200

X^2
0,9216
2,7889
2,89
2,8224
2,6244
0,2809
2,5281
2,4336
2,7225
2,8224
2,4336
25,2684

Y^2
234,09
4251,04
4303,36
6146,56
3352,41
11,56
3398,89
3226,24
3600
5184
3433,96
37142,11

Chart Title
90
80
70
60
50
Axis Title

f(x) = 59.54x - 33.92


R = 0.94

40

Linear ()

30
20
10
0
0.4

0.6

0.8

1.2

1.4

1.6

1.8

Axis Title

Calcular la recta de regresin y el coeficiente de correlacin para probar


estadsticamente su relacin.
Para calcular la recta de regresin, coeficiente de correlacin utilizo l mtodo
de los mnimos cuadrados, de esta manera determinar la ecuaciones que ms
se ajustan a la recta.

Y= a+bx

n_
xy-_x
y_______
nX2-(x)2

b=

a
=

y-bX
n

Remplazo los datos

b=

11*617.200-(16,2)(591.5)
11(25,2684)-(16,2) 2
b=

-2793.1
245.5524
b=

a=
a=

-11.37476155

y-bX
n
591,5-(11.37476155)(16.2)
11

a=
407.22886289
11
a= 37.020805717

Contino buscando el coeficiente de correlacin

Para conocerlo es necesario conocer el error estndar del estimado de la recta


ajustada

Se=

37142(11.37476155 ) (591,5 )37.020805717 ( 617.2 )

11-2

Se=2335.6593018

Ahora consigo el coeficiente de determinacin


R 2 =1 - Se
Sy
Entonces
Sy= y_ -y
n

Sy = 37142 - (53.7)
11

R = 1 Se
Sy

r=

0.6811

Sy = 34259

R =

0.6811

r= 0.82529

El valor de r nos indica que el grado de relacin entre la variable es aceptable, es


decir el peso de las personas tiene una relacin aceptable con su estatura, esta
relacin se da en un 82%

LABORATORIO.
1 Se quiere estudiar la asociacin entre consumo de sal y tensin arterial. A
una serie de voluntarios se les administra distintas dosis de sal en su dieta y
se mide su tensin arterial un tiempo despus.
X (sal)

Y (Presin)

1,8

100

2,2

98

3,5

105

4,0

110

4,3

112

5,0

120

a. Realice el diagrama de dispersin y determine el tipo de asociacin entre las


variables
b. Encuentre el modelo matemtico que permite predecir el efecto de una
variable sobre la otra. Es confiable?
c. Determine el porcentaje de explicacin del modelo y el grado de relacin de
las dos variables.
d. Si a un paciente se le administra una dosis de sal de 6,5. Cul es la
tensin arterial esperada?
DESARROLLO
A Diagrama de dispersin.

Y (Presin)
140
120
100
80
Axis Title

f(x) = 6.31x + 85.61


R = 0.92

60
40

Y (Presin)
Linear (Y (Presin))

20
0
1.5 2 2.5 3 3.5 4 4.5 5 5.5
Axis Title

El tipo de asociacin que presentan las variables en el diagrama es de


dispersin lineal.

B Modelo matemtico para predecir el efecto de la Sal en la presin arterial:


y = 6,3137x + 85,612
El modelo explica el 91,85% de los datos, as que es bastante
confiable.
C Porcentaje de explicacin del modelo es de 91,85%, el grado de relacin
de las variables es el 95%.
D Para una dosis de 6.5 de sal la tensin arterial esperada es de 126,65
y = 6, 3137(6.5) + 85,612 = 126, 65...

2. En un nuevo proceso artesanal de fabricacin de cierto artculo que est


implantado, se ha considerado que era importante ir anotando peridicamente
el tiempo medio (medido en minutos) que se utiliza para realizar una pieza y el
nmero de das desde que empez dicho proceso de fabricacin. Con ello, se
pretende analizar como los operarios van adaptndose al nuevo proceso
mejorando paulatinamente su proceso de produccin.
Los siguientes datos representan dicha
situacin:

X
Y

10
35

20
28

30
23

40
20

50
18

60
15

70
13

a. Realice el diagrama de dispersin y determine el tipo de asociacin entre


las variables
b. Encuentre el modelo matemtico que permite predecir el efecto de una
variable sobre la otra. Es confiable?
c. Determine el porcentaje de explicacin del modelo y el grado de relacin de
las dos variables.
d. Qu tiempo deber tardarse un empleado cuando se lleven 100 das?
DESARROLLO
A. Grafica de dispersin.

Chart Title
40
35
30

f(x) = - 0.35x + 35.57


R = 0.95

25
Axis Title

20

Linear ()

15
10
5
0
0

10

20

30

40

50

60

70

80

Axis Title

El tipo de asociacin que presentan las variables en el diagrama es de


dispersin lineal.
B. Modelo matemtico
Y= -0,3464x + 35,571

Dado que R es cercano al 1 podemos inferir que se tiene una


correlacin excelente por lo cual el modelo es confiable.

C. El fijndonos en R podemos afirmar que el modelo explica el 94.5% de la


informacin y el valor de r coeficiente de correlacin lineal expresa un
valor de 0.9454 el cual est muy cercano al extremo 1 positivo que es la
correlacin perfecta positiva.
D. Para halla el tiempo cuando un empleado se lleve 100 das, remplazamos x
por la ecuacin dada por el modelo matemtico.
Y= -0,3464(100) + 35,571= 0,931
Segn el nmero de das dado se espera que el obrero se demore en una
pieza 0,931 minutos.

3. Una Nutricionista de un hogar infantil desea encontrar un modelo


matemtico que permita determinar la relacin entre el peso y la estatura de
sus estudiantes. Para ello selecciona 10 nios y realiza las mediciones
respectivas.
A continuacin se presentan los
resultados:
Estatura
(cm)
Peso (
kg)

121

123

108

118

111

109

114

103

110

115

25

22

19

24

19

18

20

15

20

21

a. Realice el diagrama de dispersin y determine el tipo de asociacin


entre las variables
b. Encuentre el modelo matemtico que permite predecir el efecto de una
variable sobre la otra. Es confiable?
c. Determine el grado de relacin de las dos variables.
d. Cul es el peso que debera tener un estudiante que mida 130 cm?

Desarrollo
A. Diagrama de dispersin

Chart Title
30
25
20
Axis Title

f(x) = 0.42x - 27.38


R = 0.81

15

Linear ()

10
5
0
100

105

110

115

120

125

Axis Title

El tipo de asociacin presentado en la grfica es de dispersin lineal.

B. Modelo matemtico.
Y= 0,4212x - 27,377

El modelo presenta una confiabilidad aceptable dado que R se aleja


un poco de 1.
C. El grado de relacin de las dos variables es de 81% dado por R.
D. Para determinar el peso de un estudiante que mida 130cm remplazamos la
variable x en la ecuacin dada por el modelo matemtico.
Y= 0,4212(130) - 27,377= 27,379
El peso que debe tener un estudiante que mida 130cm es de 27,379 kg.

Anda mungkin juga menyukai