PRESENTADO POR:
JAIME YESID SALAZAR REYES 1091076
ELQUIN DAVID ORTEGA USECHE 1091050
CARLOS EDUARDO LAVERDE CONTRERAS 1091047
JUAN CARLOS VILLAMIZAR QUINTERO 1091046
PABLO ANDRES GUERRERO PALACIOS 1091077
CESAR AUGUSTO QUINTERO SUARES 1091069
ROBERT ALEXIS BERBESI PIERTRO 1091074
PRESENTADO A:
SANCHEZ FRANK JOSE VICENTE
TABLA DE CONTENIDO
Introduccin3
Objetivos.4
Metodologa
5
Muestras...............6
Marcas de clase7
Histograma.8
Polgono de
frecuencia.9
Ojiva..10
Medidas matemticas y no matemticas11
Percentiles y moda.12
Medidas de dispersin.13-14
Varianza15
Desviacin estndar.16-17
Diagrama de dispersin.18
Conceptos bsicos19-31
Conclusiones...32
INTRODUCCION
El presente trabajo de estadstica descriptiva rene un estudio descriptivo a la
recopilacin, organizacin y representacin de los datos estadsticos en la que
se tom como muestra la poblacin estudiantil de un colegio, para clasificarlo
segn sus edades.
Luego se introducen algunos procedimientos tales como las medidas
matemticas y no matemticas de tendencia central, las medidas de dispersin
absoluta y relativa con el fin de sintetizar la informacin.
Finalmente se hace un breve estudio sobre la regresin y correlacin, los cuales
nos ayudan a hacer predicciones en eventos futuros con base en los datos
actuales.
OBJETIVOS
1. Describir estadsticamente la informacin recopilada para esta investigacin.
2. Conocer de que forma se puede medir las tendencias matemticas y no
matemticas.
3. Saber como se mide el grado de variabilidad de los datos.
4. Ver como se pueden medir los cambios que sufren en el tiempo algunas variaciones
como precios, cantidades y valores.
METODOLGIA
El presente trabajo se realiza bajo el mbito de un estudio estadstico acerca de las
edades de los estudiantes de colegio, tomndose una muestra de 70 alumnos entre
hombre y mujeres, con el fin de determinar cuales son los promedios oscilantes de
edades en que se encuentra la poblacin estudiantil del plantel educativo.
Y1
Y2
Y3
Y4
Y5
Y6
Y7
Y8
Y9
Y10
20
21
18
17
19
15
14
12
15
16
11
30
47
42
39
32
19
14
11
18
39
31
33
35
17
19
40
41
13
44
36
32
24
21
19
17
11
19
16
14
39
49
44
38
17
53
13
18
14
15
30
21
18
14
42
34
26
21
19
12
13
26
29
35
48
17
16
12
21
23
R = Dm dm
R = 53-11
R = 42
AMPLITUD =
R/M
A= 42/6 = 7
A= 7
La amplitud indica la distancia que debe tener cada grupo para formar los de clase, se
parte del dato menor 11 y se le suma la amplitud 7.
MARCA DE CLASE
J
Y j-1 Y
Numero de estudiantes
total
1
2
3
4
5
6
11
18
25
32
39
46
18
25
32
39
46
53
//////////////////////////////
//////////////
////////
/////////
//////
///
30
14
8
9
6
3
Y1= (11+18)/2=14.5
DISTRIBUCION DE FRECUENCIAS
ORDEN DE
INTERVALO
MARCA DE
FRECUENCIA
FRECUENCIA
LA CLASE
DE CLASE
CLASE
ABSOLUTA
RELATIVA
ACUMULADAS
Yj-1 Yj
Yj
nj
Hj
Nj
Nj
Hj
Hj
11 - 18
18 - 25
25 - 32
32 - 39
39 - 46
46 - 53
14.5
21.5
28.5
35.5
42.5
49.5
30
14
8
9
6
3
0.43
0.20
0.11
0.13
0.09
0.04
30
44
52
61
67
70
70
40
26
18
9
3
0.43
0.63
0.74
0.87
0.96
1.00
1.00
0.57
0.37
0.26
0.13
0.04
ABSOLUTAS
1
2
3
4
5
6
TOTAL
70
RELATIVAS
HITOGRAMA
30
30
25
20
14
Nj 15
9
10
6
3
5
0
11-18
18-25
25-32
32-39
39-46
46-53
Yj
VARIABLE DE ESTUDIO
POLIGONO DE FRECUENCIAS
NUMERO DE ESTUDIANTES
35
30
25
20
Serie1
15
10
5
0
1
VARIABLE DE ESTUDIO
OJIVA
80
70
70
67
61
60
52
nj
50
44
40
40
30
70
Serie1
Serie2
30
26
20
18
10
9
3
0
11 - 18
18 - 25
25 - 32
32 - 39
39 - 46
46 - 53
Y'j - Y'j-1
La ojiva nos muestra la forma como crece y decrece la informacin a travs de los
intervalos. Para realizar la grfica se tuvo en cuenta las frecuencias acumuladas
(absoluta y relativa) en forma ascendente y descendente.
10
MEDIDAS MATEMATICAS
MEDIA ARITMETICA
Yj
nj
Yj * nj
Total del clase
14.5
21.5
28.5
35.5
42.5
49.5
30
14
8
9
6
3
435.00
301.00
228.00
319.50
255.00
148.50
70
1,687.00
M ( y)
nj * Yj
n
M (Y )
1.687
24.1
70
MEDIA GEOMETRICA
La media geomtrica G(X) de un conjunto de n valores es la raz ensima del producto
de las observaciones.
G ( x)
G ( x)
X 1 * X 2 * X 3 * ... Xn
30 * 14 * 8 * 9 * 6 * 3 9.04
MEDIDAS NO MATEMATICAS
MEDIANA
Yj-1 Yj
nj
Nj
11 - 18
18 - 25
25 - 32
32 - 39
39 - 46
46 - 53
30
14
8
9
6
3
30
44
52
61
67
70
La mediana es = 20.5
N = 70
Nj-1 n/2 < Nj
44 35 < 44
n
N j 1
Me Y ' j 1 C j
Nj
35 30
Me 18 7
20.5
14
PERCENTILES
11
rn
Pr Y ' j 1 C j
Yj-1 Yj
nj
Nj
1
2
3
4
5
6
11 - 18
18 - 25
25 - 32
32 - 39
39 - 46
46 - 53
30
14
8
9
6
3
70
30
44
52
61
67
70
N j 1
100
nj
r = partes tomadas
n = Tamao de la muestra (total de observaciones)
68 * 70
47.6 , corresponden al 68% de alumnos
100
47.6 44
P68 25 7
28.15 Alumnos
8
Esta cantidad indica que el 68% de los 70 alumnos tienen una edad mxima de 28.15
aos y el 32% restante supera esta edad.
MODA
Moda es el valor de la variable que se repite con ms frecuencia.
Notacin: Md(X)
Md Y ' j 1 C j
n j 1
n n
j 1
j 1
Donde:
Md
Moda
Yj-1
Cj
Amplitud de clase
nj-1
12
nj
Frecuencia ms alta
nj+1
nj
11 - 18
18 - 25
25 - 32
32 - 39
39 - 46
46 - 53
30
14
8
9
6
3
8
36.00 Alumnos
86
Me 32 7
MEDIDAS DE DISPERSION
MEDIDAS DE DISPERSION ABSOLUTA
La dispersin se puede medir en trminos de distancia (diferencial) entre los valores de
un conjunto de datos y se considera una medida de referencia de ese mismo conjunto.
a) EL RANGO O RECORRIDO
Es la diferencia entre el dato mayor y el dato menor de los valores observados en la
variable de estudio.
R
Rango
Dd
53 - 11
42
Este valor indica la distancia que existe entre la edad mayor y la edad menor.
B) EL RANGO MODIFICADO
13
Yj-1 Yj
Nj
Nj
11 - 18
18 - 25
25 - 32
32 - 39
39 - 46
46 - 53
30
14
8
9
6
3
70
30
44
52
61
67
70
R50
R40
0%
P11
P20
P25
P55
R60
70%
R
Rango
P60
Percentil 60
P20
Percentil 10
60 52
38.22 Alumnos
9
P60 32 7
10 0
17 Alumnos
10
P10 10 7
VARIANZA
14
P60
P65
70%
S2
__
( X j X )2
i 1
S2
Varianza de la muestra
Xj
Observacin i de la muestra
Promedio de la muestra
Tamao de la muestra
__
Edades
__
(Xi - X )
11 28.5 =
-17.5
18 28.5 =
-10.5
25 28.5 =
-3.5
32 28.5 =
3.5
39 28.5 =
10.5
46 28.5 =
17.5
0
11
18
25
32
39
46
171
__
Xi
i 1
171
28.5
6
S2
__
( X j X )2
i 1
857.5
142.92
6
DESVIACION ESTANDAR
15
__
(Xi - X )2
306.25
110.25
12.25
12.25
110.25
306.25
857.5
S 2 142.92 11.95
Este valor significa que los datos en promedio se alejan de la media aritmtica en 11.95
aos es decir la dispersin promedio:
n
S
2
X
i 1
2
i
5731 171
(X )
6
6
__
REGRESION Y CORRELACION
REGRESION SIMPLE
El rector del Colegio establece una relacin entre la edad de los alumnos y las fallas a
clases que tuvieron durante el ao lectivo de 2014. Para esto recogi la muestra de 10
alumnos tomados al azar entre todos los alumnos que terminaron el ao.
Edad (X)
Fallas(Y)
25
5
19
3
17
1
23
8
21
4
16
16
9
25
2
31
7
39
6
28
12
En el Colegio se obtiene
X
25
19
17
23
21
16
25
31
39
28
244
Y
5
3
1
8
4
9
2
7
6
12
57
XY
125
57
17
184
84
144
50
217
234
336
1448
0.130
2
(10 * 6392) ( 244)
4384
57 (0.130)(330)
2.828
10
X2
625
361
289
529
441
256
625
961
1521
784
6392
Y2
25
9
1
64
16
81
4
49
36
144
429
Y = 2.828 - 0.130X
El Rector del colegio desea estimar las fallas de un alumno con 27 aos de edad:
Y = 2.828 0.130*27 = 9.93
Se estima que un alumno de 27 aos de edad falte a clases 9.93 veces.
17
DIAGRAMA DE DISPERSIN
14
12
10
Fallas
Y = 2.828 - 0.130X
8
6
4
2
0
0
10
15
20
25
30
35
40
Edad en aos
ERROR DE ESTIMACION
Se
a X b XY
n2
10 2
18
79.564
3.15
8
45
CONCEPTOS UTILIZADOS
ESTADISTICA DESCRIPTIVA: Es aquella que recopila, analiza, estudia y describe a la
totalidad de individuos de una poblacin. Su finalidad es obtener informacin, analizarla,
elaborarla y simplificarla lo necesario para que pueda ser interpretada cmoda y
rpidamente y por lo tanto, pueda utilizarse eficazmente para el fin que se desee. La
estadstica descriptiva tambin se puede definir como la rama de la estadstica que se
ocupa del desarrollo y utilizacin de tcnicas para la presentacin eficaz de informacin
numrica con el objeto de poner de relieve los modelos que de otra forma quedaran
ocultos en un conjunto de datos
PROBABILIDAD: es un mtodo por el cual se obtiene la frecuencia de un
acontecimiento determinado mediante la realizacin de un experimento aleatorio, del
que se conocen todos los resultados posibles, bajo
condiciones suficientemente estables.
La teora de la probabilidad se usa extensamente en reas como la estadstica, la fsica,
la matemtica, las ciencias y la filosofa para sacar conclusiones sobre la probabilidad
discreta de sucesos potenciales y la mecnica subyacente discreta de sistemas
complejos, por lo tanto es la rama de las matemticas que estudia, mide o determina a
los experimentos o fenmenos aleatorios.
POBLACION: en estadstica, tambin llamada universo o colectivo, es el conjunto de
elementos de referencia sobre el que se realizan las observaciones. Tambin es el
conjunto sobre el que estamos interesados en obtener conclusiones (inferir).
Normalmente es demasiado grande para poder abarcarla, motivo por el cual se puede
hacer necesaria la extraccin de una muestra de sta.
MEDIA: o promedio es una medida de tendencia central que segn la Real Academia
Espaola resulta al efectuar una serie determinada de operaciones con un conjunto de
nmeros y que, en determinadas condiciones, puede representar por s solo a todo el
conjunto. Existen distintos tipos de medias, tales como la media geomtrica, la media
ponderada y la media armnica aunque en el lenguaje comn, el trmino se refiere
generalmente a la media aritmtica.
19
Polgono de frecuencias
Ojiva porcentual
Paso 1
Determinar el rango de los datos. Rango es igual al dato mayor menos el dato menor.
Paso 2
Obtener todos los nmeros de clases, existen varios criterios para determinar el nmero
de clases (o barras) por ejemplo, la regla de Surges. Sin embargo ninguno de ellos es
exacto. Algunos autores recomiendan de cinco a quince clases, dependiendo de cmo
estn los datos y cuntos sean. Un criterio usado frecuentemente es que el nmero de
clases debe ser aproximadamente a la raz cuadrada del nmero de datos. Por ejemplo,
la raz cuadrada de 30 (nmero de artculos) es mayor que cinco, por lo que se
seleccionan seis clases.
Paso 3
Paso 4
Construir los intervalos de clases: Los intervalos resultan de dividir el rango de los datos
en relacin al resultado del PASO 2 en intervalos iguales.
22
Paso 5
Graficar el histograma: En caso de que las clases sean todas de la misma amplitud, se
hace un grfico de barras, las bases de las barras son los intervalos de clases y altura
son la frecuencia de las clases. Si se unen los puntos medios de la base superior de los
rectngulos se obtiene el polgono de frecuencias.
ESTADISTICA INFERENCIAL: es una parte de la estadstica que comprende los
mtodos y procedimientos que por medio de la induccin determina propiedades de
una poblacin estadstica, a partir de una pequea parte de la misma. La estadstica
inferencial comprende como aspectos importantes:
El contraste de hiptesis.
El diseo experimental.
La inferencia bayesiana.
23
Los valores posibles de una variable aleatoria pueden representar los posibles
resultados de un experimento an no realizado, o los posibles valores de una cantidad
cuyo valor actualmente existente es incierto (p.e., como resultado de medicin
incompleta o imprecisa). Intuitivamente, una variable aleatoria puede tomarse como una
cantidad cuyo valor no es fijo pero puede tomar diferentes valores; una distribucin de
probabilidad se usa para describir la probabilidad de que se den los diferentes valores.
Las variables aleatorias suelen tomar valores reales, pero se pueden considerar valores
aleatorios como valores lgicos, funciones... El trmino elemento aleatorio se utiliza
para englobar todo ese tipo de conceptos relacionados. Un concepto relacionado es el
de proceso estocstico, un conjunto de variables aleatorias ordenadas (habitualmente
por orden o tiempo).
ERROR ESTADISTICO: es la diferencia entre el valor de un estimador y el del
parmetro correspondiente. Existen varias causas para producir estos errores. Segn la
causa son clasificados en errores de muestreo y de no muestreo.
El error de no muestreo puede ocurrir en cualquier encuesta, sea un censo o una
muestra. Estos errores comprenden errores sistemticos y equivocaciones.
Los factores que causan error sistemtico son: falta de definicin clara de la poblacin,
inadecuada elaboracin del marco de muestreo, falta de definicin del cuestionario,
vaga concepcin de la informacin deseada, mtodos imprecisos de entrevistas.
Surgen errores por equivocacin cuando las respuestas son anotadas en lugares
equivocados, cuando los entrevistados no responden, dan respuestas incorrectas o
inapropiadas y cuando se hacen clculos y anotaciones incorrectas al procesar los
datos. "Los errores de no muestreo pueden ser controlados mediante una atencin
cuidadosa en la construccin de los cuestionarios y en los detalles del trabajo de
campo"1. Estos errores en las encuestas pueden ser minimizados as: la no respuesta
con un plan para hacer re entrevistas a los elementos muestreados, con recompensas e
incentivos para quien responde y entrevistadores adiestrados; la respuesta incorrecta
se puede corregir si los cuestionarios despus de diligenciados son revisados por
alguien diferente al encuestador.
Los errores de muestreo son resultado de la eleccin casual de unidades de muestreo.
Este tipo de error ocurre porque solo se observa una parte de la poblacin; as que si se
hace un censo, puede esperarse que desaparezca el error de muestreo.
24
25
26
28
29
aplicar unos procedimientos consistentes con dichas guas, aunque no las garantiza al
cien por ciento.
El pensamiento estadstico, es una dimensin transversal a toda heurstica que intente
obtener informacin o tomar decisiones en ambientes de variabilidad e incertidumbre.
Para finalizar, podemos plantear la pregunta Cmo comparar la eficiencia de varias
heursticas en ambientes de incertidumbre o en situaciones pobremente estudiadas?
Una posible estrategia para lograr este propsito, puede darse con base en la
simulacin, la cual permite a costos relativamente bajos predecir el comportamiento de
una heurstica, en diferentes ambientes y condiciones de partida. Conociendo
comportamientos aproximados de las componentes de un sistema y de sus complejas
relaciones, puede hacerse uso de la herramienta que proporciona la simulacin para
obtener resultados empricos del comportamiento del sistema completo, pudindose
evaluar la sensibilidad o robustez a ciertas condiciones y ambientes.
La estadstica en el currculo de Ingeniera.
Hemos descubierto, con base en la ptica de Koen (1985) y su caracterizacin del
Mtodo de Ingeniera, algunas necesidades de conocimiento, relacionadas con
potencializar su capacidad de enfrentar la variabilidad y la incertidumbre, inherentes a
la esencia del trabajo de un ingeniero.
En este sentido y asociado a las diversas problemticas, en las que puede aparecer la
incertidumbre al aplicar el Mtodo de Ingeniera, surgieron los nombres de los temas
bsicos de la disciplina estadstica, que sera muy conveniente que un ingeniero
conociera y colocara en su maletn de heursticas.
Los contenidos.
1.
2.
3.
4.
5.
30
6. Cmo estimar el tamao de muestra para lograr una calidad definida a priori de
la estimacin?
7. Cmo obtener los datos y cmo analizarlos, cuando se desea comparar varias
alternativas de accin? cmo medir los riesgos de equivocarse en la decisin?
Cuntos experimentos realizar en cada tratamiento? (Diseo estadstico de
experimentos).
8. Cmo predecir la magnitud de una caracterstica, conociendo las magnitudes
de otras? (Modelos de Regresin).
9. El ABC de los procedimientos de simulacin.
10. Mtodos de muestreo.
11. Introduccin al anlisis de series de tiempo y pronsticos.
12. Introduccin a la teora de la fiabilidad.
13. Modelos probabilsticos para aplicaciones en ingeniera.
14. Reflexiones sobre estadstica, Ingeniera y Sociedad.
31
CONCLUSIONES
32