Anda di halaman 1dari 32

ESTADISTICA DESCRIPTIVA

PRESENTADO POR:
JAIME YESID SALAZAR REYES 1091076
ELQUIN DAVID ORTEGA USECHE 1091050
CARLOS EDUARDO LAVERDE CONTRERAS 1091047
JUAN CARLOS VILLAMIZAR QUINTERO 1091046
PABLO ANDRES GUERRERO PALACIOS 1091077
CESAR AUGUSTO QUINTERO SUARES 1091069
ROBERT ALEXIS BERBESI PIERTRO 1091074

PRESENTADO A:
SANCHEZ FRANK JOSE VICENTE

UNIVERSIDAD FRANCISCO DE PAULA SANTANDER


SAN JOSE DE CUCUTA
FACULTAD DE INGENIERIAS
30/10/2014

TABLA DE CONTENIDO
Introduccin3
Objetivos.4
Metodologa
5
Muestras...............6
Marcas de clase7
Histograma.8
Polgono de
frecuencia.9
Ojiva..10
Medidas matemticas y no matemticas11
Percentiles y moda.12
Medidas de dispersin.13-14
Varianza15
Desviacin estndar.16-17
Diagrama de dispersin.18
Conceptos bsicos19-31
Conclusiones...32

INTRODUCCION
El presente trabajo de estadstica descriptiva rene un estudio descriptivo a la
recopilacin, organizacin y representacin de los datos estadsticos en la que
se tom como muestra la poblacin estudiantil de un colegio, para clasificarlo
segn sus edades.
Luego se introducen algunos procedimientos tales como las medidas
matemticas y no matemticas de tendencia central, las medidas de dispersin
absoluta y relativa con el fin de sintetizar la informacin.
Finalmente se hace un breve estudio sobre la regresin y correlacin, los cuales
nos ayudan a hacer predicciones en eventos futuros con base en los datos
actuales.

OBJETIVOS
1. Describir estadsticamente la informacin recopilada para esta investigacin.
2. Conocer de que forma se puede medir las tendencias matemticas y no
matemticas.
3. Saber como se mide el grado de variabilidad de los datos.
4. Ver como se pueden medir los cambios que sufren en el tiempo algunas variaciones
como precios, cantidades y valores.

METODOLGIA
El presente trabajo se realiza bajo el mbito de un estudio estadstico acerca de las
edades de los estudiantes de colegio, tomndose una muestra de 70 alumnos entre
hombre y mujeres, con el fin de determinar cuales son los promedios oscilantes de
edades en que se encuentra la poblacin estudiantil del plantel educativo.

DE LA POBLACION ESTUDIANTIL DEL COLEGIO, SE TOMO UNA MUESTRA DE 70


ALUMNOS Y SE DESEA CLASIFICAR SEGN SUS EDADES AS:

Y1
Y2
Y3
Y4
Y5
Y6
Y7
Y8
Y9
Y10

20
21
18
17
19
15
14
12
15
16

11
30
47
42
39
32
19
14
11
18

39
31
33
35
17
19
40
41
13
44

36
32
24
21
19
17
11
19
16
14

39
49
44
38
17
53
13
18
14
15

30
21
18
14
42
34
26
21
19
12

13
26
29
35
48
17
16
12
21
23

CLASIFICAR LOS DATOS EN SEIS INTERVALOS (M)


VARIABLE: LA VARIABLE ES CONTINUA
RECORRIDO:

R = Dm dm
R = 53-11
R = 42

AMPLITUD =

R/M
A= 42/6 = 7
A= 7

La amplitud indica la distancia que debe tener cada grupo para formar los de clase, se
parte del dato menor 11 y se le suma la amplitud 7.

MARCA DE CLASE
J

Y j-1 Y

Numero de estudiantes

total

1
2
3
4
5
6

11
18
25
32
39
46

18
25
32
39
46
53

//////////////////////////////
//////////////
////////
/////////
//////
///

30
14
8
9
6
3

Y1= (11+18)/2=14.5

DISTRIBUCION DE FRECUENCIAS
ORDEN DE

INTERVALO

MARCA DE

FRECUENCIA

FRECUENCIA

LA CLASE

DE CLASE

CLASE

ABSOLUTA

RELATIVA

ACUMULADAS

Yj-1 Yj

Yj

nj

Hj

Nj

Nj

Hj

Hj

11 - 18
18 - 25
25 - 32
32 - 39
39 - 46
46 - 53

14.5
21.5
28.5
35.5
42.5
49.5

30
14
8
9
6
3

0.43
0.20
0.11
0.13
0.09
0.04

30
44
52
61
67
70

70
40
26
18
9
3

0.43
0.63
0.74
0.87
0.96
1.00

1.00
0.57
0.37
0.26
0.13
0.04

ABSOLUTAS

1
2
3
4
5
6
TOTAL

70

RELATIVAS

HITOGRAMA

30
30
25
20
14

Nj 15
9

10

6
3

5
0
11-18

18-25

25-32

32-39

39-46

46-53

Yj
VARIABLE DE ESTUDIO

En el histograma est representado grficamente una distribucin de frecuencias con


intervalos de amplitud.

POLIGONO DE FRECUENCIAS
NUMERO DE ESTUDIANTES

35
30
25
20

Serie1

15
10
5
0
1

VARIABLE DE ESTUDIO

Este polgono de frecuencias esta representado en una curva la tendencia de la


informacin objeto de este estudio, sealando la concentracin de la informacin.

OJIVA
80
70

70

67
61

60
52

nj

50
44
40

40
30

70

Serie1
Serie2

30
26

20

18

10

9
3

0
11 - 18

18 - 25

25 - 32

32 - 39

39 - 46

46 - 53

Y'j - Y'j-1

La ojiva nos muestra la forma como crece y decrece la informacin a travs de los
intervalos. Para realizar la grfica se tuvo en cuenta las frecuencias acumuladas
(absoluta y relativa) en forma ascendente y descendente.

10

MEDIDAS MATEMATICAS
MEDIA ARITMETICA
Yj

nj

Yj * nj
Total del clase

14.5
21.5
28.5
35.5
42.5
49.5

30
14
8
9
6
3

435.00
301.00
228.00
319.50
255.00
148.50

70

1,687.00

M ( y)

nj * Yj
n

M (Y )

1.687
24.1
70

MEDIA GEOMETRICA
La media geomtrica G(X) de un conjunto de n valores es la raz ensima del producto
de las observaciones.
G ( x)

G ( x)

X 1 * X 2 * X 3 * ... Xn
30 * 14 * 8 * 9 * 6 * 3 9.04

MEDIDAS NO MATEMATICAS
MEDIANA
Yj-1 Yj

nj

Nj

11 - 18
18 - 25
25 - 32
32 - 39
39 - 46
46 - 53

30
14
8
9
6
3

30
44
52
61
67
70

La mediana es = 20.5

N = 70
Nj-1 n/2 < Nj
44 35 < 44
n

N j 1

Me Y ' j 1 C j
Nj

35 30
Me 18 7
20.5
14

PERCENTILES

11

rn

Pr Y ' j 1 C j

Yj-1 Yj

nj

Nj

1
2
3
4
5
6

11 - 18
18 - 25
25 - 32
32 - 39
39 - 46
46 - 53

30
14
8
9
6
3
70

30
44
52
61
67
70

N j 1
100

nj

r = partes tomadas
n = Tamao de la muestra (total de observaciones)
68 * 70
47.6 , corresponden al 68% de alumnos
100
47.6 44
P68 25 7
28.15 Alumnos
8

Esta cantidad indica que el 68% de los 70 alumnos tienen una edad mxima de 28.15
aos y el 32% restante supera esta edad.
MODA
Moda es el valor de la variable que se repite con ms frecuencia.
Notacin: Md(X)

Md Y ' j 1 C j

n j 1

n n
j 1
j 1

Donde:

Md

Moda

Yj-1

Limite de la clase modal

Cj

Amplitud de clase

nj-1

Frecuencia anterior a la ms lata frecuencia

12

nj

Frecuencia ms alta

nj+1

Frecuencia posterior a la ms alta frecuencia


Yj-1 Yj

nj

11 - 18
18 - 25
25 - 32
32 - 39
39 - 46
46 - 53

30
14
8
9
6
3

8
36.00 Alumnos
86

Me 32 7

MEDIDAS DE DISPERSION
MEDIDAS DE DISPERSION ABSOLUTA
La dispersin se puede medir en trminos de distancia (diferencial) entre los valores de
un conjunto de datos y se considera una medida de referencia de ese mismo conjunto.
a) EL RANGO O RECORRIDO
Es la diferencia entre el dato mayor y el dato menor de los valores observados en la
variable de estudio.
R

Rango

Valor de la observacin mayor

Valor de la observacin menor

El rango no analiza sino los datos extremos y no la variacin de todo el conjunto de


datos
R

Dd

53 - 11

42

Este valor indica la distancia que existe entre la edad mayor y la edad menor.
B) EL RANGO MODIFICADO

13

Yj-1 Yj

Nj

Nj

11 - 18
18 - 25
25 - 32
32 - 39
39 - 46
46 - 53

30
14
8
9
6
3
70

30
44
52
61
67
70

R50
R40
0%

P11

P20

P25

P55

R60
70%
R

Rango

P60

Percentil 60

P20

Percentil 10
60 52
38.22 Alumnos
9

P60 32 7

10 0
17 Alumnos
10

P10 10 7

VARIANZA

14

P60

P65

70%

Nos indica la distancia promedio de cualquier observacin en el conjunto de datos


n

S2

__

( X j X )2
i 1

S2

Varianza de la muestra

Xj

Observacin i de la muestra

Promedio de la muestra

Tamao de la muestra

__

Edades

Desviacin con respecto a la Desviacin elevada al cuadrado


media

__

(Xi - X )
11 28.5 =
-17.5
18 28.5 =
-10.5
25 28.5 =
-3.5
32 28.5 =
3.5
39 28.5 =
10.5
46 28.5 =
17.5
0

11
18
25
32
39
46
171

Se calcula la media aritmtica


n

__

Xi
i 1

171
28.5
6

La varianza con base en la definicin es:


n

S2

__

( X j X )2
i 1

857.5
142.92
6
DESVIACION ESTANDAR

15

__

(Xi - X )2
306.25
110.25
12.25
12.25
110.25
306.25
857.5

Se obtiene extrayendo la raz cuadrada de la varianza


S

S 2 142.92 11.95

Este valor significa que los datos en promedio se alejan de la media aritmtica en 11.95
aos es decir la dispersin promedio:
n

S
2

X
i 1

2
i

5731 171
(X )

6
6
__

(955.17 812.25) 142.92

REGRESION Y CORRELACION
REGRESION SIMPLE
El rector del Colegio establece una relacin entre la edad de los alumnos y las fallas a
clases que tuvieron durante el ao lectivo de 2014. Para esto recogi la muestra de 10
alumnos tomados al azar entre todos los alumnos que terminaron el ao.

Edad (X)
Fallas(Y)

25
5

19
3

17
1

23
8

21
4

16

16
9

25
2

31
7

39
6

28
12

En el Colegio se obtiene
X
25
19
17
23
21
16
25
31
39
28
244

Y
5
3
1
8
4
9
2
7
6
12
57

XY
125
57
17
184
84
144
50
217
234
336
1448

(10 * 1448) (244 * 57)


512

0.130
2
(10 * 6392) ( 244)
4384

57 (0.130)(330)
2.828
10

X2
625
361
289
529
441
256
625
961
1521
784
6392

Y2
25
9
1
64
16
81
4
49
36
144
429

Y = 2.828 - 0.130X
El Rector del colegio desea estimar las fallas de un alumno con 27 aos de edad:
Y = 2.828 0.130*27 = 9.93
Se estima que un alumno de 27 aos de edad falte a clases 9.93 veces.

17

La informacin grficamente quedara:

DIAGRAMA DE DISPERSIN
14
12
10

Fallas

Y = 2.828 - 0.130X
8
6
4
2
0
0

10

15

20

25

30

35

40

Edad en aos

ERROR DE ESTIMACION

Se

a X b XY
n2

429 2.828 * 57 0.130 * 1448

10 2

Error de estimacin es = 3.15

18

79.564
3.15
8

45

CONCEPTOS UTILIZADOS
ESTADISTICA DESCRIPTIVA: Es aquella que recopila, analiza, estudia y describe a la
totalidad de individuos de una poblacin. Su finalidad es obtener informacin, analizarla,
elaborarla y simplificarla lo necesario para que pueda ser interpretada cmoda y
rpidamente y por lo tanto, pueda utilizarse eficazmente para el fin que se desee. La
estadstica descriptiva tambin se puede definir como la rama de la estadstica que se
ocupa del desarrollo y utilizacin de tcnicas para la presentacin eficaz de informacin
numrica con el objeto de poner de relieve los modelos que de otra forma quedaran
ocultos en un conjunto de datos
PROBABILIDAD: es un mtodo por el cual se obtiene la frecuencia de un
acontecimiento determinado mediante la realizacin de un experimento aleatorio, del
que se conocen todos los resultados posibles, bajo
condiciones suficientemente estables.
La teora de la probabilidad se usa extensamente en reas como la estadstica, la fsica,
la matemtica, las ciencias y la filosofa para sacar conclusiones sobre la probabilidad
discreta de sucesos potenciales y la mecnica subyacente discreta de sistemas
complejos, por lo tanto es la rama de las matemticas que estudia, mide o determina a
los experimentos o fenmenos aleatorios.
POBLACION: en estadstica, tambin llamada universo o colectivo, es el conjunto de
elementos de referencia sobre el que se realizan las observaciones. Tambin es el
conjunto sobre el que estamos interesados en obtener conclusiones (inferir).
Normalmente es demasiado grande para poder abarcarla, motivo por el cual se puede
hacer necesaria la extraccin de una muestra de sta.
MEDIA: o promedio es una medida de tendencia central que segn la Real Academia
Espaola resulta al efectuar una serie determinada de operaciones con un conjunto de
nmeros y que, en determinadas condiciones, puede representar por s solo a todo el
conjunto. Existen distintos tipos de medias, tales como la media geomtrica, la media
ponderada y la media armnica aunque en el lenguaje comn, el trmino se refiere
generalmente a la media aritmtica.

19

MEDIANA: representa el valor de la variable de posicin central en un conjunto de


datos ordenados.
Existen dos mtodos para el clculo de la mediana:
1. Considerando los datos en forma individual, sin agruparlos.
2. Utilizando los datos agrupados en intervalos de clase.
DESVIACION TIPICA O DESVIACION ESTANDAR: (denotada con el smbolo o s,
dependiendo de la procedencia del conjunto de datos) es una medida de
dispersin para variables de razn (variables cuantitativas o cantidades racionales) y de
intervalo. Se define como la raz cuadrada de la varianza de la variable.
Para conocer con detalle un conjunto de datos, no basta con conocer las medidas de
tendencia central, sino que necesitamos conocer tambin la desviacin que presentan
los datos en su distribucin respecto de la media aritmtica de dicha distribucin, con
objeto de tener una visin de los mismos ms acorde con la realidad al momento de
describirlos e interpretarlos para la toma de decisiones.
VARIANZA: (que suele representarse como 2) de una variable aleatoria es
una medida de dispersin definida como la esperanza del cuadrado de la desviacin de
dicha variable respecto a su media.
Est medida en unidades distintas de las de la variable. Por ejemplo, si la variable mide
una distancia en metros, la varianza se expresa en metros al cuadrado. La desviacin
estndar es la raz cuadrada de la varianza, es una medida de dispersin alternativa
expresada en las mismas unidades de los datos de la variable objeto de estudio. La
varianza tiene como valor mnimo 0.
Hay que tener en cuenta que la varianza puede verse muy influida por los valores
atpicos y no se aconseja su uso cuando las distribuciones de las variables aleatorias
tienen colas pesadas. En tales casos se recomienda el uso de otras medidas de
dispersin ms robustas.
MODA: es el valor con una mayor frecuencia en una distribucin de datos.
Hablaremos de una distribucin bimodal de los datos adquiridos en una columna
cuando encontremos dos modas, es decir, dos datos que tengan la misma frecuencia
absoluta mxima. Una distribucin trimodal de los datos es en la que encontramos tres
modas. Si todas las variables tienen la misma frecuencia diremos que no hay moda.
20

El intervalo modal es el de mayor frecuencia absoluta. Cuando tratamos con datos


agrupados antes de definir la moda, se ha de definir el intervalo modal.
La moda, cuando los datos estn agrupados, es un punto que divide al intervalo modal
en dos partes de la forma p y c-p, siendo c la amplitud del intervalo, que verifiquen que:
pcp=nini1nini+1
Siendo la frecuencia absoluta del intervalo modal las frecuencias absolutas de los
intervalos anterior y posterior, respectivamente, al intervalo modal.
DITRIBUCION DE FRECUENCIAS: a la agrupacin de datos en categoras
mutuamente excluyentes que indican el nmero de observaciones en cada
categora. Esto proporciona un valor aadido a la agrupacin de datos. La distribucin
de frecuencias presenta las observaciones clasificadas de modo que se pueda ver el
nmero existente en cada clase.
FRECUENCIA ACUMULADA: o frecuencia acumulativa es la frecuencia de ocurrencia
de valores de un fenmeno menores que un valor de referencia. El fenmeno puede ser
invariable que vara en el tiempo o en el espacio. La frecuencia acumulada se llama
tambin frecuencia de noexcedencia. El anlisis de la frecuencia acumulada se hace
con el propsito de obtener una idea de cuantas veces ocurrira un cierto fenmeno lo
que puede ser instrumental en describir o explicar una situacin en la cual el fenmeno
juega un papel importante, o en planificar intervenciones, por ejemplo en el control de
inundaciones.
TIPOS DE HISTOGRAMA
Diagramas de barras simples

Representa la frecuencia simple (absoluta o relativa) mediante la altura de la


barra la cual es proporcional a la frecuencia simple de la categora que
representa.

Diagramas de barras compuesta


Se usa para representar la informacin de una tabla de doble entrada o sea a
partir de dos variables, las cuales se representan as; la altura de la barra
representa la frecuencia simple de las modalidades o categoras de la variable y
esta altura es proporcional a la frecuencia simple de cada modalidad.

Diagramas de barras agrupadas


21

Se usa para representar la informacin de una tabla de doble entrada o sea a


partir de dos variables, el cual es representado mediante un conjunto de barras
como se clasifican respecto a las diferentes modalidades.

Polgono de frecuencias

Es un grfico de lneas que de las frecuencias absolutas de los valores de una


distribucin en el cual la altura del punto asociado a un valor de las variables es
proporcional a la frecuencia de dicho valor.

Ojiva porcentual

Es un grfico acumulativo, el cual es muy til cuando se quiere representar el


rango porcentual de cada valor en una distribucin de frecuencias.
En los grficos las barras se encuentran juntas y en la tabla los
nmeros poseen en el primer miembro un corchete y en el segundo
un parntesis, por ejemplo: (10-20) aunque existen algunas otras.
CONSTRUCCION DE UN HISTOGRAMA

Paso 1

Determinar el rango de los datos. Rango es igual al dato mayor menos el dato menor.

Paso 2

Obtener todos los nmeros de clases, existen varios criterios para determinar el nmero
de clases (o barras) por ejemplo, la regla de Surges. Sin embargo ninguno de ellos es
exacto. Algunos autores recomiendan de cinco a quince clases, dependiendo de cmo
estn los datos y cuntos sean. Un criterio usado frecuentemente es que el nmero de
clases debe ser aproximadamente a la raz cuadrada del nmero de datos. Por ejemplo,
la raz cuadrada de 30 (nmero de artculos) es mayor que cinco, por lo que se
seleccionan seis clases.

Paso 3

Establecer la longitud de clase: es igual al rango dividido por el nmero de clases.

Paso 4

Construir los intervalos de clases: Los intervalos resultan de dividir el rango de los datos
en relacin al resultado del PASO 2 en intervalos iguales.

22

Paso 5

Graficar el histograma: En caso de que las clases sean todas de la misma amplitud, se
hace un grfico de barras, las bases de las barras son los intervalos de clases y altura
son la frecuencia de las clases. Si se unen los puntos medios de la base superior de los
rectngulos se obtiene el polgono de frecuencias.
ESTADISTICA INFERENCIAL: es una parte de la estadstica que comprende los
mtodos y procedimientos que por medio de la induccin determina propiedades de
una poblacin estadstica, a partir de una pequea parte de la misma. La estadstica
inferencial comprende como aspectos importantes:

La toma de muestras o muestreo.

La estimacin de parmetros o variables estadsticas.

El contraste de hiptesis.

El diseo experimental.

La inferencia bayesiana.

Los mtodos no paramtricos.

ENCUENTA: es un estudio observacional en el que el investigador busca recopilar


datos por medio de un cuestionario previamente diseado, sin modificar el entorno ni
controlar el proceso que est en observacin (como s lo hace en un experimento). Los
datos se obtienen realizando un conjunto de preguntas normalizadas dirigidas a una
muestra representativa o al conjunto total de la poblacin estadstica en estudio,
integrada a menudo por personas, empresas o entes institucionales, con el fin de
conocer estados de opinin, caractersticas o hechos especficos. El investigador debe
seleccionar las preguntas ms convenientes, de acuerdo con la naturaleza de la
investigacin.
VARIABLE ALEATORIA: Formalmente, una variable aleatoria es una funcin, que
asigna eventos (p.e., los posibles resultados de tirar un dado dos veces: (1, 1), (1, 2),
etc.) a nmeros reales (p.e., su suma). Una variable aleatoria o variable
estocstica es una variable estadstica cuyos valores se obtienen de mediciones en
experimento aleatorio.

23

Los valores posibles de una variable aleatoria pueden representar los posibles
resultados de un experimento an no realizado, o los posibles valores de una cantidad
cuyo valor actualmente existente es incierto (p.e., como resultado de medicin
incompleta o imprecisa). Intuitivamente, una variable aleatoria puede tomarse como una
cantidad cuyo valor no es fijo pero puede tomar diferentes valores; una distribucin de
probabilidad se usa para describir la probabilidad de que se den los diferentes valores.
Las variables aleatorias suelen tomar valores reales, pero se pueden considerar valores
aleatorios como valores lgicos, funciones... El trmino elemento aleatorio se utiliza
para englobar todo ese tipo de conceptos relacionados. Un concepto relacionado es el
de proceso estocstico, un conjunto de variables aleatorias ordenadas (habitualmente
por orden o tiempo).
ERROR ESTADISTICO: es la diferencia entre el valor de un estimador y el del
parmetro correspondiente. Existen varias causas para producir estos errores. Segn la
causa son clasificados en errores de muestreo y de no muestreo.
El error de no muestreo puede ocurrir en cualquier encuesta, sea un censo o una
muestra. Estos errores comprenden errores sistemticos y equivocaciones.
Los factores que causan error sistemtico son: falta de definicin clara de la poblacin,
inadecuada elaboracin del marco de muestreo, falta de definicin del cuestionario,
vaga concepcin de la informacin deseada, mtodos imprecisos de entrevistas.
Surgen errores por equivocacin cuando las respuestas son anotadas en lugares
equivocados, cuando los entrevistados no responden, dan respuestas incorrectas o
inapropiadas y cuando se hacen clculos y anotaciones incorrectas al procesar los
datos. "Los errores de no muestreo pueden ser controlados mediante una atencin
cuidadosa en la construccin de los cuestionarios y en los detalles del trabajo de
campo"1. Estos errores en las encuestas pueden ser minimizados as: la no respuesta
con un plan para hacer re entrevistas a los elementos muestreados, con recompensas e
incentivos para quien responde y entrevistadores adiestrados; la respuesta incorrecta
se puede corregir si los cuestionarios despus de diligenciados son revisados por
alguien diferente al encuestador.
Los errores de muestreo son resultado de la eleccin casual de unidades de muestreo.
Este tipo de error ocurre porque solo se observa una parte de la poblacin; as que si se
hace un censo, puede esperarse que desaparezca el error de muestreo.

24

El Rol de la Estadstica en el trabajo del Ingeniero.


La importancia de la estadstica en la actualidad, no se pone en discusin. Casi todos
los programas profesionales universitarios incluyen en su currculo, al menos un curso
de estadstica. En muchos pases, inclusive en Colombia, la estadstica forma parte del
currculo de la educacin secundaria e inclusive se incluyen algunos tpicos en la
educacin primaria.
La dinmica del mundo moderno, exige que todo ciudadano, para ejercer sus
derechos y comprender su entorno, requiera de una alfabetizacin en estadstica.
El reconocimiento de la variabilidad y la incertidumbre, como elementos esenciales de
la naturaleza y en la vida misma, ha ido creciendo como lo muestra Cobb (1993), el
siguiente cuadro en el cual se compara la demanda por cursos de estadstica con la
demanda de cursos de clculo.
Cuadro 1. Inscripcin a cursos de estadstica como un
porcentaje de la inscripcin a los cursos de clculo.
(Inscripciones en College en USA)
Ao
1966
1970
1975
1980 1985 1990
Porcentaje 10%
19%
37%
27%
36%
52%

Este cuadro pone en evidencia la importancia creciente que se le ha dado a la


disciplina estadstica.
En la formacin de ingenieros, la pertinencia de la estadstica se hace ms evidente.
Si tomamos como referencia a Billy Vaughn Koen (1985) en la versin al castellano de
su libro El mtodo en Ingeniera, nos percataremos de que inherente a su esencia, la
estrategia del ingeniero, est envuelta en una nube de variabilidad e incertidumbre, en
medio de la cual, debe tomar decisiones que lo acerquen a su objetivo, de una manera
heurstica. Veamos algunas expresiones textuales que refuerzan estos
planteamientos:
...Por el mtodo de Ingeniera quiero decir la estrategia para causar el mejor
cambio posible, con los recursos disponibles, en una situacin incierta o
pobremente estudiada
Aqu, queda implcito, que el ingeniero debe tomar decisiones con informacin
incompleta, en ambiente de incertidumbre, asumiendo riesgos, pero no de manera
aventurera o irresponsable, lo har con criterio y guindose por heursticas, muchas
de las cuales tienen como propsito hacerse buenas ideas sobre la magnitud de los
riesgos que asume y saber cul es el lado que lo pone conservadoramente cerca de la
seguridad.
El mismo autor, dedica el captulo 3 de su libro a definir algunos heurismos usados por
el mtodo de Ingeniera y los divide en 5 categoras, una de las cuales es:
Algunos heurismos que usan los ingenieros para mantener el riesgo dentro de

25

los lmites permitidos.


Otras expresiones como:
...nunca ser posible desarrollar del todo algunos problemas complicados,
debido a la incertidumbre inherente al Mtodo de Ingeniera.
Dado que el ingeniero tratar de encontrar la mejor respuesta, an en
situaciones relativamente viables para tomar una decisin, es inevitable que
exista algn riesgo. Esto desde luego no significa que todos los niveles de riesgo
sean aceptables. Como podra esperarse a esta altura de la discusin, lo que es
razonable est determinado por heurismos adicionales que controlan el tamao
del riesgo que el ingeniero est dispuesto a tomar.
Si el sistema que desea cambiar es complejo y poco entendido; si el cambio
deseado es el mejor disponible y si est limitado por la disponibilidad de
recursos, entonces usted est ante un problema de Ingeniera. Si usted logra el
cambio usando el Mtodo de Ingeniera, entonces usted es un ingeniero..
Basados en Koen (1985), queda claro que el mtodo de ingeniera y la profesin de
ingeniero, estarn limitados en su eficiencia y eficacia, si en un sitio privilegiado de su
maletn de heursticas, no tienen algunas que le permitan resolver y decidir en
ambientes de riesgo e incertidumbre, que constituyen su condicin natural de
operacin.
Cuando Koen se refiere a que no todos los niveles de riesgo son aceptables, est
sugiriendo que el ingeniero en su responsabilidad, deber cuantificar el riesgo para
decidir con base en un riesgo de tamao razonable.
Cul es la naturaleza de aquellas heursticas que le permiten al ingeniero cuantificar
el tamao del riesgo?
Cmo obtener una estimacin pesimista de la magnitud de un efecto de particular
importancia en un proyecto, que garantice al ingeniero que acta hacia el lado de la
seguridad en cuanto al riesgo, pero sin perder de vista la racionalidad econmica o
prctica?
La estadstica y el Mtodo de Ingeniera.
La respuesta a los anteriores interrogantes, la tiene la estadstica.
El ingeniero debe cuantificar el riesgo y las heursticas que le permitirn hacerlo, son
del resorte de la probabilidad y la estadstica.
En este camino, conocer los elementos bsicos de la teora de la probabilidad, de tal
manera que a partir de la estimacin de un evento simple, pueda obtener informacin
sobre el riesgo de ocurrencia de eventos compuestos y complejos, es una necesidad
para el ingeniero.
Si con un determinado sistema puedo resolver el problema con un riesgo r, cual ser el
riesgo si coloco n sistemas, en paralelo?.
En una situacin pobremente estudiada, cmo hacer predicciones del riesgo, usando
informacin incompleta?

26

Surge aqu la necesidad de conocer algunos modelos probabilsticos y su posible uso


para simplificar la realidad y obtener respuesta sobre el riesgo de ocurrencia de
eventos de inters.
Si la magnitud de un factor F, es un insumo clave para la solucin de un problema de
ingeniera, pero solo dispongo de algunos datos sobre F, Cmo puedo estimar la
magnitud de F, asumiendo un riesgo de equivocarme en la estimacin, definido a priori
por el ingeniero?.
En esta situacin la estadstica puede apoyar la formacin del ingeniero
proporcionndole las herramientas adecuadas para la construccin de heursticas, a
travs de la llamada estimacin de cantidades, por medio de intervalos de confianza.
Billy Koen (1985) en su intento por caracterizar el trabajo del ingeniero, expresa cmo
el ingeniero inicia su trabajo saliendo de un punto de partida que corresponde a una
situacin de incertidumbre o pobremente estudiada y que su punto de llegada es
incierto. En el camino, deber ir resolviendo las dificultades y obstculos y tomando
decisiones cuando existan varios caminos alternativos.
Cmo poder hacer comparaciones y tomar decisiones ante diversos cursos
alternativos de decisin, en un ambiente de incertidumbre?
En esta problemtica, la estadstica se constituye en una verdadera mina, de la cual el
ingeniero puede dotarse de las heursticas apropiadas para enfrentar con muy buenas
posibilidades de xito la situacin de comparar alternativas, con informacin parcial,
cuantificando el riesgo de tomar una mala decisin. Este yacimiento de heursticas, se
conoce en estadstica como Contraste de hiptesis. o Cmo decidir entre varios
posibles cursos de accin en ambiente de incertidumbre?
Koen plantea de manera muy pedaggica la diferencia entre los dominios de la ciencia
y de la ingeniera. Uno de los elementos conceptuales que marca esta diferencia, es la
restriccin en los recursos disponibles. A diferencia de la ciencia, en la ingeniera no se
hace referencia a la solucin, sino a una solucin.
En ingeniera una buena solucin no se pueda juzgar, sin el conocimiento de la
restriccin generada por la disponibilidad de recursos.
En ingeniera puede preferirse una solucin que no es la ptima absoluta, pero que se
aproxima bastante bien a los requerimientos, si esta es mucho ms rpida y/o barata
que la ptima.
Si tener la informacin completa, requiere de un periodo de tiempo exagerado o exige
una cantidad de recursos muy grande, el ingeniero deber disponer de heursticas que
le permita saber cul es el punto de compromiso entre cantidad de recursos a invertir
en obtener informacin y la magnitud del riesgo de equivocarse y sus consecuencias al
tomar decisiones con dicha cantidad limitada de informacin.
La estadstica ofrece un excelente men, para que el ingeniero disponga de heursticas
que le permitan cuantificar el monto de recursos que debe asignar a la inversin en
informacin y la manera de decidir con dicha informacin. Esta carta de navegacin, se
conoce en estadstica como estimacin del tamao de muestra y puede relacionar un
tamao de muestra a seleccionar con el riesgo de equivocarse al decidir con ella en
algn sentido.
27

Por otro lado ante la incertidumbre o el pobre conocimiento de la situacin, el ingeniero


debe disponer de heursticas que le permitan en algunas ocasiones hacer ensayos en
pequea escala, para predecir el comportamiento de un sistema, anticiparlo tomando
las medidas adecuadas, llenndose de argumentos para favorecer un curso
determinado de accin.
Cmo realizar estos ensayos? Cmo concluir con base en la informacin obtenida
en los ensayos, si se sabe que es informacin parcial, no reproducible en forma exacta
si se repitieran los ensayos?
En esta situacin, un excelente socavn, rico en las mejores fuentes para producir
heursticas, lo constituye el diseo estadstico de experimentos, el cual no solo plantea
muy buenas guas para la ejecucin de los ensayos, para garantizar la validez de las
conclusiones que se obtengan, sino que permite controlar el riesgo, definiendo a priori,
la magnitud de los riesgos que el ingeniero est dispuesto asumir, en el sentido de
tomar decisiones equivocadas. Adems incluye relaciones clave que conectan recursos
a invertir con calidad de las decisiones.
Ya se dijo que una condicin inherente al trabajo de un ingeniero, y que por tanto
caracteriza el Mtodo de Ingeniera, es restriccin en la disponibilidad de recursos.
Entre varias heursticas comparables en su eficiencia, el ingeniero podra escoger
aquella que exija menos insumos de informacin y en general que implique menos
recursos.
Proteger los recursos, es una de sus misiones permanentes. En este sentido poder
predecir el estado final resultante de un curso de accin tomando en consideracin
caractersticas de su punto de partida, le permitir disminuir los riesgos de invertir
recursos en rectificaciones por deficientes predicciones.
Por otro lado, pero en el mismo sentido, en situaciones problema donde se requiere el
conocimiento de magnitud de F, para tomar una decisin, pero en lugar de conocer F,
se conocen X, Y; Z; W, que son mucho ms baratas y prcticas de medir que la propia
F, surge la pregunta: Cules heursticas me permiten tomar decisiones equivalentes
con stas ltimas en lugar de F? Entre las caractersticas disponibles (X, Y, Z, W),
Cul es el subconjunto mnimo que se requiere y cul es la calidad de las decisin
que se tome con base en dicho subconjunto? Cmo predecir el valor F
correspondiente a un conjunto de valores especfico de las caractersticas (X, Y; Z; W)?
En esta problemtica, la estadstica vuelve a salir a la palestra, poniendo a disposicin
del ingeniero, los modelos para predecir la magnitud de una caracterstica mediante el
conocimiento de otras, a travs de los llamados modelos de regresin.
Si parte de las condiciones del punto de partida del ingeniero, es la disponibilidad de
informacin sobre un conjunto de caractersticas relacionadas con la situacin
problema, Cmo explorar esta informacin, para plantear a partir de ella, algunas
hiptesis que permitan orientar el prximo curso de accin?
En esta fase la estadstica entrega en las manos del ingeniero, algunas estrategias
para hacer tiles sus datos, dndoles sentido en el contexto de su problema a travs
del llamado Anlisis Exploratorio de Datos.

28

Cuando el comportamiento futuro de una caracterstica, es un parmetro de diseo


para un proyecto, se requiere disponer de Heursticas que permitan sacar provecho del
conocimiento sobre cmo se ha comportado dicha variable en el pasado, para hacer
pronsticos y estimar su fiabilidad. En este campo, la estadstica provee los elementos
necesarios a travs del llamado anlisis de series de tiempo y _pronsticos.
En campos especficos de la ingeniera, en los cuales una caracterstica inherente a la
calidad de un producto es el tiempo que trascurre hasta que el producto falla o la
duracin del tiempo entre fallas, se requiere conocer algunos parmetros que
garanticen a priori, la confiabilidad del producto o servicio o para la definicin de
polticas de mantenimiento de equipos, para la definicin de tiempo de garanta, es muy
conveniente disponer de heursticas para la prediccin de la fiabilidad, campo frtil de
la estadstica a travs de la teora de la fiabilidad.
Si se trata de controlar y mejorar la calidad de productos o procesos en ambientes de
incertidumbre y variabilidad, como es la situacin normal en la industria manufacturera,
las heursticas universalmente usadas corresponden al rea de mtodos estadsticos
para el control y mejora de la calidad.
Si se quiere abordar la calidad desde el propio diseo del producto, intentando conocer
la interaccin entre los parmetros de diseos del producto o de la operacin de un
proceso, con caractersticas de preferencias o del ambiente del usuario final, se
requiere usar la estadstica a travs de los llamados Mtodos estadsticos para el
diseo de productos robustos.
Citando una vez ms a Koen (1985), al empezar su captulo 1, dice:
El uso del Mtodo de ingeniera, en vez del uso de la razn, es la herencia de la
humanidad ms equitativamente distribuida. Por Mtodo de Ingeniera quiero
decir la estrategia para causar, con los recursos disponibles, el mejor cambio
posible en una situacin incierta o pobremente estudiada. Por Razn, quiero dar
a entender la habilidad para distinguir lo verdadero de lo falso.
Esta distincin, indica que la lgica formal, no ser el instrumento, que usar el
ingeniero para definir sus cursos de accin y para tomar sus decisiones sobre lo que
funciona o no funciona, pues como lo explica el propio Koen en su caracterizacin de
heurismos, no se garantiza que la aplicacin de un heurismo sea siempre vlida.
Adems varios heurismos que se encuentran en el maletn del ingeniero, pueden
conducir a resultados contradictorios.
En este estado de cosas Cmo decidir sobre la plausibilidad de una heurstica o de
alguna estrategia, en ambiente de incertidumbre, si no es la lgica formal la que nos
rige?
Esta situacin se identifica extraordinariamente con lo que se conoce como
Pensamiento Estadstico, pues este da pautas y guas para valorar un conjunto de
datos, con base en la naturaleza del proceso que los gener, sin comprometerse con la
validez categrica de los mismos. Es decir, que unos datos sern tan buenos como el
proceso que les dio origen.
Igualmente cuando se requiere comparar cursos de accin, la estadstica proporciona
unas guas, que de seguirse, hacen plausibles las conclusiones que se obtengan al

29

aplicar unos procedimientos consistentes con dichas guas, aunque no las garantiza al
cien por ciento.
El pensamiento estadstico, es una dimensin transversal a toda heurstica que intente
obtener informacin o tomar decisiones en ambientes de variabilidad e incertidumbre.
Para finalizar, podemos plantear la pregunta Cmo comparar la eficiencia de varias
heursticas en ambientes de incertidumbre o en situaciones pobremente estudiadas?
Una posible estrategia para lograr este propsito, puede darse con base en la
simulacin, la cual permite a costos relativamente bajos predecir el comportamiento de
una heurstica, en diferentes ambientes y condiciones de partida. Conociendo
comportamientos aproximados de las componentes de un sistema y de sus complejas
relaciones, puede hacerse uso de la herramienta que proporciona la simulacin para
obtener resultados empricos del comportamiento del sistema completo, pudindose
evaluar la sensibilidad o robustez a ciertas condiciones y ambientes.
La estadstica en el currculo de Ingeniera.
Hemos descubierto, con base en la ptica de Koen (1985) y su caracterizacin del
Mtodo de Ingeniera, algunas necesidades de conocimiento, relacionadas con
potencializar su capacidad de enfrentar la variabilidad y la incertidumbre, inherentes a
la esencia del trabajo de un ingeniero.
En este sentido y asociado a las diversas problemticas, en las que puede aparecer la
incertidumbre al aplicar el Mtodo de Ingeniera, surgieron los nombres de los temas
bsicos de la disciplina estadstica, que sera muy conveniente que un ingeniero
conociera y colocara en su maletn de heursticas.
Los contenidos.
1.

2.

3.

4.
5.

Resumiendo stas temticas son:


Criterios para juzgar la representatividad de una muestra y la validez de la
comparacin de alternativas. Validez externa y validez interna de un estudio.
(Pensamiento estadstico y criterios de validez.)
Cmo sacar jugo (informacin) a partir de un conjunto de datos. Cmo
generar hiptesis? Cmo comunicar los resultados de un diagnstico? (Anlisis
Exploratorio de datos).
Cmo determinar el riesgo de que ocurra un evento complejo, a partir del
conocimiento del riesgo de ocurrencia de eventos simples? (Fundamentos de la
teora de la probabilidad). Dado un conjunto de datos sobre la frecuencia de
ocurrencia de un fenmeno, Cmo ajustar un modelo probabilstico a esta
situacin, de tal manera que permita hacer pronsticos sobre su comportamiento
en otras condiciones?
Estimacin de cantidades, calculando el riesgo de equivocarse en la estimacin.
(intervalos de confianza.)
Cmo escoger un curso de accin, entre varias posibles opciones, en ambiente
de incertidumbre? (fundamento del contraste o prueba de hiptesis).

30

6. Cmo estimar el tamao de muestra para lograr una calidad definida a priori de
la estimacin?
7. Cmo obtener los datos y cmo analizarlos, cuando se desea comparar varias
alternativas de accin? cmo medir los riesgos de equivocarse en la decisin?
Cuntos experimentos realizar en cada tratamiento? (Diseo estadstico de
experimentos).
8. Cmo predecir la magnitud de una caracterstica, conociendo las magnitudes
de otras? (Modelos de Regresin).
9. El ABC de los procedimientos de simulacin.
10. Mtodos de muestreo.
11. Introduccin al anlisis de series de tiempo y pronsticos.
12. Introduccin a la teora de la fiabilidad.
13. Modelos probabilsticos para aplicaciones en ingeniera.
14. Reflexiones sobre estadstica, Ingeniera y Sociedad.

31

CONCLUSIONES

Este trabajo nos ayud a comprender la importancia de la estadstica a la hora


de la toma de decisiones.

Comprendimos que por medio de la estadstica aumentamos la eficiencia ya que


podemos llegar a predecir eventos.

En el rol de ingeniera abarca un sin nmero de aplicaciones las cuales nos


ayudan a desarrollar los procedimientos en la industria con mayor certeza.

32

Anda mungkin juga menyukai