CONCEPTO
La estadstica es comnmente considerada como una coleccin de hechos
numricos expresados en trminos de una relacin sumisa, y que han sido
recopilado a partir de otros datos numricos.
Kendall y Buckland (citados por Gini V. Glas / Julian C. Stanley, 1980) definen la
estadstica como un valor resumido, calculado, como base en una muestra de
observaciones que generalmente, aunque no por necesidad, se considera como
una estimacin de parmetro de determinada poblacin; es decir, una funcin de
valores de muestra.
"La estadstica es una tcnica especial apta para el estudio cuantitativo de los
fenmenos de masa o colectivo, cuya mediacin requiere una masa de
observaciones de otros fenmenos ms simples llamados individuales o
particulares". (Gini, 1953.
Murria R. Spiegel, (1991) dice: "La estadstica estudia los mtodos cientficos para
recoger, organizar, resumir y analizar datos, as como para sacar conclusiones
vlidas y tomar decisiones razonables basadas en tal anlisis.
"La estadstica es la ciencia que trata de la recoleccin, clasificacin y
presentacin de los hechos sujetos a una apreciacin numrica como base a la
explicacin, descripcin y comparacin de los fenmenos". (Yale y Kendal, 1954).
Cualquiera sea el punto de vista, lo fundamental es la importancia cientfica que
tiene la estadstica, debido al gran campo de aplicacin que posee.
LA ESTADSTICA EN LA HISTORIA
La palabra "estadstica" procede del latn statisticum collegium ("consejo de
Estado") y de su derivado italiano statista ("hombre de Estado" o "poltico"). El
trmino alemn Statistik, que fue primeramente introducido por Gottfried Achenwall
(1749), designaba originalmente el anlisis de datos del Estado, es decir, "la
ciencia del Estado" (tambin llamada "aritmtica poltica" de su traduccin directa
del ingls). No fue hasta el siglo XIX cuando el trmino estadstica adquiri el
significado de recolectar y clasificar datos. Este concepto fue introducido por el
ingls John Sinclair.
En su origen, por tanto, la estadstica estuvo asociada a datos, a ser utilizados por
el gobierno y cuerpos administrativos (a menudo centralizados). La coleccin de
datos acerca de estados y localidades contina ampliamente a travs de los
servicios de estadstica nacionales e internacionales. En particular, los censos
suministran informacin regular acerca de la poblacin.
Desde los comienzos de la civilizacin han existido formas sencillas de estadstica,
pues ya se utilizaban representaciones grficas y otros smbolos en pieles, rocas,
palos de madera y paredes de cuevas para contar el nmero de personas,
animales o ciertas cosas. Hacia el ao 3000 a. C. los babilnicos usaban ya
pequeas tablillas de arcilla para recopilar datos en tablas sobre la produccin
agrcola y de los gneros vendidos o cambiados mediante trueque. Los egipcios
analizaban los datos de la poblacin y la renta del pas mucho antes de construir
las pirmides en el siglo XI a. C. Los libros bblicos de Nmeros y Crnicas
"La estadstica es una tcnica especial apta para el estudio cuantitativo de los
fenmenos de masa o colectivo, cuya mediacin requiere una masa de
observaciones de otros fenmenos ms simples llamados individuales o
particulares".
Murria R. Spiegel, (1991) dice: "La estadstica estudia los mtodos cientficos para
recoger, organizar, resumir y analizar datos, as como para sacar conclusiones
vlidas y tomar decisiones razonables basadas en tal anlisis.
"La estadstica es la ciencia que trata de la recoleccin, clasificacin y
presentacin de los hechos sujetos a una apreciacin numrica como base a la
explicacin, descripcin y comparacin de los fenmenos". (Yale y Kendal, 1954).
Cualquiera sea el punto de vista, lo fundamental es la importancia cientfica que
tiene la estadstica, debido al gran campo de aplicacin que posee. La
investigacin en Psicologa, Sociologa y Educacin, al igual que ocurre en otras
ciencias, en buena medida se basa en el manejo de recursos estadsticos como
elementos indispensables para llegar a conclusiones aceptables por el resto de la
comunidad cientfica. Dada la peculiaridad de su objeto de estudio, inabordable en
la mayora de los casos si no es a travs de perspectivas complejas de relacin
entre variables, la atencin de los investigadores en las ciencias humanas y
sociales se concentra cada vez ms en la llamada Estadstica Multivariante. Los
diseos complejos de investigacin y anlisis, las aportaciones ms recientes de
la informtica para la aplicacin de tcnicas avanzadas de manipulacin de datos
y la discusin de estos aspectos desde perspectivas tericas y aplicadas,
preocupan y concentran a multitud de profesionales cuyo quehacer cotidiano es el
estudio de cmo se investiga, haciendo de ello su especialidad. Paralelamente,
otras especialidades dentro de estas ciencias utilizan el conocimiento ya
elaborado y retransmitido, preocupadas ms por los resultados y posibilidades que
por las condiciones de aplicacin y el fundamentos de uso, de tal forma que se ha
propiciado la utilizacin de las tcnicas estadsticas, sin considerar la adecuacin
de stas a las condiciones en las que se aplican.
A su vez, las ciencias sociales se han visto apabulladas en los ltimos aos por
avances vertiginosos en informtica y aplicaciones estadsticas (Manheim, 1982;
Rossi y otros, 1983), y muy especialmente en la psicologa (Judd y otros, 1995), lo
que favorece una absorcin de poca calidad por parte de los especialistas en
reas no metodolgicas. Por otro lado, la adopcin de procedimientos informticos
para realizar tareas metodolgicas no parece ser una solucin inmediata,
considerando la ansiedad que generan los ordenadores, fenmeno muy
generalizado (Faria y Arce, 1993).
La fusin de esta creciente complicacin de las herramientas de anlisis, junto con
la discrepancia entre los objetivos de formacin y la necesidad de uso de los
recursos estadsticos, consigue finalmente que el especialista en reas aplicadas
tienda a descuidar aspectos muy bsicos, previos a la aplicacin de estos
recursos estadsticos complejos. Por otro lado, en muchas ocasiones, la aplicacin
de herramientas estadsticas se deja arrastrar por hiptesis de comodidad, en el
sentido de aplicarse para permitir la ejecucin de una prueba o el ajuste de un
modelo, no porque son las estrategias ms adecuadas, sino porque son las ms
cmodas
Estadstica en Investigacin
Estadstica en Derecho
Estadstica en Restauracin de Obras
Estadstica en Literatura
Estadstica en Astronoma
Estadstica en la Antropologa (Antropometra)
Estadstica en Historia
Estadstica Militar
Geoestadstica
Bioestadstica
Estadsticas de Negocios
Estadstica Computacional
Estadstica en las Ciencias de la Salud
Investigacin de Operaciones
Estadsticas de Consultora
Estadstica de la educacin, la enseanza, y la formacin
Estadstica en la comercializacin o mercadotecnia
Cienciometra
Estadstica del Medio Ambiente
Estadstica en Epidemiologa
Minera de datos (aplica estadstica y reconocimiento de patrones para el
conocimiento de datos)
Estadstica econmica (Econometra)
Estadstica en Ingeniera
Geografa y Sistemas de informacin geogrfica, ms especficamente en
Anlisis espacial
Demografa
Estadstica en psicologa (Psicometra)
Calidad y productividad
Estadsticas sociales (para todas las ciencias sociales)
Cultura estadstica
Encuestas por Muestreo
Anlisis de procesos y quimiometra (para anlisis de datos en qumica
analtica e ingeniera qumica)
Estadsticas Deportivas
Divisin de la estadstica
La Estadstica para su mejor estudio se ha dividido en dos grandes ramas: la
Estadstica Descriptiva y la Inferencial.
En primer lugar la tabla estar formada por estas dos columnas, pero ms tarde
iremos aadiendo ms segn los clculos que necesitemos. Sin hacer muchos
clculos, podemos ir completando la tabla con las frecuencias, que definimos a
continuacin:
Frecuencia absoluta. Es el nmero de veces que aparece cualquier valor de la
variable. Se representa por fi. En algunos libros de texto nos la encontraremos
representada por ni.
Frecuencia absoluta acumulada. Es la suma de la frecuencia absoluta de un
valor de la variable con todos los anteriores. Se representa por Fi.
Frecuencia relativa. Es el cociente entre la frecuencia absoluta y el nmero de
datos (N). Se representa por hi. Al multiplicarla por 100 obtenemos el porcentaje
de individuos que presentan esta caracterstica.
Frecuencia relativa acumulada. Es la suma de la frecuencia relativa de un valor
de la variable con todos los anteriores. Tambin se puede definir como el cociente
entre la frecuencia absoluta acumulada y el nmero total de datos. Se representa
por Hi.
Vamos a realizar tres estudios estadsticos entre nuestros alumnos y alumnas,
cada uno de ellos correspondiente a un tipo de variable estadstica: lugar de
residencia, nmero de hermanos y estatura. Preguntamos uno a uno sobre estas
caractersticas y obtenemos:
Lugar de residencia: Pozo Alcn, P.A., P.A., P.A., P.A., P.A., P.A., P.A., P.A.,
Fontanar, Campo Cebas.
Nmero de hermanos: 2, 3, 2, 3, 3, 3, 3, 4, 2, 2, 2.
Estatura: 1.59, 1.75, 1.71, 1.85, 1.64, 1.62, 1.66, 1.60, 1.63, 1.76, 1.66.
En las siguientes escenas puedes construir la tabla de frecuencias para variables
discretas y continuas.
Como puedes observar no se han tenido en cuenta las variables cualitativas. Esto
se debe a que al no trabajar con nmeros no se pueden hacer operaciones.
nicamente tendra sentido en la tabla construir las columnas de frecuencias
absolutas y relativas, pero no las acumuladas. En el siguiente apartado de grficos
estadsticos tambin se podran representar, pero para los apartados de clculo de
parmetros no podremos trabajar con ellas. si tienes inters en alguna
representacin, sustituye los valores la variable por los nmeros que quieras y
represntalas o construye la tabla.
ESTADSTICA DESCRIPTIVA
La estadstica formula reglas y procedimientos para la presentacin de una masa
de datos en una forma mas til y significativa. Establece normas para la
representacin grafica de los datos. Tambin son una base importante para el
anlisis en casi todas las disciplinas acadmicas. "La estadstica descriptiva es la
organizacin y resumen de datos"
VARIABLES CONTINUAS Y DISCONTINUAS
Llamada tambin variable cuantitativa, es aquella variable numrica que en un
intervalo cualquiera de dominio puede asumir una cantidad infinita no numerable
de valores distintos. Variable que no tiene un nmero fijo de valores. Por ejemplo,
la variable "ingresos", en $.
Si el nmero de datos es grande la variable es continua, los datos se agrupan en
intervalos o clases.
Todas las clases deben tener la misma amplitud.
Son aquellas en las que la variable puede tomar cualquier valor, como el peso, la
talla, la humedad, etc.
Toda variable que puede tomar cualquier valor entre unos lmites dados.
Las Variables Discontinuas son aquellas en las que la variable representa
valores bien determinados, entre los cuales no cabe ningn valor, como son el
nmero de hijos por familia, la compra anual de libros por estudiante, etc.
Variable continua: cuando los valores numricos que forman la variable en un
intervalo cualquiera son infinitos. Por ejemplo, se necesita contratar a una persona
para laborar como guardin, un requisito es estatura mnima de 1.65 m. y una
estatura mxima de 1.70 m.. El intervalo entre 165 y 170 cm. hay una infinidad de
valores, ya que podemos obtener estaturas de 165.001, 165.01, 165.02, 165.03.
Variable discontinua o discreta: es la variable cuyos valores numricos se
pueden contar o son finitos en un intervalo cualquiera Por ejemplo, El nmero de
hijos que puede tener una pareja, puede ser 1 , 2, 3; pero no 2 hijos y medio (2.5)
HISTOGRAMAS Y POLGONOS DE FRECUENCIA
En estadstica, un histograma es una representacin grfica de una variable en
forma de barras, donde la superficie de cada barra es proporcional a la frecuencia
de los valores representados. En el eje vertical se representan las frecuencias, y
en el eje horizontal los valores de las variables, normalmente sealando las
marcas de clase, es decir, la mitad del intervalo en el que estn agrupados los
datos.
Se utiliza cuando se estudia una variable continua, como franjas de edades o
altura de la muestra, y, por comodidad, sus valores se agrupan en clases, es decir,
valores continuos. En los casos en los que los datos son cualitativos (nonumricos), como sexto grado de acuerdo o nivel de estudios, es preferible un
diagrama de sectores.
Los histogramas son ms frecuentes en ciencias sociales, humanas y econmicas
que en ciencias naturales y exactas. Y permite la comparacin de los resultados
de un proceso.
TIPOS DE HISTOGRAMA:
DIAGRAMAS DE BARRAS SIMPLES
Representa la frecuencia simple (absoluta o relativa) mediante la altura de la barra
la cual es proporcional a la frecuencia simple de la categora que re presenta.
DIAGRAMAS DE BARRAS COMPUESTA
Se usa para representar la informacin de una tabla de doble entrada o sea a
partir de dos variables, las cuales se representan as; la altura de la barra
representa la frecuencia simple de las modalidades o categoras de la variable y
esta altura es proporcional a la frecuencia simple de cada modalidad.
DIAGRAMAS DE BARRAS AGRUPADAS
Se usa para representar la informacin de una tabla de doble entrada o sea a
partir de dos variables, el cual es representado mediante un conjunto de barras
como se clasifican respecto a las diferentes modalidades.
POLGONO DE FRECUENCIAS
Es un grfico de lneas que se usa para presentar las frecuencias absolutas de los
valores de una distribucin en el cual la altura del punto asociado a un valor de las
variables es proporcional a la frecuencia de dicho valor.
OJIVA PORCENTUAL
Es un grfico acumulativos, el cual es muy til cuando se quiere representar el
rango porcentual de cada valor en una distribucin de frecuencias.
En los graficos las barras se encuentran juntas y en la tabla los nmeros poseen
en el primer miembro un corchete y en el segundo un parentesis
por ejemplo: (10-20]
PROBABILIDAD
La probabilidad mide la frecuencia con la que se obtiene un resultado (o conjunto
de resultados) al llevar a cabo un experimento aleatorio, del que se conocen todos
los resultados posibles, bajo condiciones suficientemente estables. La teora de la
probabilidad se usa extensamente en reas como la estadstica, la matemtica, la
ciencia y la filosofa para sacar conclusiones sobre la probabilidad de sucesos
potenciales y la mecnica subyacente de sistemas complejos.
Probabilidad de un suceso es el nmero al que tiende la frecuencia relativa
asociada al suceso a medida que el nmero de veces que se realiza el
experimento crece
Autor:
Alfredo Enrique Gil Rondon