Anda di halaman 1dari 16

MODULO I: HISTORIA, NOCION DE ESTADISTICA Y SU

UTILIZACION PARA LA INVESTIGACION

UN POCO DE HISTORIA
El uso de herramientas cuantitativas para el tratamiento de datos, tiene origen en pocas
remotas. Se tiene informacin de hace ms 3000 aos antes de Cristo, donde las antiguas civilizaciones,
como la Egipcia, aplicaron continuamente censos que ayudaban a la organizacin del estado y la
construccin de las pirmides.
El antiguo testamento nos sugiere que Moiss orden un Censo a la poblacin Israelita para
identificar los miembros de las familias. En la antigua Grecia y el Imperio Romano, era comn la
aplicacin de censos para la planificacin de impuestos y la prestacin del servicio militar.
La palabra estadstica deriva del latn moderno statisticum collegium (consejo de estado), del
latn antiguo status (posicin, forma de gobierno), de la palabra italiana moderna statista
(estadista, poltico) y del italiano antiguo stato (estado). En 1749, el alemn, Gottfried Achenwall
(1719-1792) usa el trmino Statistik en su libro titulado Staatswissenschaft der vornehmen
Europischen Reiche und Republiken, quien originalmente design la palabra estadstica para el anlisis
de los datos de un gobierno, definindola como la Ciencia del Estado. A Gottfried Achenwall se le
conoce como el Padre de la Estadstica.
La primera persona que introdujo el trmino estadstica en Inglaterra fue Sir John Sinclair
(1754-1835) con su trabajo Statistical Account of Scotland (1791-,1799) trabajo compilado en 21
volmenes. El autor explica en su libro, que la palabra estadstica la adopt gracias al estudio de
investigaciones realizadas en Alemania, como una palabra novedosa que llamara la atencin de los
ingleses; a diferencia, de que en Alemania la estadstica se usa como instrumento para medir la
fortaleza de un estado, mientras que Sinclair, la empleara como generadora de informacin interna
para encontrar falencias y proponer mejoras en el pas. A este trabajo le siguieron dos publicaciones: la
segunda edicin elaborada entre 1834 y 1845; la tercera edicin comienza despus de la segunda guerra
mundial comprendiendo los periodos entre 1951 y 1992.1
El registro de nacimientos y defunciones comenz en Inglaterra a principios del siglo XVI, y en
1662 apareci el primer estudio estadstico notable de poblacin, titulado Observations on the London
Bills of Mortality (Comentarios sobre las partidas de defuncin en Londres). Un estudio similar sobre la
tasa de mortalidad en la ciudad de Breslau, en Alemania, realizado en 1691, fue utilizado por el
astrnomo ingls Edmund Halley como base para la primera tabla de mortalidad

A comienzos del siglo XIX, la palabra estadstica adopta un significado ms generalizado hacia
la recoleccin y clasificacin de cualquier tipo de datos cuantitativos. William Playfair (1759-1823)
expone su idea de que los grficos permiten una comunicacin ms eficiente que las tablas de
frecuencia. Es considerado como el inventor de los grficos lineales, de barras y de sectores. Playfair
public el libro titulado The Commercial and Political Atlas (1786) el cual contiene 43 grficos de
series de tiempo y por primera vez, es usado un grfico de barras. En 1801 utiliza el primer grfico de
sectores en su obra Playfairs Statistical Breviary.
Tambin en este siglo, con la generalizacin del mtodo cientfico para estudiar todos los
fenmenos de las ciencias naturales y sociales, los investigadores aceptaron la necesidad de reducir la
informacin a valores numricos para evitar la ambigedad de las descripciones verbales.
Sir Francis Galton (1822-1911) cre el concepto estadstico de regresin y correlacin, y fue el
primero en aplicar mtodos estadsticos para estudiar las diferencias humanas basadas en el uso de
cuestionarios y entrevistas para recolectar los datos. Herman Hollerith (1860-1929) fue un estadstico
estadounidense quien desarrollo la primera mquina tabuladora basada en tarjetas perforadas y
mecanismos elctrico-mecnicos para el tratamiento rpido de millones de datos. Su mquina fue usada
en el censo de 1890 en estados unidos que redujo la tabulacin de los datos de 7 aos (censo de 1880) a
2.5 aos. En nuestros das, la estadstica se ha convertido en un mtodo efectivo para describir con
exactitud los valores de datos econmicos, polticos, sociales, psicolgicos, biolgicos y fsicos, y sirve
como herramienta para relacionar y analizar dichos datos. El trabajo del experto estadstico no
consiste ya slo en reunir y tabular los datos, sino sobre todo en el proceso de interpretacin de esa
informacin.
El desarrollo de la teora de la probabilidad ha aumentado el alcance de las aplicaciones de la
estadstica. Muchos conjuntos de datos se pueden aproximar, con gran exactitud, utilizando
determinadas distribuciones probabilsticas; los resultados de stas se pueden utilizar para analizar
datos estadsticos. La probabilidad es til para comprobar la fiabilidad de las inferencias estadsticas y
para predecir el tipo y la cantidad de datos necesarios en un determinado estudio estadstico.
DEFINICION DE ESTADISTICA
Como vimos en el apartado anterior, la estadstica a variado su significado a travs del tiempo,
pasando de ser una herramienta usada solo para la administracin de los gobiernos, a una ciencia con un
sin fin de aplicaciones en diferentes disciplinas
La estadstica admite varias definiciones entre las que podemos citar
"El estudio, recuento y comparacin de cifras para observar o analizar los procesos de
cualquier conjunto de hechos".
El estudio de los mtodos y procedimientos para recoger, clasificar, resumir y analizar
datos y para hacer inferencias cientficas partiendo de tales datos".
Una ciencia bsica cuyo objetivo principal es el procesamiento y anlisis de grandes
volmenes de datos, resumindolos en tablas, grficos e indicadores estadsticos, que
permiten la fcil compresin de las caractersticas concernientes al fenmeno
estudiado.
Un rea de la matemtica aplicada orientada a la recoleccin e interpretacin de datos
cuantitativos y al uso de la teora de la probabilidad para calcular los parmetros de una
poblacin.

UTILIDAD DE LA ESTADISTICA
Quiz uno se puede preguntar por que razn es importante la estadstica. Hay varios motivos por
los cuales se debe conocer y manejar la estadstica:
COMO HERRAMIENTA DE TRABAJO: La estadstica es de una utilidad inmediata y
practica.
Ayuda a que el trabajo diario y repetitivo se efecte con ms rapidez y eficacia.
Ayuda a los profesores en la determinacin de calificaciones y en la realizacin de test.
Ayuda a interpretar sus datos y observaciones.
En las ciencias del comportamiento, la estadstica se ha convertido en una parte
imprescindible del trabajo.
En todos estos campos, la eficacia y la facilidad de operacin exige un conocimiento de
los mtodos estadsticos bsicos
EN LA SOLUCION DE PROBLEMAS:
La investigacin se lleva a menudo segn una escala limitada, no para comprobar la
teora, sino para revisar alguna informacin vital para la solucin de un problema
practico. Es frecuente que surjan preguntas como estas.
Cules son los alumnos que ms rpido corren?
El mtodo de entrenamiento aplicado a este grupo, es mejor o peor que el que
emplee para con otro?
Existe alguna relacin entre las variables obtenidas con un grupo y otro?
Evidentemente, las respuestas se obtienen aplicando los mtodos estadsticos a los
datos observados
EN LA INVESTIGACION TEORICA:
Las ciencias del comportamiento han alcanzado, hoy en da un alto grado de elaboracin,
se han hecho ms cuantitativas. El desarrollo de teoras es til para organizar la
informacin disponible. Las teoras predicen lo que se espera observar en circunstancias
determinadas. Los medios con que se comprueban las teoras de las ciencias de la
educacin, psicologa, sociologa y economa son en gran parte estadsticos.
COMPRESION Y UTILIZACION DE LA INVESTIGACION:
Un profesional competente, adems de su especialidad, tiene que estar al corriente de
los avances tcnicos. Debe comprender los informes de la investigacin aplicada y
terica. En las ciencias del comportamiento, esto exige que conozca el significado de
ciertos trminos estadsticos, y cuando se puede emplear un mtodo particular.
Desgraciadamente, no toda investigacin es una buena investigacin y el peso de la
evaluacin cae, finalmente en el lector. Las estadsticas pueden ser mal empleadas o mal
interpretadas, pero para aquellos que la entiende, les dicen la verdad o no le dicen nada
SATISFACCION PERSONAL:
Muchos estudiantes creen o piensan que el hecho de recoger y analizar datos es tarea
poco grata. Pero con los datos obtenidos encontramos que solucionamos un problema o
nos dems cuenta que el mtodo aplicado al entrenamiento de un deportista fue
acertado; estaremos en presencia de un logro personal, con solo haber utilizado a la
estadstica como herramienta para obtener la informacin que queramos saber

CLASIFICACION DE LA ESTADISTICA
La estadstica se puede dividir en 2 categoras, la "estadstica inferencial o inductiva" y la
"estadstica descriptiva o deductiva"
Inferencial o inductiva tiene por objeto establecer previsiones o conclusiones sobre una
poblacin basndose en los resultados obtenidos de una muestra
Descriptiva o deductiva, tiene por objeto recoger, recopilar, y calcular de valores
estadsticos que representan al conjunto de datos. Pueden representarse dentro de su
organizacin en tablas y grficos. La estadstica descriptiva sirve como mtodo para
organizar datos y poner de manifiesto sus caractersticas esenciales con el propsito de
llegar a conclusiones.

DEFINICIONES DE TERMINOS ESTADISTICOS:


Poblacin: es el conjunto de elementos, individuos o entes, sujetos a estudio y de los cuales
se desea obtener un resultado.
Las personas o cosas que forman parte de la poblacin se denominan elementos. En sentido
estadstico un elemento puede ser algo con existencia real, como un automvil o una casa, o algo ms
abstracto como la temperatura, un voto, o un intervalo de tiempo. A su vez, cada elemento de la
poblacin tiene una serie de caractersticas que pueden ser objeto del estudio estadstico. As por
ejemplo si consideramos como elemento a una persona, podemos distinguir en ella los
siguientes caracteres: Sexo, Edad, Nivel de estudios, Profesin, Peso, Altura, Color de pelo, Etc.
A partir de este concepto, se desprende que de cada elemento de la poblacin podremos estudiar
uno o ms aspectos, cualidades o caracteres.
La poblacin puede ser segn su tamao de dos tipos:
Poblacin finita: Cuando el nmero de elementos que la forman es finito, por ejemplo el
nmero de alumnos de una escuela o la cantidad de jugadores de un club de bsquet de
distintas categoras.
Poblacin infinita: Cuando el nmero de elementos que la forman es infinito, o tan grande
que pudiesen considerarse infinitos... Como por ejemplo si se realizase un estudio sobre los
productos que hay en el mercado. Hay tantos y de tantas calidades que esta poblacin podra
considerarse infinita.
Ahora bien, normalmente en un estudio estadstico, no se puede trabajar con todos los elementos
de la poblacin sino que se realiza sobre un subconjunto de la misma. Este subconjunto se llama muestra
Muestra: Es un subconjunto de una poblacin. Una muestra es representativa cuando los
elementos son seleccionados de tal forma que pongan de manifiesto las caractersticas de
una poblacin. Su caracterstica ms importante es la representatividad. La seleccin de los
elementos que conforman una muestra pueden ser realizados de forma probabilstica o
aleatoria (al azar), o no

Las poblaciones son grupos definidos arbitrariamente y engloban a las muestras. Ejemplo:

Si se censan escuelas, cada escuela es un individuo y el conjunto de escuelas en la poblacin


Si se recopilan datos de cualquier test en una escuela, cada divisin o curso es un
instrumento y la escuela toda es la poblacin

Las muestras son partes de la poblacin. Una de las aplicaciones ms importantes de la


estadstica es hacer inferencia acerca de grupos muy grandes basndose en la informacin obtenida de
pequeos grupos. En otras palabras, se trata de conocer la poblacin a partir de los datos de una o ms
muestras.
Distinguimos dos tipos fundamentales de muestreo:
Muestreo probabilstico (aleatorio): En este tipo de muestreo, todos los individuos de la
poblacin pueden formar parte de la muestra, tienen probabilidad positiva de formar parte
de la muestra. Por lo tanto es el tipo de muestreo que deberemos utilizar en nuestras
investigaciones, por ser el riguroso y cientfico.
Muestreo no probabilstico (no aleatorio): En este tipo de muestreo, puede haber clara
influencia de la persona o personas que seleccionan la muestra o simplemente se realiza
atendiendo a razones de comodidad. Salvo en situaciones muy concretas en la que los errores
cometidos no son grandes, debido a la homogeneidad de la poblacin, en general no es un tipo
de muestreo riguroso y cientfico, dado que no todos los elementos de la poblacin pueden
formar parte de la muestra. Por ejemplo, si hacemos una encuesta telefnica por la maana,
las personas que no tienen telfono o que estn trabajando, no podrn formar parte de la
muestra.
Mtodos de muestreo probabilsticas
Los mtodos de muestreo probabilsticos son aquellos que se basan en el principio de
equiprobabilidad. Es decir, aquellos en los que todos los individuos tienen la misma probabilidad de ser
elegidos para formar parte de una muestra y, consiguientemente, todas las posibles muestras de
tamao n tienen la misma probabilidad de ser elegidas. Slo estos mtodos de muestreo
probabilsticos nos aseguran la representatividad de la muestra extrada y son, por tanto, los ms
recomendables. Dentro de los mtodos de muestreo probabilsticos encontramos los siguientes tipos:
Muestreo aleatorio simple: Todos los individuos tienen la misma probabilidad de ser
seleccionados. La seleccin de la muestra puede realizarse a travs de cualquier mecanismo
probabilstico en el que todos los elementos tengan las mismas opciones de salir. El
procedimiento empleado es el siguiente:
1. Se asigna un nmero a cada individuo de la poblacin
2. A travs de algn medio mecnico (bolitas dentro de una bolsa, tablas de nmeros
aleatorios, nmeros aleatorios generados con una calculadora o computadora, etc.) se
eligen tantos sujetos como sea necesario para completar el tamao de muestra
requerido.

Este procedimiento, atractivo por su simpleza, tiene poca o nula utilidad prctica cuando la
poblacin que estamos manejando es muy grande.

En este ejemplo se seleccionaron al azar 7 individuos de una poblacin de 20


Muestreo aleatorio sistemtico: Este procedimiento exige, como el anterior, numerar todos los
elementos de la poblacin, pero en lugar de extraer n nmeros aleatorios slo se extrae uno. Se
parte de ese nmero aleatorio i , que es un nmero elegido al azar, y los elementos que integran
la muestra son los que ocupan los lugares i ; ( i k ); ( i 2k ),( i 3k ) : i ( n 1) k . Es decir se

k en k , siendo k el resultado de dividir el tamao de la poblacin entre


N
el tamao de la muestra k
. El nmero i que empleamos como punto de partida ser un
n
60
nmero al azar entre 1 y k . N 60 n 15 k
4 i 2
15
toman los individuos de

El riesgo se este tipo de muestreo est en los casos en que se dan periodicidades en la poblacin
ya que al elegir a los miembros de la muestra con una periodicidad constante (k) podemos introducir una
homogeneidad que no se da en la poblacin. Imaginemos que estamos seleccionando una muestra sobre
listas de 10 individuos en los que los 5 primeros son varones y los 5 ltimos mujeres, si empleamos un
muestreo aleatorio sistemtico con k=10 siempre seleccionaramos o slo hombres o slo mujeres, no
podra haber una representacin de los dos sexos.

Ejemplo: Tenemos 60 alumnos y queremos tomar 15 de ellos en una muestra.


Aleatoriamente utilizamos el nmero
a 4 aleatoriamente.

60
4.
25

i 2 . Entonces comenzando del 2 alumno, vamos extrayendo de

Muestreo aleatorio estratificado: Trata de obviar las dificultades que presentan los
anteriores ya que simplifican los procesos y suelen reducir el error muestral para un tamao
dado de la muestra. Consiste en considerar categoras tpicas diferentes entre s (estratos)
que poseen gran homogeneidad respecto a alguna caracterstica (se puede estratificar, por
ejemplo, segn la profesin, el municipio de residencia, el sexo, el estado civil, etc.). Lo que se
pretende con este tipo de muestreo es asegurarse de que todos los estratos de inters
estarn representados adecuadamente en la muestra. Cada estrato funciona
independientemente, pudiendo aplicarse dentro de ellos el muestreo aleatorio simple o el
estratificado para elegir los elementos concretos que formarn parte de la muestra. En
ocasiones las dificultades que plantean son demasiado grandes, pues exige un conocimiento
detallado de la poblacin. (tamao geogrfico, sexos, edades,...). Se divide la poblacin en
clases o estratos y se escoge, al eatoriamente, un nmero de individuos de cad a
estr ato proporcional al nmero de compo nentes de cada estrato.
Ejemplo: En una escuela primaria hay 600 alumnos entre el segundo y tercer ciclo. Queremos
tomar una muestra de 20 alumnos. Sabemos que hay 200 alumnos en cuarto grado, 150 en quinto, 150
en sexto y 100 en sptimo. Procedemos entonces de esta manera

20
600
20
600
20
600
20
600

x1
x1
200
x
2 x2
150
x
3 x3
150
x
4 x4
100

20 * 200
6.6 7 alumnos de 4to grado
600
20 * 150

5 alumnos de 5to grado


600
20 * 150

5 alumnos de 6to grado


600
20 * 100

3.3 3 alumnos de 4to grado


600

Una vez que tengo la cantidad, puedo aplicar cualquiera de las dos tcnicas anteriormente
descriptas para seleccionar la cantidad de alumnos determinados
Es frecuente que cuando se realiza un estudio que interese estudiar una serie de subpoblaciones
(estratos) en la poblacin, siendo importante que en la muestra haya representacin de todos y cada
uno de los estratos considerados. El muestreo aleatorio simple no nos garantiza que tal cosa ocurra.
Para evitar esto, se saca una muestra de cada uno de los estratos.
Hay dos conceptos bsicos:
Estratificacin: El criterio a seguir en la formacin de los estratos ser formarlos de tal
manera que haya la mxima homogeneidad en relacin a la variable a estudio dentro de cada
estrato y la mxima heterogeneidad entre los estratos.
Afijacin: Reparto del tamao de la muestra en los diferentes estratos o subpoblaciones.
Existen varios criterios de afijacin entre las que se destaca:
Afijacin igual: Todos los estratos tienen el mismo nmero de elementos en la
muestra.
Afijacin proporcional: Cada estrato tiene un nmero de elementos en la muestra
proporcional a su tamao.

Afijacin ptima: Se tiene en cuenta la previsible dispersin de los resultados, de


modo que se considera la proporcin y la desviacin tpica. Tiene poca aplicacin ya que
no se suele conocer la desviacin.
Ejemplo: Supongamos que estamos interesados en estudiar el grado de aceptacin que la
implantacin de la reforma educativa ha tenido entre los padres de una determinada provincia. A tal
efecto seleccionamos una muestra de 600 sujetos. Conocemos por los datos del ministerio que de los
10000 nios escolarizados en las edades que nos interesan, 6000 acuden a colegios pblicos, 3000 a
colegios privados y 1000 a colegios privados de gestin pblica. Como estamos interesados que en
nuestra muestra estn representados todos los tipos de colegio, realizamos un muestreo estratificado
empleando como variable de estratificacin el tipo de escuela.
Si empleamos una afijacin simple elegiramos 200 nios de cada tipo de centro, pero esta bien
la proporcin? Estn todos los colegios representados de la misma manera?
En este caso parece ms razonable utilizar una afijacin proporcional pues hay bastante
diferencia en el tamao de los estratos. Por consiguiente, calculamos que proporcin supone cada uno de
los estratos respecto de la poblacin para poder reflejarlo en la muestra.

6000
3000
0.60 Colegios privados
0.30
10000
10000
1000
Colegios privados de gestin pblica
0.10
10000
Colegios pblicos:

Para conocer el tamao de cada estrato en la muestra no tenemos ms que multiplicar esa
proporcin por el tamao muestral.
Colegios pblicos: 0.60 * 600 360 padres
Colegios privados: 0.30 * 600 180 padres
Colegios privados de gestin pblica: 0.10 * 600 60 padres
Muestreo aleatorio por conglomerados: Los mtodos presentados hasta ahora estn pensados
para seleccionar directamente los elementos de la poblacin, es decir, que las unidades
mustrales son los elementos de la poblacin. En el muestreo por conglomerados la unidad
muestral es un grupo de elementos de la poblacin que forman una unidad, a la que llamamos
conglomerado. El muestreo por conglomerados consiste en seleccionar aleatoriamente un cierto
numero de conglomerados (el necesario para alcanzar el tamao muestral establecido) y en
investigar despus todos los elementos pertenecientes a los conglomerados elegidos.
Ejemplo: En una investigacin en la que se trata de conocer el grado de satisfaccin laboral de
los profesores de los institutos de formacin docente, necesitamos una muestra de 700 sujetos. Ante
la dificultad de acceder individualmente a estos sujetos se decide hacer una muestra por
conglomerados. Sabiendo que el nmero de profesores por instituto es aproximadamente de 35, los
pasos a seguir seran los siguientes:
1.
2.
3.

Recoger un listado de todos los institutos de formacin docente.


Asignar un nmero a cada uno de ellos.
Elegir por muestreo aleatorio simple o sistemtico los 20 institutos (700/35=20) que
nos proporcionarn los 700 profesores que necesitamos.

Aleatorio simple

TIPOS

CARACTERSTICAS
Se selecciona una muestra
de tamao n de una
poblacin de N unidades,
cada elemento tiene una
probabilidad de inclusin
igual y conocida de n/N.

VENTAJAS
Sencillo
y
de
fcil
comprensin.
Clculo rpido de medias y
varianzas.
Se basa en la teora
estadstica, y por tanto
existen
paquetes
Informticos
para
analizar los datos
Fcil de aplicar.
No siempre es necesario
tener un listado de toda
la poblacin.
Cuando la poblacin est
ordenada siguiendo una
tendencia
conocida,
asegura una cobertura de
unidades de todos los
tipos

INCONVENIENTES
Requiere que se posea de
antemano
un
listado
completo de toda la
poblacin.
Cuando se trabaja con
muestras pequeas es
posible
que
no
represente a la Poblacin
adecuadamente.
Si la constante de
muestreo est asociada
con el fenmeno de
inters, las estimaciones
obtenidas a partir de la
muestra
pueden
contener
sesgo
de
seleccin

Conglomerados

Estratificado

Sistemtico

Conseguir un listado de
los N elementos de la
poblacin
Determinar
tamao
muestral n.

Definir un intervalo k=
N/n.
Elegir
un
nmero
aleatorio, r, entre 1 y k
(r= arranque aleatorio).
Seleccionar los elementos
de la lista.
En
ciertas
ocasiones Tiende a asegurar que la Se ha de conocer la
resultar
conveniente
muestra
represente
distribucin
en
la
estratificar la muestra
adecuadamente
a
la
poblacin
de
las
segn ciertas variables de
poblacin en funcin de
variables utilizadas para
inters.
unas
variables
la estratificacin.
Por eso debemos conocer
seleccionadas.
la
composicin Se obtienen estimaciones
estratificada
de
la
ms precisa
poblacin
objetivo
a Su objetivo es conseguir
hacer un muestreo.
una muestra lo ms
Una vez calculado el
semejante posible a la
tamao
muestral
poblacin en lo que a las
apropiado,
este
se
variables estratificadotas
reparte
de
manera
se refiere.
proporcional entre los
distintos
estratos
definidos en la poblacin
usando una simple regla
de tres.
Se realizan varias fases Es muy eficiente cuando la El error estndar es
de muestreo sucesivas La
poblacin es muy grande y
mayor
que
en
el
necesidad de listados de
dispersa.
muestreo
aleatorio
las unidades de una etapa No es preciso tener un
simple o estratificado. El
se
limita
a
aquellas
listado
de
toda
la
clculo
del
error
unidades de muestreo
poblacin, slo de las
estndar es complejo
seleccionadas en la etapa
unidades primarias
de
anterior.
muestreo.
Comparacin entre distintos Tipos de Muestreo Probabilstica

OTRAS DEFINICIONES ESTADISTICAS


Tamao muestral: Es el nmero de elementos u observaciones que se recolecciona de la
muestra.
Dato: Cada uno de los individuos, cosas, entes abstractos que integran una poblacin o
universo determinado. Dicho de otra forma, cada valor observado de la variable.
Estadstico: Cualquier caracterstica medible calculada sobre una muestra o poblacin.
Variable: es cada una de las caractersticas o cualidades que poseen los individuos de
una pobl acin
Las variables se pueden dividir en variable cual itativa y variable cuantita tiva
La varia ble cualitativa es aquellas que no aparecen en forma numrica, sino como categoras o
atributos (sexo, profesin, color de ojos) Podemos distinguir dos tipos:
Variable cualitativa nominal: Solo permite la clasificacin, no se puede establecer
ningn tipo de orden. Ejemplos
Nacionalidad: Argentino, Uruguayo, Espaol
Sexo: Femenino, Masculino
Estadio Civil: C asado, Divorciado, Separ ado, Soltero
Variable cualitativa ordinal: Hay una clasificacin con cierto orden natural. Hay
diferencia de grado o nivel, presentan modalidades no numricas en la s que existen un
orden. Por ejemplo:
Puesto conseguido en una prueba: 1 2 3
Medalla obtenida. Oro, Plata, Bronce
La va riable cuantita tiva es la que se expresa mediante un nmero, por tanto se pueden
realizar operaciones aritmticas con ella. Podemos distinguir dos tipos:
Variable cuantitativa discreta: Es aquella que toma valor es aislado s, es decir
no admite valor es intermedios entre dos valores especficos. Ejemplos
El nmero de hermanos: 2, 1, 0, 1, 3
La cantidad de pelotas encestadas por partido en un torneo de bsquet: 30, 35,
38, 32
La cantidad de abdominales realizado durante un minuto, por un grupo de alumnos:
42, 43, 45, 51
Variable cuantitativa continua: Es aquella que puede tomar valores compr endido s
entre dos nmero s. Por ejemplo:
La estatura de los alumnos: 1.73, 1.82, 1.77, 1.69, 1.75. (En la prctica medimos la
altura con dos decimales, pero tambin se podra dar con tres decimales.
Los metros recorridos en 40 segundos por un grupo de atletas. 230, 245, 287,
241
Potencia de miembros inferiores expresados en KGM/SEG de un grupo de
jugadores de voleibol 46.3 48.2 52.9 55.1 58.4

QUE SE PUEDE HACER CON LA ESTADISTICA


Todos los docentes recogen a diario gran nmero de datos deferentes. Muchos de ellos
proceden de instrumentos de medicin validos. El conocimiento de la estadstica es imprescindible en la
interpretacin y anlisis de dichos datos. Qu se puede hacer con esos datos?
Se pueden calcular las medias aritmticas o promedios. La media proporciona una ubicacin
del comportamiento caracterstico del grupo
Se pueden calcular la dispersin de datos _(Desvos) en torno a un dato central
Se pueden preparar grficas, tablas o figuras para describir claramente la naturaleza del
grupo o de los grupos
Es posible determinar relacin de una variable con otra. Estos estadgrafos se llaman
coeficientes de correlacin y su utilidad es enorme. Por ejemplo para hallar las relaciones
entre los resultados de un test de velocidad y los tiempos empleados en una carrera de 100
metros.
A partir de las mediciones en una muestra de individuos, se pueden obtener deducciones
acerca de la poblacin de la que procede dicha muestra
Se puede determinar la fiabilidad de los instrumentos de medicin o la validez de las
mediciones.
Se pueden comparar los comportamientos o actuaciones de dos grupos. Supongamos que un
una escuela se esta ensayando un nuevo sistema de entrenamiento. Se eligen dos grupos; a
uno se le ensea durante un determinado tiempo con el sistema tradicional o utilizado
anteriormente y al otro con el nuevo. Se toman luego los resultados y se extraen
conclusiones, etc., etc.,
EL METODO ESTADISTICO
El proceso de aplicacin de la estadstica implica una serie de pasos
1. Seleccin y determinacin de la poblacin o muestra
Se debe adems seleccionar las caractersticas contenidas que se desean estudiar. En el
caso de que se desee tomar una muestra, es necesario determinar el tamao de la misma y
el tipo de muestreo a realizar (probabilstico o no probabilstico).
2.

Recuento, relevamiento y compilacin de datos


La etapa inicial consiste en la recoleccin de datos, generalmente muy numerosos, referidos
a la situacin que se investiga. Estos datos brindan informacin sobre las caractersticas de
los individuos pertenecientes a la poblacin objeto de estudio. La obtencin de los datos
puede ser realizada mediante la observacin directa de los elementos, la aplicacin de
encuestas y entrevistas, y la realizacin de experimentos.

3.

Tabulacion y agrupamiento de datos


Los datos recogidos son convenientemente ordenados, clasificados y tabulados; es decir
dispuestos en tablas que facilitan la lectura.

4.

Medicin de datos
En esta etapa comienza la elaboracin matemtica y medicin de los datos. El anlisis se
complementa con la obtencin de indicadores estadsticos como las medidas: de tendencia
central, dispersin, posicin y forma. Se observa que los datos tienden a centrarse en torno
a ciertos valores llamados parmetros o medida de posicin (Promedio, Mediana, Modo,
Etc.,)

5.

Elaboracin de grficos
A partir de la medicin de datos se establecen grficos al respecto que permiten una
interpretacin simple y rpida de los hechos y por otra parte pueden conducir a la eleccin
de los mtodos mas adecuados para el anlisis de datos.

6.

Inferencia estadstica. Prediccin


Despus de la medicin de datos la Teora de la Probabilidad acude en ayuda de la
Estadstica. Se deducen las llamadas leyes de inferencia que permiten predecir el
comportamiento futuro de la poblacin investigada

7. Elaboracin de conclusiones.
Se construye el informe final.

Desarrollo de los pasos


PASO 1 Seleccin y determinacin de la poblacin o muestra
Trataremos de definir los conceptos bsicos necesarios para calcular una
muestra
representativa sobre el total de una poblacin, considerando como tal al conjunto de individuos de los
que se quiere obtener una informacin. Por ejemplo, si deseamos conocer la opinin general de un total
de alumnos, podramos preguntarles a todos y sacar la media aritmtica u otros parmetros, pero para
aquellos casos en los que este nmero de alumnos es muy elevado, la estadstica nos permite tomar slo
una muestra de forma aleatoria. De este modo, preguntando nicamente a los alumnos resultantes de la
muestra, los porcentajes medios que obtendremos de sus respuestas sern los mismos que si
preguntsemos al total de la poblacin. El error que se comete debido al hecho de que se obtienen
conclusiones del total de una poblacin a partir del anlisis de slo una parte de ella, se denomina error
de muestreo.
Obtener una muestra adecuada significa lograr una versin simplificada de la poblacin,
reproduzca de algn modo sus rasgos bsicos.

que

Clculo del tamao muestral.


Cada estudio tiene un tamao muestral idneo, que permite comprobar lo que se pretende con la
seguridad y precisin fijadas por el investigador. Esta seguridad y precisin dependern del rango de
posibles respuestas (necesitaremos una muestra ms pequea si las opciones son si o no, que si por el
contrario la opcin es elegir entre 1 y 10). As mismo, tambin influir si el estudio se realiza sobre una
poblacin finita o infinita. Las formulas son las siguientes

Poblacin Finita

Z 2* N * p* q
e 2 * N 1 Z 2 * p * q

Poblacin infinita

Z 2* p* q
e2

A continuacin se explica cada uno de los parmetros indicados en la formula

n Tamao de la muestra
N Tamao de la poblacin si se conoce (Poblacin finita)
Z Valor correspondiente a la distribucin de Gauss. Para el 95% de confianza, Z=1.96, para el
99% de confianza 2.57. (Estos valores provienen de las tablas de la distribucin normal Z)Se explicara
luego cuando se desarrolle curvaturas y desvo estndar)
p Probabilidad de xito o proporcin esperada. Esta idea se puede obtener revisando la
literatura, por estudio pilotos previos. Asumamos que puede ser prxima al 5%. En caso de no tener
dicha informacin utilizaremos el valor p = 0.5 (50%).
q Probabilidad de fracaso 1 p

e Precisin (error mximo admisible en trminos de proporcin)


Ejemplo 1: A cuntos estudiantes tendramos que censar para conocer la preferencia de una
ropa deportiva de mercado, si se conoce que el nmero de estudiantes que pueden estar interesados en
usar esa ropa es de 1.500?
Proporcin esperada = asumamos que puede ser prxima al 5%; si no tuviese ninguna idea de dicha
proporcin utilizaramos el valor p = 0.5 (50%) que maximiza el tamao muestral.

N 1500 Z 1.96 p 0.05 . q 1 0.05 0.95 e 3% 0.03

1.962 * 1500 * 0.05* 0.95


0.032 * 1500 1 1.962 * 0.05 * 0.95

178.71 179

Se requerira encuestar a no menos de 179 estudiantes para poder tener una seguridad del 95%
Ejemplo 2 Cmo hubiera cambiando el ejemplo anterior, si se desconoce la proporcin esperada?
Si se desconoce la proporcin esperada, se tendra que utilizar el criterio conservador (p = q =
0.5), lo cual maximiza el tamao de muestra de la siguiente manera:

1.962 * 1500 * 0.5 * 0.5


0.032 * 1500 1 1.96 2 * 0.5 * 0.5

623.7 624

Se requerira encuestar a no menos de 624 estudiantes


Ejemplo 3 A cuntos estudiantes tendramos que censar para conocer la preferencia de una ropa
deportiva de mercado, si se desconoce la poblacin total y no tenemos idea de la proporcin esperada?

Z 1.96 p 0.5 . q 1 0.5 0.5 e 3% 0.03


n

1.96 2 * 0.5 * 0.5


0.032

1067

COMO TRABAJAR CON DATOS ORDENADOS Y AGRUPADOS


En la estadstica se utilizan varias medidas que van dando el comportamiento del grupo. Cuando
uno procesa los datos puede ser que trabaje con estos ORDENADOS o bien se los AGRUPA. Esto
depende de la cantidad de datos que manejemos. Un consejo es de trabajar con datos agrupados a
partir de una cantidad considerable de datos (por ejemplo ms de cincuenta datos), ya que facilita el
procesamiento de los mismos.
Las Tablas con datos ordenados se caracterizan por manejar un conjunto pequeo de posibles
resultados de una variable dentro de la muestra o poblacin. Por lo general, su uso tiende al manejo de
datos cualitativos o variables cuantitativas discretas.
Ejemplo: Tabla de datos ordenados
Determinamos un test de lanzamiento al aro de bsquet frente a este y sobre el borde de la
lnea de triple y anotamos la cantidad de encestadas sobre diez lanzamiento posibles. Luego
establecemos una escala conceptual sobre la siguiente cantidad de emboques. 0-1-2 MALO.
3-4 REGULAR, 5-6 BUENO, 7-8 MUY BUENO y 9-10 EXCELENTE: Los resultados de 10
jugadores fueron los siguientes
Jugador
A
B
C
D
E
F
G
H
I
J
k
L

Aciertos
7
6
8
6
10
4
6
6
1
7
8
5

Clasificacin
Bueno
Bueno
Muy bueno
Bueno
Excelente
Regular
Bueno
Bueno
Malo
Muy bueno
Muy bueno
Regular

En presencia de estos puntajes, confeccionamos una nueva tabla


Clasificacin
Malo
Regular
Bueno
Muy bueno
Excelente

Frecuencia
1
2
5
3
1

Como podemos observar, el numero de resultados que puede alcanzar la variable Clasificacin son
pocos (solo cinco posibilidades), por lo cual identificaremos la tabla de frecuencia resultante como una
tabla de datos ordenados
La estadstica considera otros tipos de frecuencias auxiliares
La forma ms simple de agrupar datos consiste en indicar el nmero de veces que figura cada
valor de la variable estudiada. Ese numero de veces que la variable toma un determinado valor se llama
frecuencia.

Cmo construir una tabla de frecuencias?


El nmero de intervalos, k, a utilizar no est determinado de forma fija y por tanto tomaremos
un k que nos permita trabajar cmodamente y ver bien la estructura de los datos; Como referencia
nosotros tomaremos una de los siguientes valores aproximados:

Donde n es la cantidad de datos que tengo registrados


Por ejemplo si el nmero de observaciones que tenemos es
las observaciones
razonable

, un buen criterio es agrupar

intervalos. Sin embargo si tenemos


elegir

, ser ms
intervalos,

que
1. Determinamos el Rango, que es igual a

R dato max dato min

2. Determinamos la amplitud de intervalo (limites entre el menor valor y mayor valor que va a
tener cada intervalo)

R
k

3. Con estos datos construimos la tabla correspondiente


Ejemplo: Tenemos 46 (cuarenta y seis) datos correspondiente a una prueba de salto en largo
317 324 329 331 337 338 340
352 352 354 354 355 358 359
366 367 368 368 371 373 375
406

344 344 345 345 347 350 351 352


360 360 361 361 361 361 365 365
379 380 382 382 387 391 394 398

Como n no es muy grande elegimos

, tomamos 7 intervalos

R 406 317 89
89
i
12, 71 13 Se recomienda que la amplitud sea impar.
7
Una vez calculado los valores procedemos a confeccionar la tabla
X
317- 329
330-342
343-355
356-368
369-381
382-394
395-407

f
3
4
13
14
5
5
2

fa
3
7
20
34
39
44
46

PM
323
336
349
362
375
388
403

Si sumamos sucesivamente cada frecuencia nos encontramos con la frecuencia acumulada, cuyo
numero final nos da como resultado la totalidad de alumnos que participaron de la muestra al que
llamaremos con la letra n . El agrupamiento de datos se hace a travs de intervalos de clase o
simplemente intervalos