POBLACIN Y MUESTRA.
Marco de referencia de un estudio estadstico:
1. Definir la unidad de observacin (elemento sobre el que vamos a registrar los datos).
Las unidades de observacin pueden tener existencia natural, como una persona o una
cosa elementos tangibles -, o pueden estar definidas artificialmente, como las distintas
reas de una empresa.
ORDENAMIENTO DE DATOS.
Los datos son colecciones de cualquier cantidad de observaciones relacionadas. Una coleccin
de datos se conoce como conjunto de datos, y una sola observacin es un punto de dato.
Para que los datos sean tiles, necesitamos organizar nuestras observaciones, de modo que
podamos distinguir patrones y llegar a conclusiones lgicas.
Recoleccin de datos:
Los especialistas en estadstica seleccionan sus observaciones de manera que todos los
grupos relevantes estn representados en los datos.
Los datos pueden provenir de observaciones reales o de registros que se mantienen para otros
propsitos.
Los datos pueden ayudar a los responsables de tomar decisiones a hacer suposiciones bien
pensadas acerca de las causas y, por tanto, de los efectos probables de ciertas caractersticas
en situaciones dadas. Tambin el conocimiento de tendencias adquirido de la experiencia
previa puede permitir estar al tanto de posibles resultados y actuar en consecuencia.
Cuando los datos son ordenados de manera compacta y til, los responsables de tomar
decisiones pueden obtener informacin confiable sobre el ambiente y usarla para tomar
decisiones inteligentes. Los administradores deben tener mucho cuidado y asegurar que los
datos utilizados estn basados en suposiciones e interpretaciones correctas. Para ello, se
utilizan las pruebas para datos:
1. De dnde vienen los datos? La fuente es parcial? Es posible que haya un inters
en proporcionar datos que conduzcan a una cierta conclusin ms que a otras?
2. Los datos comprueban o contradicen otras evidencias que se poseen?
3. Hace falta alguna evidencia cuya ausencia podra ocasionar que se llegue a una
conclusin diferente?
4. Cuntas observaciones se tienen? Representan a todos los grupos que se desea
estudiar?
5. La conclusin es lgica? Se ha llegado a conclusiones que nuestros datos no
confirman?
Vale la pena usar los datos o debemos esperar y recabar ms informacin antes de actuar?
Diferencia entre muestras y poblaciones:
Muestra y poblacin son trminos relativos. Una poblacin es un todo y una muestra es una
fraccin o segmento de ese todo.
Estudiaremos muestras con el fin de ser capaces de describir poblaciones.
El estudio de muestras es ms sencillo que el estudio de la poblacin completa, cuesta menos
y lleva menos tiempo. Adems, se ha probado que el examen de una poblacin entera todava
permite la aceptacin de elementos defectuosos, por tanto, en algunos casos, el muestreo
puede elevar el nivel de calidad.
Una poblacin es un conjunto de todos los elementos que estamos estudiando, acerca de los
cuales intentamos sacar conclusiones. Debemos definir dicha poblacin de modo que quede
claro cundo un cierto elemento pertenece o no a la poblacin.
Una muestra es una coleccin de algunos elementos de la poblacin, pero no de todos.
Cualquier grupo que cumple con los requisitos de la poblacin, puede constituir una muestra,
siempre y cuando el grupo sea una fraccin de la poblacin completa.
Una muestra representativa contiene las caractersticas relevantes de la poblacin en las
mismas proporciones en que estn incluidas en tal poblacin.
Bsqueda de un patrn significativo en los datos:
Existen muchas formas de organizar los datos. Podemos slo colectarlos y mantenerlos en
orden; o si las observaciones estn hechas con nmeros, entonces podemos hacer una lista de
los puntos de dato de menor a mayor segn su valor numrico. Pero si los datos son
trabajadores especializados o los distintos tipos de automviles que ensamblan todos los
fabricantes, debemos organizarlos de manera distinta. Necesitaremos presentar los puntos de
dato en orden alfabtico o mediante algn principio de organizacin. Una forma comn de
organizar los datos consiste en dividirlos en categoras o clases parecidas y luego contar el
nmero de observaciones que quedan dentro de cada categora. Este mtodo produce una
distribucin de frecuencias.
El objetivo de organizar los datos es permitirnos ver rpidamente algunas de las caractersticas
de los datos que hemos recogido: el alcance (los valores mayor y menor), patrones evidentes,
alrededor de qu valores tienden a agruparse los datos, qu valores aparecen con mayor
frecuencia, etc.
RECOMENDACIONES:
Al plantear un estudio estadstico, definir claramente la poblacin objeto de anlisis.
Si se trabaja con muestras, definir las condiciones que deben reunir antes de extraerlas.
Especificar qu se va a medir, las unidades a usar y la forma de registro.
Datos sin procesar:
La informacin obtenida, antes de ser organizada y analizada, se conoce como datos sin
procesar puesto que an no han sido tratados mediante ningn mtodo estadstico.
La cantidad de datos ms grande y los detalles ms minuciosos pueden no contener la
informacin ms til para la toma de decisiones administrativa. Una parte importante de la
planeacin de sistemas de informacin administrativa consiste en resumir y presentar los datos
de modo que se pueda obtener la informacin crtica de manera rpida y sencilla.
Ordenamiento de datos utilizando su arreglo y distribucin de frecuencias:
La ordenacin de datos es una de las formas ms sencillas de presentarlos, los forma en orden
ascendente o descendente.
Ventajas:
1.
2.
3.
4.
En ocasiones, un ordenamiento de datos no resulta til. Debido a que da una lista de todos los
valores, es una forma incmoda de mostrar grandes cantidades de datos.
La distribucin de frecuencias.
Una forma en que podemos comprimir los datos es la tabla de frecuencias o distribucin de
frecuencias. Las distribuciones de frecuencias sacrifican algunos detalles, pero ofrecen nuevas
perspectivas sobre los patrones de datos.
Una distribucin de frecuencias es una tabla en la que los datos se organizan en clases, es
decir, en grupos de valores que describen una caractersticas de los datos.
Una distribucin de frecuencias muestra el nmero de observaciones del conjunto de datos que
caen en cada una de las clases.
Caractersticas de las distribuciones de frecuencias relativas.
Tambin podemos expresar la frecuencia de cada valor como una fraccin o un porcentaje del
nmero total de observaciones. Para obtener este valor, dividimos la frecuencia de esa clase
entre el nmero total de observaciones del conjunto de datos. La respuesta se puede expresar
como una fraccin, un nmero decimal o un porcentaje.
La suma de todas las frecuencias relativas es igual a 1,00 o a 100%. Esto es as debido a que
una distribucin de frecuencias relativas aparea a cada clase con su fraccin o porcentaje
apropiados del total de datos. Por consiguiente, las clases que aparecen en cualquier
distribucin de frecuencias, ya sean relativas o simples, son completamente inclusivas. Todos
los datos caen en una u otra categora. Las clases son mutuamente exclusivas, es decir,
ningn punto de dato cae en ms de una categora.
En las distribuciones de frecuencias no aparecen clases que se traslapen.
1. Decidir el tipo y nmero de clases para dividir los datos. De acuerdo con la medida
cuantitativa o un atributo cualitativo. Necesitamos decidir cuntas clases distintas usar
y el alcance que cada clase debe cubrir. el alcance total debe dividirse entre clases
iguales, esto es, el ancho del intervalo, tomado desde el principio de una clase hasta el
principio de la clase siguiente, necesita ser el mismo para todas las clases.
El nmero de clases depende del nmero de puntos de dato y del alcance de los datos
recolectados. Cuantos ms puntos de dato se tengan o cuanto ms grande sea el
alcance, ms clases se necesitarn para dividir los datos. Como regla general, los
estadsticos rara vez utilizan menos de 6 y ms de 15 clases.
Debido a que necesitamos hacer los intervalos de clase de igual tamao, el nmero de
clases determina el ancho de cada clase.
Ancho de los intervalos de clase = (valor unitario siguiente despus del valor ms
grande
de los datos valor ms pequeo de los datos) / nmero total de intervalos
Debemos utilizar el siguiente valor ms alto de las mismas unidades, ya que estamos
midiendo el intervalo entre el primer valor de una clase y el primer valor de la siguiente.
2. Clasificar los puntos de dato en clases y contar el nmero de datos que hay en
cada clase.
trazado de lneas verticales desde los lmites de clase y luego conectando tales lneas con
rectas horizontales a la altura de los puntos medios del polgono.
Un polgono de frecuencias que utiliza frecuencias relativas de puntos de dato en cada una de
las clases, en lugar del nmero real de puntos, se conoce como polgono de frecuencias
relativas. Este polgono tiene la misma forma que el polgono de frecuencias construido a partir
del mismo conjunto de datos, pero con una escala diferente en los valores del eje vertical.
Ventajas de los histogramas:
Un polgono alisado mediante el aumento de clases y de puntos de dato se conoce como curva
de frecuencias.
Ojivas.
Una distribucin de frecuencias acumuladas nos permite ver cuntas observaciones estn por
encima de ciertos valores, en lugar de hacer un mero registro del nmero de elementos que
hay dentro de los intervalos.
La grfica de una distribucin de frecuencias acumuladas se conoce como ojiva.
En ocasiones, la informacin que utilizamos se presenta en trminos de frecuencias
acumuladas "mayores que". La ojiva adecuada para tal informacin tendra una inclinacin
hacia abajo y hacia la derecha, en lugar de tener una inclinacin hacia arriba y a la derecha.
Podemos construir una ojiva de una distribucin de frecuencias relativas de la misma manera
en que trazamos la ojiva de una distribucin de frecuencias absolutas. Slo habr un cambio: la
escala del eje vertical.
Del ordenamiento de datos podemos construir distribuciones de frecuencias. A partir de las
distribuciones de frecuencias podemos construir distribuciones de frecuencias acumuladas. A
partir de stas podemos trazar una ojiva. Y de esta ojiva podemos aproximar los valores que
tenemos en el ordenamiento de datos. Sin embargo, no podemos recobrar de manera normal
los datos originales exactos a partir de cualquiera de las representaciones grficas que hemos
analizado.
Tratamiento de una variable discreta:
Se utilizan los diagramas de barras, la diferencia con el histograma es que los rectngulos no
se tocan entre s; esto se debe a que, al ser la variable discreta, entre los valores sucesivos no
hay valores intermedios.
Las frecuencias acumuladas se grafican por medio de una ojiva en forma de escalera, debido a
que la frecuencia aumenta de a saltos.
RECOMENDACIONES:
Cuando se trabaja con muestras, recopilar el mayor nmero de datos posible.
Usar 5 clases como mnimo y 15 como mximo para agrupar los datos, en funcin del nmero
de datos disponibles.
Trabajar con intervalos de clase de igual longitud.
Tener cuidado con la clasificacin automtica que hacen los paquetes estadsticos.
Al calcular frecuencias relativas como proporcin trabajar con cuatro dgitos despus de la
coma, para evitar errores de redondeo en la suma.
Al dibujar un grfico, no exagerar la escala vertical u horizontal. Un grfico desproporcionado
complica su interpretacin y puede resultar engaoso a simple vista.
CONCEPTOS:
Poblacin: conjunto formado por todas las unidades objeto de un estudio estadstico.
Coleccin de todos los elementos que se estn estudiando y sobre los cuales
intentamos llegar a conclusiones.
Arreglo de datos: organizacin de los datos sin procesar por observacin, tomados en
orden ascendente o descendente.
Clase de extremo abierto: clase que permite que el extremo superior o inferior de un
esquema de clasificacin cuantitativo no tenga lmite.
Datos continuos: datos que pueden pasar de una clase a la siguiente sin
interrumpirse y que pueden expresarse mediante nmeros enteros o fraccionarios.
Datos numricos que admiten infinitos valores entre dos valores cualesquiera;
generalmente surgen de una medicin.
Datos discretos: datos que no pasan de una clase a la siguiente sin que haya una
interrupcin; esto es, donde las clases representan categoras o cuentas distintas que
pueden representarse mediante nmeros enteros. Datos numricos que no admiten
valores intermedios entre dos valores sucesivos; generalmente surgen de un conteo.
Datos sin procesar: informacin antes de ser organizada o analizada por mtodos
estadsticos. Conjunto de datos que no han recibido ningn tratamiento estadstico.
Datos tratados: conjunto de datos que ha sido objeto de algn tipo de ordenamiento o
procesamiento.
Polgono de frecuencias: lnea que une los puntos medios de cada clase de un
conjunto de datos, trazada a la altura correspondiente a la frecuencia de datos.
Representacin grfica de la distribucin de frecuencias en forma suavizada de una
variable continua.