VARIABLES
INTRODUCCIN
Son las caractersticas de cada uno de los sujetos. Se le llama variable precisamente porque vara de sujeto a sujeto. Cada sujeto tiene un valor para cada variable.
Ejemplos:
Variable sexo biolgico, valores varn o mujer. Variable aos cumplidos: ; valores 25, 26, 27, 30, etc. Variable ingresos anuales; Valores: cualquier nmero entre 0 y cientos de miles o millones de nuevos soles.
INTRODUCCIN
Segn el tipo de valores que toman las variables, distinguimos diferentes tipos de variables.
El tipo de variable es importante: afecta a lo que podemos hacer con ella, al tipo de anlisis que podemos hacer. Los mtodos estadsticos que usamos dependen del tipo de variable.
INTRODUCCIN
El proceso de definir y medir una variables es crucial, esta proceso se denomina operacionalizacin de variables. Si se hace una definicin incorrecta o si se mide mal: todo lo que venga detrs, toda la estadstica que podamos ser invalida. Algunas variables no hace falta definirlas ni hay dificultades para medirlas (Ejem.: sexo cromosmico).
Otras variables aparentemente obvias no lo son tanto (Ejem.: sexo fenotpico).
Existen tambin variables que son francamente difciles de medir (Ejem.: sexualidad).
INTRODUCCIN
La descripcin de las variables debe permitir evaluar la adecuacin entre: Los instrumentos utilizados. Las variables elegidas. Los conceptos tericos descritos en el cuadro conceptual.
La descripcin operativa debe tener en cuenta dos clases de restricciones: Restricciones de acceso a los datos. Restricciones de adecuacin para la medicin de los conceptos.
INTRODUCCIN
Las variables constituyen un primer nivel de operacionalizacin de un modelo terico y ser necesario darle a cada una, una descripcin operacional (conjunto de operaciones necesarias para medirla): Definir los indicadores a utilizar para cada dimensin (y componente) que se desee medir. Definir los extremos generales de variacin de los indicadores. Definir los extremos de cada intervalo de medicin de los indicadores Definir los instrumentos de medicin de cada indicador Definir las condiciones operacionales de la medicin de cada indicador
TIPOS DE VARIABLES
CUALITATIVAS
CUANTITATIVAS
NOMINALES
ORDINALES
DISCRETAS
CONTINUAS
TIPOS DE VARIABLES
Variables cualitativas. Son aquellas que clasifican las unidades en categoras, tambin se llaman variables categricas. Con estas variables podemos contar nmero de casos, comparar entre categoras, pero no podemos realizar operaciones numricas. Ordinales. Estn asociadas a un orden natural (Ejem.: nivel educacional, estado nutricional, nivel socioeconmico, etc.) Nominal. Estn asociados a una cualidad del sujeto de estudio (Ejem.: sexo, religin, etnia, etc.)
TIPOS DE VARIABLES
Variables cuantitativas. Tienen valores numricos que representan medidas (largo, peso, etc.) o frecuencias (nmero de). Tiene sentido realizar operaciones numricas con estas variables.
Discretas. Es aquella en la cul se puede contar el nmero posible de valores. Es decir, slo puede tomar un nmero finito o contable de posible valores (Ejem.: el nmero de lesiones por unidad de rea). Continuas. Puede tomar cualquier valor en un intervalo dado (Ejem.: el peso, la glucemia, la concentracin de hemoglobina, etc.)
C
Variables dependientes. Variables independientes. Variables confusoras. Variables modificadoras. Variables controladas Variables desconocidas.
DISTRIBUCIN DE FRECUENCIAS
INTRODUCCIN
Una vez que se halla recogido la informacin de inters para un estudio, intentar visualizar directamente todos los datos, sin un procesamiento previo, resulta engorroso y poco prctico.
Resulta ms productivo visualizar ellos tras un proceso de agrupamiento, a partir del cual adems se puedan generar tablas y grficos. A este agrupamiento se le conoce como distribucin de frecuencias.
INTRODUCCIN
Una distribucin de frecuencias es un resumen tabular de un conjunto de datos que tienen determinadas caractersticas observadas, a esta caractersticas se les suele denominar categoras o clases.
Es una tabla que representa el nmero de elementos que pertenecen a cada una de las clases o categoras en las que se haya dividido el conjunto de datos para su estudio
INTRODUCCIN
La distribucin de frecuencias permite tener una mejor perspectiva de los datos, ella resume la informacin en una tabla o grfico que permite visualizar la centralidad y la dispersin de los datos
CONCEPTOS BSICOS
Clase o categora. Es el nmero de subconjuntos en que se han agrupado los datos. Cada clase se puede denominar mediante una letra, un nmero o alguna caracterstica del subconjunto.
Intervalo de clase. Es un conjunto de elementos que forman a una clase, conteniendo un lmite inferior y un lmite superior. Tamao de clase. Es la diferencia entre dos lmites inferiores o superiores de clases sucesivas. Frecuencia. Es el nmero de datos que pertenecen a cada clase
REPRESENTACIN GRFICA
La representacin grfica contribuye a un mejor anlisis de los datos.
Facilita la comprensin del fenmeno considerado. Se pierde detalle de informacin pero se obtiene otro tipo de informacin.
REPRESENTACIN GRFICA
Para variables cualitativas: Grfico sectorial. Grfico de barras. Para variables cuantitativas: Grfico de puntos. Diagrama de tallos y hojas. Histograma de frecuencias. Polgono de frecuencias Ojiva
Distrito C
Distrito D Distrito A Distrito A
Distrito A
Distrito A Distrito E Distrito B
Distrito E
Distrito A Distrito E Distrito C
Distrito E
Distrito A Distrito E Distrito D
Distrito B
Distrito D Distrito E Distrito E
Distrito de procedencia
Frecuencia absoluta
16 14 10 8 7 55
30
29.1 25.5
20
10
Distrito de procedencia
14.5
18.2 25.5
Con estos datos se deber construir una tabla de distribucin de frecuencias para la variable de inters.
Para nuestro ejemplo K = 7 (aprox.) Cuarto paso. Se determina el ancho del intervalo.
=
Recomendaciones Las clases deben ser exhaustivas y mutuamente excluyentes. Procurar que el nmero de clases oscile entre 5 y 10. Evitar, hasta donde sea posible, clases de diferente amplitud. En ocasiones se pueden emplear clases abiertas en la primera y ltima categora.
30 33
34 37 38 41 42 - 45 TOTAL
3
6 5 6 50
5.5
10.9 9.1 10.9 100.0
69.1
80.0 89.1 100.0 100.0
10
Frecuencia
0 14 17 18 21 22 25 26 29 30 33 34 37 38 41 42 - 45
Histograma de frecuencias
12 10 Frecuencia 8 6 4
2
0 14 17 18 21 22 25 26 29 30 33 34 37 38 41 42 - 45
Polgono de frecuencias
10
Frecuencia
0 14 17 18 21 22 25 26 29 30 33 34 37 38 41 42 - 45
Polgono de frecuencias
Curvas de frecuencias
80
Frecuencia acumulada
60
40
20
0 14 17 18 21 22 25 26 29 30 33 34 37 38 41 42 - 45
MEDIDAS DE RESUMEN
MEDIA ARITMETICA
El valor en la distribucin respecto del cual la suma de las desviaciones es igual a cero.
Ventajas: Intervienen todos los datos en su elaboracin. Es siempre calculable. Es nica para cada distribucin
Inconvenientes: Puede dar lugar a conclusiones no muy atinadas debido a la presencia de valores extremos, ya sea por exceso o por defecto. Usos: Cuando los valores tienen la misma importancia en el grupo de datos. Para el resumen estadstico en caso de distribuciones en escala de intervalos o de proporcin.
MEDIA GEOMETRICA
Ventajas: Intervienen todos los datos en su elaboracin. Es menos sensible que la media aritmtica a la presencia de Valores extremos Inconvenientes: Es de ms difcil de interpretar y estimar que la media aritmtica. No es siempre calculable. No es nica para cada distribucin. Usos: Cuando los valores dependen en el tiempo y varan de manera no lineal; es decir, cuando la variable presenta variaciones acumulativas. Ejem.: cambios porcentuales, crecimientos anualizados de poblacin o ventas etc.
MEDIA ARMONICA
Ventajas: Intervienen todos los datos en su elaboracin Es nica para cada distribucin.
Inconvenientes: No es siempre calculable. No es aconsejable su uso cuando existan valores pequeos. Usos: Cuando los valores representan razones de cambio. Ejem.: Para promediar velocidades, rendimientos, etc. En general para promediar todo aquello cuyas unidades vengan expresadas como cocientes de dos magnitudes simples
MEDIANA
Se refiere al valor que divide la distribucin en dos partes iguales.
Usos: Tiene mayor sentido en distribuciones en escala ordinal, es decir, datos susceptibles de ser ordenados, por describir la tendencia central de la misma (no tiene sentido utilizar promedios). Ventajas No es muy sensible a la presencia de valores extremos. Reduce el efecto de valores extremos para obtener un valor representativo de centro. Desventajas. Implica ordenar los datos. Insensible a la magnitud de los valores. Sensible al tamao del conjunto de datos.
MODA
Es el valor de la variable con mayor frecuencia absoluta, podra no ser nica en cada distribucin.
Ventajas Cuando un valor predomina es fcil de detectar. Permite visualizar cuando dos o ms grupos distintos aparecen en un mismo grupo de datos. (Distribuciones bimodales, trimodales) Desventajas. No siempre existe Es insensible a la presencia de valores extremos. No provee informacin referente a la distribucin de frecuencia de un grupo de datos.
Usos: Es la medida ms representativa en distribuciones con escala nominal. Esto se debe a que estos datos no son susceptibles de ordenacin y no es posible realizar operaciones con ellos.
Moda
Mediana
Media
Media
Mediana
Moda
Percentiles. Son los 99 valores que dividen a la distribucin en 100 partes iguales.
Quantiles. Son los k 1 valores que dividen a la distribucin en k partes iguales
Desviacin estndar.
La varianza hace uso de la propiedad de todos los cuadrados de ser positivos para establecer una medida unidireccional. Este estadstico tiene el inconveniente de ser poco significativo, pues se mide en el cuadrado de la unidad de la variable.
ni S S ( xi x ) N i 1
2 2
Este estadstico se mide en la misma unidad que la variable por lo que se puede interpretar mejor. Es un derivado de la varianza, grficamente representa la distancia desde la media de la distribucin normal hasta el punto de inflexin de la curva que representa la distribucin.