Anda di halaman 1dari 54

VARIABLES, DISTRIBUCIN DE FRECUENCIAS Y MEDIDAS DE RESUMEN

Francisco L. Huapaya Jurado

VARIABLES

Francisco L. Huapaya Jurado

INTRODUCCIN
Son las caractersticas de cada uno de los sujetos. Se le llama variable precisamente porque vara de sujeto a sujeto. Cada sujeto tiene un valor para cada variable.
Ejemplos:
Variable sexo biolgico, valores varn o mujer. Variable aos cumplidos: ; valores 25, 26, 27, 30, etc. Variable ingresos anuales; Valores: cualquier nmero entre 0 y cientos de miles o millones de nuevos soles.

INTRODUCCIN
Segn el tipo de valores que toman las variables, distinguimos diferentes tipos de variables.
El tipo de variable es importante: afecta a lo que podemos hacer con ella, al tipo de anlisis que podemos hacer. Los mtodos estadsticos que usamos dependen del tipo de variable.

INTRODUCCIN
El proceso de definir y medir una variables es crucial, esta proceso se denomina operacionalizacin de variables. Si se hace una definicin incorrecta o si se mide mal: todo lo que venga detrs, toda la estadstica que podamos ser invalida. Algunas variables no hace falta definirlas ni hay dificultades para medirlas (Ejem.: sexo cromosmico).
Otras variables aparentemente obvias no lo son tanto (Ejem.: sexo fenotpico).

Existen tambin variables que son francamente difciles de medir (Ejem.: sexualidad).

INTRODUCCIN
La descripcin de las variables debe permitir evaluar la adecuacin entre: Los instrumentos utilizados. Las variables elegidas. Los conceptos tericos descritos en el cuadro conceptual.
La descripcin operativa debe tener en cuenta dos clases de restricciones: Restricciones de acceso a los datos. Restricciones de adecuacin para la medicin de los conceptos.

INTRODUCCIN
Las variables constituyen un primer nivel de operacionalizacin de un modelo terico y ser necesario darle a cada una, una descripcin operacional (conjunto de operaciones necesarias para medirla): Definir los indicadores a utilizar para cada dimensin (y componente) que se desee medir. Definir los extremos generales de variacin de los indicadores. Definir los extremos de cada intervalo de medicin de los indicadores Definir los instrumentos de medicin de cada indicador Definir las condiciones operacionales de la medicin de cada indicador

TIPOS DE VARIABLES

CUALITATIVAS

CUANTITATIVAS

NOMINALES

ORDINALES

DISCRETAS

CONTINUAS

TIPOS DE VARIABLES
Variables cualitativas. Son aquellas que clasifican las unidades en categoras, tambin se llaman variables categricas. Con estas variables podemos contar nmero de casos, comparar entre categoras, pero no podemos realizar operaciones numricas. Ordinales. Estn asociadas a un orden natural (Ejem.: nivel educacional, estado nutricional, nivel socioeconmico, etc.) Nominal. Estn asociados a una cualidad del sujeto de estudio (Ejem.: sexo, religin, etnia, etc.)

TIPOS DE VARIABLES
Variables cuantitativas. Tienen valores numricos que representan medidas (largo, peso, etc.) o frecuencias (nmero de). Tiene sentido realizar operaciones numricas con estas variables.

Discretas. Es aquella en la cul se puede contar el nmero posible de valores. Es decir, slo puede tomar un nmero finito o contable de posible valores (Ejem.: el nmero de lesiones por unidad de rea). Continuas. Puede tomar cualquier valor en un intervalo dado (Ejem.: el peso, la glucemia, la concentracin de hemoglobina, etc.)

RELACIN ENTRE VARIABLES

C
Variables dependientes. Variables independientes. Variables confusoras. Variables modificadoras. Variables controladas Variables desconocidas.

DISTRIBUCIN DE FRECUENCIAS

Francisco L. Huapaya Jurado

INTRODUCCIN
Una vez que se halla recogido la informacin de inters para un estudio, intentar visualizar directamente todos los datos, sin un procesamiento previo, resulta engorroso y poco prctico.
Resulta ms productivo visualizar ellos tras un proceso de agrupamiento, a partir del cual adems se puedan generar tablas y grficos. A este agrupamiento se le conoce como distribucin de frecuencias.

INTRODUCCIN
Una distribucin de frecuencias es un resumen tabular de un conjunto de datos que tienen determinadas caractersticas observadas, a esta caractersticas se les suele denominar categoras o clases.
Es una tabla que representa el nmero de elementos que pertenecen a cada una de las clases o categoras en las que se haya dividido el conjunto de datos para su estudio

INTRODUCCIN

La distribucin de frecuencias permite tener una mejor perspectiva de los datos, ella resume la informacin en una tabla o grfico que permite visualizar la centralidad y la dispersin de los datos

CONCEPTOS BSICOS
Clase o categora. Es el nmero de subconjuntos en que se han agrupado los datos. Cada clase se puede denominar mediante una letra, un nmero o alguna caracterstica del subconjunto.
Intervalo de clase. Es un conjunto de elementos que forman a una clase, conteniendo un lmite inferior y un lmite superior. Tamao de clase. Es la diferencia entre dos lmites inferiores o superiores de clases sucesivas. Frecuencia. Es el nmero de datos que pertenecen a cada clase

REPRESENTACIN GRFICA
La representacin grfica contribuye a un mejor anlisis de los datos.
Facilita la comprensin del fenmeno considerado. Se pierde detalle de informacin pero se obtiene otro tipo de informacin.

REPRESENTACIN GRFICA
Para variables cualitativas: Grfico sectorial. Grfico de barras. Para variables cuantitativas: Grfico de puntos. Diagrama de tallos y hojas. Histograma de frecuencias. Polgono de frecuencias Ojiva

DISTRIBUCIN DE FRECUENCIAS PARA VARIABLES CUALITATIVAS


Se llev a cabo una encuesta entre los pacientes con diagnostico de Tuberculosis hospitalizados en el servicio de Neumologa del Hospital X (n=55). En relacin al distrito de procedencia se encontr:
DISTRITO DE PROCEDENCIA

Distrito A Distrito B Distrito C Distrito B Distrito D Distrito A Distrito B

Distrito E Distrito D Distrito E Distrito A Distrito B Distrito C Distrito E

Distrito E Distrito A Distrito B Distrito A Distrito E Distrito A Distrito D

Distrito B Distrito D Distrito B Distrito E Distrito C Distrito E Distrito C

Distrito E Distrito B Distrito A Distrito C Distrito D Distrito A Distrito E

Distrito C
Distrito D Distrito A Distrito A

Distrito A
Distrito A Distrito E Distrito B

Distrito E
Distrito A Distrito E Distrito C

Distrito E
Distrito A Distrito E Distrito D

Distrito B
Distrito D Distrito E Distrito E

DISTRIBUCIN DE FRECUENCIAS PARA VARIABLES CUALITATIVAS


Entonces la distribucin de frecuencias para la variable Distrito de procedencia sera la siguiente:

Distrito de procedencia

Frecuencia absoluta

Frecuencia relativa (%)

Frecuencia relativa acumulada (%)

Distrito E Distrito A Distrito B Distrito D Distrito C TOTAL

16 14 10 8 7 55

29.1 25.5 18.2 14.5 12.7 100.0

29.1 54.6 74.0 88.0 100.0 100.0

DISTRIBUCIN DE FRECUENCIAS PARA VARIABLES CUALITATIVAS


40

Frecuencia relativa (%)

30

29.1 25.5

20

18.2 14.5 12.7

10

0 Distrito E Distrito A Distrito B Distrito D Distrito C

Distrito de procedencia

DISTRIBUCIN DE FRECUENCIAS PARA VARIABLES CUALITATIVAS


Distrito de procedencia
12.7 29.1

14.5

Distrito E Distrito A Distrito B Distrito D Distrito C

18.2 25.5

DISTRIBUCIN DE FRECUENCIAS PARA VARIABLES CUANTITATIVAS


En los mismos pacientes (n=55), se recogi informacin en relacin al tiempo transcurrido desde el inicio de sus sntomas.
NUMERO DE DAS DESDE EL INICIO DE LOS SINTOMAS 15 20 25 23 45 29 18 21 37 25 38 34 32 26 28 32 33 37 41 40 19 15 14 24 26 15 16 17 24 26 38 36 29 28 18 26 29 35 36 41 19 20 23 25 24 23 27 15 16 18 42 43 44 44 45

Con estos datos se deber construir una tabla de distribucin de frecuencias para la variable de inters.

DISTRIBUCIN DE FRECUENCIAS PARA VARIABLES CUANTITATIVAS


Primer paso. Los datos deben ser ordenados de manera ascendente o descendente.
NUMERO DE DAS DESDE EL INICIO DE LOS SINTOMAS 14 19 25 29 38 15 19 25 29 38 15 20 25 32 40 15 20 26 32 41 15 21 26 33 41 16 23 26 34 42 16 23 26 35 43 17 23 27 36 44 18 24 28 36 44 18 24 28 37 45 18 24 29 37 45

DISTRIBUCIN DE FRECUENCIAS PARA VARIABLES CUANTITATIVAS


Segundo paso. Se calcula el rango de los datos.
NUMERO DE DAS DESDE EL INICIO DE LOS SINTOMAS 14 19 25 29 38 15 19 25 29 38 15 20 25 32 40 15 20 26 32 41 15 21 26 33 41 16 23 26 34 42 16 23 26 35 43 17 23 27 36 44 18 24 28 36 44 18 24 28 37 45 18 24 29 37 45

Rango (R) = Vmax Vmin = 45 14 = 31

DISTRIBUCIN DE FRECUENCIAS PARA VARIABLES CUANTITATIVAS


Tercer paso. Se calcula el nmero de intervalos de clase (K) necesarios.
Opcin a. = 1 + 3.322 () Opcin b. = Opcin c. 2 (en donde K debe tomar el mnimo valor posible).

Para nuestro ejemplo K = 7 (aprox.) Cuarto paso. Se determina el ancho del intervalo.
=

Para nuestro ejemplo W = 31/7 = 4.43

DISTRIBUCIN DE FRECUENCIAS PARA VARIABLES CUANTITATIVAS


Quinto paso. Determinar las clases en si mismas (es decir los lmites mnimos y mximos de cada clase).
Nmero de das desde el inicio de los sntomas 14 18 22 26 30 34 38 42 17 21 25 29 33 37 41 45

Recomendaciones Las clases deben ser exhaustivas y mutuamente excluyentes. Procurar que el nmero de clases oscile entre 5 y 10. Evitar, hasta donde sea posible, clases de diferente amplitud. En ocasiones se pueden emplear clases abiertas en la primera y ltima categora.

DISTRIBUCIN DE FRECUENCIAS PARA VARIABLES CUANTITATIVAS


Sexto paso. Calcular las frecuencias absolutas, relativas y acumuladas de cada clase, con lo cual se culmina la elaboracin de la tabla de distribucin de frecuencias.
Distrito de procedencia 14 17 18 21 22 25 26 29 Frecuencia absoluta 8 8 9 10 Frecuencia relativa (%) 14.5 14.5 16.4 18.2

Frecuencia relativa acumulada (%)


14.5 29.1 45.5 63.6

30 33
34 37 38 41 42 - 45 TOTAL

3
6 5 6 50

5.5
10.9 9.1 10.9 100.0

69.1
80.0 89.1 100.0 100.0

DISTRIBUCIN DE FRECUENCIAS PARA VARIABLES CUANTITATIVAS


Siendo que nuestra variable es ahora de intervalo, esta tambin puede ser expresada de manera grfica con un histograma de frecuencias o con un polgono de frecuencias.

DISTRIBUCIN DE FRECUENCIAS PARA VARIABLES CUANTITATIVAS


NMERO DE DAS DESDE EL INICIO DE SINTOMAS
12

10

Frecuencia

0 14 17 18 21 22 25 26 29 30 33 34 37 38 41 42 - 45

Histograma de frecuencias

DISTRIBUCIN DE FRECUENCIAS PARA VARIABLES CUANTITATIVAS


NMERO DE DAS DESDE EL INICIO DE SINTOMAS

12 10 Frecuencia 8 6 4

2
0 14 17 18 21 22 25 26 29 30 33 34 37 38 41 42 - 45

Polgono de frecuencias

DISTRIBUCIN DE FRECUENCIAS PARA VARIABLES CUANTITATIVAS


NMERO DE DAS DESDE EL INICIO DE SINTOMAS 12

10

Frecuencia

0 14 17 18 21 22 25 26 29 30 33 34 37 38 41 42 - 45

Polgono de frecuencias

DISTRIBUCIN DE FRECUENCIAS PARA VARIABLES CUANTITATIVAS

Curvas de frecuencias

DISTRIBUCIN DE FRECUENCIAS PARA VARIABLES CUANTITATIVAS


Las frecuencias acumuladas pueden ser presentadas como ojivas.
100

80

Frecuencia acumulada

60

40

20

0 14 17 18 21 22 25 26 29 30 33 34 37 38 41 42 - 45

MEDIDAS DE RESUMEN

Francisco L. Huapaya Jurado

Algunos conceptos previos

MEDIDAS DE POSICIN CENTRAL


Reflejan la concentracin de los datos.
Los conjuntos de datos muestran una tendencia definida a agruparse o resumirse en torno a cierto punto, por lo que para cualquier conjunto particular de datos, es posible seleccionar un valor tpico para describir, representar o resumir todo el conjunto de datos.

MEDIDAS DE POSICIN CENTRAL


PROPIEDADES DESEABLES
Definida objetivamente a partir de los datos de la serie. Que dependa de todas las observaciones. De significado sencillo y fcil de entender.

De clculo rpido y fcil.


Poco sensible a las fluctuaciones del muestreo (valor parecido al de la poblacin) Adecuado a clculos algebraicos posteriores.

MEDIA ARITMETICA
El valor en la distribucin respecto del cual la suma de las desviaciones es igual a cero.

Ventajas: Intervienen todos los datos en su elaboracin. Es siempre calculable. Es nica para cada distribucin

Inconvenientes: Puede dar lugar a conclusiones no muy atinadas debido a la presencia de valores extremos, ya sea por exceso o por defecto. Usos: Cuando los valores tienen la misma importancia en el grupo de datos. Para el resumen estadstico en caso de distribuciones en escala de intervalos o de proporcin.

MEDIA GEOMETRICA

Ventajas: Intervienen todos los datos en su elaboracin. Es menos sensible que la media aritmtica a la presencia de Valores extremos Inconvenientes: Es de ms difcil de interpretar y estimar que la media aritmtica. No es siempre calculable. No es nica para cada distribucin. Usos: Cuando los valores dependen en el tiempo y varan de manera no lineal; es decir, cuando la variable presenta variaciones acumulativas. Ejem.: cambios porcentuales, crecimientos anualizados de poblacin o ventas etc.

MEDIA ARMONICA

Ventajas: Intervienen todos los datos en su elaboracin Es nica para cada distribucin.

Inconvenientes: No es siempre calculable. No es aconsejable su uso cuando existan valores pequeos. Usos: Cuando los valores representan razones de cambio. Ejem.: Para promediar velocidades, rendimientos, etc. En general para promediar todo aquello cuyas unidades vengan expresadas como cocientes de dos magnitudes simples

RELACIN ENTRE LAS MEDIAS

MEDIANA
Se refiere al valor que divide la distribucin en dos partes iguales.

Usos: Tiene mayor sentido en distribuciones en escala ordinal, es decir, datos susceptibles de ser ordenados, por describir la tendencia central de la misma (no tiene sentido utilizar promedios). Ventajas No es muy sensible a la presencia de valores extremos. Reduce el efecto de valores extremos para obtener un valor representativo de centro. Desventajas. Implica ordenar los datos. Insensible a la magnitud de los valores. Sensible al tamao del conjunto de datos.

MODA
Es el valor de la variable con mayor frecuencia absoluta, podra no ser nica en cada distribucin.
Ventajas Cuando un valor predomina es fcil de detectar. Permite visualizar cuando dos o ms grupos distintos aparecen en un mismo grupo de datos. (Distribuciones bimodales, trimodales) Desventajas. No siempre existe Es insensible a la presencia de valores extremos. No provee informacin referente a la distribucin de frecuencia de un grupo de datos.

Usos: Es la medida ms representativa en distribuciones con escala nominal. Esto se debe a que estos datos no son susceptibles de ordenacin y no es posible realizar operaciones con ellos.

RELACION ENTRE MEDIA, MEDIANA Y MODA


Si la media, moda y mediana son iguales, se puede decir que los datos se distribuyen simtricamente.

RELACION ENTRE MEDIA, MEDIANA Y MODA

Moda

Mediana

Media

Media

Mediana

Moda

MEDIDAS DE POSICIN NO CENTRALES


Cuartiles. Son los 3 valores que dividen a la distribucin en 4 partes iguales. Deciles. Son los 9 valores que dividen a la distribucin en 10 partes iguales.

Percentiles. Son los 99 valores que dividen a la distribucin en 100 partes iguales.
Quantiles. Son los k 1 valores que dividen a la distribucin en k partes iguales

MEDIDAS DE DISPERSIN ABSOLUTAS


Reflejan la dispersin o variabilidad de los datos. Rango.
Rango intercuartlico. Varianza.

Desviacin estndar.

MEDIDAS DE DISPERSIN ABSOLUTAS


VARIANZA

La varianza hace uso de la propiedad de todos los cuadrados de ser positivos para establecer una medida unidireccional. Este estadstico tiene el inconveniente de ser poco significativo, pues se mide en el cuadrado de la unidad de la variable.

MEDIDAS DE DISPERSIN ABSOLUTAS


DESVIACIN ESTANDAR La varianza es difcil de interpretar porque las unidades de la medida estn elevadas al cuadrado. La desviacin tpica es:

ni S S ( xi x ) N i 1
2 2

Este estadstico se mide en la misma unidad que la variable por lo que se puede interpretar mejor. Es un derivado de la varianza, grficamente representa la distancia desde la media de la distribucin normal hasta el punto de inflexin de la curva que representa la distribucin.

Anda mungkin juga menyukai