Anda di halaman 1dari 50

Fundamentos de Estadstica Descriptiva

De manera creciente la ciencia moderna deviene cuantitativa en sus mtodos de pensamiento y de actividad. La historia de la ciencia muestra que el desarrollo inicial de cualquier disciplina es puramente cualitativo, y que slo cuando emerge de este estado y pasa a la fase cuantitativa es cuando empieza a tener un lugar asegurado en la jerarqua de las ciencias establecidas.

Raymond Pearl *

Introduction to medical biometry and statistics, 3a ed. Philadelphia:W.B. Saunders Company; 1940. p.1. Citado por: de la Torre E, Lpez C, Mrquez M, Gutirrez JA, Rojas F.
Salud para todos s es posible. La Habana: Sociedad Cubana de Salud Pblica; 2004. p. 171.

1 PDF created with pdfFactory Pro trial version www.pdffactory.com

Fundamentos de Estadstica Descriptiva


q

QU ES LA ESTADSTICA Y QU SON LAS ESTADSTICAS?

Existen mltiples definiciones de lo que es la estadstica, quizs tantas como libros de estadstica hayan sido escritos. Por estadstica podemos entender la ciencia y el arte de obtener datos, analizarlos y producir informacin. Observe que en esta definicin se mencionan tres procesos esenciales vinculados a la estadstica: la obtencin y el anlisis de datos, y la produccin de informacin a partir de ellos. Por otro lado, por estadsticas se puede entender un conjunto de datos numricos asociados a un asunto en particular; por eso se habla de las estadsticas de salud, de las estadsticas sobre la educacin, etc
q

CULES OTRAS DEFINICIONES BSICAS DEBEMOS CONOCER?

Se entiende por poblacin el conjunto de elementos sobre los cuales queremos obtener cierta informacin. Estos elementos pueden ser, por ejemplo, personas, familias, empresas o computadoras. Luego, una poblacin puede estar integrada por todas las personas que residieron en el mes de abril del 2006 en el barrio de Pueblo Nuevo, o por todas las familias que han recibido atencin mdica en el consultorio Primero de Mayo en el ao 2007, o por todas las empresas productoras de cacao del pas, o por todas las computadoras que en una cierta escuela estn a disposicin de los alumnos. Una muestra es una parte de una poblacin definida. Digamos, una muestra puede estar constituida por una parte de las familias que recibieron atencin mdica en el consultorio Primero de Mayo en el ao 2007. Las muestras suelen clasificarse en muestras aleatorias y muestras opinticas. Una muestra es aleatoria (o al azar) cuando el proceso de seleccin de los elementos que la integran se hizo aleatoriamente, y es opintica, cuando el investigador decide cules elementos de la poblacin son los que integran la muestra. Asuma, por ejemplo, que una poblacin est integrada por todos los escolares de 6 a 12 aos que asisten a una determinada escuela primaria (digamos que son 154) y que se desea sacar una muestra de 20 de entre esos 154 estudiantes para hacerles 2 PDF created with pdfFactory Pro trial version www.pdffactory.com

Fundamentos de Estadstica Descriptiva ciertas pruebas de conocimientos. Una manera de obtener esa muestra es poniendo los nombres de los 154 escolares en unos papelitos, introducirlos en un saquito, y sacar 20 papelitos; entonces las muestra estara integrada por los 20 estudiantes seleccionados. Esta es una muestra aleatoria, porque fue el azar, la casualidad, quien decidi cules nios o nias integraran la muestra. Adems de papelitos existen otros procedimientos para seleccionar una muestra aleatoria, por ejemplo, las llamadas tablas de nmeros aleatorios, o ciertos programas computacionales. Por otro lado, otra manera de obtener la muestra es que la maestra dijera que la muestra la van a integrar Juanito, Manuel, Magdalena, etc. as hasta 20. Esta sera una muestra opintica, porque fue la opinin de la maestra la que determin quines conformaran la muestra. En general, las muestras aleatorias resultan ms representativas de lo que ocurre en la poblacin, porque el azar no tiene preferencia ni por uno ni por otro, mientras que en la opintica el criterio de seleccin del que elige puede influir en los resultados; por ejemplo, la maestra pudo haber seleccionado a los escolares que sabe mejores preparados para las pruebas que se quieren hacer, y estos no representan a todos los nios o nias de la poblacin definida. Por otro lado, se conoce como parmetro una medida que describe lo que ocurre en una poblacin y por estadstico o estimador una medida que describe lo que sucede en una muestra. Por ejemplo, si se calcula el porcentaje de nias que hay en la poblacin de 154 estudiantes se estara calculando un parmetro; si el porcentaje de nias se calcula a partir de la muestra de 20 estudiantes se estara obteniendo un estadstico o estimador. Estas ideas se resumen en el cuadro sinptico 1.

3 PDF created with pdfFactory Pro trial version www.pdffactory.com

Fundamentos de Estadstica Descriptiva


Cuadro sinptico 1 / Poblacin, tipos de muestras, parmetro y estimador
TIPO CONCEPTO

Poblacin Muestra Parmetro Estadstico o estimador

Conjunto de elementos sobre los cuales se desea obtener cierta informacin Parte de una poblacin donde los elementos son aleatoria seleccionados aleatoriamente. Parte de una poblacin donde los elementos son opintica seleccionados segn criterio del investigador. Medida que describe lo que ocurre en una poblacin. Medida que describe lo que ocurre en una muestra.

CUNTOS TIPOS DE DATOS EXISTEN?

Existen varias formas de clasificar los datos, tambin llamados variables. Una forma de clasificarse es en datos cualitativos y datos cuantitativos. Datos cualitativos son aquellos cuyos posibles resultados se expresan en forma no numrica, como atributos o categoras, en tanto los datos cuantitativos son los que los posibles resultados se dan como nmeros. Los datos cualitativos pueden clasificarse en nominales u ordinales. Un dato cualitativo nominal es aquel que slo clasifica las observaciones sin establecer ninguna jerarqua entre ellos, en tanto un dato cualitativo ordinal es el que, adems de clasificar, estable una jerarqua, un orden, entre las categoras que toma la variable. Por ejemplo, el sexo es una variable cualitativa nominal, porque las personas se clasifican en masculino y femenino, pero masculino no es ms sexo que femenino, ni femenino es ms sexo que masculino. Raza, lugar de residencia de una persona y tipo de artculos que produce una empresa son otros ejemplos de variables cualitativas nominales. Por otro lado, la escolaridad de una persona es un dato cualitativo ordinal porque las personas no solamente se pueden clasificar en escolaridad primaria, escolaridad secundaria, etc, sino estas categoras establecen una jerarqua: secundaria es ms escolaridad que primaria, universitario es ms escolaridad que secundaria, etc.

4 PDF created with pdfFactory Pro trial version www.pdffactory.com

Fundamentos de Estadstica Descriptiva

A su vez, las variables cuantitativas pueden clasificarse en discretas y continuas. Una variable cuantitativa discreta es aquella que slo puede tomar determinados valores, habitualmente nmeros enteros, y usualmente resulta de contar ciertos objetos. Por otro lado, una variable cuantitativa continua es la que en un determinado intervalo puede adoptar cualquier valor, y frecuentemente resulta de medir un cierto aspecto de un objeto. Por ejemplo, el nmero de hijos que tiene una familia es una variable cuantitativa discreta (el nmero de hijos puede ser 1 hijo, 2 hijos, etc, pero no 1.25 hijos), en tanto la estatura de una persona es una variable cuantitativa continua (esa variable puede tomar valor 166 cm, 166.5 cm, 166.51 cm, etc. dependiendo de la precisin con que haga la medicin). En el cuadro sinptico 2 se sintetizan estas ideas.
Cuadro sinptico 2 / Tipos de datos TIPO DE DATO O VARIABLE CONCEPTO Los resultados se expresan en forma no numrica como atributos o categoras SUBTIPO nominal CONCEPTO Las categoras slo permiten clasificar a las observaciones. Las categoras clasifican las observaciones y las jerarquizan. La variable slo puede tomar ciertos valores, habitualmente, valores enteros. Frecuentemente resultan de contar. La variable puede adoptar toma cualquier valor numrico en un intervalo. Usualmente resultan de medir. EJEMPLO Estado civil de una persona. Grados militares.

Cualitativa

ordinal

discreta Cuantitativa Los resultados se expresan en forma numrica continua

Nmero de personas residiendo en cierto territorio.

Temperatura ambiental.

5 PDF created with pdfFactory Pro trial version www.pdffactory.com

Fundamentos de Estadstica Descriptiva


q

CMO SE PUEDEN RESUMIR LOS DATOS CUALITATIVOS?

Los datos cualitativos se pueden resumir mediante razones, proporciones, porcentajes y tasas. Usemos los siguientes datos para ilustrar estas medidas. Asuma que para un cierto municipio de 145000 habitantes se dispone de los siguientes datos: DATO O VARIABLE Sexo CATEGORAS NMERO (FRECUENCIA) 73950 71050 51759 45148 48093 57 107 1028

Masculino Femenino Casado Estado civil Soltero Otros Accidentes Causa de defuncin de los Influenza y neumona fallecidos en el 2006 otras causas

Una razn es un cociente que establece cuantas veces es el valor del numerador respecto al valor del denominador. Lo ms adecuado es que tanto el numerador como el denominador sean frecuencias observadas en dos categoras pertenecientes a una misma variable; es decir, el cociente resulta de dividir las frecuencias de dos partes de un todo. Por ejemplo, la razn de fallecidos por influenza y neumona a fallecidos por accidentes vendra dada por nmero de fallecidos por influenza y neumona / nmero de fallecidos por accidentes igual a 107 / 57 = 1.9 que se interpreta como han ocurrido casi 2 defunciones por influenza y neumona por cada defuncin debida a accidentes. Una proporcin es un cociente que mide que parte es el valor del numerador respecto al valor del denominador. Lo ms frecuente, y correcto, es que el numerador sea el nmero de observaciones para una categora de una variable y el denominador el total de observaciones para esa variable; o sea, el cociente es

6 PDF created with pdfFactory Pro trial version www.pdffactory.com

Fundamentos de Estadstica Descriptiva la resultante de dividir la frecuencia de una parte entre la frecuencia del todo. Por ejemplo, la proporcin de casados estara dada por nmero de personas casadas / nmero total de personas igual a 51759 / 145000 = 0.357 Un porcentaje no es ms que una proporcin multiplicada por 100. Luego el porcentaje de casados en el municipio es igual a 0.357 x 100 = 35.7 que se interpreta como por cada 100 personas en la poblacin, unas 36 son casadas. Una tasa es el cociente entre el nmero de personas en las que ha ocurrido un cierto hecho, habitualmente negativo, entre el nmero de personas en las que pudo haber ocurrido ese hecho, multiplicado por una constante (frecuentemente, 1000 o 100000). En general, las tasas pretenden medir el riesgo a que ocurra el hecho tenido en cuenta, Por ejemplo, la tasa de mortalidad por accidentes para el municipio considerado se obtiene como (nmero de defunciones por accidentes / total de la poblacin) x 100000 igual a (57 / 145000) x 100000 = 39.3 que se interpreta como por cada 100000 personas en la poblacin algo ms de 39 mueren por accidentes. Si se calcula la tasa de mortalidad por influenza y neumona nos dara 73.8 por 100000 habitantes o sea, (107 / 145000) x 100000 lo que nos indicara que en esa poblacin el riesgo de fallecer por influenza y neumona es casi el doble (73.8 / 39.3 = 1.9) que el de fallecer por accidentes. Estas ideas se resumen en el cuadro sinptico 3.

7 PDF created with pdfFactory Pro trial version www.pdffactory.com

Fundamentos de Estadstica Descriptiva


Cuadro sinptico 3 / Formas de resumir datos cualitativos MEDIDA DE RESUMEN Razn FORMA DE CLCULO PARA EL EJEMPLO Cociente entre las Razn de nmero de frecuencias observadas estudiantes estudiantes de en dos categoras de secundaria / nmero pertenecientes a una secundaria a de estudiantes de misma variable estudiantes primaria de primaria Cociente entre la Proporcin nmero de hombres / frecuencia observada en de hombres poblacin total una categora y la frecuencia total para todas las categoras de la variable. Proporcin multiplicada Porcentaje (nmero de hombres por 100. de hombres / poblacin total) x 100 Nmero de personas en Tasa de (nmero de las que ha ocurrido un mortalidad defunciones por cierto hecho, por accidentes / frecuentemente accidentes poblacin total) x negativo, entre el nmero por 100000 100000 de personas en las que habitantes. pudo haber ocurrido ese hecho, multiplicado por una constante DEFINICIN EJEMPLO

Proporcin

Porcentaje Tasa

Todas las medidas expuestas se asocian a lo ocurrido en un cierto lugar en un determinado momento
q

CMO SE PUEDEN RESUMIR LOS DATOS CUANTITATIVOS?

La forma de resumir datos cuantitativos depende de la manera en que se presentan. Los datos cuantitativos se pueden mostrar de tres maneras diferentes: no agrupados, agrupados segn valores iguales, y agrupados en clases. Presentacin de datos no agrupados

En esta forma de exposicin los valores se presentan sin ninguna forma de agrupacin, como se muestra en el Ejemplo 1. 8 PDF created with pdfFactory Pro trial version www.pdffactory.com

Fundamentos de Estadstica Descriptiva Ejemplo 1 Nmero de publicaciones cientficas (en decenas) entre 2004 y 2006 en una muestra de 10 instituciones del pas. 18.2, 20.5, 20.9, 18.5, 21.9, 20.5, 17.4, 20.7, 20.9, 20.5 Presentacin de datos agrupados segn valores iguales

En esta manera de presentacin se muestra la frecuencia de cada valor observado de la variable cuantitativa considerada. El Ejemplo 2 ilustra esta manera de presentacin. Ejemplo 2 Distribucin del nmero de familias segn el nmero de veces que han asistido a una consulta de orientacin familiar en una NUMERO DE NUMERO DE VECES FAMILIAS 0 4 1 6 2 8 3 12 4 10 5 6 6 4 TOTAL 50

poblacin de 50 familias en el ao 2006. No debe confundirse la variable (nmero de veces que se ha asistido a la consulta) con la frecuencia con que ello ha ocurrido (el nmero de familias que han ido los diferentes nmero de veces).

Presentacin de valores agrupados en clases

En esta forma de presentacin las observaciones se agrupan en clases de valores de la variable cuantitativa tenida en cuenta, como se muestra en el Ejemplo 3.

9 PDF created with pdfFactory Pro trial version www.pdffactory.com

Fundamentos de Estadstica Descriptiva GANANCIA (EN MILLONES DE DLARES) 4.0 4.4 4.5 4.9 5.0 5.4 5.5 5.9 6.0 6.4 6.5 6.9 7.0 7.4 TOTAL NMERO DE EMPRESAS 2 9 15 29 40 69 10 174

Ejemplo 3 Ganancia (en millones de dlares) en una muestra de 174 empresas entre los aos 2001 al 2005. Igualmente, debe observarse que la variable considerada es la ganancia de las empresas.

En la tabla anterior deben destacarse los siguientes aspectos: las clases son los intervalos de valores dados; por ejemplo, 4.0 4.4, 4.5 4.9, etc, los lmites de clase (inferiores y superiores) son los valores extremos de cada clase; para el ejemplo dado, los lmites de clase inferiores son 4.0, 4.5, ..., 7.0, y los lmites de clase superiores son 4,4, 4.9, ..., 7.4. los puntos medios o marcas de clase es el valor central de la clase; se obtiene como la semisuma del lmite inferior y superior de la clase; por ejemplo, el punto medio de la primera clase (4.0 4.4) es igual a 4.2 [(4.0 + 4.4)/2]. Las medidas que permiten resumir los datos cuantitativos se agrupan en medidas de tendencia central y medidas de dispersin. MEDIDAS DE TENDENCIA CENTRAL

Existen varias medidas de tendencia central. Aqu estudiaremos el clculo e interpretacin de tres de ellas (la media aritmtica, la mediana, y la moda) en las tres formas de presentacin de los datos cuantitativos. Media aritmtica

La media aritmtica, tambin llamada por muchos promedio, es la ms conocida, y utilizada, medida de tendencia central. La media aritmtica poblacional se 10 PDF created with pdfFactory Pro trial version www.pdffactory.com

Fundamentos de Estadstica Descriptiva denota por la letra griega (que se lee como mu), en tanto la media aritmtica muestral se identifica por

x (que se lee como x barra).

Media aritmtica en datos no agrupados En datos no agrupados la media aritmtica se calcula como la suma de todos los valores dividida entre el nmero de observaciones. Si denotamos por xi cada valor, por xi la suma de las observaciones, por N el nmero de observaciones en la poblacin, y por n el nmero de observaciones en la muestra, entonces, la media aritmtica poblacional y la media aritmtica muestral vienen dadas por las expresiones

= xi / N

x = xi / n

As, para el Ejemplo 1, la media aritmtica del nmero de publicaciones por ao (tambin se puede decir el nmero medio de publicaciones por ao) de la muestra de las 10 instituciones cientficas ser igual a

x = xi / n = (18.2 + 20.5 + 20.9 + ... + 20.5) / 10 = 200.0 / 10 = 20.0 decenas


que puede interpretarse como cada una de las instituciones consideradas publican anualmente alrededor de 20.0 decenas de publicaciones, o tambin si todas las instituciones hicieran el mismo nmero de publicaciones, cada una hara 20.0 decenas de publicaciones. Como se ver cuando se estudie la desviacin estndar, una propiedad de la media aritmtica es que la suma de las diferencias de cada valor respecto a la media aritmtica es igual a 0. Media aritmtica en datos agrupados segn valores iguales Igualmente, si denotamos por xi cada valor de la variable cuantitativa, por ni el valor de cada frecuencia observada, por ni xi la suma del producto de cada valor de la variable por su frecuencia, por N el nmero de observaciones en la

poblacin, y por n el nmero de observaciones en la muestra, entonces, la media

11 PDF created with pdfFactory Pro trial version www.pdffactory.com

Fundamentos de Estadstica Descriptiva aritmtica poblacional y la media aritmtica muestral vienen dadas por las expresiones

= n i xi / N

x = n i xi / n

El clculo se ilustra seguidamente con los datos brindados en el Ejemplo 2. Para facilitar los clculos se puede construir la siguiente tabla de trabajo. NUMERO NUMERO DE DE FAMILIAS VECES

ni xi
0 6 16 36 40 30 24 152

De esta manera, la media aritmtica del nmero veces que la poblacin de 50 familias ha asistido a consulta de orientacin familiar viene dada por

xi
1 2 3 4 5 6

ni

4 6 8 12 10 6 4 50 = N

= ni xi / N = 152 / 50 = 3.04 veces

Media aritmtica en datos agrupados en clases

Si denotamos por xi el punto medio de cada clase, por ni el valor de la frecuencia de cada clase, por ni xi la suma del producto del punto medio de cada clase por su frecuencia, por N el nmero de observaciones en la poblacin, y por n el nmero de observaciones en la muestra, entonces, la media aritmtica poblacional y la media aritmtica muestral se obtienen a travs de las relaciones

= ni xi / N

x = ni xi / n

Con los datos proporcionados en el Ejemplo 3 se ilustra el clculo. Una tabla de trabajo como la siguiente facilita el cmputo..

12 PDF created with pdfFactory Pro trial version www.pdffactory.com

Fundamentos de Estadstica Descriptiva PUNTO MEDIO DE LA FRECUENCIA CLASE ni

CLASE 4.0 4.4 4.5 4.9 5.0 5.4 5.5 5.9 6.0 6.4 6.5 6.9 7.0 7.4

ni xi
8.4 42.3 78.0 165.3 248.0 462.3 72.0
1076.3

Luego, la media aritmtica de ganancia anual de la

xi
4.2 4.7 5.2 5.7 6.2 6.7 7.2 2 9 15 29 40 69 10
174 = n

muestra estudiada es igual a

x = ni xi / n = 1076.3/174
= 6.18 millones de dlares

Mediana

La mediana es otra de las medidas conocidas como de tendencia central, as llamadas porque resumen los datos cuantitativos por un valor que tiende a estar en el centro de los valores observados. Cuando se exponga la obtencin de la mediana en datos no agrupados se explicar la razn de esta medida. En lo adelante, denotaremos por M a la mediana poblacional, y por m a la mediana muestral. Mediana en datos no agrupados En datos no agrupados, la mediana se define como el valor que divide a la serie de valores ordenados ascendentemente en dos partes iguales. Asumamos que se tiene los siguientes valores correspondientes al nmero de meses que una muestra de 7 fbricas han sobrecumplido su plan de produccin en el ao 2006. 1, 2, 4, 0, 1, 12, 1 Es decir, una de las fbricas sobrecumpli su plan de produccin 1 mes, otra, 2 meses, etc. La media aritmtica de esos valores es 3 meses. Sin embargo, 3 meses resume adecuadamente ese conjunto de valores?. Observe que de los 7 valores, 5 son menores que 3, y slo 2 son mayores que 3. Qu ha ocurrido?. Que en la serie hay un valor atpico, el 12, que eleva el valor del promedio. Justamente, cuando en la serie de valores hay valores atpicos bien muy altos o muy bajos que hacen que la media aritmtica no constituya una buena medida

13 PDF created with pdfFactory Pro trial version www.pdffactory.com

Fundamentos de Estadstica Descriptiva de resumen es que se recomienda el clculo de la mediana. Entonces, considerando la definicin dada de mediana en datos no agrupados, la obtencin del valor de la mediana implica tres etapas: primero, ordenar la serie de valores en forma ascendente; segundo, identificar cul es la posicin del valor central (el que deja igual nmero de observaciones por debajo de l, que por encima de l, o sea, a su izquierda y a su derecha); tercero, concluir que la mediana es ese valor central. Sigamos este proceso para los datos previamente dados: 1) 2) Ordenar los valores ascendentemente: 0, 1, 1, 1, 2, 4, 12 Identificar cul es el valor central: es 1, porque hay 3 valores a su

izquierda y 3 valores a su derecha. 3) Por tanto, m = 1 mes.

Y que hacer si el nmero de observaciones es par?. En este caso, la mediana es la semisuma de los dos valores centrales. Retomemos el Ejemplo 1 1) Ordenar los valores en forma ascendente: 17.4, 18.2, 18.5, 20.5, 20.5, 20.5, 20.7, 20.9, 20,9, 21.9 2) Identificar cul es el valor central. Como el nmero de observaciones es

par, no hay un valor central, sino dos valores centrales: 20.5 y 20.5 3) Entonces, el valor de la mediana ser m = (20.5 + 20.5)/ 2 = 20.5 decenas

de publicaciones. Una frmula til para determinar cul, o cules, son los valores centrales, es decir la posicin de la mediana una vez ordenados ascendentemente los datos, es la siguiente:

PMED = (nmero de observaciones + 1) / 2


Digamos, para el ejemplo dado de las 7 fbricas, la posicin del valor central era (7 + 1)/2 = 4; para el Ejemplo 1 con 10 observaciones, la posicin del valor central es (10 + 1)/2 = 5.5, es decir, entre la 5ta y la 6ta observacin. Debe recordarse que esta frmula no da el valor de la mediana, sino la posicin de la observacin que corresponde al valor de la mediana.

14 PDF created with pdfFactory Pro trial version www.pdffactory.com

Fundamentos de Estadstica Descriptiva

Resumiendo, para obtener la mediana en datos no agrupados se procede de la siguiente forma: 1) Se ordenan ascendentemente los valores. 2) Se identifica cul es el valor central (si es un nmero impar de observaciones) o los valores centrales (si es un nmero par de observaciones). Para esto se puede utilizar la frmula

PMED = (nmero de observaciones + 1) / 2.


3) Si el nmero de observaciones es impar, el valor de la mediana es el valor que ocupa la posicin central, y si el nmero de observaciones es par, el valor de la mediana es la semisuma (la media aritmtica, el promedio) de los dos valores centrales. Mediana en datos agrupados segn valores iguales El clculo de la mediana en datos agrupados segn valores iguales es similar a cuando los datos estn no agrupados, pero aprovechando la ventaja de la agrupacin de los datos. Retomando el Ejemplo 2, si los 50 datos no estuvieran agrupados, se obtendra lo siguientes: 0, 0, 0, 0, 1, 1, 1, 1, 1, 1, 2, 2, 2, 2, 2, 2, 2, 2, ...., 6, 6, 6, 6. Dado que hay 50 valores la posicin de la mediana sera (50 + 1) / 2 = 25.5; es decir, la semisuma de los valores ocupados por las posiciones 25 y 26. Sin embargo, no tiene sentido, desagrupar datos que ya se encuentran agrupados, cmo proceder entonces?. Observe la siguiente tabla de trabajo construida a partir de los propios datos del Ejemplo 2.

15 PDF created with pdfFactory Pro trial version www.pdffactory.com

Fundamentos de Estadstica Descriptiva

Es decir, 0 vez hay 4 observaciones, 0 NUMERO DE VECES NUMERO DE FAMILIAS y 1 vez hay 10 observaciones, 0, 1, y 2 FRECUENCIA ACUMULADA 4 10 18 30 40 36 40 veces hay 18 observaciones, etc. Qu valores que tomarn estn en las las

xi
0 1 2 3 4 5 6

ni
4 6 8 12 10 6 4 50 = N

observaciones

posiciones 25 y 26?. Pues si hasta el valor 2 hay acumuladas 18

observaciones, y hasta el valor 3 (cuando termine el ltimo 3) hay acumuladas 30 observaciones, las

observaciones 25 y 26 toman valor 3. Luego, M = 3 veces. En sntesis, para obtener la mediana en datos agrupados segn valores iguales se procede de la siguiente forma: 1) Se construye la frecuencia acumulada de las observaciones para cada valor de la variable. 2) Se identifica cul es la, o las, observaciones centrales. Para esto se puede utilizar la frmula PMED = (nmero de observaciones + 1) / 2. 3) Considerando las frecuencias acumuladas se determina que valor

corresponde a la, o las, observaciones centrales. Ese valor es la mediana de los valores dados. Mediana en datos agrupados en clases El clculo exacto de la mediana en datos agrupados en clases es relativamente complejo. Una aproximacin se obtiene de la siguiente forma. 1) Se construye la frecuencia acumulada de las observaciones para cada clase de la variable. 2) A partir de las frecuencias acumuladas se identifica cul es la clase que contiene la observacin que corresponde a [(nmero de observaciones) / 2]. Dicha clase la denominaremos clase mediana

16 PDF created with pdfFactory Pro trial version www.pdffactory.com

Fundamentos de Estadstica Descriptiva 3) La mediana ser igual al punto medio (o marca de clase) de la clase mediana.

Se ilustra este procedimiento a partir de los datos brindados en el Ejemplo 3, construyendo la siguiente tabla de trabajo.

CLASE 4.0 4.4 4.5 4.9 5.0 5.4 5.5 5.9 6.0 6.4 6.5 6.9 7.0 7.4

PUNTO MEDIO DE LA FRECUENCIA FRECUENCIA CLASE ACUMULADA ni

xi
4.2 4.7 5.2 5.7 6.2 6.7 7.2 2 9 15 29 40 69 10 174 = n 2 11 26 55 95 164 174

La observacin [(nmero de observaciones) / 2] corresponde a la observacin (174 / 2) = 87. Si hasta la clase de 5.5 a 5.9 hay acumuladas 55 observaciones, y hasta la clase de 6.0 a 6.4 hay acumuladas 95 observaciones, la observacin 87 estar en la clase de 6.0 a 6.4. Luego, la clase de 6.0 a 6.4 es la clase mediana, y la mediana ser igual a 6.2, valor del punto medio de la clase. Considerando la notacin y las unidades de medida empleadas, entonces, m = 6.2 millones de dlares. Moda

La moda es de las medidas de tendencia central, probablemente la menos utilizada. En una distribucin de valores puede no haber moda, o haber ms de una moda. Denotemos por Mo a la moda poblacional y por mo a la moda muestral.

17 PDF created with pdfFactory Pro trial version www.pdffactory.com

Fundamentos de Estadstica Descriptiva Moda en datos no agrupados En este tipo de datos la moda es el valor que ms se repite; el que est de moda. As, en el Ejemplo 1, mo = 20.5 decenas de publicaciones.

Moda en datos agrupados segn valores iguales En datos agrupados segn valores iguales, la moda es el valor con mayor frecuencia. En el Ejemplo 2, la moda es igual a 3 porque es el valor con mayor frecuencia absoluta. Empleando la notacin y las unidades de medida se dira que

Mo = 3 veces.
Moda en datos agrupados en clases En este tipo de presentacin de datos cuantitativos el clculo exacto de la moda puede resultar algo complicado. Una aproximacin se obtiene considerando el valor de la moda como el punto medio de la clase modal, entendiendo como tal la clase con mayor frecuencia absoluta. En el Ejemplo 3, la clase modal es la de 6.5 a 6.9 porque es la de mayor frecuencia absoluta. El punto medio de dicha clase es 6.7. Luego, mo = 6.7 millones de dlares. MEDIDAS DE DISPERSIN

Ante todo se ver porque son necesarias las medidas de dispersin. Asuma que se tiene dos poblaciones, A y B, cada una con 5 personas a las que se les pregunta cuntos hijos tienen, y se registran los siguientes resultados; A: 4, 3, 2, 1, 5
B: 3, 3, 3, 3, 3

Si para la poblacin A se calcula la media aritmtica se obtiene el valor 3 hijos, y la mediana es tambin igual a 3 hijos. Para la poblacin B, obviamente, la media aritmtica y la mediana son iguales a 3 hijos. Luego, si solamente contramos con estas medidas de resumen diramos que las poblaciones A y B son idnticas en cuanto a los hijos que tienen porque tienen igual media aritmtica e igual mediana. No obstante, si bien coinciden es sus medidas de tendencia central, difieren en su

18 PDF created with pdfFactory Pro trial version www.pdffactory.com

Fundamentos de Estadstica Descriptiva dispersin; los valores de la poblacin A son ms heterogneos (ms dispersos) que los de la poblacin B que son todos iguales. Por tanto, en los anlisis, a las medidas de tendencia central hay que incorporar las medidas de dispersin. Existen varias medidas de dispersin; de ellas, consideraremos el estudio del recorrido, la desviacin estndar y el coeficiente de variacin en los tres tipos de formas de presentacin de datos cuantitativos. Recorrido o Amplitud

Esta es la medida de dispersin ms sencilla que existe. La notacin a utilizar ser la siguiente: recorrido poblacional R y recorrido basado en una muestra r.

Recorrido en datos no agrupados Se calcula como el valor de la diferencia entre el valor mximo xMAX y el valor mnimo xMIN observados en la serie de valores. Luego, para la situacin dada de las poblaciones A y B previamente expuestas, los recorridos para ambas poblaciones seran las siguientes: Para A: R = xMAX - xMIN = 5 1 = 4 hijos Para B: R = xMAX - xMIN = 3 - 3 = 0 hijos Para los datos brindados en el Ejemplo 1 se tiene

r = xMAX - xMIN = 21.9 17.4 = 4.5 decenas de publicaciones


Recorrido en datos agrupados segn valores iguales De igual manera, en datos agrupados segn valores iguales el recorrido es la diferencia entre el valor mximo y mnimo registrados. As, para el Ejemplo 2 el recorrido ser igual a

R = xMAX - xMIN = 6 0 = 6 veces


Recorrido en datos agrupados en clases En esta forma de presentacin, el recorrido viene dado por la diferencia entre el valor del lmite superior de la ltima clase ( Lim
ltima SUP

) y el valor del lmite

19 PDF created with pdfFactory Pro trial version www.pdffactory.com

Fundamentos de Estadstica Descriptiva inferior de la primera clase (Lim


primera INF

). Luego, el recorrido de los valores

presentados en el Ejemplo 3 es igual a

r = Lim SUP ltima - Lim INF primera = 7.4 4.0 = 3.0 millones de dlares
Desviacin estndar o desviacin tpica

La desviacin estndar es una medida de dispersin ms compleja pero brinda ms informacin que el recorrido. La desviacin estndar poblacional la denotaremos por la letra griega sigma (),y la muestral por s. Desviacin estndar en datos no agrupados. La desviacin estndar poblacional se define como

= ( xi ) 2 / N
y la muestral como

s=

( x x)
i

/ n 1

A partir de las frmulas dadas se derivan otras relaciones que tambin se pueden emplear para calcular la desviacin estndar. Para el clculo de una u otra desviacin estndar con las frmulas previamente dadas, lo ms prctico es construir una tabla de trabajo como la que se presenta a continuacin utilizando los datos del Ejemplo 1. Recordemos que la media aritmtica ( x ) para esa muestra de 10 observaciones era 20.0 decenas de publicaciones.

Valores (xi) (xi - x ) (xi - x )2

18.2 -1.8 3.24

20.5 0.5 0.25

20.9 0.9 0.81

18.5 -1.5 2.25

21.9 1.9 3.61

20.5 0.5 0.25

17.4 -2.6 6.76

20.7 0.7 0.49

20.9 0.9 0.81

20.5 0.5

0.25 18.72

Observe que (xi - x ) = 0, lo cual es una propiedad, como previamente se mencion, de la media aritmtica. Entonces, el valor de la desviacin estndar del nmero de publicaciones de la muestra de 10 instituciones (n = 10) vendr dado por

20 PDF created with pdfFactory Pro trial version www.pdffactory.com

Fundamentos de Estadstica Descriptiva

s = ( xi x) 2 / n 1 =

18.72 / 9 =

2.08 = 1.44 decenas de publicaciones

Observe que si todas las observaciones tienen el mismo valor (como el nmero de hijos en la poblacin B anteriormente expuesta) ocurrir que toda diferencia

(xi - x ) ser igual a 0, y por tanto todo valor (xi - x )2 ser asimismo igual a 0, de
aqu que la desviacin estndar tomar el valor 0. Luego, los valores de la desviacin estndar pueden estar entre 0 y cualquier nmero positivo, y en tanto ms alto el valor, mayor es la variabilidad de las observaciones. Por ejemplo, si en otro grupo de instituciones cientficas la desviacin estndar del nmero de publicaciones en decenas fuera de 2.07, pudiera decirse que en estas instituciones la variabilidad (dispersin) del nmero de publicaciones entre las instituciones es mayor que en la muestra cuya desviacin estndar fue 1.44. No obstante, la interpretacin del valor de la desviacin estndar tiene sus limitaciones como se ver posteriormente.

Desviacin estndar en datos agrupados segn valores iguales La desviacin estndar poblacional en este tipo de presentacin de datos cuantitativos se define como

= ni ( xi ) 2 / N
y la muestral como

s=

n ( x x)
i i

/ n 1

donde, como en el caso del clculo de la media aritmtica, ni son las frecuencias observadas para cada valor xi de la variable cuantitativa.

Al igual que para el clculo en datos no agrupados, es recomendable construir una tabla de trabajo. Luego, la desviacin estndar del nmero de veces que la poblacin de 50 familias (N = 50) asiste a una consulta de orientacin familiar (Ejemplo 2) se calcula de la siguiente manera. Recuerde que la media aritmtica () era de 3.04 veces

21 PDF created with pdfFactory Pro trial version www.pdffactory.com

Fundamentos de Estadstica Descriptiva Valores 0 1 2 3 4 5 6 (xi) ni 4 6 8 12 10 6 4 -3.04 -2.04 -1.04 -0.04 0.96 1.96 2.96 (xi - ) 2 9.2416 4.1616 1.0816 0.0016 0.9216 3.8416 8.7616 (xi - ) ni (xi - )2 36.9664 24.9696 8.6528 0.0192 9.2160 23.0496 35.0494 137.92 Finalmente,

n (x )
i i

/ N = 137.92 / 50 =

2.7584 = 1.66 veces

Desviacin estndar en datos agrupados en clases El clculo en este tipo de presentacin es similar al caso anterior, excepto que - al igual que en el clculo de la media aritmtica - en este tipo de presentacin, cada clase se resume por su punto medio (xi). De esta manera, la desviacin estndar poblacional viene dada por la expresin

= ni ( xi ' ) 2 / N
mientras que la desviacin estndar muestral por

s = ni ( xi ' x) 2 / n 1
Se presenta a continuacin una tabla de trabajo similar a la anterior para los datos brindados en el Ejemplo 3, donde la media aritmtica de ganancia de la muestra de 174 empresas ( x ) result ser 6.18 millones de dlares.

Puntos medios (xi)

4.2 2 -1.98 3.9204

4.7 9 -1.48 2.1904

5.2 15 -0.98 0.9604

5.7 29 -0.48 0.2304

6.2 40 0.02 0.0004

6.7 80 0.52 0.2704

7.2 10 1.02 1.0404

ni (xi - x ) (xi - x )2 ni (xi - x )2


As,

7.8408 19.7136 14.4060 6.6816

0.0160 18.6578 10.4040 77.7196

s = ni ( xi ' x) 2 / n 1

77.7196 / 173 =

0.4492 = 0.670 millones de dlares

22 PDF created with pdfFactory Pro trial version www.pdffactory.com

Fundamentos de Estadstica Descriptiva

Coeficiente de variacin

Asuma que para 14 provincias de un pas se obtiene la siguiente informacin para cuatro indicadores: INDICADOR Tasa de mortalidad infantil (por 1000 nacidos vivos) Porcentaje de recin nacidos con bajo peso al nacer Porcentaje de poblacin con acceso a agua potable Esperanza de vida al nacer (aos) MEDIA DESVIACIN ARITMTICA ESTNDAR

()
9.31 7.62 90.6 73.2

()
1.23 1.21 9.61 1.45

Si nos preguntramos cul indicador es el que presenta mayor variabilidad entre las provincias?, responderamos, teniendo en cuenta el valor de la desviacin estndar, el porcentaje de poblacin con acceso a agua potable. No obstante, como se ver inmediatamente, el valor de la desviacin estndar (y de la media aritmtica) depende de las unidades de medida consideradas. Por ejemplo, si la tasa de mortalidad infantil se diera por 10000 nacidos vivos en lugar de por 1000 nacidos vivos, entonces la media aritmtica de la tasa fuera de 93.1 y la desviacin estndar 12.3. Entonces, esto convertira a la tasa de mortalidad infantil en el indicador con mayor variabilidad entre las provincias?: de manera alguna, porque la variabilidad depende del valor de las observaciones, y no de las unidades de medida utilizadas. Cmo solucionar el problema? Para medir la dispersin entre variables con diferentes unidades de medida se utiliza el coeficiente de variacin. Tanto para poblacin, como para muestras,

coeficiente de variacin = desviacin estndar / media aritmtica

23 PDF created with pdfFactory Pro trial version www.pdffactory.com

Fundamentos de Estadstica Descriptiva Si denotamos por V el coeficiente de variacin poblacional, y por v el muestral, y usando las notaciones previamente empleadas, se tendr que

V=/ y v=s/ x
El coeficiente de variacin resulta en un valor adimensional, o sea, no depende de las unidades de medida. Por ejemplo, si la tasa de mortalidad infantil se da por 1000 nacidos, el coeficiente de variacin para ese indicador es 1.23/9.31 igual a 0.132; y si fuera por 10000 nacidos vivos sera 12.3/93.1 tambin igual a 0.132. Los valores obtenidos del coeficiente de variacin para los cuatro indicadores se muestran a continuacin. INDICADOR Tasa de mortalidad infantil (por 1000 nacidos vivos) Porcentaje de recin nacidos con bajo peso al nacer Porcentaje de poblacin con acceso a agua potable Esperanza de vida al nacer (aos) MEDIA DESVIACIN COEFICIENTE ARITMTICA ESTNDAR DE VARIACIN

()
9.31 7.62 90.6 73.2

()
1.23 1.21 9.61 1.45

(V = / )
0.132 0.159 0.106 0.020

As, el indicador con mayor dispersin relativa se dice relativa porque se compara con otras es el porcentaje de recin nacidos con bajo peso al nacer, dado que es el que presenta mayor coeficiente de variacin. En sntesis, en tanto mayor es el valor del coeficiente de variacin, mayor es la dispersin relativa de la variable. En el cuadro sinptico 4 se resume lo expuesto sobre las medidas de tendencia central y las medidas de dispersin.

24 PDF created with pdfFactory Pro trial version www.pdffactory.com

Fundamentos de Estadstica Descriptiva


Cuadro sinptico 4 / Medidas de tendencia central y de dispersin datos no agrupados datos agrupados segn valores iguales datos agrupados en clases

MEDIDA Media aritmtica Mediana Moda

xi / N xi / n

ni xi / N

ni xi / N ni xi / n
Punto medio de la clase mediana Punto medio de la clase modal

x
M

ni xi / n
Valor central de los valores ordenados ascendentemente Valor con mayor frecuencia absoluta

Valor central de los valores ordenados m ascendentemente Mo Valor ms frecuente mo de la serie

Recorrido Desviacin estndar Coeficiente de variacin

R
r

xMAX - xMIN

xMAX - xMIN
/N

Lim SUP ltima Lim INF primera


2

s
V v

(x )
i

n (x )
i i

/N

( x x)
i

/ n 1

n ( x x)
i i

/ n 1

n ( x ' ) / N n ( x ' x) / n 1
2 i i
2 i i

s/ x

donde:

N n xi xi ni xMAX XMIN
Lim SUP ltima Lim INF primera

: nmero de observaciones en la poblacin : nmero de observaciones en la muestra : valor observado en datos no agrupados o agrupados segn valores iguales : punto medio de la clase : frecuencia absoluta en datos agrupados segn valores iguales o agrupados en clases : valor mximo observado en datos no agrupados o agrupados segn valores iguales : valor mnimo observado en datos no agrupados o agrupados segn valores iguales : lmite superior de la ltima clase : lmite inferior de la primera clase

Muchas de las medidas descriptivas para datos cuantitativos examinadas previamente son calculables a travs de programas computacionales especficos de tcnicas estadsticas, o mediante programas de uso ms general como Excel.. Seguidamente se presenta los resultados obtenidos mediante este programa para los datos del Ejemplo 1.

25 PDF created with pdfFactory Pro trial version www.pdffactory.com

Fundamentos de Estadstica Descriptiva


PUBLICACIONES Media Error tpico Mediana Moda Desviacin estndar Varianza de la muestra Curtosis Coeficiente de asimetra Rango Mnimo Mximo Suma Cuenta 20 0.45607017 20.5 20.5 1.44222051 2.08 -0.503819298 -0.821716336 4.5 17.4 21.9 200 10

De estos resultados se ha estudiado la Media (Media aritmtica), la Mediana, la Moda, la Desviacin estndar, y el Rango (Recorrido o Amplitud).

Compruebe la coincidencia de estos resultados con los obtenidos

previamente. Adicionalmente, esta salida de Excel nos informa que el valor mnimo observado es 17.4 y el mximo 21.9. El estudio de las restantes medidas escapa a los objetivos de este trabajo.

CMO SE PUEDE PRESENTAR LA INFORMACIN EN TABLAS Y GRFICOS?

Una manera adecuada de resumir los resultados de un sistema continuo de obtencin de informacin como los de un sistema estadstico de registro de nacimientos y defunciones o los encontrados en una investigacin, es a travs de tablas. Las tablas se emplean esencialmente con los siguientes propsitos: presentar una o ms distribuciones de frecuencias de variables tanto cualitativas como cuantitativas, presentar una serie cronolgica, y presentar valores asociados a indicadores o ndices. Cada uno de estos usos se muestra en las tablas 1, 2 y 3 que se presentarn. Una tabla, en general, debe contener las siguientes partes: IDENTIFICACIN Las tablas se numeran segn el orden de aparicin en el documento. TITULO Debe de ser corto e informar qu se presenta, a dnde pertenece la informacin, y a qu momento se refiere; es decir, qu?, dnde? y cundo?. Se excepta el dnde y/o el cundo si todas las tablas se refieren a un mismo lugar y/o a una misma fecha y esto est declarado en alguna parte del documento.

26 PDF created with pdfFactory Pro trial version www.pdffactory.com

Fundamentos de Estadstica Descriptiva

CUERPO DE LA TABLA Est compuesto por columnas y filas, con sus encabezamientos. El nmero de columnas y filas depende de las caractersticas de la tabla.

NOTAS EXPLICATIVAS Se emplean cuando se hace necesario aclarar algn aspecto contenido en la tabla.

FUENTE Se seala la fuente de la informacin que se presenta en la tabla. De ser un documento (libro, artculo de revista cientfica, informe de un organismo, por ejemplo) debe expresarse segn las normas de redaccin de estos documentos. Si la fuente de la informacin que se muestra en la tabla es la misma para todas las tablas, digamos el resultado de una encuesta que se realiz, es innecesario declarar en cada tabla, por ejemplo, FUENTE: Encuesta realizada.

Seguidamente se muestra algunos ejemplos de tablas.


Identificacin Ttulo

Cuerpo de la tabla

Notas explicativas Fuente

Tabla 1 PASES DE LAS AMRICAS SEGN PORCENTAJE DE POBLACIN CON ACCESO A AGUA POTABLE EN REGIONES SELECCIONADAS (a), 2002 PORCENTAJE DE POBLACIN REGIN ALFABETA TOTAL Ms de 90 80 a 90 Menos de 80 Istmo 7 0 0 7 Centroamericano Caribe Latino 4 0 1 5 rea Andina 1 4 0 5 Cono Sur 2 1 0 3 Caribe No Latino 14 1 1 16 TOTAL 28 6 2 36 NOTAS; (a) Se excluye Mxico y Brasil y los pases para los que no se dispone de informacin. FUENTE: Organizacin Panamericana de la Salud. Indicadores bsicos 2005. Washington, D.C.: OPS; 2005.

27 PDF created with pdfFactory Pro trial version www.pdffactory.com

Fundamentos de Estadstica Descriptiva

Tabla 2 Tasa de matrcula en el primer nivel de enseanza


Repblica Bolivariana de Venezuela / 1995-2001

Ao Tasa (%)
FUENTE :

1995 19.2

1996 22.3

1997 ...

1998 48.0

1999 51.1

2000 55.3

2001 57.9

Comisin Econmica para Amrica Latina y el Caribe. Anuario Estadstico 2005, [on line] http://www.eclac.org( [Fecha de acceso: 05/03/07], Cuadro 34.

Tabla 3 ESPERANZA DE VIDA AL NACER PASES SELECCIONADOS DE AMRICA LATINA Y EL CARIBE; 2004 PAIS ESPERANZA DE VIDA AL NACER Argentina 74.6 Bolivia 64.4 Brasil 70.8 Chile 78.1 Colombia 72.6 Costa Rica 78.3 Cuba 77.6 Ecuador 74.5 Guatemala 67.6 Hait 52.0 Venezuela (Rep. Bolivariana) 73.0
FUENTE: Programa de las Naciones Unidas para el Desarrollo. Informe sobre desarrollo humano 2006. Madrid: Ediciones Mundi-Prensa; 2006. Cuadro 1

Como se aprecia, hay diversos estillos para presentar las tablas, pero todos ellos responden a las exigencias que debe tener una tabla estadstica. Entre los errores ms frecuentes en la construccin de una tabla se encuentran los siguientes: Tablas sin identificar Tablas sin ttulos, Ttulos en extremo extensos, respondiendo o no a las preguntas que debe responder, o que no responden a las preguntas bsicas. Tablas sumamente complejas de interpretar. Encabezamiento inadecuado de filas y/o columnas. Errores de clculo, incluyendo el cuadre de los totales. Tablas que presentan slo porcentajes, lo que dificulta el anlisis. Uso inadecuado de smbolos.

28 PDF created with pdfFactory Pro trial version www.pdffactory.com

Fundamentos de Estadstica Descriptiva Tablas con defecto o exceso de notas aclaratorias, y notas aclaratorias que nada aclaran. Tablas sin fuente cuando son necesarias, o con la fuente sealada, siendo la fuente el mismo trabajo. Otra forma de presentar la informacin es en grficos. El objetivo bsico de un grfico es transmitir una informacin que pueda ser captada con rapidez, de un golpe de vista, por el lector. Un grfico debe, en general, estar compuesto por las siguientes partes: IDENTIFICACIN Los grficos se numeran segn el orden de aparicin en el documento. TITULO Tiene las mismas caractersticas que el ttulo de una tabla. EL GRAFICO EN SI LEYENDA Se utiliza cuando se emplean smbolos en el grafico. FUENTE Se seala la fuente de la informacin que se presenta en el grfico, que puede ser una tabla del mismo trabajo o un documento. El cuadro sinptico 5 muestra el empleo de los grficos de uso ms frecuente.
Cuadro sinptico 5 / Uso de los grficos fundamentales Tipo de dato QU SE DESEA REPRESENTAR? Cuantitativo Cualitativo Discreto Continuo Serie cronolgica AS AS Distribucin de frecuencias absolutas BS BS Frecuencias observadas en una tabla de dos BM BM o ms criterios de clasificacin istribuciones porcentuales BC , P BC , P Relacin entre dos variables D D AS. Aritmtico simple ; BS; Barras simples ; BM: Barras mltiples ; BC: Barras compuestas ; P Pastel ; D : Dispersin

29 PDF created with pdfFactory Pro trial version www.pdffactory.com

Fundamentos de Estadstica Descriptiva Seguidamente se presenta un ejemplo de cada uno de los seis tipos de grficos mencionados. Algunos se basan en informacin presentada en las tablas previamente expuestas. GRFICO ARITMTICO SIMPLE

El grfico aritmtico simple se utiliza para representar series cronolgicas. Por serie cronolgica, tambin llamada serie histrica, o serie de tiempo, se puede entender un conjunto de valores de una misma variable cuantitativa, o indicador, relativos a un mismo evento en un determinado lugar asociados a unidades de tiempo equidistantes.
Grfico 7

Mortalidad infantil y mortalidad de menores de 5 aos Cuba, 1990 - 2005


16.0 Tasa por 1000 nacidos vivos 14.0 12.0 10.0 8.0 6.0 4.0 2.0 0.0
1990 1992 1994 1996 1998 2000 2002 2004 2006

MORT. INF.

MORT. MENOR 5

FUENTE: Ministerio de Salud Pblica, Direccin Nacional de Estadstica. Anuario Estadstico de Salud 2005, cuadro 21. La Habana: MINSAP; 2006.

GRFICO DE BARRAS SIMPLES

El grfico de barras simples se emplea para representar la distribucin de frecuencias de una variable cualitativa o cuantitativa discreta. Las barras pueden ser horizontales o verticales. Tambin se utiliza para representar valores de un indicador como se ilustra en el siguiente grfico.

30 PDF created with pdfFactory Pro trial version www.pdffactory.com

Fundamentos de Estadstica Descriptiva

Grfico 3

ESPERANZA DE VIDA AL NACER Pases seleccionados de Amrica Latina y el Caribe; 2004


Costa Rica Chile Cuba Argentina Ecuador Venezuela (R.B.) Colombia Brasil Guatemala Bolivia Hait 0 10 20 30 40 50 60 70 80

FUENTE: Tabla 3

GRFICO DE BARRAS MLTIPLES

El grfico de barras mltiples se utiliza para mostrar la distribucin conjunta de dos o ms variables como las que se presentan en tablas de dos o ms entradas, como la Tabla 1, por ejemplo.
Grfico 12

PORCENTAJE DE POBLACIN CON ACCESO A AGUA POTABLE EN PASES DEL CARIBE LATINO Y NO LATINO
Nmero de pases 14

12 10 8 6 4 2 0

CARIBE LATINO CARIBE NO LATINO

Menos de 80

80 a 89

Ms de 90 %

FUENTE: Tabla 1

31 PDF created with pdfFactory Pro trial version www.pdffactory.com

Fundamentos de Estadstica Descriptiva GRFICO DE BARRAS COMPUESTAS

El grfico de barras compuestas se emplea, como se ilustra en el siguiente grfico, para mostrar simultneamente varias distribuciones porcentuales.
Grfico 16

DISTRIBUCIN PORCENTUAL DE LAS PRINCIPALES CAUSAS DE MUERTE SEGN SEXO / Estado de Mayoguacn, 2006.
MASCULINO FEMENINO

100% 90% 80% 70% 60% 50% 40% 30% 20% 10% 0%

ECz : Enfermedades del corazn TM : Tumores malignos ECb: Enfermedad cerebrovascular IN : Influenza y neumona Acc : Accidentes

FUENTE: Oficina de Estadstica. Anuario Demogrfico 2006. Mayoguacn: OE; 2006.

ECz

TM

ECb

IN

Acc

GRFICO DE PASTEL
Grfico 12 Distribucin porcentual de los pases de Amrica Latina y el Caribe segn porcentaje de poblacin con acceso a agua potable / 2002
menos de 80 % 80 % a 90% ms de 90%

FUENTE: Tabla 1

32 PDF created with pdfFactory Pro trial version www.pdffactory.com

Fundamentos de Estadstica Descriptiva Se emplea este grfico para mostrar una distribucin porcentual, como se ve en el grfico anterior. Asimismo, varias distribuciones porcentuales pueden presentarse con diversos grficos de pastel mostrados simultneamente. GRFICO DE DISPERSIN

Este grfico, tambin llamado de correlacin, permite establecer la relacin entre dos variables cuantitativas. En este grfico cada punto representa una unidad de observacin con los valores correspondientes al eje vertical (Y) y al eje horizontal (X). Asuma que en 25 regiones de un cierto pas, llammosle Repblica Federativa de Estunia, se aplic un Indice de Acceso a Agua Potable y Saneamiento que puede adoptar valores entre 0 y 100, ms alto en tanto mejor es la situacin del acceso a agua potable y a saneamiento, y se conoce el valor de la mortalidad infantil para cada regin. Los resultados se muestran en el siguiente grfico de dispersin.
Grfico 23

INDICE CONJUNTO DE ACCESO A AGUA POTABLE Y SANEAMIENTO, Y MORTALIDAD INFANTIL (a) EN 25 REGIONES, R. F. ESTUNIA, 2006
60.0 55.0 MORTALIDAD INFANTIL 50.0 45.0 40.0 35.0 30.0 25.0 20.0 30.0

40.0

50.0

60.0 INDICE

70.0

80.0

90.0

NOTA: (a) Tasa por 1000 nacidos vivos FUENTE: Oficina de Estadstica de la R.F. de Estunia. Anuario Estadstico 2006, cuadros 13 y 34. (en imprenta)

Cuando se obtiene una distribucin de puntos como la mostrada, se dice que existe una correlacin negativa entre las variables, dado que en tanto el valor en eje X (en este caso el Indice) aumenta, disminuye el valor de la variable

33 PDF created with pdfFactory Pro trial version www.pdffactory.com

Fundamentos de Estadstica Descriptiva representada en el eje Y (la tasa de mortalidad infantil en este ejemplo). Es decir, en estas 25 regiones se observa que, como tendencia, en tanto aumenta el Indice de Acceso a Agua Potable y Saneamiento, disminuye la mortalidad infantil. Si se observara una disposicin de puntos como la del grfico a la derecha, se dice que existe una correlacin positiva, dado que en tanto el valor en el eje X aumenta, tambin aumenta el valor en el eje Y. Por ejemplo, para un conjunto de empresas X Y

agropecuarias, X pudiera ser la productividad del trabajo y Y la ganancia de la empresa. Existen otros grficos; aqu slo se han mostrado los ms sencillos, y, probablemente, los ms utilizados. A su vez, para todos los grficos presentados hay distintas alternativas de diseo. Por ejemplo, en todos los grficos de barras, stas se pueden representar en colores, en lugar de en tramas como se ha hecho. Al igual que en la elaboracin de tablas, se identifican errores en la confeccin de grficos. Los principales son los siguientes: Inventar nuevos grficos, en lugar de utilizar, para un propsito definido, los ya existentes. Uso de grficos inadecuados dado lo que se desea representar. Grficos sin identificar. Grficos sin ttulos, o ttulos incorrectos. Grficos con una desproporcin notable entre la longitud de sus ejes. Omisin en la identificacin de los ejes (excepto cuando es obvio). Omisin en las unidades de medida utilizadas. Omisin de leyendas cuando se han utilizado smbolos. Grficos sobrecargados en extremo difciles de interpretar.

34 PDF created with pdfFactory Pro trial version www.pdffactory.com

Fundamentos de Estadstica Descriptiva


q

CUL ES EL PAPEL DE LOS INDICADORES EN EL ANALISIS ESTADSTICO?

Entre otras formas, se ha definido un indicador como un instrumento de medicin construido tericamente para ser aplicado a un conjunto de unidades de anlisis con el propsito de producir un nmero que cuantifica algn concepto asociado a ese colectivo. La anterior definicin subraya que el indicador es un instrumento para medir, como puede ser un termmetro, que es una construccin terica, que resulta en un nmero o sea, todo indicador es cuantitativo - y lo que pudiera ser ms importante, cuantifica un concepto. Luego, antes de medir algo, ese algo tiene que estar definido. Digamos, no se debe construir un indicador de progreso cientfico-tcnico, sin que previamente se haya definido qu es el progreso cientfico-tcnico. En ocasiones no est suficientemente claro de que todo indicador sea cuantitativo. Ello se debe a que se confunde indicador con variable. El ingreso de un ncleo familiar es una variable cuantitativa, y tambin es cuantitativo el indicador promedio de ingreso de los ncleos familiares del municipio Libertador; el estado civil de una persona es una variable cualitativa, pero el indicador porcentaje de personas casadas entre los estudiantes universitarios es cuantitativo. A su vez, se define habitualmente un ndice, como un macroindicador que resume, dadas ciertas ponderaciones, indicadores simples, de aqu que se hable de ndices sintticos. Ejemplo de ndice de este tipo es el Indice de Desarrollo Humano (IDH) propuesto por el Programa de las Naciones Unidas para el Desarrollo Humano (PNUD) desde 1990, y conformado, como posteriormente se ver, por varios indicadores. En otras ocasiones, el trmino ndice se utiliza simplemente como sustituto de indicador, frecuentemente cuando su clculo entraa cierta complejidad. Existen indicadores para cuantificar diversos aspectos del desarrollo econmico, del desarrollo social e, integralmente, del desarrollo humano. En el cuadro

35 PDF created with pdfFactory Pro trial version www.pdffactory.com

Fundamentos de Estadstica Descriptiva sinptico 6 se muestra una clasificacin de los indicadores segn reas y esferas del desarrollo.
Cuadro sinptico 6. Clasificacin de los indicadores e ndices segn reas y esferas del desarrollo AREA ESFERA Desarrollo econmico Crecimiento econmico Desigualdad en el desarrollo econmico Pobreza Nivel de educacin Recursos para la educacin Estado de salud de la poblacin Recursos para la salud Seguridad alimentaria Acceso a servicios bsicos Acceso a fuentes energticas Acceso a las comunicaciones Conservacin del medio ambiente Desarrollo cientfico y tcnico Equidad de gnero Equidad rural-urbana Ambiente demogrfico Desarrollo humano a escala de pases Aspectos particulares del desarrollo humano

Desarrollo social

Desarrollo humano

En el cuadro sinptico 7 se presentan los indicadores e ndices que sern considerados en esta discusin. Posteriormente se definir cada uno de ellos, excepto los de obvia interpretacin.
Cuadro sinptico 7. Principales indicadores e ndices segn esfera ESFERA Crecimiento econmico Desigualdad en el desarrollo econmico Pobreza Nivel de educacin INDICADOR Producto Interno Bruto per capita ajustado a paridades de poder adquisitivo Coeficiente Gini Porcentaje de poblacin viviendo con menos de $1 diario Porcentaje de poblacin viviendo por debajo de la lnea de pobreza nacional Tasa de alfabetizacin en adultos (%)

36 PDF created with pdfFactory Pro trial version www.pdffactory.com

Fundamentos de Estadstica Descriptiva


Recursos para la educacin Estado de salud de la poblacin Recursos para la salud Seguridad alimentaria Acceso a servicios bsicos Acceso a fuentes energticas Acceso a las comunicaciones Conservacin del medio ambiente Desarrollo cientfico y tcnico Equidad de gnero Equidad rural-urbana Ambiente demogrfico Gasto pblico en educacin (% del PIB) Relacin alumno-maestro en la enseanza primaria Esperanza de vida al nacer Tasa de mortalidad infantil (por 1000 nacidos vivos) Tasa de mortalidad de menores de 5 aos (por 1000 nacidos vivos) Razn de mortalidad materna (por 100000 nacidos vivos) Gasto pblico en salud (% del PIB) Mdicos (por 10000 habitantes) Disponibilidad diaria de caloras per capita Indice de bajo peso al nacer Poblacin con acceso a fuentes mejoradas de abastecimiento de agua (%) Poblacin con acceso a fuentes mejoradas de servicio de saneamiento (%) Consumo de electricidad per capita (kilovatioshora) Lneas telefnicas instaladas (por 1000 habitantes) PIB por unidad de uso de energa Cambio porcentual promedio anual de superficie de bosques Indice de Adelanto Tecnolgico Indice de Creacin de Capacidades de Ciencia y Tecnologa Paridad mujer-hombre respecto a la tasa de alfabetizacin en poblacin de 15 y ms aos Mujeres en el Parlamento (% del total de parlamentarios) Paridad mujer-hombre respecto a la participacin en el Parlamento (%) Paridad rural-urbana respecto al acceso a fuentes mejoradas de abastecimiento de agua (%) Paridad rural-urbana respecto al acceso a fuentes mejoradas de servicio de saneamiento (%) Tasa de crecimiento anual de la poblacin (por 1000 habitantes) Tasa bruta de natalidad (por 1000 habitantes) Tasa global de fecundidad Indice de urbanizacin

37 PDF created with pdfFactory Pro trial version www.pdffactory.com

Fundamentos de Estadstica Descriptiva


Desarrollo humano a escala de pases Aspectos particulares del desarrollo humano Indice de Desarrollo Humano Indice de Desarrollo Humano y Equidad Indice de Eficiencia Relativa del Recurso Econmico en el Desarrollo Econmico Indice de Pobreza Humana para los pases en desarrollo Indice de Desarrollo de Gnero Indice de Potenciacin de Gnero

La cuantificacin sinttica del crecimiento econmico es un problema complejo. Habitualmente se mide a travs del Producto Interno Bruto (PIB) que es el valor total de mercado de todos los bienes finales (bienes que han sido adquiridos para un uso final y no para reventa o para posterior procesamiento o elaboracin) y servicios producidos en una economa durante un ao. Dividido entre el tamao de la poblacin genera el PIB per capita. Sin embargo, el PIB es incapaz de reflejar los logros sociales de un pas, o la desigual distribucin de la riqueza, o el bienestar y el desarrollo humano integral de una sociedad, pues, entre otras insuficiencias, subestima los consumos gratuitos y subsidiados en particular en los servicios de salud y de educacin brindados en el pas. Por ello, en muchos pases se calcula el PIB per capita ajustado a paridades de poder adquisitivo (PIB per capita PPA) que refleja ms objetivamente el poder de compra de la moneda del pas. Esta medida es el PIB per capita convertido a dlares de Estados Unidos sobre la base de la paridad de poder adquisitivo de la moneda de ese pas, entendiendo por paridad de poder adquisitivo el nmero de unidades de moneda de ese pas necesarias para adquirir la misma canasta representativa de bienes y servicios que un dlar de Estados Unidos (moneda de referencia) adquirira en los Estados Unidos (o una canasta similar de bienes y servicios). El Coeficiente Gini mide el grado en que la distribucin del ingreso (o del consumo) entre los individuos u hogares de un pas se desva con respecto a una distribucin con perfecta igualdad. Puede adoptar valores entre 0 y 1, o entre 0 y 100, ms alto en cuanto mayor es la desigualdad de la distribucin.

38 PDF created with pdfFactory Pro trial version www.pdffactory.com

Fundamentos de Estadstica Descriptiva En el quincuagsimo quinto perodo de sesiones de la Asamblea General de Naciones Unidas, celebrada en septiembre del 2000, representantes de 189 pases apoyaron la conocida como Declaracin del Milenio de Naciones Unidas en la que se enunciaban los principios y valores que deban regir las relaciones internacionales en el presente siglo. Los ocho objetivos del rea de desarrollo y erradicacin de la pobreza derivados de la Declaracin del Milenio se han dado en denominar Objetivos de Desarrollo del Milenio (ODM), y para cada uno de esos objetivos se han establecido metas que deben cumplirse en el ao 2015 que son evaluadas travs de indicadores. El primero de esos objetivos es erradicar la pobreza extrema y el hambre, y una de sus metas es reducir a la mitad entre 1990 y 2015 el porcentaje de personas con ingresos inferios a $1 diario. Otra manera de cuantificar el nivel de pobreza de un pas es a travs del porcentaje de poblacin que vive por debajo de la lnea de pobreza nacional. La lnea de pobreza se define como el ingreso mnimo necesario para que una persona o un hogar satisfagan sus necesidades bsicas y clasifican como pobres aquellos que no alcancen este ingreso. Esta lnea se define para cada pas y para diferentes momentos. La tasa de alfabetizacin en adultos es un indicador frecuentemente empleado para medir el nivel de educacin de una poblacin. Cuantifica qu porcentaje de la poblacin (habitualmente de 15 aos y ms) se encuentra alfabetizada. El gasto pblico en educacin como parte del PIB (o por habitante) refleja el compromiso del Estado por la educacin de la poblacin. Este indicador y la relacin alumno-maestro en la enseanza primaria son habitualmente empleados como medida de los recursos para la educacin. La esperanza de vida al nacer es, probablemente, el mejor indicador del estado de salud de la poblacin, porque sintetiza todos los riesgos de mortalidad a los que est expuesta la poblacin. Es el nmero de aos que se espera viva una persona al nacer de mantenerse los patrones de mortalidad existentes al momento del nacimiento. La tasa de mortalidad infantil es un indicador del riesgo a morir 39 PDF created with pdfFactory Pro trial version www.pdffactory.com

Fundamentos de Estadstica Descriptiva en el primer ao de vida. Se obtiene como el nmero de defunciones ocurridas en menores de 1 ao por cada 1000 nacidos vivos en un cierto territorio y en un determinado perodo. Un indicador del riesgo a fallecer en los primeros 5 aos de vida es la tasa de mortalidad de menores de 5 aos calculada como el nmero de defunciones en menores de 5 aos por cada 1000 nacidos vivos en un determinado territorio y en un cierto perodo. UNICEF considera esta tasa como el principal indicador del estado de los nios. Tanto la tasa de mortalidad infantil como la de menores de 5 aos son indicadores utilizados para medir el cumplimiento de otro de los ODM (el cuarto) de reducir la mortalidad infantil. La razn de mortalidad materna contribuye a medir el riesgo de una mujer de fallecer consecuencia del embarazo, el parto o el puerperio, y es uno de los indicadores considerados para evaluar el cumplimiento del ODM de mejorar la salud materna. As como en lo que respecta al gasto en educacin, el gasto pblico en salud como porcentaje del PIB traduce el inters del Estado por la atencin en salud de sus ciudadanos. El nmero de mdicos por 10000 habitantes es usualmente utilizado tambin como indicador de recursos en salud. La disponibilidad diaria de caloras per capita y el indice de bajo peso al nacer, calculado como el porcentaje de recin nacidos con peso inferior a los 2500 gramos, son dos indicadores trazadores de la seguridad alimentaria de la poblacin. El porcentaje de poblacin con acceso a fuentes mejoradas de

abastecimiento de agua y el porcentaje de poblacin con acceso a fuentes mejoradas de servicio de saneamiento cuantifican que parte de la poblacin accede a estos servicios bsicos. El UNICEF ha considerado que la carencia de agua potable y de sistemas seguros de saneamiento marca una de las ms importantes lneas divisorias entre quienes viven en condiciones de pobreza absoluta y el resto de la humanidad

40 PDF created with pdfFactory Pro trial version www.pdffactory.com

Fundamentos de Estadstica Descriptiva Garantizar la sostenibilidad del medio ambiente es otro de los objetivos del ODM. Uno de los indicadores empleados para evaluar el cumplimiento de este objetivo es el PIB por unidad de uso de energa (2000 PPA en US$ por kg equivalente de petrleo), medida que proporciona una medida de la eficiencia energtica Otro indicador que contribuye a medir el desarrollo ambiental es el cambio porcentual promedio anual de superficie de bosques que mide el incremento, o reduccin, de la superficie de bosques de un pas.

La medicin del desarrollo cientfico y tecnolgico, y las comparaciones internacionales al respecto, son complejas, por al menos las siguientes razones: i) las diferentes formas de concebir el desarrollo de la ciencia y el desarrollo tecnolgico en funcin, entre otros aspectos, del nivel de desarrollo de los pases en estas esferas; ii)el carcter intangible, cualitativo, que presentan tanto el desarrollo cientfico, como el desarrollo de la tecnologa; iii) el grado de apertura y relacin recproca del desarrollo cientfico-tecnolgico y las restantes variables del contexto socioeconmico, incluidas las que caracterizan el desarrollo humano, y iv) la falta de comparabilidad internacional de los indicadores utilizados. En el Informe sobre Desarrollo Humano 2001 elaborado para el PNUD se introdujo el Indice de Adelanto Tecnolgico (IAT) que trata de reflejar en qu medida un pas est creciendo y difundiendo la tecnologa y construyendo una base de conocimientos humanos, y, por ende, su capacidad para tomar parte en las innovaciones de la era de las redes. El IAT est conformado por cuatro dimensiones (creacin de tecnologa, difusin de innovaciones recientes, difusin de antiguas invenciones y conocimientos especializados), cada una de las cuales est representada en el ndice por dos indicadores. En un informe preparado para el Banco Mundial por la institucin RAND en el cual se aborda, entre otras cuestiones, las tendencias de la colaboracin en ciencia y tecnologa entre pases desarrollados y subdesarrollados, y las implicaciones de estas actividades para la generacin de capacidad de ciencia y tecnologa en los pases subdesarrollados, se introduce el Indice de Creacin de Capacidades de

41 PDF created with pdfFactory Pro trial version www.pdffactory.com

Fundamentos de Estadstica Descriptiva Ciencia y Tecnologa en el que son considerados siete aspectos ponderados de acuerdo a una cierta metdica, El ndice puede tomar valores positivos y negativos y los pases se clasifican en cuatro categoras segn su posicin respecto a la media internacional: cientficamente de avanzada, cientficamente adelantados, en desarrollo y cientficamente atrasados. La igualdad entre mujeres y hombres es una meta de los organismos internacionales y de los hombres y mujeres de pensamiento ms avanzado. En particular, promover la igualdad de gnero y la autonoma de la mujer constituye uno de los ODM. La paridad mujer-hombre respecto a la tasa de alfabetizacin en la poblacin de 15 y ms aos - concebida como el porcentaje de la tasa de alfabetizacin de la mujer respecto a la del hombre es, por tanto, un indicador de equidad de gnero, como lo es el porcentaje de mujeres en el parlamento respecto al total de parlamentarios y la paridad mujer-hombre respecto a la participacin en el parlamento. Tanto la paridad rural-urbana respecto al acceso a a fuentes mejoradas de abastecimiento de agua como la paridad rural-urbana respecto al acceso a a fuentes mejoradas de servicio de saneamiento cuantifican la equidad ruralurbana respecto al acceso a dos servicios bsicos. Existen mltiples indicadores que conforman el ambiente demogrfico de un pas. La tasa de crecimiento anual de la poblacin es el promedio de la tasa anual de crecimiento exponencial en un determinado perodo, la tasa bruta de natalidad cuantifica el nmero de nacimientos ocurridos por cada 1000 habitantes de la poblacin, la tasa global de fecundidad se interpreta como el nmero de hijos promedio que tendra cada miembro de una cohorte hipottica de mujeres que cumplieran las dos condiciones siguientes: durante el perodo frtil tuvieran sus hijos de acuerdo con las tasas de fecundidad por edad de la poblacin en estudio, y no tuvieran expuestas al riesgo de la mortalidad antes del trmino del perodo frtil, y el Indice de urbanidad que no es ms que el porcentaje que representa la poblacin viviendo en zonas urbanas respecto al total de la poblacin.

42 PDF created with pdfFactory Pro trial version www.pdffactory.com

Fundamentos de Estadstica Descriptiva

El ndice estrella de los Informes sobre Desarrollo Humano elaborados para el PNUD a los efectos de cuantificar el desarrollo humano, tal como est concebido, es el Indice de Desarrollo Humano (IDH) introducido en el primer informe sobre desarrollo humano en 1990 y cuyo diseo se ha ido modificando en sucesivos Informes anuales. El ndice mide, de acuerdo a los redactores de los Informes, el desarrollo humano en forma integral al contemplar las dimensiones de longevidad, conocimientos e ingreso, y se considera como una medida de la capacidad de la gente para lograr vidas sanas, comunicarse y participar en las actividades de la comunidad y contar con recursos suficientes para conseguir un nivel de vida razonable. Cada una de las dimensiones consideradas en el IDH se han cuantificado a travs de ndices sustentados en indicadores que no han sido siempre los mismos en las diversas oportunidades en que se ha calculado. El ndice puede adoptar valores entre 0 y 1, ms alto en tanto mayor es el desarrollo humano segn la concepcin de este paradigma. El ndice no ha estado exento de crticas, tanto del aspecto conceptual involucrado en el ndice, como en torno a su diseo, y diversos autores han realizado propuestas alternativas de ndices sintticos de medicin del desarrollo humano. Se ha sugerido el Indice de Desarrollo Humano y Equidad (IDHE) como indicador de eficacia en el logro del desarrollo humano. El ndice est integrado por 11 indicadores vinculados a tres componentes: el logro en reas relevantes del desarrollo humano, la equidad de grupos humanos al interior del pas, y el impacto del ingreso en el desarrollo humano. El IDHE contempla las dimensiones consideradas en el IDH (desarrollo econmico, nivel de educacin y estado de salud) e incorpora otras dimensiones igualmente relevantes del desarrollo humano no consideradas en el IDH. Puede adoptar valores en el intervalo de 0 a 1, ms alto en tanto mayor es el desarrollo humano relativo, asociado a equidad, en el universo de pases considerados. Un resultado contrastante entre el IDH y el IDHE es el peso que tiene el recurso econmico cuantificado por el PIB per capita ajustado a PPA en los ndices. El 43 PDF created with pdfFactory Pro trial version www.pdffactory.com

Fundamentos de Estadstica Descriptiva recurso econmico tiene mucho menos peso en el IDHE que en el IDH. Mientras cerca del 85% de los cambios en el IDH se explican por las variaciones del PIB per capita ajustado a PPA, el efecto de este indicador en el IDHE se reduce al 57%; es decir, vez y media menos que en el IDH. Luego, el IDHE pareciera aproximarse ms a una medicin integral del desarrollo humano que el IDH, aislando pero no ignorando el efecto del recurso econmico en este desarrollo. Para el clculo del Indice de Eficiencia Relativa del Recurso Econmico en el Desarrollo Humano se parte de obtener la ecuacin de ajuste del indicador de resultado (el IDHE) en funcin del indicador de recurso, y, basado en las distancias de los valores observados con respecto a los esperados de acuerdo a la funcin obtenida, se calcula el ndice, que puede adoptar valores entre 1 y 1, el primer valor denotando la mayor eficiencia relativa negativa (o la mayor ineficiencia relativa) y 1 la mayor eficiencia relativa positiva.

En el Informe sobre Desarrollo Humano 1997 se introdujo el concepto de pobreza humana. Los autores consideran que si el desarrollo humano consiste en ampliar las opciones, la pobreza significa que se deniegan las oportunidades y las opciones ms fundamentales del desarrollo humano: vivir una vida larga, sana y creativa y disfrutar de un nivel decente de vida, libertad, dignidad, respeto por si mismo y de los dems Se procura medir la pobreza humana de los pases en desarrollo mediante el Indice de Pobreza Humana (IPH-1) y se basa en la privacin de la longevidad, los conocimientos y un nivel de vida decente. El ndice puede tomar valores desde 0%, ms alto en tanto es mayor la pobreza humana. Ente los indicadores empleados para evaluar aspectos particulares del desarrollo humano se encuentran el Indice de Desarrollo de Gnero (IDG) y el Indice de Potenciacin de Gnero (IPG). El Indice de Desarrollo de Gnero introducido en el Informe sobre Desarrollo Humano de 1995 se propone cuantificar el grado de adelanto en el desarrollo humano igual que el IDH -, pero incorpora la desigualdad entre la mujer y el hombre en cuanto al grado de este adelanto. Un valor de 1 en este ndice (mximo posible) refleja el adelanto mximo, con

44 PDF created with pdfFactory Pro trial version www.pdffactory.com

Fundamentos de Estadstica Descriptiva igualdad perfecta entre hombres y mujeres. En el mismo Informe de 1995 se incorpora el Indice de Potenciacin de Gnero que pretende medir la desigualdad de gnero en las esferas claves de la participacin econmica y poltica, y en la toma de decisiones.

En la tabla 1 se muestran los valores para la Repblica Bolivariana de Venezuela y para Amrica Latina y el Caribe de los indicadores e ndices relacionados en el cuadro sinptico 7 y previamente examinados.
TABLA 1

VALORES PARA LA REPUBLICA BOLIVARIANA DE VENEZUELA (RBV) Y PARA AMERICA LATINA Y EL CARIBE (ALC) DE INDICADORES E INDICES FUNDAMENTALES
INDICADOR Producto Interno Bruto (PIB) per capita ajustado a paridades de poder adquisitivo Coeficiente Gini Porcentaje de poblacin viviendo por debajo de la lnea de pobreza ($1 diario) Porcentaje de poblacin viviendo por debajo de la lnea de pobreza nacional Tasa de alfabetizacin en adultos (%) Gasto pblico en educacin (% del PIB) Relacin alumno-maestro en la enseanza primaria Esperanza de vida al nacer Tasa de mortalidad infantil (por 1000 nacidos vivos) Tasa de mortalidad de menores de 5 aos (por 1000 nacidos vivos) Razn de mortalidad materna (por 100000 nacidos vivos) Gasto pblico en salud (% del PIB) Mdicos (por 10000 habitantes) Disponibilidad diaria de caloras per capita Indice de bajo peso al nacer VALOR PARA RBV (a) ALC (b) 6043 7964 44.1 8.3 31.3 93.0 5.2 23 73,0 18.5 28.0 57.8 2.0 20.0 2336 8.7 51.5 (21) 13.0 (22) 33.3 (19) 90.2 ... 24 (d) 72.2 24.2 33.1 94.5 3.5 (23) 18.3 2843 8.8 FECHA (c) 2004 2000 1990-2004 uad 1990-2003 uad 2004 1994 1994 2004 2003 2004 2003 2003-2004 uad c 2001 2002 2000-2004 uad FUENTE (1) (2) (3) (3) (1) (4) (5) (1) (6) (6) (6) (7) (6) (6) (6)

45 PDF created with pdfFactory Pro trial version www.pdffactory.com

Fundamentos de Estadstica Descriptiva


INDICADOR Poblacin con acceso a fuentes mejoradas de abastecimiento de agua (%) Poblacin con acceso a fuentes mejoradas de servicio de saneamiento (%) Consumo de electricidad per capita (kilovatios-hora) Lneas telefnicas instaladas (por 1000 habitantes) PIB por unidad de uso de energa (2000 PPA en US$ por kg equivalente de petrleo) Cambio porcentual promedio anual de superficie de bosques Indice de Adelanto Tecnolgico Indice de Creacin de Capacidades de Ciencia y Tecnologa Paridad rban-hombre respecto a la tasa de alfabetizacin en poblacin de 15 y ms aos (%) Mujeres en el parlamento (% del total de parlamentarios) Paridad rban-hombre respecto a la participacin en el parlamento (%) Paridad rural-urbana respecto al acceso a fuentes mejoradas de abastecimiento de agua (%) Paridad rural-urbana respecto al acceso a fuentes mejoradas de servicio de saneamiento (%) Tasa de crecimiento anual de la poblacin (por 1000 habitantes) Tasa bruta de natalidad (por 1000 habitantes) Tasa global de fecundidad Indice de rbanizacin (%) Indice de Desarrollo Humano Indice de Desarrollo Humano y Equidad Indice de Eficiencia Relativa del Recurso Econmico en el Desarrollo Humano Indice de Pobreza Humana para los pases en desarrollo Indice de Desarrollo de Gnero Indice de Potenciacin de Gnero VALOR PARA RBV (a) ALC (b) 83 89 FECHA (c) 2002 FUENTE (6)

68

74

2002

(6)

3510 128 2.3

1932 179 6.2

2003 2004 2000-2005

(8) (9)| (8)

-0.6 nc -0.22 0.99

-0.51 0.293 (18) -0.31 (22) 98.2 (23) 19.3 (23) 25.8 (23) 79.1 (22) 65.9 (22)

2000-2005 c 1998 2001 2004

(10) (11) (12) (13)

18.0 22.0 82.4

2006 2006 2002

(14) (14) (6)

67.6

2002

(6)

2.5 22.0 2.6 93.0 0.784 0.678 0.015 8.8 0.780 0.532

1.9 20.7 2.4 76.3 0.795 0.573 -0.007 (23) 11.5 (22) 0.768 (18) 0.560 (15)

1975-2004 2005 2005 2004 2004 c 2000 c 2000 2006 fi 2004 2000f fi

(15) (6) (6) (15) (1) (16) (17) (3) (13) (14)

46 PDF created with pdfFactory Pro trial version www.pdffactory.com

Fundamentos de Estadstica Descriptiva


NOTAS (a) nc: no calculado (b) Las cifras corresponden al valor global de la regin. Cuando es el valor promedio, las cifras se dan en cursiva, y entre parntesis el nmero de pases en los que se bas el clculo. (c) uad: ltimo ao disponible en el perodo c : alrededor de la fecha dada fi: fecha del informe (d) ao 2004 FUENTES: (1) PNUD. Informe sobre desarrollo humano 2006. Madrid: Ediciones Mundi-Prensa; 2006. Cuadro 1 de Indicadores de desarrollo humano (2) PNUD. Op. cit. 1. Cuadro 15 de Indicadores de desarrollo humano (3) PNUD. Op. cit. 1. Cuadro 3 de Indicadores de desarrollo humano (4) CEPAL. Anuario estadstico de Amrica Latina y el Caribe 2006 [on line] http://www.eclac.org/publicaciones Cuadro 1.3.9 [Consultado: 19/03/07* (5) CEPAL. Op. cit. 4. Cuadro 1.3.7 (6) OPS. Indicadores bsicos 2005. Washington, D.C.: OPS; 2005. (Doc. OPS/AIS/ 05.01 (7) PNUD. Op. cit. 1. Cuadro 19 de Indicadores de desarrollo humano (8) PNUD. Op. cit. 1. Cuadro 21 de Indicadores de desarrollo humano (9) PNUD. Op. cit. 1. Cuadro 13 de Indicadores de desarrollo humano (10) FAO. Worlds forests 2007. Annex [on line] http://www.fao.org/forestry [Consultado[ 23/03/07] (11) PNUD. Informe sobre desarrollo humano 2001. Madrid: Ediciones Mundi-Prensa; 2001. Cuadro A2.1 (12) Wagner CS et al. Science and technology collaboration: building capacity in developing countries?. Santa Monica: RAND; 2001. (13) PNUD. Op. cit. 1. Cuadro 24 de Indicadores de desarrollo humano (14) PNUD. Op. cit. 1. Cuadro 25 de Indicadores de desarrollo humano (15) PNUD. Op. cit. 1. Cuadro 5 de Indicadores de desarrollo humano (16) CIEM. Investigacin sobre desarrollo humano y equidad en Cuba 1999. La Habana: Editorial Caguayo; 2000. Recuadro 9.3 (17) Lpez C. Desarrollo humano en Amrica Latina y el Caribe: eficacia y eficiencia. Revista Economa y Desarrollo 2002;133:11-37.

CULES USOS TIENE LA ESTADSTICA?

Adems de los mtodos descriptivos ya vistos, y otros no considerados con igual propsito, la estadstica posee una variedad de procedimientos para la solucin de diversas necesidades de anlisis, como se resume en la tabla 2. Una gran parte de las tcnicas que conforman los procedimientos mencionados pueden ejecutarse mediante programas computacionales; los programas ms afines a

47 PDF created with pdfFactory Pro trial version www.pdffactory.com

Fundamentos de Estadstica Descriptiva cada procedimiento tambin se sealan en el cuadro. Posteriormente se hace un comentario sobre los programas mencionados.
TABLA 2

USOS MS FRECUENTES DE LA ESTADSTICA


QU SE DESEA HACER? Describir informacin mediante medidas de resumen, tablas y grficos Seleccionar muestras de una poblacin definida. Estimar parmetros a partir de estimadores. Determinar la significacin estadstica de las diferencias observadas entre muestras. Determinar el tipo y la intensidad que existe entre dos o ms variables cuantitativas Pronosticar el valor de una variable cuantitativa en funcin de otras variables. Establecer tendencias de series histricas y elaborar pronsticos Seleccionar entre un conjunto de variables aquellas de mayor importancia en el problema estudiado. CUL PROCEDIMIENTO ESTADSTICO EMPLEAR? Mtodos descriptivos CUL PROGRAMA ESTADSTICO SE PUEDE UTILIZAR? Excel

Procedimientos muestrales. EPIDAT Estimacin de parmetros Pruebas de hiptesis clsicas y no paramtricas Anlisis de tablas de contingencia. Anlisis de correlacin Excel, SPSS Excel, SPSS, EPIDAT

Excel, EViews, SPSS

Anlisis de regresin

Excel, EViews, SPSS

Anlisis de series de tiempo EViews

Anlisis de regresin. Anlisis multivariado

EVIews, SPSS

Excel es un programa de mltiples usos del sistema de programas Office. Entre sus posibilidades se encuentra la de elaborar diversos tipos de grficos, y la opcin de Anlisis de Datos incluye el clculo de diversas medidas descriptivas, la ejecucin de diferentes pruebas de hiptesis y la realizacin de anlisis de correlacin y de regresin.

48 PDF created with pdfFactory Pro trial version www.pdffactory.com

Fundamentos de Estadstica Descriptiva EPIDAT, ya en su versin 3.1, es un programa fundamentalmente elaborado para el anlisis de datos presentados en tablas. Contempla, entre sus opciones, aspectos del anlisis demogrfico y de los procedimientos muestrales. Fue elaborado en conjunto por la Junta de Galicia, Espaa, y la Organizacin Panamericana de la Salud. Es de acceso libre y su ltima versin puede obtenerse en la direccin http://dxsp.sergas.es Econometric Views (EViews) es un programa de gran utilidad para el anlisis de series de tiempo, adems de realizar variados tipos de anlisis economtricos. No es un programa de acceso libre.

SPSS (Statistical Package for the Social Sciences) es un programa no de acceso libre que posibilita la realizacin de gran nmero de tcnicas estadsticas, entre ellas, los procedimientos descriptivos, pruebas de hiptesis, clsicas y no paramtricas, anlisis de datos presentados en tablas, anlisis de regresin y de correlacin, anlisis multivariado y anlisis de series de tiempo.

EJERCITACION
(1) Basado en la siguiente informacin Valores del Indice de Desarrollo Humano para pases seleccionados PAIS 1975 1980 1985 1990 1995 2000 Bolivia 0.514 0.550 0.582 0.605 0.637 0.675 Nicaragua 0.585 0.595 0.603 0.610 0642 0.667 Venezuela R.B. 0.719 0.734 0.742 0.760 0.768 0.774 a) Construya un grfico que represente los valores observados. b) Calcule los valores medios del ndice para los tres pases. c) Determine cul de los tres pases present mayor variabilidad en los valores del ndice. (2) Calcule que porcentaje representa el valor para la Repblica Bolivariana de Venezuela respecto al valor para Amrica Latina y el Caribe de los siguientes indicadores, e interprete los resultados (vase tabla 1): PIB per capita ajustado a paridades de poder adquisitivo, Coeficiente Gini, Tasa de alfabetizacin en adultos, Esperanza de vida al nacer, Tasa de mortalidad infantil, Disponibilidad diaria de caloras per capita, Consumo de electricidad per capita, Paridad mujerhombre respecto a la participacin en el parlamento, Paridad rural-urbana respecto al acceso a fuentes mejoradas de

49 PDF created with pdfFactory Pro trial version www.pdffactory.com

Fundamentos de Estadstica Descriptiva


abastecimiento de agua, Tasa de crecimiento anual de la poblacin, Indice de Desarrollo Humano y Equidad e Indice de Desarrollo de Gnero. (3) Los siguientes valores corresponden al nmero de mdicos por 10000 habitantes para pases del Caribe Latino: Cuba, 60.4; Guadalupe, 13.8; Guayana Francesa, 13.9; Martinica, 19.7; Puerto Rico, 17.5; Repblica Dominicana, 19.0. Resuma estos valores mediante una medida de tendencia central adecuada. (4) Asuma que para un cierto pas se tiene la siguiente informacin para varios aos de los siguientes indicadores: 1970 67.9 34 8.7 3.7 1980 68.1 29 8.1 3.5 1990 68.8 25 7.9 3.9 2000 70-2 22 7.5 4.1

Esperanza de vida al nacer Relacin alummo-maestro en la enseanza primaria Indice de bajo peso al nacer Gasto pblico en educacin (%) del PIB)

Cul de los indicadores muestra menor variabilidad relativa? |

Bibliografa
CIEM. Investigacin sobre ciencia, tecnologa y desarrollo humano en Cuba 2003. La Habana: CIEM; 2004. Cu JL, Castell E, Hernndez JM. Estadstica, primera parte. La Habana: Universidad de La Habana; 1987. Chavez E (ed.). Glosario de trminos demogrficos. La Habana: Editorial de Ciencias Sociales; 1977. Guerra CW, Menndez E, Barrera R, Egaa F. Estadstica. La Habana: Editorial Flix Varela; 2004. PNUD. Informe sobre desarrollo humano 2006. Madrid: Ediciones Mundi-Prensa; 2006. Villanueva N, DEspaux J, Sols M, Jimnez B, Garca E. Laboratorio de Estadstica Matemtica I, primera parte. La Habana: Editorial Flix Varela; 2004.

50 PDF created with pdfFactory Pro trial version www.pdffactory.com

Anda mungkin juga menyukai