TRATAMIENTO DE DATOS
Pgina n 1
1.- OBJETIVOS
Estudio de los mtodos y tcnicas estadsticas bsicas para el conocimiento cientfico de la
realidad social y su posterior plasmacin cartogrfica.
Conocer las condiciones de aplicacin de las diferentes medidas estadsticas.
Evaluar los diferentes mtodos de clasificacin para la realizacin de cartografa temtica.
Pgina n 2
Tratamiento: Comprende todas las operaciones que se realizan con los datos tras su adquisicin
hasta que toman forma cartogrfica
Pgina n 3
Son operaciones que se aplican sobre todo a la componente espacial, pero que terminan
afectando a la temtica
Implica una seleccin de elementos, una esquematizacin de los mismos y una armonizacin del
conjunto
La generalizacin se realiza a travs de una serie de operadores
clasificacin y simbolizacin
simplificacin
desplazamiento
agregacin y amalgamado
colapso
tipificacin
suavizado
exageracin
Pgina n 4
Generalizacin de reas
Generalizacin raster
Estructural: Remuestreo, interpolacin de celdas
Numrica: Filtros de suavizado, realce,
direccionales
Morfologa matemtica (cascos urbanos)
Reduccin
Pgina n 5
Pgina n 6
o
o
Homogeneizar los datos estadsticos, si se obtienen de distintas fuentes para tener valores
comparables.
Depurar las estadsticas para eliminar datos innecesarios.
Convertir los datos para poderlos utilizar en la elaboracin cartogrfica como ndices,
rendimientos por hectrea, densidades, porcentajes, etc. debindose calcular antes de
proceder al diseo del mapa.
Pgina n 7
Pgina n 8
Poblacin: Conjunto de todos los objetos en los que se quiere estudiar un determinado carcter
Estadstica inferencial o inductiva: El anlisis de una muestra permite inferir resultados de toda la
poblacin
Estadstica
Absolutos
Relativos.
Mapas que muestran los datos en forma absoluta: los valores se muestran tal y como se toman:
produccin o el consumo de bienes, poblacin, las elevaciones de la superficie terrestre sobre el nivel del
mar, etc. Se muestran sobre el mapa en trminos absolutos.
Mapas que representan valores relativos: expresan algn tipo de resumen o alguna clase de relacin entre
dos o ms juegos de datos: densidad de poblacin, los ingresos per cpita, la tasa de paro
Pgina n 9
Cartografa Temtica y Topografa Subterrnea
Para establecer los lmites de las clases se parte del rango de la variable, que se obtiene como la
diferencia entre el valor mximo y el mnimo. Dividiendo el rango de la variable por el nmero de clases
se obtiene el ancho de cada una de las clases, de manera que pueden calcularse los lmites entre estas.
Se conoce como marca de clase o punto medio al valor que representa la mitad de cada clase
establecida.
Pgina n 11
Donde:
=
= .
1
1 =
Evolucin de la poblacin en la regin centro. Absoluta y nmero ndices respecto a la situacin de 1991
Pgina n 12
Distribucin del PIB por habitante provincial: frecuencias absolutas acumuladas y porcentuales
Pgina n 13
Pgina n 14
Pgina n 15
LA MEDIANA
Si ordenamos todos los valores que toma una variable desde el inferior hasta el superior, la mediana es el valor
situado en el centro, de forma que la mitad de los valores sern superiores y la otra mitad inferiores a dicho valor. Es
otro tipo de medida relativa de la tendencia central, utilizable por ejemplo en un mapa que represente, en este caso,
la mediana de los valores de tierra de cultivo por hectrea en cada provincia, obtenida a partir de los datos
municipales.
Al igual que en el caso anterior, si las regiones varan muchsimo en cuanto a extensin, debe considerarse la mediana
en funcin de la superficie. Hacindolo as, la mediana geogrfica ser el valor por encima y por debajo del cual se
halla la mitad de la superficie total. El valor de la mediana geogrfica es aquel cuya superficie acumulada asociada,
resulta igual a la mitad de la superficie total
LA MODA
FRECUENCIA
4-6
7-9
10-12
13-15
16-18
19-21
22-24
25-27
28-30
31-33
Pgina n 16
Pgina n 17
Al igual que la mediana, los cuartiles se calculan ordenando los datos de menor a mayor, y buscando
aquellos valores que dividen el conjunto de la distribucin en cuatro partes iguales.
Se denominan primer Q1, segundo Q2 y tercer Q3 cuartiles. Por lo tanto, Q1 deja por debajo el 25% de
los datos y por encima el 75%, mientras Q3 deja por debajo el 75% de los valores y por encima el 25%.
Lgicamente, Q2 coincide con la mediana. De lo anterior, se deduce que entre Q1 y Q3 hay un 50% de
los datos.
De la misma manera, los valores que dividen al conjunto de datos en cinco partes iguales son llamados
quintiles (Q1, Q2, Q3 y Q4 ), los que dividen al conjunto de datos en diez partes iguales son llamados
deciles (D1, D2, D9) y los que lo hacen en 100 partes iguales son llamados percentiles (P1, P2, P9).
Tanto los cuartiles como los deciles, percentiles u otros valores que subdividen el conjunto de datos en
grupos con el mismo nmero de valores se llaman cuantiles.
Pgina n 18
La figura presenta de forma grfica las medidas de posicin o cuantiles (ya sean cuartiles, quintiles, deciles y percentiles):
Pgina n 19
MEDIDAS DE DISPERSIN
Las medidas de centralizacin proporcionan una informacin parcial de la distribucin de la variable.
El rango y los cuantiles proporcionan cierta informacin complementaria a las medias de
centralizacin sobre la distribucin de la variable. Sin embargo, es necesario completar esta
informacin con medidas relativas a las desviaciones de los datos respecto a las medidas de
centralizacin.
Las dos medidas ms usadas son la desviacin tpica y la varianza. La varianza se refiere a la media
del cuadrado de las diferencias de los valores con la media. La formulacin es la que sigue:
=1( )
*fi
Los valores de las diferencias respecto a la media se elevan al cuadrado pues como vimos una de
las propiedades de la media es que la suma de las desviaciones es 0. Al elevar los valores al
cuadrado, estos toman siempre valores positivos, y cuando los valores son altos y las desviaciones
grandes la varianza ser grande. Para reducirla, se utiliza la desviacin tpica, que se obtiene
como la raz cuadrada de la varianza
Pgina n 20
COEFICIENTES DE DISPERSIN
Cualquier distribucin pueden ser caracterizado, por tanto, a partir de la media y la desviacin tpica.
De esta forma, ambas medidas son usadas con frecuencia para comparar las diferencias de las
distribuciones de una variable en dos espacios diferentes o la evolucin de una misma variable en
distintos momentos temporales.
Sin embargo, para comparar la variabilidad de datos que tienen distintas unidades se utiliza el
coeficiente de variacin de Pearson. Este se calcula como el porcentaje del cociente de la desviacin
tpica entre la media, y tiene la ventaja de no poseer unidades, lo que permite comparar la
dispersin entre datos de distinta naturaleza:
*100
Pgina n 21
INDICES
Otra clase de cantidad relativa es la consistente en medidas como razones o ndices, proporciones y
porcentajes, en las que algo se mide por unidades de otro elemento, o en las que algn elemento de
los datos se individualiza para compararlo con el resto.
Los mapas que representan el porcentaje de das de lluvia, la proporcin de ganado vacuno dentro de
la ganadera en general, las tasas o ndices de mortalidad, o la tasa de crecimiento o decrecimiento de
algn fenmeno son algunos ejemplos. En este grupo el valor numrico representado en el mapa ser
normalmente el resultado de una de las siguientes operaciones:
RAZN O NDICE
La razn es una expresin de relacin entre datos que se expresa de la forma fa/fb, en donde fa es la
frecuencia de una clase a y fb es la frecuencia o nmero de elementos de otra clase b. Como ejemplo
podemos considerar la razn de sexos de una pequea poblacin. Saber que existen 3000 hombres da
una idea al respecto, pero si adems se sabe que el nmero de mujeres es de 1500 la idea cambia y
vemos que la razn es de dos hombres por mujer
PROPORCIN
La proporcin es la razn entre la frecuencia de una clase (fa para la clase a) y el total (fa/N) siendo N
la frecuencia total. En el ejemplo anterior, la proporcin de hombres es de 3000/4500, es decir de
0,66
Pgina n 22
Cartografa Temtica y Topografa Subterrnea
INDICES
PORCENTAJE
Normalmente las proporciones se dan multiplicadas por 100, o lo que es lo mismo en porcentajes. En
este caso decir que el 66% de la poblacin son hombres, es ms sencillo y fcil de entender que hablar
de una proporcin de hombres de 0,66. Tambin estas estadsticas presentan a veces las
caractersticas de un promedio espacial. Este tipo de razones son la base del concepto de densidad
que se trata ms adelante. Una razn tpica de la geografa es la de densidad de poblacin, definida
como el nmero de habitantes por kilmetro cuadrado o por otra unidad superficial. Si el rea de la
poblacin anterior es de 10 kilmetros cuadrados, la densidad de poblacin sera de 4500/10, es decir
de 450 hab/km2.
La cartografa de este tipo de cantidades relativas se elabora para mostrar las variaciones de un lugar a
otro de la realizacin definida, y normalmente se prepara a partir de resmenes de datos estadsticos.
Cuando los porcentajes, razones y tasas se simbolizan en unos lmites, el usuario supone que el valor
representado se extiende de modo ms o menos uniforme a travs de dicha unidad.
Pgina n 23
INDICES
DENSIDADES
Las densidades se utilizan cuando lo que se quiere reflejar es la acumulacin o escasez geogrfica
relativa de datos discretos. Se calcula dividiendo el dato por la superficie en la que se encuentra, pero
en muchos casos este valor no es tan significativo como el que expresa la razn entre otros factores que
estn ms estrechamente relacionados. Por ejemplo, la relacin entre nmero de personas y superficie
productiva en sociedades predominantemente agrcolas. Esta relacin se considera ms til que lo es el
simple clculo de la poblacin con respecto al rea total, productiva o no.
Al trabajar con densidades el cartgrafo est limitado en el detalle que puedan presentar los tamaos
de las unidades de enumeracin (municipios, regiones o pases).
Otra categora de cantidades relativas son las potenciales (o criterio de gravedad), que tambin se
utilizan en mapas, y que supone que los elementos de una distribucin (personas o precios por
ejemplo) influyan entre s directamente con las magnitudes del fenmeno e inversamente con la
distancia entre sus ubicaciones. De este modo el valor del potencial en un punto, es la suma de la
influencia de todos los dems puntos sobre l, ms su propia influencia
Cartografa Temtica y Topografa Subterrnea
Pgina n 24
Pgina n 25
EL NMERO DE CLASES
El nmero de clases es funcin del detalle necesario para mostrar adecuadamente el contenido
temtico, pero viene limitado por aspectos perceptivos. Hay que buscar un punto de equilibrio segn
cada caso particular.
Pgina n 26
CONCLUSIONES
La clasificacin de datos en intervalos es un proceso de generalizacin que afecta a la superficie
estadstica correspondiente, donde se uniforman sus pequeas irregularidades. No obstante se deben
intentar mantener los rasgos ms destacados de cada distribucin, de modo que si entre los datos
existe alguno excepcional, ste debe constar como tal en el mapa.
Se debe intentar seleccionar las clases de manera que se mantengan las caractersticas ms
significativas de la distribucin, abarcando todo el rango de datos y sin que existan claves vacas.
Asimismo resulta conveniente dividir los datos en grupos de nmeros de observaciones
razonablemente similares, as como buscar una relacin lgica en los tamaos de los intervalos pues
facilitar la lectura.
Una progresin aritmtica ser adecuada cuando la grfica de la distribucin del conjunto de datos se
asemeje a una progresin aritmtica, y lo mismo ocurrira con las progresiones geomtricas, que sern
aplicables cuando la grfica tienda a mostrar una progresin geomtrica
Los puntos de ruptura de la distribucin nos proporcionarn grupos de valores homogneos, lo que
sin duda es deseable, y su utilizacin ser interesante cuando dichas rupturas queden claramente
definidas. Adems este sistema puede utilizarse junto con algn otro sistema de clasificacin.
Vistos los distintos tipos de clasificacin para un mismo conjunto de datos, slo queda ver cul de ellos
es el que mejor se adecua a la distribucin real de los mismos. La ms parecida al modelo real es la
correspondiente a la mejor clasificacin para el conjunto de datos
Cartografa Temtica y Topografa Subterrnea
Pgina n 27