M.D. Peris
UB - 2014
M.D. Peris
UB. 2014
M.D. Peris
UB. 2014
2. Introduccin de variables
Se comienza con la introduccin de los datos en el programa informtico, que
en este curso es el SPSS 14 y sobre el que existen muchos tutoriales en la red en
espaol. Sobre la introduccin de los datos 15 conviene clarificar algunas cuestiones
todava confusas, porque no afectan al anlisis univariable, pero sin embargo si lo
hacen al multivariable. La principal, como ya se ha apuntado, se refiere a la
codificacin de las variables dicotmicas, tambin denominadas discretas, que son
aquellas que tienen tan slo dos opciones, de la que la ms habitual es el sexo. Con el
fin de realizar anlisis multivariables que obligan a obtener coeficientes de correlacin,
asociacin, proximidad o distancia entre las variables, hay que codificarlas como 1
para la opcin que se desee interpretar y como 0 aquella que se entiende como su
ausencia. Por ejemplo, si el estudio est centrado en el anlisis de las mujeres, ser 1
el cdigo con el que se identifique este hecho y 0 su ausencia. Si por el contrario se
analizan roles masculinos, se otorgar un 1 a los varones y un 0 a quienes no tengan
esta caracterstica. Es decir, la variable con dos opciones se introduce como si se
tratara de una sola opcin en trminos de presencia vs. ausencia. Esta codificacin es
imprescindible para que sea tratada matemticamente como una variable binomial,
donde la serie de decimales que se suceden entre 0 y 1 constituye una escala de
mtrica continua.
14
M.D. Peris
UB. 2014
Por ello mantener esta falsa dicotoma adems de ser errnea, es una forma de
impedir el desarrollo de disciplinas como la sociologa, donde la confusin impide
discernir lo que es investigacin de lo que son meras opiniones subjetivas y carentes
de toda validez cientfica. Es a travs de la medida, o de la metrologa, como se
procede a transformar la informacin percibida en modo cualitativo en Dato
cuantitativo. Y este proceso transformador se puede aplicar a TODO tipo de
informacin, luego se trata de dos niveles sucesivos de tratamiento o registro y no de
dos tipos de informacin. Mucho menos de dos tipos de investigacin, mtodos o lo
que se quiera titular para una falacia dualista que ha retrasado en ms de medio siglo
la investigacin social. No es necesario abundar los intereses a los que sirve. Para
resumir, hay que diferenciar con toda nitidez los diferentes niveles de generalizacin.
1.- Variables: La realidad concreta, de la que se obtiene un determinado tipo
de informacin que ya en si misma es un reduccionismo y un posible sesgo a controlar
en relacin a que atributos se registran y cuales se ignoran. En este proceso es
fundamental atender a la representatividad de los trminos utilizados y a la ausencia
de agregaciones que confundan el objetivo de estudio. Cada atributo, fenmeno,
objeto o aspecto de la realidad considerada relevante para la investigacin, constituye
una variable. Algunos tratados establecen diferencias entre la informacin, como algo
holstico, por ejemplo una grabacin, y las variables como la atomizacin en parcelas
claramente identificadas de dicha realidad.
2.- Datos: Los parmetros con los que se miden diferentes fenmenos y
atributos con el fin de establecer una magnitud que diferencie situaciones o unidades
de medida. El ms simple es el registro de presencia vs. ausencia, es decir, si se
observa o no o si existe o no la informacin a registrar. Es necesario que en el
conjunto de datos exista variabilidad, porque si es constante la presencia o la
ausencia, entonces no constituye una variable y por tanto no es vlida esta
informacin para el anlisis estadstico que consiste precisamente en el anlisis de las
variabilidades. Esta consideracin apunta a que la simple anotacin de la presencia vs.
ausencia de una variable, es algo diferente a la variable misma, porque es el
parmetro que registra su magnitud, aunque sea en ese nivel mnimo de existencia
vs. ausencia.
Hay 3 parmetros que se han generalizado para la observacin de la realidad:
- La duracin cronometrada en tiempo, y por ello en una escala continua.
- La frecuencia acumulada por el recuento de ocasiones en que se repite un
hecho en un periodo de tiempo dado, que se registra en una escala de intervalo,
puesto que no hay continuidad entre dos frecuencias consecutivas.
- La intensidad con la que dicho fenmeno se da y que puede constituir una
escala objetiva si existen instrumentos para su medicin exacta, pero que en CCSS
suele registrarse como escala subjetiva y por ello ordinal. Es el caso de anotar si la
intensidad es baja, media o alta a partir de la percepcin del observador.
Hay por tanto una clara diferenciacin entre la variable, que es la referencia
ms o menos operativizada a la informacin seleccionada de la realidad. Hay una
M.D. Peris
UB. 2014
18
M.D. Peris
UB. 2014
M.D. Peris
UB. 2014
5. Recodificaciones
Una vez realizado el anlisis exploratorio o simplemente el descriptivo
univariable 25, se procede a la recodificacin de aquellas variables que lo requieran, 26
siguiendo los procedimientos que para tal fin prevn los paquetes estadsticos. 27
Una advertencia preliminar es la de no borrar nunca el registro original de cada
variable, porque a partir de cada registro original se pueden calcular diferentes
indicadores, nuevas variables 28 y codificaciones alternativas que sern de utilidad
25
M.D. Peris
UB. 2014
cada una de ellas para diferentes anlisis. As pues una sola recodificacin 29 no agota
las posibilidades y para nuevas transformaciones 30 siempre hay que volver a utilizar
el registro original. Por ejemplo para proceder con diferentes ponderaciones 31 para
diferentes agregaciones de variables o agrupaciones de casos. 32
Y una regla general es que siempre se puede transformar una escala superior
en inferior. Se puede reducir la amplitud del recorrido o/y eludiendo los requisitos de
continuidad o de equivalencia de distancias entre puntuaciones o intervalos. Pero no
se puede realizar directamente el proceso inverso. As pues lo que siempre es posible
es transformar toda la informacin al nivel ms simple: la dicotoma. Pero en ese caso
se pierden los matices y la precisin y por ello se produce un reduccionismo de la
informacin y una perdida de sensibilidad. El resto de transformaciones tiene
diferentes limitaciones que a continuacin se sistematizan.
1.- Reduccin a una escala dicotmica.
A) Conservando todos los casos:
- En las variables continuas y de intervalo se establece un punto de corte en la
media, con el fin de igualar los dos grupos resultantes, el superior y el inferior a la
media.
- En las variables ordinales se establece un punto de corte en la mediana con lo
que se deja el 50 % en cada grupo. Cuando la escala tiene un nmero impar de
grados se ha de decidir como se reparten las frecuencia del grado con puntuacin
coincidente con la mediana. Para evitar este problema conviene que la escala ordinal
tenga un nmero par de grados, aunque si no es simtrica tambin puede recaer la
mediana en un valor y no en un punto intermedio entre dos valores.
- En las variables multinomiales, polinmicas o categoriales se procede a
construir variables ficticias, denominadas dummy, procedimiento por el que cada una
de las opciones de respuesta menos una se transforman en una nueva variable
dicotmica con presencia o ausencia. El problema de esta transformacin es la
relacin negativa entre las nuevas variables dummy cuando es obligado elegir una
sola opcin, perdiendo el requisito de independencia. Por este motivo no se puede
interpretar la relacin interna entre las variables dummy si la eleccin es una sola
categora y tan slo se utiliza su relacin con el resto de variables. Esta independencia
si se mantiene en las variables dicotmicas o discretas originales, por ello no hay que
confundirlas con las dummy.
B) Seleccionando casos:
En ocasiones interesa conocer tan slo una
ejemplo interesa investigar tan slo la tipologa
situacin o muy conformes con una propuesta,
audiencias o usuarios. En este caso tanto
29
M.D. Peris
UB. 2014
M.D. Peris
UB. 2014
10
http://www.eyeintheskygroup.com/Azar-Ciencia/Metodos/Abraham-de-Moivre-DistribucionNormal.htm
34
Xenakis, D. 2014. 08 - Los mundos de la estadstica y la ley de los grandes nmeros
http://www.youtube.com/watch?v=H3-agC9pAjo
35
Parada, R. 2011. El sorprendente Teorema de Limite Central
http://www.youtube.com/watch?v=wyhWGf90Rdw
36
Rincn, L. 2013. Ley de los grandes nmeros. http://www.youtube.com/watch?v=v9sII0JsXIc
37
http://www.fundacionbengoa.org/personalidades/adolphe-lambert-jacques-quetelet.asp
38
Cabrera Garca, S. 2012. Distribucin normal. Conceptos y propiedades. UPV.
http://www.youtube.com/watch?v=b_Oee84PrGg
39
Kentros, A. 2014. EST-C6_AxPi - Cap 9 (2) - Probabilidad - Campana de Gauss.
http://www.youtube.com/watch?v=xfsg57PhalY
40
2011. La regla emprica. http://www.youtube.com/watch?v=j287OsBna84
M.D. Peris
UB. 2014
11
6. Anlisis Multivariable
Una revisin de la posicin que ocupa la estadstica multivariable en el resto de
temas generales de la estadstica aplicada a las CCSS, la presenta en clave de humor
Cuy Avila.41
Actualmente existen en la red numerosas introducciones en nuestro idioma
dirigidas a la aplicacin y por ello sin el inters en el algoritmo matemtico. Entre las
ms consultadas (Figueras 42, Sierra, 43...), estudios ms completos 44 y ms
centrados en el clculo, como el pionero en su aplicacin en la UB, el Dr. Cuadras 45
en el primer centro de clculo (antes de que se masificaran los Pcs) en el jardn de la
Pza. Universidad de tan grato recuerdo para quienes como la autora, realizaron en l
sus primeros anlisis multivariables.
Y abundan las publicaciones en las que se aplican varias de ellas 46 en reas
muy diferentes, resaltando estudios que aunan la aplicacin con la revisin terica. 47
Las tcnicas principales estn listadas 48 siguiendo diferentes criterios.
Condicin para entender los resultados del anlisis multivariable es imaginar el
espacio n-dimensional. Algunos intentos de proyeccin multidimensional para ayudar
a esta interpretacin se encuentran para 3 dimensiones,49 para cuatro 50 - 51 y
sucesivas,52 para seis 53 y hasta diez,54 donde parece establecerse el lmite para una
41
M.D. Peris
UB. 2014
12
7. Anlisis Factorial
El anlisis de Componentes principales 57 precedi al A. Factorial y hay autores
que los consideran tcnicas diferentes, aunque el SPSS lo considera un subtipo de A.
Factorial.
Para entender el procedimiento de su aplicacin as hay numerosos
documentos en la red que prescinden de las demostraciones matemticas, destacando
los publicados en la UCM. 58 Inicialmente se ha de conocer su vocabulario especfico
inicialmente 59 y las opciones ms utilizadas 60 en su amplitud de campos de
aplicacin 61 a travs de diferentes ejemplos.62
Su aplicacin ms frecuente en CCSS es para obtener la validez de constructo
de escalas 63 y cuestionarios 64 y validacin de teoras 65
8. Anlisis Cluster
Con un resultado prximo a las asociaciones bivariadas entre las variables
registradas, el dendograma que es el resultado que se publica e interpreta del
55
M.D. Peris
anlisis Cluster
entender. 68
66
o de Conglomerados,
67
UB. 2014
13
9. Anlisis de Correspondencias.
El anlisis de correspondencia simple ampla el anlisis bivariable de las tablas
de contingencia 72 ampliando el concepto de dependencia entre variables que obtiene
2. 73
El anlisis de correspondencia lo cre Benzecri (1973, 74 Francia) 75 y es en el
idoma francs donde se encuentra la mayor amplitud de referencias y aplicaciones. No
obstante actualmente se ha incorporado al colectivo de pruebas multivariables 76 por
su adecuacin al anlisis de las variables categoriales, contando con importantes
especialistas en Catalunya dada la vecindad con Francia. Se diferencian las formas
simples 77 y mltiples, si bien lo ms habitual es aplicar el anlisis simple para
establecer las relaciones no tanto con las variables, sino con las categoras de las
variables 78. Tiene gran utilidad para valorar y depurar las clasificaciones al
determinar cuando conviene agrupar ms de una. La ausencia de requisitos
paramtricos a los datos le permite una amplia aplicacin en los mbitos ms
subjetivos.79
66
M.D. Peris
UB. 2014
14
80
M.D. Peris
UB. 2014
15
M.D. Peris
UB. 2014
16
ANEXO I
Bases de datos estadsticos e de poblacin internacionales y locales
INFOCAThttp://www20.gencat.cat/portal/site/governacio/menuitem.c69dfb9d746aa11f8e629e30b0c0e1a0/?
vgnextoid=eb96117986c87110VgnVCM1000000b0c1e0aRCRD&vgnextchannel=eb96117986c8711
0VgnVCM1000000b0c1e0aRCRD&vgnextfmt=default o bien http://www.gencat.cat
IDESCAT http://www.idescat.cat/es/
Centre d'Estudis Demogrfics (CED) http://www.ced.uab.es/
Cambra Oficial de Comer, Indstria i Navegaci de Barcelona http://www.cambrescat.es/
Cambra Oficial de Comer i Indstria de Terrassa http://www.cambraterrassa.es/
Institut Cartogrfic de Catalunya (ICC) http://www.icc.es/
Fitxes indicadors. http://elperfildelaciutat.wordpress.com/que-es-un-perfil/fitxes-indicadors/
Programa HERMES http://www.diba.es/hg2/menu_pre.asp
Xarxa dobservatoris de Barcelona. http://www.diba.cat/web/promoeco/xodel/default
http://www.diba.cat/web/promoeco/xodel/relacio
LObservatori http://www.girona.cat/observatori/links.php
Ajuntament de Girona http://www.girona.cat/observatori/
Ajuntament de Barber del Valls http://www.bdv.cat/barbera-en-xifres
Ajuntament de Granollers http://indicadors.granollers.cat/internet/default.aspx
http://www.granollers.cat/esports/estudis-i-estadistiques-0
Ajuntament de Lleida http://www.paeria.cat/butlletieconomic/2013/02-setembre/
Ajuntament de Manresa http://www.ajmanresa.cat/web/contingut.php?id_menu=1015&parent=1006&area=1
Ajuntament de Matar http://www.mataro.cat/portal/ca/sostenibilitat/agenda21/indicadors_control/index.html
Ajuntament de Mollet http://www.molletvalles.cat/DetallNoticia/_wEovPETJ6tcLeTQVVch_ZqTCdjWC4tjmO_4SZetl-fk
Ajuntament de Rub http://www.ajrubi.cat/ajrubi/apartats/index.php?apartat=2797
Ajuntament de Sabadell http://www.sabadell.cat/ca/element-dades-poblacio
Ajuntament de Santa Coloma http://www.grame.net/principal/la-ciutat/dades-estadistiques.html
Ajuntament de Terrassa http://opendata.terrassa.cat/VW_Principal.aspx
http://opendata.terrassa.cat/VW_CatalegDades.aspx o bien
http://transparencia.terrassa.cat/
Ajuntament de Vic
http://www.vic.cat/viure-a-vic/viure-a-vic
M.D. Peris
UB. 2014
17
M.D. Peris
UB. 2014
18
http://datos.bancomundial.org/indicador