1. Fuentes de datos
GESIS
http://zacat.gesis.org/webview/
ISSP
Eurobarometer
Comparative Studies
Election Studies
ALLBUS (GGSS)
QoG Standard Dataset One aim of the QoG Institute is to make publicly available
cross-national comparative data on QoG and its correlates. To accomplish this objective
we have compiled both a cross-sectional dataset with global coverage pertaining to the
year 2002 (or the closest year available), and a cross-sectional time-series dataset with
global coverage spanning the time period 19462009.
QoG Social Policy Dataset The aim of the QoG Social Policy Dataset is to promote
cross-national comparative research on social policy output and its correlates, with a
special focus on the connection between social policy and quality of government (QoG).
QoG Expert Survey Dataset The QoG Survey is a unique data set on the structure
and behaviour of public administration, based on a web survey of 973 country experts
from 126 countries around the world.
Informe PISA
http://pisa2009.acer.edu.au/downloads.php
PISA 2009 dataset with the full set of responses from individual students, school principals and
parents. These files will be of use to statisticians and professional researchers who would like to
undertake their own analysis of the PISA 2009 data. The files available on this page include
questionnaires, data files in ASCII format, codebooks, compendia and SAS and SPSS control
files in order to process the data.
Elaboracin de do-files.
Todo lo que hacemos en Stata debe quedar convenientemente documentado en los do-files, de
modo que en cualquier momento podamos reconstruir todos los pasos y volver al trabajo desde
cero, o bien que otras personas puedan replicar nuestro trabajo.
Podemos escribir directamente sobre el do-file, o usar la lnea de comando de Stata. En este
segundo caso, que no es el ms aconsejable, es muy importante que nos acordemos de pasar
TODOS los comandos relevantes al do-file cada cierto tiempo.
Los do-files deben cumplir los siguientes requisitos:
Completos. Deben inclur todos los pasos realizados, desde la apertura del archivo
de datos original hasta la elaboracin de las tablas y grficos finales.
Para garantizar que siempre podremos volver atrs y corregir cualquier error que hubisemos
cometido en cualquier punto del proceso de anlisis, el archivo de datos original lo trataremos
siempre cmo un archivo de slo lectura. Esto quiere decir que no guardaremos cambios
sobre l. Para seguir esta norma, tenemos dos opciones:
a) Si debemos guardar cambios sobre un archivo de datos, lo haremos sobre una copia
otro nombre, manteniendo el original intacto. Todas las instrucciones de guardar con un
nuevo nombre, etc. Deben estar dentro del do-file.
b) La otra opcin es no guardar cambios sobre los datos, y cada vez que queramos
retomar el trabajo, ejecutaremos el do-file desde el principio.
2. Utilidades
En este apartado vamos a conocer algunos comandos tiles para el trabajo con Stata, que
tienen ms que ver con la organizacin del trabajo y la gestin de los datos que con el anlisis
en s.
Pwd pwd (Print Working Directory) nos muestra el directorio sobre el que est
trabajando Stata.
las extensiones escritar por los usuarios. Para buscar e instalar comandos nuevos, usaremos
los siguientes comandos:
Net search Cuando queramos explorar los paquetes disponibles a partir de alguna
palabra clave usaremos net search, que busca entre todos los comandos disponibles
los que contengan esta palabra clave en su descripcin.
Ssc hot y ssc new nos informan de los ltimos comandos publicados, de los ms
descargados.
order El orden de las variables en nuestra base de datos puede parecer poco
importante pero, de hecho, si no lo ajustamos podemos perder mucho tiempo
buscando variables. El comando order nos permite cambiar el orden de la base de
datos: podemos mover una variable antes o despus de otra con las opciones
before(variable) y after(variable) o ordenarlas todas en orden alfabtico con el comando
order _all, alphabetic
datasignature Para comprovar que los datos con los que trabajamos son
efectivamente los que nosotros creemos, existe el comando datasignature (set /
confirm/report) que crea un identificador nico de la base de datos (set), lo compara
con otro (confirm) y nos lo muestra en pantalla (report).
Collapse Si queremos colapsar nuestra base de datos para hacer una nueva base de
datos de estadsticos de resumen por grupos de casos (por ejemplo, de pases a partir
de una encuesta transnacional, o de comarcas a partir de datos municipales),
usaremos el comando collapse (estadstico) variable (estadstico)
variablenueva=variableoriginal
Merge Para fusionar bases de datos, existen los comandos merge y append. Merge
sirve para aadir variables (ms informacin de las mismas observaciones) y, por lo
tanto, requiere una variable con el mismo nombre en ambas bases de datos que nos
servir para enlazarlas. Es fundamental que la variable de identificacin tenga los
mismos cdigos en ambos archivos. Merge produce una variable, _merge, que sirve
para comprobar el resultado del proceso de enlace. Si _merge tiene valor 3 quiere decir
que la observacin se ha enlazado, si tiene valor 1 o 2, es seal de algn problema.
Append Si lo que queremos es aadir observaciones (ms casos con las mismas
variables), usaremos append en lugar de merge. En este caso lo importante es que las
variables tengan el mismo nombre.
Reshape A veces los datos con estructuras complejas (por ejemplo, datos panel) se
nos distribuyen en formatos largo o ancho y necesitamos transformarlos. En estos
casos disponemos del comando reshape long y reshape wide.
Importacin de datos
No siempre los datos nos llegarn en un formato apto para ser ledo directamente en Stata,
pero afortunadamente Stata dispone de capacidades para leer datos en un buen nmero de
formatos:
Usespss SPSS sigue siendo uno de los programas ms utilizados, lo cual puede tener
como consecuencia que nos lleguen archivos de datos en formato .sav, que es el
propio de SPSS. Esto puede ser problemtico, aunque el comando usespss lo
soluciona (slo funciona en Windows) puesto que permite a Stata abrir directamente
archivos de SPSS. Otras opciones incluyen usar SPSS para guardar en Stata, o usar
Stat/Transfer.
import excel lee hojas de clculo de Excel (.xls y .xlsx). Puede leer hojas enteras o
podemos definir determinados rangos de datos.
Insheet es el compando para leer archivos de texto creados a partir de una hoja de
clculo o programa de bases de datos. Los valores pueden estar separados por comas,
por tabulaciones o con un separador especfico. Cada observacin debe estar en una
lnea.
Infix/infile es para datos con un formato de ancho de columnas fijas, con o sin
diccionario. En estos archivos una observacin puede ocupar varias lneas. Un buen
recurso para crear diccionarios en Stata es el siguiente:
http://library.columbia.edu/indiv/dssc/technology/stata_write.html