Anda di halaman 1dari 15

Introduccin al STATA: Creacin y manejo de informacin estadstica La pantalla de inicio de STATA muestra cuatro grandes ventanas: Review: donde

aparecen los comandos empleados segn el orden de ejecucin. Variables: muestra la lista de variables cargada en la memoria segn el orden de creacin. Stata Results: presenta los comandos, resultados y mensajes de error. Stata Command: ventana en la que se ingresan los comandos. Otras ventanas importantes son: Stata Editor: permite navegar y modificar los datos como si fuese una hoja de Excel. Stata Viewer: permite acceder a informacin en lnea y tambin a la ayuda del programa. Stata Graphs: presenta el ltimo grfico realizado. Stata Do-file Editor: ventana separada en Windows y funciona como un editor de textos que permite ejecutar una lista de comandos.

Los comandos pueden ser directamente utilizados desde la barra de men desplegable (Grafical User Interface), pueden ser tipeados en la barra de comandos o, para uso ms avanzado, puede agruparse una serie de comandos en un do file.

Un do file es un archivo que guarda extensin .do, el cual sirve para guardar un programa de comandos de STATA. Para iniciar uno se puede llegar desde la barra de men desplegable de la siguiente manera:

Asimismo, se puede utilizar el cono asociado a un nuevo do file Los log files

Estos archivos de extensin por default .log, son muy tiles al momento de recoger los resultados y pasarlos a formato Excel o Latex. Cuando el STATA muestra sus resultados, si no se le ha especificado otra cosa, el programa los muestra solo en pantalla. Este comando permite que todo lo que se muestre en la ventana de resultados se guarde en un archivo que luego puede ser fcilmente exportado y trabajado. Para obtener ayuda especfica de algn comando o tema se pueden utilizar el comando help, search, findit y hsearch. El comando help permite buscar sintaxis, opciones y ejemplos de comandos o tipos de comandos que tiene el STATA. As, para que este comando sea de utilidad tiene que conocerse el nombre del comando del cual se requiere la ayuda! Su sintaxis se presenta a continuacin: help [command_or_topic_name] [, nonew name(viewername) marker(markername)] El comando search no requiere conocer el nombre del comando pues realiza una bsqueda por palabra clave. Si adems utilizamos net search, el STATA buscar los paquetes disponibles de comandos para STATA en la web. Algo similar ocurre con el comando findit, el cual provee la bsqueda ms amplia posible y no necesita de la escritura de las palabras exactas pues permite abreviaciones. search word [word ...] [, search_options]

findit word [word ...] Finalmente, el commando hsearch es utilizado para conocer si STATA contiene determinadas palabras en su ventana de ayuda (si lo contiene dentro del manual de ayuda que propone para cada comando). Asimismo, genera una lista interactiva, a modo de indice. hsearch word(s) Datos tiles para el trabajo con STATA Smbolos del STATA: + Adicin - Sustraccin * Multiplicacin / Divisin ^ Potencia ~ Negacin (!) & Y > < >= <= == != | Mayor que Menor que Mayor o igual que Menor o igual que Igual que No igual que

Dentro de un do file, se puede correr una o ms lneas del programa sombreando alguna parte de la lnea o grupo de lneas y presionando Ctrl + D. El STATA distingue entre maysculas y minsculas y puede aceptar en nombres de variables hasta 32 caracteres, pudiendo estos ser A-Z, a-z, 0-9, _. Sin embargo, algunos nombres para variables se encuentran reservados como in. El nombre del comando se puede abreviar hasta la mnima expresin que no permita que el STATA lo confunda con otro comando. Lo mismo sucede cuando se llama a una variable. Asimismo, se puede utilizar el * para reemplazar letras o nmeros o buscar ms fcilmente variables que difieran en solo algunas letras. Para realizar operaciones matemticas rpidas podemos utilizar el comando display y escribir luego de l la operacin necesaria. El resultado aparecer en la lnea siguiente de la pantalla. Si un comando ya se ha digitado antes en la barra de comandos, no hay necesidad de digitarlo nuevamente pues se puede hacer clic en el comando correspondiente en la ventana Review de Comandos. Adems Stata presenta una barra de herramientas que permite realizar operaciones comunes como abrir un archivo, grabarlo, imprimir o ver alguna ventana en particular.

Sirve para abrir una base de datos de Stata. Sirve para grabar en el disco la base de datos que est siendo usada. Imprime los grficos o el contenido de la ventana Stata Viewer. Empieza un log, abre una existente, cierra o suspende la que se est usando. Muestra una ventana Stata Viewer que est oculta. Muestra el ltimo grfico creado. Abre un Do-File Editor o muestra la ventana del Do-File Editor que est oculta (equivale a ctrl+8). Abre el Stata Editor o muestra la ventana del Stata Editor que est oculta (equivale a edit). Abre el Stata Browser o muestra la ventana del Stata Browser que est oculta (equivale a browse). Le dice al Stata que contine la ejecucin de un comando que ha sido detenido. Detiene el Stata (equivale a la tecla q). STATA tiene 6 tipos de variables de datos: float double byte int long nmeros reales en formato 8,5 (8 cifras enteras, cinco decimales) nmeros reales en formato 16,5 enteros entre 127 y 100 enteros entre 32767 y 32740 enteros entre 3147483647 y 2147483620

STATA por defecto le asigna formato float a una variable de datos nueva. str1 str80 cadenas de 1 carcter cadenas de 80 caracteres

Sintaxis bsica:
[by varlist:] command [varlist] [=exp] [if exp] [in range] [weight]

Operadores: Aritmticos * Multiplicacin / Divisin ^ Potencia

Lgicos ~ No | O & Y

De >= <= == ~=

relaciones Mayor o igual Menor o igual Igual No igual

1. Crear y guardar bases de datos clear: Se usa para limpiar la memoria de los datos que se encuentren actualmente cargados, inclusive cuando no se hayan guardado set mem: fija el tamao de la memoria (para abrir bases grandes) set mem 16m edit: permite introducir datos y modificar informacin ya existente a travs del editor. edit [varlist] [if exp] [in range] [,nolabel] describe: muestra un resumen del contenido de la base de datos describe [varlist] save: guarda una base de datos save "c:\mis documentos\base1.dta", replace

2. Cargado de datos, listado de variables y observaciones use: abre una base de datos ya existente Ejemplo: use "c:\mis documentos\base1.dta", clear insheet: permite cargar bases de datos de hojas de clculo (y ASCII (texto) creados por programas de datos). El usuario le puede especificar al STATA si es que los valores en la base de datos se encuentran separados por espacios, tabulaciones o comas. Asimismo, se debe tomar en cuenta que el STATA asumir que en la primera lnea de la hoja de clculo se encuentran los nombres de las variables. Su sintxis es: insheet [varlist] using filename [, options] Existe una variante de este comando que permite guardar la base de datos de STATA en format de hoja de clculo, conocida como outsheet. sort: ordena las observaciones de manera ascendente segn los valores de una(s) determinada(s) variable(s). Gsort es un comando ms general que el sort. sort varlist gsort [+|-] varname [[+|-] varname ...] [,generate (newvar)] format: permite especificar el formato de visualizacin (display format) de una variable format varlist %fmt donde %fmt = %9.0g, %9.2f, %10s

list: permite visualizar los valores de las variables [by varlist:] list [varlist] [if exp] [in range] [, nolabel] codebook: examina cada variable indicando el tipo de variable, el nmero de observaciones, el rango numrico en que se encuentran dichas observaciones (si corresponde), algunos estadsticos descriptivos como la media, la desviacin estndar, los percentiles o ejemplo de la variables si esta es string.

browse: permite visualizar los valores de las variables a travs del editor browse [varlist] [if exp] [in range] [,nolabel]

3. Creacin de variables y su manejo generate: crea una nueva variable generate [type] newvar = exp [if exp] [in range]

Principales funciones matemticas: abs(x) - valor absoluto exp(x) - exponencial ln(x) - logaritmo natural log(x) - igual que ln(x) sqrt(x) - raz cuadrada Nmeros aleatorios: uniform() Genera nmeros aleatorios distribuidos uniformemente entre [0,1] normden(z) Genera el valor de la densidad normal estndar. normden(z,s) Genera el valor de la funcin de densidad normal normden(z,s)= normden(z)/s si s>0 norm(z) Genera el valor de la funcin normal estndar acumulada egen: extensin del comando generate. Puede generar grupos de variables segn los valores de otra variable (usando la opcin by). egen newvar = fcn (varlist) [if exp] [in range] [,options] donde fcn = (r)sum, (r)mean, (r)max, (r)min Opciones: by (varlist) label: permite etiquetar las variables y sus valores label variable varname "label" (etiqueta una variable) label define lblname # "label" [# "label" ...] [, add modify] (define etiquetas para los valores de una variable) label values varname lblname(asigna etiquetas a los valores de una variable) label list (lista las etiquetas existentes) replace: cambia el contenido de una variable existente replace oldvar = exp [if exp] [in range]

rename: cambia el nombre de una variable existente rename old_varname new_varname recode: permite recodificar los valores de una variable existente recode varname rule [rule ...] [if exp] [in range] drop: elimina variables u observaciones de la base de datos drop varlist drop if exp [in range] keep: especifica las variables u observaciones que se desean mantener keep varlist keep if exp [in range] clear: borra todo lo que est en la memoria (es equivalente a reiniciar Stata)

4. Generacin de resultados a partir de una base de datos summarize: devuelve diversos estadsticos sobre una variable [by varlist:] summarize [varlist] [weight] [if exp] [in range] tabulate: genera frecuencias de una sola variable y tablas cruzadas de dos variables [by varlist:] tabulate varname [weight] [if exp] [in range] [, nolabel] [by varlist:] tabulate varname1 varname2 [weight] [if exp] [in range] [, column row nofreq] Opciones: col: muestra los totales por columna row: muestra los totales por fila nofreq: se usa con col o row. Muestra los porcentajes respecto del total. Permite generar variables dicotmicas: tab varname, g(dummyname) table: genera tablas de estadsticas table rowvar [colvar [supercolvar]] [weight] [if exp] [in range] [, contents(clist) by (superrow_varlist) col row format(%fmt) center] donde clist = freq, [sum, mean, varname, sd, max, min] varname . ttest: hace un test de igualdad de las medias de una o ms variables. - Si la media es igual a un valor determinado ttest varname = # [if exp] [in range] [, level(#)] - Si las medias de dos variabnles son iguales ttest varname1 = varname2 [if exp] [in range] - Si las medias de una misma variable son distintas segn grupos de observaciones ttest varname [if exp] [in range], by(groupvar) [level(#)] Opciones: level: especifica la probabilidad de para calcular el intervalo de confianza. correlate: devuelve la matriz de correlaciones de las variables especificadas correlate [varlist] [if exp] [in range]

pwcorr [varlist] [if exp] [in range] collapse: convierte la informacin en una base de datos de medias, sumas y medianas collapse [(stat) varlist [[(stat)] ] [weight] [if exp] [in range] [, by(varlist)] donde stat = mean, sum, median, sd, max, min

5. Anlisis grfico graph: opcion para graficos ms complejos [by varlist:] graph [varlist] [weight] [if exp][in range]graph_type common_options sa] Tipos de grfico: twoway Grfico de dispersin en dos direcciones, por defecto. histogram Histograma. Opciones: bin(#) especifica el nmero de intervalos; normal: ajusta una distribucin normal. Opciones comunes: c(l) Conecta con lnea los valores graficados c(m) Conecta las bandas de medias usando lineas verticales s(.) Especifica que no se use conectores. sa(name) Guarda el grfico con un nombre determinado t1title("text") Ttulo principal del grfico b1title("text") Ttulo del eje x b2title("text") Ttulo del eje y xscale(#[,]#) Escala del eje x yscale(#[,]#) Escala del eje y kdensity: Calcula la funcin de densidad de Kernel (no paramtrica) de una variable kdensity varname [weight] [if exp] [in range] [, nograph generate(newvarx newvard) n(#) at(varx) normal] Opciones: at(varx) Utiliza los valores de una variable determinada para estimar la densidad.

6. Indicadores de pobreza y desigualdad poverty: calcula una serie de indicadores de pobreza basados en la distribucin de una determinada variable (ingreso) poverty varname [if exp] [in range] [fweight] [, line(#) gen(newvarname) all] Opciones: line(#): permite establecer el valor de la lnea de pobreza all: calcula y reporta todos los estadsticos de pobreza, tales como: - Tasa de pobreza - Brecha de pobreza agregada (valor) - Tasa de brecha de pobreza - Los ndices de Foster, Greer and Thorbecke con parmetros 0.5, 1.5, 2, 2.5, 3, 3.5, 4, 4.5, y

5 lorenz: grafica la curva de Lorenz de una variable lorenz varname [if exp] [in range] [fweight]

inequal: calcula indicadores de desigualdad de una variable especfica inequal varname [if exp] [in range] [fweight] Permite obtener: Coeficiente de variacin: desviacin estndar entre la media Desviacin estndar de los logaritmos Indice de Gini xtile: genera un numero determinado de cuantiles a partir de los valores de una variable. Tambin pude generar cuantiles a partir de los puntos de corte dados por los valores de otra variable. Solo acepta fweights xtile newvar= exp [weight] [if exp] [in range][, nquantiles(#) | cutpoints(varname)] Opciones: nq (#): Especifica el nmero de cuantiles cut(varname): genera una variable con los valores de los puntos de corte.

EJEMPLO DE SESIN EN STATA 10 Abrir una base de datos Para abrir una base de datos desde el men principal, seguimos la siguiente ruta: File/Open. En el cuadro de dilogo que aparece a continuacin se elige el archivo deseado, que en este caso tiene la extensin de los archivos de datos naturales de Stata, dta. Como ejemplo de sesin abriremos el archivo Table F7.1.dta: Este archivo contiene una base de datos para aerolneas de los EEUU: 90 observaciones de 6 firmas para 15 aos, desde 1970 hasta 1984. i = t= q= c= pf lf Aerolnea Ao Producto, ndice de beneficios por milla-pasajero Costo total en miles de US$ = Precio del combustible = Ratio de ocupacin de las aeronaves

Nota 3: Ntese que al ejecutar los comandos mediante estos mens se registran automticamente estos en la ventana Stata Review el comando equivalente para la ventana Stata Command. Esta caracterstica es muy til cuando se aprende Stata porque es posible ejecutar un comando mediante la GUI y luego repetirlo empleando comandos. Una vez cargado en la memoria el archivo Table F7.1.dta, mediante el men Stata, ste ha incorporado en la ventana de resultados los comandos equivalentes que se hubiesen tenido

que poner en Stata Command para obtener el mismo resultado. Los comandos se han almacenado en la ventana Review del mismo modo que sucedera si hubisemos digitado los comandos en dicha ventana. Si bien trabajar con la barra de herramientas y con los mens desplegables es ms intuitivo, para el usuario es ms rpido y eficiente trabajar directamente con los comandos (lo cual le permite emplear los archivos de ejecucin y la programacin avanzada). Inspeccin de los datos. Para ver una descripcin rpida de los datos ingresamos el comando describe. Para copiar a MSWord lo que acaba de aparecer en la ventana de resultados seleccionamos dicho resultado y lo copiamos como texto o como tabla.
. describe Contains data from C:\Cursos\Indecopi2007\Sesion Panel Estatico\Table f7.1.dta obs: 90 Source: William Greene: Econometric Analyisis, Fifth Edition. vars: 6 1 Mar 2007 16:58 size: 1,980 (99.9% of memory free) ------------------------------------------------------------------------------storage display value variable name type format label variable label ------------------------------------------------------------------------------i byte %8.0g Airline t byte %8.0g Year c long %12.0g Total cost, in $1000 q float %9.0g Output, in revenue passenger miles, index number pf long %12.0g Fuel price lf float %9.0g Load factor, the average capacity utilization of the fleet . des Contains data from C:\Cursos\Indecopi2007\Sesion Panel Estatico\Table f7.1.dta obs: 90 Source: William Greene: Econometric Analyisis, Fifth Edition. vars: 6 1 Mar 2007 16:58 size: 1,980 (99.9% of memory free)

------------------------------------------------------------------------------storage display value variable name type format label variable label ------------------------------------------------------------------------------i byte %8.0g Airline t byte %8.0g Year c long %12.0g Total cost, in $1000 q float %9.0g Output, in revenue passenger miles, index number pf long %12.0g Fuel price lf float %9.0g Load factor, the average capacity utilization of the fleet

. ds i t c q pf lf Nota 4: Ntese que es posible en algunos casos redactar el comando incompleto para ejecutar la misma funcin, as: describe es equivalente a des. Sin embargo ejecutar el comando ds realiza una descripcin de las variables utilizadas muy limitada.

Tipos de variables Stata permite manejar hasta 6 tipos de variables de datos importantes: float double byte int long nmeros reales en formato 8,5 (8 cifras enteras, cinco decimales) nmeros reales en formato 16,5 enteros entre 127 y 100 enteros entre 32767 y 32740 enteros entre 3147483647 y 2147483620

Stata por defecto le asigna formato float a una variable de datos nueva. Asimismo, Intercooled Stata8.0 en adelante soporta cadenas de hasta 80 caracteres de largo. str1 str240 cadenas de 1 carcter cadenas de 240 caracteres

Para ver los datos tal como si los visemos en MSExcel digitamos browse y aparece la ventana Stata Editor. . browser . br

Para editar los datos escribimos edit o pulsamos el botn correspondiente: . edit

Nota 5: Cuando las ventanas Browser y/o Edit se encuentran abiertas es imposible ingresar comandos, puesto que la barra Stata Command se deshabilita. Generacin bsica de grficos. Para crear grficos seguimos un procedimiento similar. Desde el men principal: Graphics/Easy graphs/Scatter plot, y en el cuadro de dilogo, con el cursor en la casilla X variable pulsamos q y en la casilla Y variable pulsamos c. Luego de pulsar el botn OK. . twoway scatter c q

Manipulacin bsica de variables. El modelo microeconmico original es:

pf

pf

lf

lf

_ cons

No obstante, es posible obtener la versin lineal de la misma funcin mediante la aplicacin del logaritmo. De manera que el modelo que estimaremos es el siguiente:

ln(c)

ln(q)

pf

ln( pf )

lf

lf

_ cons

Ahora bien, se requiere de calcular los logaritmos neperianos tanto del costo como del producto y el del precio del combustible. Para ello, desde el men principal, utilizamos la siguiente ruta: Data/Create or change variables/Create new variable y aparece un cuadro de dilogo en el cual debemos ingresar el nombre de la variable y su regla de creacin. En esta casilla Generate variable escribimos lnc, pulsamos el botn Create, elegimos mathematical, luego elegimos el logaritmo neperiano con doble click, luego vamos a la ventana variables y pulsamos la variable c y finalmente pulsamos el botn OK en los dos cuadros de dilogo. Al final de este proceso vemos que ha aparecido una nueva variable (lnc) y que el comando empleado en su creacin ha aparecido en la ventana de Results y en la ventana Review.

generate float lnc = ln(c) gen float lnc = ln(c) gen lnc = ln(c)

Nota 6: Obsrvese que por defecto a la nueva variable se le ha asignado el tipo float. Nota 7: En Stata los comandos deben ir siempre en minsculas. Adems, para los nombres de las variables Stata tomar en cuenta si empleamos minsculas o maysculas, no son la misma variable Modelo, modelo, MODELO, ni por ejemplo moDelO. Nota 8: Para reejecutar los comandos pulsamos el comando en la ventana Review o lo escogemos con las teclas avanzar pgina y/o retroceder pgina. Para crear las otras dos variables no es necesario repetir el tedioso proceso, basta pulsar el comando que acaba de aparecer en la ventana Review para que aparezca en la ventana de comandos tal como nos indica la nota anterior y editar del siguiente modo: generate float lnq= ln(q) generate float lnpf= ln(pf) Creacin de variables generate newvar=ejm: crea una variable nueva

replace oldvar=ejm: reemplaza una variable (Stata no sobrescribe variables, este comando no se puede abreviar) drop: borra una variable o un registro. Keep: borra las variables no nombradas o los registros no nombrados. Nota 9: los caracteres vlidos son dgitos (0-9), caracteres (a-z y A-Z) y el guin bajo (_). Nota 10: Stata recomienda que las variables comiencen con maysculas (para evitar confusiones con los comandos que siempre van en minsculas) Guardar una base de datos. Stata emplea la extensin dta para los archivos de bases de datos. Para grabar se pulsa el botn que tiene el icono de un disco o desde el men principal: File/ Save o File /Save as. Grabaremos la base de datos con un nuevo nombre: greene1.dta. Nota 11: Stata no guarda en el disco los cambios en las bases de datos a menos que ejecutemos el comando save (en eso se parece a MSExcel), por lo que si se apaga o si se cuelga la mquina perderemos los cambios. Nota 12: En Stata hay compatibilidad hacia adelante, es decir, los comandos y bases de datos de Stata9 sirven en Stata10 ( y Stata11), pero lo inverso no siempre es posible. Por ello, si trabajamos con una base de datos en Stata10 y luego la vamos a abrir en Stata7 deberemos grabarla con formato compatible. USO DEL MENU AYUDA DE STATA Comando help Este es uno de los comandos ms importantes de Stata, pues presenta la sintaxis de los comandos as como ejemplos de cmo se usan. Para pedirle ayuda a Stata sobre un comando se escribe en la ventana de comandos help (o hel o he o h) seguido del nombre del comando que queramos conocer. Abramos el archivo auto.dta y luego escribamos: . help summarize Observemos que el comando y su sintaxis obligatoria estn en negritas, mientras que en azul se reserva para los hipervnculos. En el nombre del comando se observa que las primeras letras estn subrayadas, lo que indica que podemos en lugar de escribir el comando como summarize podemos escribir sum (o cualquier forma intermedia). Notemos que todo lo que va entre corchetes es optativo y que en la sintaxis de los comandos primero se ponen las variables, luego el ponderador, los condicionales (if) preceden a los rangos (in) y les siguen las opciones despus de un coma: [varlist] es la lista de variables. [weight] son los pesos o ponderaciones. [if exp] permite seleccionar la muestra donde exp es una expresin lgica.

[in range]

permite seleccionar la muestra donde range es un rango de los datos.

ARCHIVOS DE INSTRUCCIONES (DO-FILES) En lugar de escribir los comandos en la ventana correspondiente una manera ms prctica de hacerlo es crear un archivo con una lista de instrucciones que se ejecutarn en conjunto desde all. Puede crearse mediante la ventana Do-file Editor o desde cualquier editor de textos, siempre y cuando le asignemos la extensin do. La ventaja de emplear la ventana Do-file Editor es que podemos ejecutar en forma parcial el archivo. Recordemos que para abrir la ventana del Do-file Editor pulsamos el botn correspondiente o las teclas {ctrl+8} o desde el men principal: Windows/Do-file Editor. OPERADORES EN STATA Conectores relacionales < menor que <= menor o igual que == igual a > mayor que >= mayor o igual que != diferente a (puede usarse ~=) ()parntesis para indicar el orden de evaluacin Conectores lgicos & y ( & se evala antes que el | ) |o ! no es el caso (puede usarse ~ ) Operadores aritmticos + suma - resta * multiplicacin / divisin ^ potencia + concatenacin de cadenas alfanumricas

Anda mungkin juga menyukai