Anda di halaman 1dari 520

Cuader nos

Metodolgicos

45

Anlisis de datos
con Stata

2. edicin

Modesto Escobar Mercado


Enrique Fernndez Macas
Fabrizio Bernardi
Stata es uno de los paquetes estadsticos de
referencia en las comunidades cient
cas de muy
diversas ramas, como la economa, la ciencia poltica
y la sociologa. En este Cuaderno Metodolgico
se ensean los rudimentos de su uso mediante
aplicaciones prcticas y e
plicaciones sustantivas
de anlisis de datos. os contenidos de esta ora
aordan con nivel sico e intermedio las tcnicas
ms utili
adas en la investigacin social
talas
de contingencia, comparacin de medias, anlisis
gr
co, regresin lineal, anlisis logstico,
istoria de
acontecimientos y ponderaciones
. El
ec
o de que
todas las e
plicaciones estn guiadas con e
emplos
reales facilita la comprensin de la tcnica y su
aplicacin prctica en las ciencias sociales. El liro
propone numerosos e
ercicios con investigaciones
reales, cuyos datos e instrucciones estn disponiles
en .cis.es
pulicaciones
CM
. Esta segunda
edicin se
a actuali
ado a la versin del programa
y la revisin del te
to se
a seguido ene
ciando del
StataCorps ut
or Support rogram.

Cuader nos
Metodolgicos

45

Anlisis de datos
con Stata

2. edicin revisada

Modesto Escobar Mercado


Enrique Fernndez Macas
Fabrizio Bernardi

00_PRIMERAS PAGINAS.indd 1

06/06/12 09:06

Con sejo E ditorial de la coleccin Cu adern os Metodolgicos


Di r e c t o r
Flix Requ en a San tos, Presiden te del CIS
c o n se je r o s
Franciso Alvira Martn, Universidad Com plu tense de Madrid.
M. ngeles Cea Ancona, Universidad Com plu tense de Madrid.

ess M. de Miguel Rodrgue, Universidad de Barcelona.


Modesto Escoar Mercado, Universidad de Salam anca.

. Seastin Fernnderados, Universidad de Alm era.

uan
gnacio Martneastor, Universidad Nacional de Edu cacin a Distancia.

s e c r e t a r ia
M. aCristina Rodrgu eela, Directora del Departam en to de Pu blicacion es om en to de la
In vesti
acin CIS
as n oras editoriales las in stru ccion es ara los au tores ueden con su ltarse en
tt

.cis.es
u licacion es
CM
odos los derecos reservados. roiida la reroduccin total o arcial de esta ora or
cu alqu ier rocediien to
a sea gr
ico, electrn ico, tico, quico, ecn ico,
otocoia,
etc.el alacen aien to o transisin de su s con ten idos en soortes agnticos, son oros,
visu ales o de cu alquier otro tio sin eriso exreso del editor.
CE CC
CAE RS ME
CS, M.
Catlogo de u licaciones de la Adin istracin en eral del E stado
tt

ulicacion eso
iciales.oe.es
riera edicin , diciere de
Segu n da edicin , ao de
CE RE
E S
AC
E S SC

CAS
Mon taln , . Madrid
Modesto E scoar Mercado.
E n riqu e Fernn deMacas.
Fari
io ernardi.
De r e c h o s r e s e r v a Do s c o n f o r m e a l a l e y

reso eco en E sa a
Prin ted and m ade in Spain

esito legalM. .

Fotocoosicin e iresin
E
ca, S. A.
arque
n du strial as Monjas eran o,
orrejn de Ardo
Madrid
El ael utili
ado ara la iresin de este liro es reciclado totalente lire
de cloro.

00_PRIMERAS PAGINAS.indd 2

06/06/12 09:06

n d ice
P
s.

.
RCC
...........................................................................

. R
ME RS ASS C SAA ..................................................
.. a in
oracin en los ar civos de Stata ...........................
.. a in ter
ad e Stata .............................................................
.. as ven tan as d e Stata ..........................................................
.. Modos de tr aajo en Stata ..................................................
.. E l
icer o d e r esu ltad os .......................................................
.. as variales de la atr ide datos ....................................
.. E jer cicios ..............................................................................

.
RCC
E AS .......................................................
..
n tr odu ccin an u al d e d atos ............................................
.. ectu r a d e d atos con Stata ..................................................
.. Fu sin de
iceros ................................................................
.. E jer cicios ..............................................................................

. E SAS
CAS E A SA AR
AE .................................
.. Clasi
icacin de var iales ....................................................
.. a tala de distriu cin de
recu en cias ..............................
.. E stadsticos res en es de distr iu cion es ...........................
.. ten cin de las ed idas car acter sticas de u n a
d istr iu cin ...........................................................................
.. a on d eracin d e los datos ................................................
.. E l err or tico ........................................................................
.. E jer cicios ...............................................................................

. MA
AC
M
F
CAC
E AS .......................
.. Man iu lacin d e d atos .........................................................

00_PRIMERAS PAGINAS.indd 3

06/06/12 09:06

c Ua De r n o s m e t o Do l Gi c o s 45
P
s.

.. en er acin odi
icacin d e variales ...........................
.. Caractersticas e in stru ccion es eseciales .........................
.. E jer cicios..............................................................................

. RF
CS C SAA................................................................
.. Caractersticas d e los gr
icos de Stata .............................
.. r
icos u n id ien sion ales .................................................
.. r
icos idien sion ales....................................................
.. Coon en tes de los gr
icos ..............................................
.. E squ eas .............................................................................
.. E l ed itor de gr
icos ............................................................
.. E jer cicios..............................................................................

. A RE A E SAS
CA AS CMARAC
E S ............
.. r u eas de u n a sola variale ..............................................
.. Coar acin d e dos variales ...........................................
.. Coar acion es de dos u estr as
in d een d ien tes..........
.. Coar acion es de u estras in deen d ien tes .................
.. Coar acion es de u estras deen dien tes ....................
.. E jer cicios..............................................................................

. CFE CC
A
S
S E AAS C SAA..............
.. alas de con tin gen cia de dos var iales............................
.. Ms de dos var iales ...........................................................
.. tr as talas eseciales ........................................................
.. as talas d e r esu esta ltile ........................................
.. E jer cicios..............................................................................

. A RE RE S
............................................................................
.. ue de untos, varian
a correlacin entre dos variales..
.. a regresin sile .............................................................
.. on dad d el aju ste d e la r egr esin ......................................
..
n
er en cias en la regresin sile .....................................
.. Regr esin ltile ..............................................................
.. Regr esin con variales
icticias ........................................
.. Regr esion es con in ter accin ...............................................
.. tr as r elacion es
u n cion ales de la r egr esin ....................
.. E jer cicios..............................................................................

00_PRIMERAS PAGINAS.indd 4

06/06/12 09:06

a n l i s i s De Da t o s c o n s t a t a
P
s.

.
AS
C E A RE RE S
.........................................
.. Su u estos d e la r egr esin lin eal.......................................
.. An lisis de los casos en la r egr esin ................................
.. Regresion es eseciales ......................................................
.. Regresin rou sta..............................................................
.. Regresin de cu an tiles ......................................................
.. Regresin or an das .......................................................
.. E jer cicios ............................................................................

. A RE RE S
S
CA......................................................
.. E l od elo estadstico ........................................................
.. E stiacin del odelo .....................................................
.. iagn stico d el od elo.....................................................
.. Coaracin de odelos .................................................
..
n terretacin del od elo ................................................
.. E jer cicios ............................................................................

. RE RE S
S
CA ARA AR
AE R
A
M
M
A.........................................................................
.. E l od elo estadstico d el logit or din al ............................
.. E stiacin e in terretacin d el od elo .........................
.. E l su u esto d e r egr esion es ar alelas o raon es
roor cion ales ...................................................................
.. Regresin logstica ar a var iale d een d ien te
n oin al ..............................................................................
.. E stiacin e in terretacin d el od elo .........................
.. E l su u esto d e in d een den cia d e altern ativas
irr elevan tes .........................................................................
.. E jer cicios ............................................................................
. E A
S
S E A
SR
A E ACE C
M
E S
C SAA....................................................................................
.. u es co
u n cion a el AA ......................................
.. E l AA con Statain stru ccion es ara d e
in ir los d atos...
.. a
u n cin de su er viven cia .............................................
.. Modelos de la tasa de tran sicin con tieo con tin u o ...
.. E jer cicios ............................................................................

00_PRIMERAS PAGINAS.indd 5

06/06/12 09:06

c Ua De r n o s m e t o Do l Gi c o s 45
P
s.

. A
S
S E AS E E CE SA C SAA .................
.. Aju stes en el an lisis d e u estras colejas..................
.. on deracion es, estr atos con gloer ados.......................
.. n ejelo rctico con Stata. as r den es sv............
.. E jercicios ............................................................................

RAFA CME AA....................................................

00_PRIMERAS PAGINAS.indd 6

06/06/12 09:06

A Mara
os E ceverra

u dit Balbs Marta raile

00_PRIMERAS PAGINAS.indd 7

06/06/12 09:06

00_PRIMERAS PAGINAS.indd 8

06/06/12 09:06

1
In t r o d u cci n
E s in n egable qu e la estadstica se h a con ver tido en u n a h er ram ien ta fu n d am en tal p ar a la in vestigacin en las cien cias sociales. Au n qu e n adie n iegu e
tam poco qu e pu edan r ealizarse estu d ios sobr e el m u n do h u m an o qu e r ecojan y an alicen d atos sin n ecesidad d e op er acion es m atem ticasu n a parte
con sid er able de an lisis n ecesita ap licar con ocim ien tos de esta r am a del
sab er au n sien d o slo de m od o bsico p ara con tar ocu r ren cias o p ar a
etrapolar los resu ltados d e u n a m u estr a al con ju n to d e elem en tos qu e se
d esea in vestigar.
ace cin cu en ta a os tod os los in str u m en tos qu e se d ispon an para las
op er acion es estadsticas eran el pap elel lpiz o b olgr afo yen el m ejor de
los casosu n a calcu lad ora qu e h ab a qu e en ch u far a la r ed elctrica yslo
en los m odelos m s eclu sivoscapaz de calcu lar races cu adradas. esde
en ton cesdos d esar rollos casi p aralelos h an cam b iado las posib ilid ad es
de aplicacin de la estadstica a la in vestigacin . or u n ladoel desarrollo de
la in for m ticaqu e h a p u esto a d isposicin d el b olsillo de los p articu lares la
ad qu isicin de u n ord en ador con cap acidades d e clcu lo qu e an ta o slo
estab an a d isp osicin de m u ltin acion ales y organ ism os p b licosyp or el
otrola ap ar icin d e pr ogram as especializad os en tar eas estad sticasqu e
h an perm itid o la ejecu cin d e tar eas de en orm e com plejid ad a per son as con
escasos con ocim ien tos m atem ticos.
e acu er do con este pan oram aeste libr o pr eten d e ser u n m an u al qu e
p erm ita a qu ien lo tr ab aje u n u so aplicad o y racion al de las h err am ien tas
estad sticas u sadas en la in vestigacin social yp or eten sin a la in vestigacin biosan itaria o ep idem iolgica. Au n qu e el objetivo cen tr al d e estas pgin as es en se ar a u tilizar u n p rogram a estad stico determ in ado n o m u y
distin to de otros qu e eisten en el m ercadoesta obra tam bin eplica cu les son los requ er im ien toslos pr ocedim ien tos yan te todola in terp retacin
d e los r esu ltad os de aplicar tcn icas estad sticas a u n con ju n to d e datos. or
ellolos au tores h an p reten did o con ju n tar lo qu e sera u n a in tr od u ccin a la
estad stica aplicad a con u n m an u al d e in iciacin a tata.
tata es u n a aplicacin estad stica n acida en el a o en el en tor n o
n ie in m ediatam en te traslad ad a al sistem a oper ativo in dos y

01_introduccin.indd 9

06/06/12 09:09

AE E

p oster ior m en teal de Ap ple. E ste pr ogram a h a ten ido tres im p or tan tes
p recu r sorespor ord en d e an tig edad destacan el (Biom edical Program )el A(Statistical An alysis System ) y el (Statistical Program s for
the Social Scien ces). E stos n acieron con ceb idos en en tor n os d e gran des ord en ador esevitan do la pr ogram acin en ortran p ara la resolu cin de los
p roblem as estadsticospar a pasar a ejecu tar se tam b in en or den adores
p er son ales en los a os och en ta. E n tre estos tres y tata tam bin cabe destacar la ap ar icin de otr as aplicacion es estadsticas
Ay tatr aph ics
p or ejem p loqu e se im p lem en taron en el en torn o in d os con u n a filosofa m u ch o m s in ter activa qu e los in iciales paqu etesm s p en sados par a
p rocesos p or lotes qu e para in stru ccion es in stan tn eas p resen tes en u n
m en a d isp osicin d el u su ario.
r es son las caractersticas m s sobr esalien tes qu e h an p er m itid o qu e
tata obten ga u n a posicin d estacad a en tre las ap licacion es estadsticasen
p rim er lu garel em pleo de in str u ccion es con u n len gu aje fcil d e m odo in ter activo. ren te al p rim er acer cam ien to d e los pr ogr am as clsicos a travs
d e in str u ccion es escr itas en con ju n to en u n fich eroo al m s m odern o estilo
d e dar r den es a tr avs d e m en stata ofr eca u n m od elo en el qu e se escriba u n a in str u ccin e in m ediatam en te se vean los resu ltadossiem pr e y
cu an do fu er a bien escrita. E n segu n d o lu gartata se especializ en el an lisis de regresion es. ren te a otros pr ogr am as estadsticos qu e p rcticam en te ab arcaban u n am plio elen co d e an lisistata au n qu e n o d e m odo eclu sivo se con cen tr especialm en te en los d iver sos an lisis d e regresin
ofr ecien d o u n a am plia varied ad de pr ocedim ien tos qu e van d esd e la r egr esin sim p le h asta los m odelos d e ecu acion es estru ctu r ales. in al y p rin cip alm en ten o slo se pod an em paqu etar todas las in stru ccion es en u n fich er o
para su em pleo con trastado y repetidosin o qu e tam bin por la propia n atu raleza de las in stru ccion es an alticascom bin adas con las fu n cion es y las
rden es de flu joera posible para u n tcn ico eperto la con feccin de n u evas
u tilidadesdistin tas de las im plem en tadasper o com partibles en u n a var iedad de situ acion es por u n con ju n to de in vestigadores con el n ico requ isito
com n de dispon er de este program aabierto a n u evas program acion es.
or tan top odr an d estacarsefr en te a otr os p rogram as de estadstica
las sigu ien tes caractersticasen p rim er lu gar sob resale por su facilid ad d e
u so. E sp ecialm en te tr as su ver sin
en er o de
en la qu e se in cor pora
u n sistem a de m en qu e pr cticam en te in tegra todas las in stru ccion es disp on iblestata es u n paqu ete asequ ible al au toap ren dizajesi ad em s se
con su lta la d etallada d ocu m en tacin en for m ato p df qu e le acom p a a. am b in destaca tata p or u n a am plia gam a d e tareas. ien es cierto qu e don de
sobr esale fren te a otr os p rogram as estad sticos es en las r egr esion espero
tam b in se destaca en an lisis d e m u estras com p lejasen ser ies tem p orales
en datos de pan elen an lisis d e su cesos h istricosen im p u tacion es de casos per did os ym s recien tem en teen grficos d e con torn os y d e m ar gin alesas com o en el an lisis de m odelos de ecu acion es estr u ctu rales. am bin

01_introduccin.indd 10

06/06/12 09:09

ANLIS IS DE DATOS CON S TATA

es u n pu n to fu erte d e esta ap licacin su carcter abier topu es n o slo d a al


u su ar io ep er to la posibilid ad de gen er ar o m od ificar p rogr am assin o qu e
tam bin perm ite a los u su ar ios m en os h biles la im p ortacin de esas n u e
vas h err am ien tas a su sistem a . E stoju n to a la eten sin d e las com u n icacion es in form ticash a gen erad o u n a com u n idad cien tfica qu e com par te
p rob lem as y solu cion esam plian do a su vez las posibilid ad es d e an lisis con
este paqu ete estad stico.
E ste libro va d irigido a p rin cip ian tesespecialm en te a los qu e se estn
in ician d o en el u so d e tata. u cu rva d e ap ren dizaje es esp ecialm en te plan a
en los com ien zoses deciren el in icio su u so n o resu lta fcild esp u sse
ap ren de con m en or d ificu ltad h asta u n n ivel en el qu e ya slo pu eden avan zar aqu ellos qu e sobr esalgan en estadstica o en pr ogr am acin . E l ob jetivo
d e las pgin as qu e sigu en a con tin u acin es h acer m en os costoso el ap ren d izaje in icial de esta h er ram ien ta de trabajo. ien e d os posibles u su ariosen
p rim er lu gar aqu ellos acad m icosesp ecialm en te d el cam po d e la sociologa
y de la cien cia polticaqu e n ad a o poco sepan d e estadstica y qu ier an h acerlo d e la m an o de u n o d e los p rogram as esp ecializados con m ayor pr estigio en el m u n d o u n iversitarioen segu n d o lu garp ar a aqu ellos eper tos en
tcn icas de an lisis qu e qu ieran apr en d er a m an ejar u n p rim er o u n segu n d o p rogram a d e tareas estad sticas. Au n qu e se con ten gan d eter m in ad as ep licacion es estadsticasestas estn d ir igidas m s bien a u n p b lico n efito
o a veces estn r ed actad as com o recor dator io d e cosas qu e se su pon e son
con ocidas. o es la in ten cin d e estas pgin as en se ar m s estad stica a
aqu el qu e ya la con oce y m u ch o m en os est dir igid o a qu ien dom in a tata
y qu iere apr en der m s tcn icas de an lisis d e datos. ara este ltim o p blico h ab ra qu e escribir u n n u evo lib ro don d e este term in a.
E n cu alqu ier casodebe su br ayarse qu e este n o es slo u n m an u al d e u n
p rogram a d e estadstica. A la vez qu e se eplica el u so de las rd en estam b in se dice p ar a qu sirven en qu con d icion es h an de u sarse ysobr e tod o
cm o h an de in ter pretar se los r esu ltad os. e h a escr ito con la in ten cin de
qu e aqu ellos p rofesion ales o acadm icos qu e qu ieran ad en trar se en el em p leo d e la estadstica ap licad a n o se en cu en tr en slo con u n listado d e in stru ccion essin o con u n a gu a qu e les ayu d e a saber em plear las y sacarles su
ju go. E ste p rogram a vien e acom p a ad o de u n m an u al tan eten so
vein ti n
vol m en es en su ver sin aparecida en ju lio d e qu e tien d e a desan im ar a qu ien se en fr en ta por pr im era vez a l. ien es cier to qu e en tr e estos
vol m en es h ay u n a gu a de in icio y otr a p ara el u su ar iop ero la pr im era es

om o m u estrasirvan los ejem plos de Pan elwhiz
h ttp

.pan elh iz.eu


qu e perm ite
trabajar con bases de datos proven ien tes de algun as in stitucion es de diferen tes pases
Alem an iaAu straliaein o n idoE E y E u ropay A
istribu tive An alysis tata acage

que con tien e h erram ien tas estadsticas para el an lisis de la distribucin de la riqu eza
http

dasp.ecn .u laval.ca
in de.htm l
y las ru tinas ost de on g y reese
para regresiones de
variable depen dien te n om inalas com o la in stru ccin para la tabu lacin m ltiple m rtab de
en n
an n

qu e sern eplicadas m s adelan te en este libro.

01_introduccin.indd 11

06/06/12 09:09

AE E

m s bien in su ficien te y la segu n da es d esigu al en la com plejidad de los tem as


tr atadospor lo qu e se estim a qu e es m ejor la secu en cia d e ap ren dizaje pr esen tada en esta obr a. Adem sm ien tras se plan ificaban y escr ib an las pgin as presen tesse h a preten d ido cu brir los con ten idos de u n cu rso de estadstica in ter m ediocon lo qu ead em s de u n m an u al d e u n p rogr am atam bin
p u ed e ser con sider ad o com o u n m ed io para apr en d er a p rocesar y an alizar
d atos m ed ian te u n a aplicacin d e ord en ad or.
or tod o elloeste libr o pr esen ta u n a estr u ctu ra secu en cialde lo sim p le
a lo com plejo. esd e los ru d im en tos b sicos a los p lan team ien tos m s avan zados. n o slo en tre cap tu lossin o tam b in en el in ter ior de los m ism os
se h a preten d ido ir de lo sen cillo a lo com plicad o. E n con secu en ciap ara
m u ch os lectores las pgin as qu e sigu en a con tin u acin n o se tien en qu e leer
o estu d iar u n a p or u n a. e con sidera m u y con ven ien te qu e cu an d o se llegu e
a u n apartado com plejose p ase a u n cap tu lo sigu ien tep ar a volver a l
cu an d o se est m s fam iliar izad o con el p rogram a. E jem plo clar o d e ello es
el ltim o apar tado del prim er cap tu loqu e ver sa sob re los for m atos de las
variab lestem a com plejo d on d e los h ayaqu e tien e m s qu e ver con la p resen tacin qu e con el con ten ido d e u n an lisis y con m s in ters in for m tico
qu e estad sticoau n qu e lam en tab lem en te de cru cial n ecesidad p ar a cu an do
se tr ab aja con var iables de tip o.
E l pr im o cap tu lo est ded icad o a los elem en tos bsicos d el p rogr am a.
om ien za con la in terfazqu e con stitu ye el m odo d e com u n icacin d e la
m qu in a con el u su ario. e an alizan cada u n a d e las ven tan as y m en s a
tr avs d e los qu e el in vestigad or p u ed e solicitar o con tem plar resu ltad os. e
eplican los tr es p rin cipales m od os d e trabajo con el pr ogram aes d ecircon
m en scon in stru ccion es o con fich er osy fin alm en te se clasifican y describ en los distin tos fich er os en los qu e se gu ar dan los datoslos resu ltadoslas
rd en es o las ayu das del pr ogr am a.
A con tin u a cin se d ed ica u n ca p tu lo a la in tr od u ccin d e d atosp r im er oa la en tr ad a m a n u a l d e in for m a cin d esp u s a la lectu r a a u tom tica d e otr os fich er os en for m a to teto y a la con ver sin d e a r ch ivos escr itos en otr os p r ogr a m a s o a p lica cion escom o E cel y a l for m a to
p r op io d e ta ta . in a lm en te
ter m in a este a p a r ta d o con u n a ser ie d e in str u ccion es qu e p er m iten la m a n ip u lacin d el fich er o p r op io d e la a p lica cin sea p a r a a a d ir le ca sos o p ar a a d ju n tar le va r ia b les p r oced en tes d e
otr os a r ch ivos.
E l cu ar to cap tu lo es el pr im ero qu e se ded ica al an lisis estad stico pr op iam en te dich o. Abor da la estadstica u n ivar iable descriptivacom p ren dien do las m edidas de ten den cia cen trallas de posicin las de dispersin las d e
sim etr a y las d e ap u n ta m ien tocon el fin d e estu d iar las d istrib u cion es y
su com por tam ien to. A con tin u acin se epon en los pr ocedim ien tos m s fciles p ara la p on d eracin con tatareservan do par a el ltim o cap tu lo los
p roced im ien tos com p lejos de pon d er acin de m u estr as. al fin al del cap tu lose r ealiza u n a in tr odu ccin a la estad stica in feren cial ep lican d o el

01_introduccin.indd 12

06/06/12 09:09

ANLIS IS DE DATOS CON S TATA

er ror tpico y los in ter valos de con fian zaim p rescin dibles p ara la estim acin de los p ar m etr os d e la p oblacin .
ras este p rim er cap tu lo d e an lisisse in clu ye el tem a d el tratam ien to
y m odificacin de d atos. tata con tien e u n a ser ie de in str u ccion es qu e perm iten or den ar y seleccion ar los casos sin qu e n ada qu ed e alterad o. A este
p roceso se le d en om in a tr atam ien to y pu ed e ser til en u n a m u y am p lia
varied ad d e casoscom o cu an do se desee r ealizar u n an lisis especfico d e
jven es o d e m u jer es. or otr o lad ola m odificacin de datos in clu ye tan to
la recod ificacin d e los valor es d e las variab les del fich er o com o la gen eracin d e n u evas var iables m edian te tran sfor m acion es algebr aicas de otr as ya
eisten tesporqu e m u y a m en u d o n o in ter esa an alizar los datos tal com o
fu er on r ecogidossin o tr as aplicarles algu n os cam b ios qu e m ejor en su p resen tacin com o pu ed e ser el caso de p resen tar u n a tab la d e la edad con su s
valor es r ecod ificados.
a versin d e tata m odific radicalm en te las in str u ccion es p ar a la
con feccin de grficos ycom o n o pod a ser d e otra m an er ase dedica u n
captu lo a la r ealizacin d e estos. Au n qu e los m en s pu eden facilitar esta
tareala p eticin de u n grfico n o es tar ea fcilcu an do se desea algo distin to de lo estn dar. ebid o a esta dificu ltada partir de la ver sin apar ece
u n editor d e grficos con el qu e se sim plifica en gr an m ed id a el em p leo de
cam bios sin ten er qu e apr en der las op cion es o sin ten er qu e n avegar por u n
en m ar a ado sistem a d e m en s y solap as. E l or den de pr esen tacin de los
d istin tos tip os d e gr ficos es fu n cion a lpor su u so. r im er o se d escr ib en
los gr ficos u n id im en sion ales qu e repr esen tan u n a o varias var iables en u n a
n ica escala ya con tin u acin se en u m er an los qu e con tien en al m en os d os
escalas d istin tas. in alm en teal acabar el captu lose eplica br evem en te el
ed itor d e gr ficos.
E n el sp tim o captu lo se tr atan las pr u ebas estad sticas m s sim p les
con ten id as en tata. e com ien za con u n a in trod u ccin sobr e la p ru eb a estadstica ap licad a a u n a sola var iable. e ep lican las pr u eb as par am tricas
d e p rop or cion es y m edias y la pru eb a d e los sign os. on ellaslos in vestigad ores pu eden com p rob ar si su s h iptesis d escr iptivas son con gr u en tes con
su s datos. er o tam bin en este captu lo se eplican las p ru ebas estadsticas
qu e sir ven par a las h iptesis com p ar ativas. ay p ru ebas par a d os o m s
m u estras in depen dien tes
u n a variab le m edid a en gr u pos distin toso p ar a
d os o m s d ep en d ien tes
dos o m s variab les ob ten idas en u n n ico gru p o
.
n a d e la s op er acion es m s em p lea d a s en el a n lisis d e cu estion a r ios
son las tab la s d e con tin gen cia . A ellas se le d ed ica tod o u n cap tu lo. e
estu d ia n los d istin tos tip os d e p or cen ta jes qu e se p u ed en a p lica rlos r esid u osla s p r u eb a s esta d sticas d e sign ifica cin y los coeficien tes d e a socia cin . od o ellop r in cip alm en tep ar a estu d ia r la fu er za d e la r ela cin en tr e
d os va r ia b les. om p lem en ta r ia m en tese ter m in a el cap tu lo con u n a con sid er a cin sob r e las ta b las d e m s d e d os d im en sion es en lo qu e p u ed e
con sid er a r se u n a in tr od u ccin a l an lisis m u ltivar iab le y con la ep lica -

01_introduccin.indd 13

06/06/12 09:09

AE E

cin de u n p r ogr am a eter n o qu e p er m ite la tab u lacin d e p r egu n tas m u ltir esp u esta .
os cu atr o sigu ien tes cap tu los estn ded icad os a lo qu e son los pr ocedim ien tos m s n otab les d e tatalas r egr esion es. e com ien za en el n oven o
con la r epr esen tacin d e d os va riab les en la n u b e d e pu n tos p ar a ep licar
el con cepto d e covarian za y el d e cor relacin se ep lica el m tod o de m n im os cu adrados para la etraccin de u n a r ecta qu e pase lo m s cerca posible
d el con ju n to d e pu n tos repr esen tad os y se abor dan los tem as m s espin osos
d e la estim acin d e los par m etros poblacion ales. esp u s de ep licar en u n
p rim er m om en to la regresin sim ple
con u n a sola variable in depen dien te

se p asa a la regresin m ltip le


m s d e u n a variab le in dep en d ien te
se
abor da poster iorm en te el u so e in terp retacin d e d eterm in ad os tipos d e var iables com o las dicotm icas yfin alm en tese pr esen tan m odelos con u n a
r elacin fu n cion al distin ta de la lin eal
regresion es cu adr ticasc bicasep on en cialeslogar tm icasin versas
.
E l dcim o captu lo se ded ica a an alizar los su p u estos d e la regresin y
las p osibles solu cion es a su s an om alas. e p resta aten cin a las m edidas
p ar a la d eteccin de casos an m alos qu e d esvirt an la obten cin de la r ecta
y se acab a con u n con ju n to d e regresion es especiales qu e evitan los pr oblem as gen erados por el n o cu m plim ien to de las asu n cion es d e este an lisis. e
eplican en con secu en cialas r egr esion es con pon d er acin las r ob u stas y
las r ealizadas por b an d as o cu an tiles.
E l ter cer o d e los captu los dedicados a la r egr esin se cen tr a en la logstica bin ar iap ara los casos en los qu e se desee efectu ar u n a r egr esin con
variab le d epen dien te dicotm ica. E n el caso d e las cien cias sociales ab u n d an las var iables n om in alesp or lo qu e esta altern ativa a la r egr esin com n pu ede aplicar se evitan d o qu e las pr ed iccion es se salgan d e los lm ites
p ropios de este tip o d e var iables. E l ltim o cap tu lo d e regresion esel d u od cim over sa sob re otras var iables d e r esp u esta n o cu an titativa. E n p articu larse cen tr a sob re las r egr esion es or din ales y m u ltin om ialesp ara abord ar
aqu ellos casos en los qu e es in su ficien te u n tr atam ien to dicotm ico d e la
variab le depen d ien te. ara tod as estas tcn icas estadsticas se ep lican n o
slo las r den es d el pr ogr am asin o tam b in otras disp on ibles en
n ter n et
creadas por on g y r eese

.
r as las regresion es se d edica u n captu lo a u n a tcn ica en la qu e tata
p osee m u y am plios recu rsos com o es el an lisis d e la h istor ia d e acon tecim ien tosespecialm en te til para el an lisis din m ico de los fen m en os n atu r ales o sociales.
E n ltim o lu garse cier ra este m an u al in tr odu ctor io con u n captu lo
d ed icad o a las p on d eracion es de m u estr as especiales m u y tiles en el p rocesam ien to de en cu estaspu esto qu e en estas rara es la ocasin en la qu e se
r esu elven m edian te m u estr eos aleator ios sim ples.
bviam en te n o se trata gran par te de los an lisis qu e estn d isp on ibles
en tata. E n tr e otrosson de especial m en cin por su im p or tan cia las r egr e-

01_introduccin.indd 14

06/06/12 09:09

ANLIS IS DE DATOS CON S TATA

sion es m u ltin ivel y con dicion aleslas ser ies tem por alesel an lisis factor ial
o el d e con glom er ad oslos datos disp u estos en pan ella im pu tacin de casos p er didoso los recin in cor porad os m odelos d e ecu acion es estr u ctu r ales. u in clu sin im p licar a dob lar las pgin as de este m an u alcu ya pr eten sin es in tr od u ctoria. osib lem en te d eb er a escr ib irse u n segu n do volu m en
d edicado a an lisis m s com plejos para cu b rir todas estas lagu n as. E n cu alqu ier casosiem pr e estn los ecelen tes m an u ales d e tata para el qu e d esee
ir m s all.
o qu e h a p residido en la redaccin d e este lib ro es an te todo la sim plicid ad. or elloen las ep licacion es se tien d e a ir de lo sim p le a lo com plejo
y se in siste en el ap ren dizaje a tr avs d e los ejem plos. odos los r esu ltad os
d e an lisis m ostr ados estn acom pa ados p reviam en te de la in stru ccin
qu e los gen era yp osterior m en tedel com en tar io pertin en te. o se olvida
in clu ir las fr m u las de las oper acion escon el fin de qu e n o slo sea u n
m an u al d e u n p rogr am asin o tam b in u n a in trod u ccin a la estadstica y
com o com p lem en to para n avegar en el in m en so cau d al de r den esopcion es y su bop cion es de este pr ogr am ase ofr ece u n n dice d e in str u ccion es
p ara qu e el lector sepa en qu lu gar del libr o se en cu en tra su ep licacin .
am bin son im por tan tes los ejercicios in clu idos al fin al de cad a captu lo
ya qu e slo con la pr ctica se con segu ir n dom in ar las d ificu ltad es pr opias
d e su bu en u so. in em bargod ifcilm en te p od rn leer se las p gin as qu e
sigu en a con tin u acin secu en cialm en te. ar a qu ien es se in ician en E stad sticase su giere qu e com ien cen con los captu los y p ar a con tin u ar
con el el y el . u ien es qu ieran apren der slo tataen cam biodeberan
em p ezar con estos y d esp u s pr osegu ir con los captu los qu e ver sen sobr e lo
qu e realiza m s fr ecu en tem en te o con aqu ellos qu e le resu lten m s d escon ocid osseg n su d estreza sea p oca o m u ch a. in alm en tepar a los in iciad os
tan to en el p rogram a com o en el con ocim ien to estad sticop u ed e r ecom en d arse u n a lectu r a a p ar tir del d cim o o u n d cim o cap tu lodesde don de se
ab or dan las tcn icas m s com plejas.
a au tor a d e este lib ro se h a distrib u ido del sigu ien te m odoel captu lo
h a sido con feccion ad o p or abr izio er n ar dilos cap tu los y
p or E n riqu e er n n d ezqu e ad em s es el au tor pr in cipal d e los captu los
y y el r esto d e los tetospor od esto E scobarqu ien es tam b in r esp on sab le d e la actu alizacin de todos los gr ficosilu str acion es e in stru ccion es p ar a con form ar los a la ltim a versin d e tatapu es en esta segu n d a
ed icin d e la obr a se h a qu er ido actu alizar el con ten ido con algu n as de las
m ltiples n ovedades in cor por adas en la versin .
u edafin alm en teagr adecer todas aqu ellas con tribu cion es qu e h an
ayu d ado a qu e este p rod u cto h aya visto la lu z en su form a actu al. a n iversidad d e alam an ca y el
n stitu to
u an ar ch d e E stu d ios e
n vestigacion es son las in stitu cion es qu e m s h an con trib u ido a qu e los au tores h ayan
p odid o dedicar su s esfu erzos en este em pe o did ctico. E stu d ian tes de u n a
y otra in stitu cin docen te h an recibido n u estr as en se an zas en estas m ate-

01_introduccin.indd 15

06/06/12 09:09

AE E

r iasy n o h ay du da d e qu e gr acias a ellas se h an refor m u lad o el esqu em ala


orien tacin y la didctica del p resen te teto. Adem sla b u en a r ecepcin
qu e h a ten id o la pr im era tir ad a de este m an u al n os h a m otivad o a sacar lo
an tes posible u n a n u eva ed icin qu e in cor por ar a los cam b ios de la ltim a
ver sin d el progr am a. ebe m en cion arsep or cier tola ecelen te p oltica de
la em p r esa qu e lo p r od u ceta ta or p d e asesor am ien to a los a u tor es
d e libr os qu e em plean su pr ogram a. E sta obr a se h a acogido a ella y se h a
b en eficiad o de m ltip les com en tar ios cr ticos de u stavo n ch ezesp ecialm en te tiles para qu e los ejem plos d e las in str u ccion es con tu vieran los m en os er ror es posibles. Asim ism ou b n u iz ley u n a abu n dan te seleccin
d el teto e h izo su geren cias m u y tiles a los au tor es. am p oco sera ju sto
om itir la p rofesion alidad y p acien cia d e los ed itor esin corp oran do decen as
d e corr eccion esas com o la ecelen te tar ea acom etida por los dos evalu ad or es an n im osal em itir in teligen tes apor tacion es qu e h em os in ten tad o
r eflejar en esta obr a. i qu e d ecir tien e qu e los er ror es qu e sigan p resen tes
en el teto son slo resp on sab ilidad d e qu ien es lo fir m am os.

01_introduccin.indd 16

06/06/12 09:09

2
P r im e r o s
p a so s
co n
St a t a
2 .1 .La
in fo r m a ci n
en
lo s
a r ch ivo s
de
St a t a
Cu alqu ier pr ogram a estadstico trabaja con in for m acin en m u y diver sos
form atos alm acen ada en distin tos tip os de fich ero. Por ello, en este apar tad o se van a d escr ibir los prin cipales arch ivos con los qu e tr abaja Stata. os
seis tip os qu e se vern a con tin u acin p u ed en dividir se en tr es gran des gr u p oslos qu e gu ar dan in for m acin sin procesar, los qu e con servan la in form acin p rocesad a y los qu e perm iten o ayu dan a tran sfor m ar la in for m acin . n el pr im er gru po se in clu yen los fich er os qu e con tien en los d atos
in divid u ales tal y com o son in trodu cid os en el ord en ador despu s del tr abajo de cam p oen el segu n do se con sid er an los arch ivos d on de se gu ard an los
estad sticos o gr ficos qu e se gen er an con el an lisis del pr ogr am a y, fin alm en te, se con sideran del ter cer gr u po los fich er os don de con ven ien tem en te
se alm acen an las in str u ccion es n ecesar ias p ara reali
ar las tareas.
a b ase d e tr ab ajo es la m atr id e datos, qu e con siste en u n a disposicin
or den ada d e in for m acin , poco o n ada p rocesad a. en er alm en te, el m od o
com o esta se organ ia para su tr atam ien to es de tal form a qu e los casos se
en cu en tren epu estos en filas y las variables en colu m n as. n ejem plo sim ple
p u ed e bastar para la com pren sin d e la estr u ctu ra. Su pon ien do qu e h u b iera
qu e an aliar a d os p erson as, u n a m u jer y u n h om br e d e ed ad es respectivas
d e y a os, se pu eden distin gu ir tres con cep tos pr im or diales
n p rim er lu gar, el con cep to de caso, esto es, cu alqu ier u n id ad d e la qu e
se r ecoge in for m acin . n los datos an ter iores eisten d os, las dos p er son as
d e las qu e se sab en su s caractersticas sociodem ogrficas. n segu n do lu gar,
el con cepto d e variable, es d ecir, las caractersticas su sceptibles de adqu ir ir
d istin tas m od alid ades. n el ejem plo pr esen te, las dos variab les d isp on ibles
son seo y edad. n a de ellas es d e n atu rale
a cu alitativa, m ien tr as la otra
se p resen ta com o cu an titativa. Cada u n a d e las m od alid ades, cu alitativas o
cu an titativas, de estas variab les r ecib e el n om b re de valor. n este caso, son
valor es y a os. am bin son valores m u jer y h om br e, au n qu e p or
n o ser d e n atu ralea n u m r ica, tam b in pu eden d en om in arse atribu tos, categoras o, en con ju n to, u n factor.

02_primeros pasos(nuevo).indd 17

06/06/12 09:23

CS
CS

ILUSTR ACI
2.1 .a t r i
lit e r a l
d e
d atos
om b re
u jer

sta m a tr id e d a tos p od r a con d en sa r se a n m s si se r ep r esen ta n los


a tr ib u tos con u n a ser ie d e cd igos. s p u ed e r ed u cir se H om bre, p on ien d o
a tod os los ca sos con esta ca r a cter stica u n sm b olo qu e lo r ep r esen te, qu e
p u ed e ser , o p r efer ib lem en te u n d gito, p a r a qu e la in tr od u ccin d e la
in for m a cin se p u ed a h acer d el m od o m s r p id o y, p or costu m b r e, el
p a r a la s p er son a s d e gn er o m ascu lin o y el p a r a las m u jer es. e esta
for m a , la m a tr id e d a tos or igin a l p r esen ta u n a estr u ctu r a com o la sigu ien te
ILUSTR ACI
2.2.a t r i
c o d ific a d a
d e
d atos

sta m atrio con ju n to d e datos, p ara qu e pu eda ser tr atada in form ticam en te m s d e u n a ve, h a d e ser gu ard ad a en u n fich ero de datos. n
p rin cip io, cu alqu ier ar ch ivo qu e con ten ga in form acin or den ad a pu ede ser
ledo d irecta o in dir ectam en te p or Stata. Pero slo p u ed en ser u tili
ados
d esd e el in ter ior del pr ogram a m edia docen a d e form atosSC
o n icode,
, C, SS Py cel. Para el r esto d e casos, eisten otros pr ogram as qu e tran sfor m an los fich eros gen er ados p or ap licacion es com o h ojas d e clcu lo, bases d e d atos o in clu so otros p rogram as estadsticos en fich er os d e trab ajo ap tos p ar a Stata. n tre ellos, u n o de los m s con ocidos es
Stat-Tran sfer , cu yo u so y u tilid ad se ver en la seccin ...
Sin em b ar go, p ar a el trabajo estadstico n o basta con ten er la m atr id e
datos b ru ta. ay qu e a ad irle al m en os los n om bres de las variab les para
qu e cu an d o se solicite u n a d eter m in ad a tar ea el pr ogr am a sepa qu in form acin se d esea tr atar. o es lo m ism o solicitar u n a m ed ia del seo qu e de
la edad . Se podr a in d icar qu e se d esea slo u n a m edia de la segu n da var iablep er o es m u ch o m s cm odo solicitar la llam n d ola edad. Por ello, u n a
de las operacion es im pr escin d ib les en todo p rogram a estadstico es la de
con vertir el fich er o de datos br u tos en otr o con la m atr ide datos am pliada
con las defin icion es y tran sfor m acion es de la in form acin origin al qu e el
u su ario con sider e con ven ien te.

Stat-ran sfer no es u n produ cto de la casa StataCorp., sin o de Circle System , au n qu e


fuera de stados nidos lo su elen com ercialiar las m ism as em presas qu e ven den Stata.

02_primeros pasos(nuevo).indd 18

06/06/12 09:23

ANLIS IS DE DATOS CON S TATA

stos esp ecficos fich eros con in form acin b ru ta, d efin icion es y tr an sform acion es se d en om in an fich eros de trabajo. Slo pu eden con str u ir se con
el p rogram a Stata o con otros pocos p rogram as estadsticos qu e in clu yen la
p osibilidad d e gu ar dar los datos en este for m ato. en er alm en te se les recon oce p or ten er la eten sin .dta . n ellos estn alm acen ad os los d atos d e
las var iables origin ales y de las cr eadas p osterior m en te por el u su ario, ju n to
con su s cor respon dien tes n om b res, etiqu etas y form atos.
Para qu e pu edan com prob arse los ejem p los de su m an u al, Stata p er m ite
acced er a tod os los fich eros em plead os. Se p u ed e ob ten er u n a relacin d e
los fich eros de d atos in cor por ad os en la in stalacin del progr am a m edian te
la in str u ccin sysu se dir:
ILUSTR ACI
2..ir e c t o r io
de
lo s
fich e r o s
d e
d a t o s
en
e l
sist e m a

tr os ar ch ivos de in ters en el trabajo con Stata son los ficheros de resu ltados
con eten sin sm cl o log
siem p re qu e as se le in diqu e, los r esu ltad os d e las r den es d ad as al pr ogram a son ar ch ivad os en u n fich er o par a qu e
p u edan qu ed ar d ispon ib les p erm an en tem en te, sin ten er qu e volver a procesar de n u evo los d atos m edian te las in stru ccion es p er tin en tes. Stata dispon e
d e u n for m ato especfico de gr ab acin d e los r esu ltad os en u n fich ero (form atted logal qu e in cor pora la eten sin sm cl, qu e con sta de todos los elem en tos ad icion ales n ecesarios p ar a u n a p resen tacin id n ea d e las tablas
estad sticas. Pero en ocasion es es til qu e los resu ltados se gen er en en u n
form ato tratab le u n iversalm en te, com o es el caso d e los fich er os en cd igo
SC

. Por ello, tam bin eiste la posib ilidad d e gr abar los resu ltados sin
form ato en ar ch ivos gen er ad os en Stata con la eten sin log.
n cu alqu ier caso, en n in gu n o d e estos dos tipos de fich er os se in corp or an los grficos, pu es cada u n o de estos se gu ar da en u n fich ero in depen d ien te y esp ecfico para este tip o de r ep resen tacin de datos. Com o se ver
en el captu lo , cu an do Stata gen era u n grfico, el progr am a abr e u n a ven tan a esp ecial d on d e lo u bica y caso de qu e qu iera con servarse, h a de grab arse com o u n fichero grfico. Stata d ispon e de u n form ato pr op io (gph
pero,
p ara qu e otros u su ar ios qu e n o u sen Stata lo pu ed an con tem p lar, tam b in
eterm in ados ficheros de datos creados para las fu n ciones de im pu lso
respu esta asociadas a m odelos y C se gu ardan con la eten sin irf, en lu gar de dta.

Por ejem plo, cuan do se desea trasladar los resu ltados a otro program a, com o puede ser
u n procesador de tetos, o cu ando se qu iere qu e sean ledos en alg n orden ador qu e n o dispon ga del program a Stata.

02_primeros pasos(nuevo).indd 19

06/06/12 09:23

CS
CS

p er m ite gr abarlo en otr os for m atos tales com o m etaar ch ivo d e in d os


(m f
m etaarch ivo m ejor ado (em f
por table de r ed (pn g
p ostcript (ps

p ostcr ip t en cap su lad o (eps


form ato de d ocu m en to porttil (pdfy el form ato d e fich er o d e im agen etiqu etada (tif
.
in a lm en te, es im p or ta n te cer r a r la lista d e fich er os d e Sta ta con los
d en om in a d os fich er os d e p r ogr a m a
do y a do
, qu e con tien en con ju n tos
d e in str u ccio n es d e Sta ta q u e p u ed en ejecu ta r se a u tom tica m en te sin n ecesid a d d e ten er la s qu e volver a in tr od u cir in ter a ctiva m en te. os h a y b sica m en te d e d os tip oslos p r im er o s p er m iten r ep etir los m ism os a n lisis
o tr a n sfor m a cion es d e d a tos cu a n ta s veces se d esee a lo s m ism os d a tos
m ien tr a s qu e los segu n d os se u tilia n p a r a a p lica r u n tr a ta m ien to com n
a d a to s d ifer en tes, com o si fu er a u n a in str u cci n m s d el p r ogr a m a p u es
se in cor p or a n a u tom tica m en te a l a r r a n ca r lo. a y cien tos d e ellos q u e
p u ed en ob ten er se en la s p gin a s oficia les d e Sta ta p er o u n u su a r io a va n a d o p u ed e con str u ir los p a r a su p r op io u so y p u ed e p on er los a d isp osici n d e la com u n id a d cien tfica . d em s, tien en su com p lem en to en los
fich er os d e a yu d a , d istin gu ib les ta n to en Sta ta com o en otr os p r ogr a m a s
p or su eten sin sth lp
o h lp en la s p r im er a s ver sion es
, d on d e se in clu yen
ep lica cion es con cr eta s d e cm o p u ed en u sa r se la s in str u ccion es p r o gr a m a d a s.
Com o resu m en , pu ede con feccion ar se el sigu ien te esqu em a de los seis
tipos de fich eros acabad os d e d escr ibir
CUAR
2.1.Tip o s
d e
fic h e r o s
en
St a t a
Tip o

St ip o

t e n sio n e s

atos

ru tos

.dat, .tt y otras

m pliados
rabajo

.dta e .irf

etu ales

.sm cl y .log

rficos

.m f, .em f, .png, .pdf, .ps y .eps

Program a

.do y .ado

yu da

.sthlp y .h lp

esu ltados

Program as

2.2.
La
in t e r fa
d e
St a t a
l ejecu tarse Stata, se m u estra u n a p an talla com pu esta p or u n a ser ie de
elem en tos cu yos u sos y fu n cion es se dan a con tin u acin . o pr im er o qu e
h ay qu e ten er en cu en ta son las cin co fran jas h orion tales qu e p resen ta la
in ter fadel pr ogram a. od as estas division es, salvo la cu ar ta, qu e es la m ayor y est com p u esta por u n con ju n to d e ven tan as, pr esen tan u n a sola ln ea
d e eten sin ver tical

02_primeros pasos(nuevo).indd 20

06/06/12 09:23

ANLIS IS DE DATOS CON S TATA

ILUSTR ACI
2..P r im e r a
p a n t a lla
d e
St a t a
12

a p rim er a de las on as presen ta el color qu e p or d efecto le ad ju d iqu e el


sistem a oper ativo a los pr ogr am as qu e con l se ejecu tan . n ella estn in d icados el n om b re y la ver sin d el pr ogram a qu e se h a p u esto en m ar ch a, el
n om b re del fich ero d e trabajo qu e estu viera abier to, as com o la r u ta o dir ector io del or den ador en el qu e se en cu en tr a.
con tin u acin , en la segu n da
on a h ori
on tal, aparece la fr an ja del
m en , com pu esto por n u eve ap ar tados, qu e son los sigu ien tes
ileste tem del m en perm ite reali
ar la apertura, grabacin e im presin de los distintos ficheros de trabajo anali
ados en el apartado anterior.
l segundo apartado del m en es dit. Sirve para copiar y pegar fragm entos de te
to. l uso m s com n que se da a esta instruccin es la de
trasladar los resu ltados del an lisis a otra aplicacin com o pu eda ser
un procesador de te
to la m ayor parte de veces, una hoja de clculo o un
program a de grficos. am bin puede utili
arse para cortar y pegar determ inados fragm entos de instrucciones de un lugar a otro. as dos opciones principales de este m en son copy
copiary paste
pegar
. Com o
en la m ayor parte de los program as qu e se ejecu tan con in dos,
am bas pueden ser sustituidas respectivam ente por la com binacin de
teclas Ctrlc y Ctrlv. am bin en este apartado se encuentra la opcin
de las preferen cias (referen ces
. Perm ite el cam bio de determ in ados
aspectos de las ventanas del program a. os son los principales apartados
que pueden cam biarse. l relativo a los te
tos o ventanas y el relacionado
con los grficos. n relacin con el prim ero, en las antiguas versiones de

02_primeros pasos(nuevo).indd 21

06/06/12 09:23

CS
CS

este program a estaba asociada la im agen de los resultados con una pantalla de fondo negra en la que las instrucciones aparecan en blanco, los
resultados estadsticos en am arillo, el te
to com plem entario en verde y
los errores en rojo. odos los elem en tos de esta com bin acin pu eden
cam biarse tanto en la pantalla activa de resultados (esu lts Colorscom o
en el visor de otros ficheros (ieer Colorsde m odo independiente. n
relacin con los grficos, puede cam biarse el esquem a
vase la seccin
.
, la fuente de sus te
tos y algunos aspectos de la im presin o de su
e
portacin directa a otros program as. inalm ente, la disposicin de las
ventanas de Stata puede cam biarse si el usuario cam bia m anualm ente el
tam ao o la posicin de estas y guarda su opcin m ediante Save reference Set. partir de ese m om ento, el program a se presentar de esa form a
incluso despus de salir al arrancar de nuevo. Por su lado, hay en la versin .incorporados seis m odelos de disposicinpara obtener la configuracin m ostrada en la ilustracin .hay que optar por el idscreen
ayou t, m ientras que la disposicin clsica de otras versiones se obtiene
m ediante la opcin Com bined ayou t.
n los tres apartados sigu ien tes del m en
ata, raphics y Statistics
se despliegan las m ltiples operacion es estadsticas de la qu e es capa
Stata a travs de cu adros de dilogos. n el prim ero
atase in clu yen aqu ellas in stru ccion es qu e sirven para describir los datos,
tran sform arlos o h acer m an ipu lacion es al fich ero don de estn conten idos. n a parte su stan cial de estas rden es estn eplicadas en la
presen te obra a lo largo de los captu los y . l segu n do de los tres
apartados en cu estin (raphicsest reservado a las in stru ccion es
grficas. as m s im portan tes estn con tem pladas en el captu lo . ,
bajo el rtu lo de Statistics, se dispon e la casi totalidad de operacion es
estadsticas de la qu e es capaeste program a. ay qu e ten er en cu enta qu e esta posibilidad de obten er resu ltados estadsticos m edian te
m en s y cu adros de dilogo slo se h a in corporado a Stata a partir de
su versin . u n u su ario n ovel de Stata le resu ltar m u ch o m s cm odo el em pleo de estas gu as. Sin em bargo, u n u su ario eperim en tado preferir escribir directam en te las in stru ccion es u n a a u n a o recopilarlas en u n fich ero para ejecu tarlas en serie.
a denom inacin ser, situada en la se
ta posicin de la franja del m en,
sirve para que un program ador inserte all sus propias utilidades. Por
tanto, nada ser dicho sobre este apartado en este libro introductorio.
l ap ar tado in dos per m ite acceder a diede los on ce tipos de
ven tan as qu e com pon en la estru ctu r a in tern a d el progr am a Stata en
su d u odcim a ver sin in str u ccion es, r esu ltad os, h istor ia (revie
,

Se en tien de por eportacin directa, cuan do se utili


a el portapapeles de in dos para
pasar u n objeto de u n a aplicacin a otra. tro m odo de traspasar u n grfico a otra aplicacin
es grabndolo en u n fichero qu e sea capade ser ledo por el su sodich o program a.

02_primeros pasos(nuevo).indd 22

06/06/12 09:23

ANLIS IS DE DATOS CON S TATA

var iables, p ropied ades, grficos, visor de fich er os, editor d e datos,
ed itor d e pr ogr am as y gestor d e var iables. Por su especial im por tan cia, se ded icar el pr im o apartad o a su descrip cin .
in alm en te, n o falta en el m en el tem correspon dien te a la ayu da
(Help
. n l se distin gu en cin co partes diferen ciadasen la prim era,
slo eiste u n a ln ea qu e rem ite al m an u al com pleto de Stata, dividido en cada u n o de su s vol m en es en la segu n da, se ofrece toda la
ayu da in tern a dispon ible del program a qu e se m u estra en las ven tan as de ayu da con u n form ato especial dotado de h ipertetu alidad,
rem itien do tan to a otros con ten idos de la m ism a ven tan a com o a seccion es con cretas del m an u al en pdfen la tercera, se ofrecen n oticias
del program a y detalles sobre el con ten ido de las actu ali
acion es desde la in stalacin in icial del softare h asta la ltim a versin in stalada
en la cu arta aparecen posibles actu ali
acion es y eten sion es del program a as com o la ayu da ofrecida en la red, qu e ser m ostrada en el
eplorador de pgin as eb por defecto qu e se dispon ga, y la qu in ta
ofrece el logotipo y direccin de la em presa, la can tidad de m em oria
fsica y la dispon ible en el orden ador, la versin de Stata y la in form acin sobre la licen cia en u so. stas cin co partes se com pon en de
on ce ln eas distin tas tal com o se m u estra en la ilu stracin .
ILUSTR ACI
2..e n
d e
a d a

n la versin se cuentan diecioch o u n idades en el n dice conju n to del fich ero con ten edor en form ato pdfCon ten idos, u a de in stalacin

, Prim eros pasos


S
u n a breve
in trodu ccin con los aspectos bsicos de Stata
, u a del usu ario

desarrollo de los elem entos com un es m s im portan tes de Statasin tais, form atos, variables, fu n cion es, m acros y elem entos bsicos de program acin
, estin de datos

, rficos

,
m pu tacin m ltiple

, stadsticas m u ltivariantes

, eferen cia bsica

listado alfabtico de las in stru ccion es de Stata no con tem pladas en el resto de m an u ales
, odelos de ecu acion es estru ctu rales

S
, n lisis de supervivencia
S
, atos de en cu esta
S
, Series tem porales
S
, atos
lon gitudin ales

, Program acin
P
, ata

len gu aje especfico de program acin para


trabajar con m atrices
, ndice

y abla de con ten idos.

02_primeros pasos(nuevo).indd 23

06/06/12 09:23

CS
CS

r a s la d ocu m en tacin en pdfh a y cin co ln ea s cor r esp on d ien tes


a la ayu d a in ter n a , qu e ofr ece u n a ser ie d e con sejos p a r a la ob ten cin d e d istin tos tip os d e a yu d a (dvice
u n n d ice tem tico d e los
con ten id os (Con ten ts
u n b u sca d or d e tr m in os (Sea rch
u n a r efer en cia d e tod a s la s in str u ccion es d el p r ogr a m a (Sta ta Com m a n d

u n r ep er tor io d e n oved ad es d e la ltim a ver sin in sta la d a (h a ts


ey u n n oticia r io r ela cion a d o con el p r ogr am a (es
. n cu a lqu ier a d e los seis ca sos, ap a r ece el visor d e ayu d a d on d e se ep on e
lo solicita d o a m od o d e h ip er teto, d e m od o tal qu e se p u ed e n a vegar p or la in gen te ca n tid a d d e in for m a cin d isp on ib le tan to en el
for m a to p r op io d e Stata com o en el for m ato p d f, qu e con tien e la
d ocu m en tacin com p leta d el p r ogr a m a . Com o b otn d e m u estr a ,
la ilu str a cin .con tien e la p a n ta lla ob ten id a a l solicitar el n d ice
tem tico d e con ten id os
ILUSTR ACI
2..n d ic e
t e m t ic o
d e
co n t e n id o s

a ayu da que se m u estra en la ven tan a del visor de Stata in clu ye prcticam ente toda la
docu m en tacin de los m an u ales con ecepcin de los ejem plos aislados del teto, las n otas
tcn icas y las referencias bibliogrficas.

02_primeros pasos(nuevo).indd 24

06/06/12 09:23

ANLIS IS DE DATOS CON S TATA

as tr es sigu ien tes ln eas de la ayu da son las ltim as actu ali
acion es dispon ibles
Checfor pdates
program as divu lgados en los boletin es y revistas del progr am a (San d ser-ritten rogram s
, qu e
pu eden in corporarse gratu itam en te a los in corporados en el program a, y la pgin a eb oficial de la corpor acin Stata (Stata ebsite
,
su bdividida por su parte en pgin a prin cipal, soporte al u su ario,

pregu n tas r espon didas frecu en tem en te


, blog, revista y editorial.

a ter cer a fran ja h or i


on tal de la in terfade Stata es la barr a de h er ram ien tas, qu e est con stitu id a en las version es y por doce icon os con
op eracion es tiles y fr ecu en tes del pr ogram a. stas son de iqu ierd a a derech a la s sigu ien tesa p er tu r a d e u n fich er o d e d atos, gr a b a cin d el fich er o
de datos activo, im pr esin de los resu ltados, ap er tu r a
visin o cier red el
fich er o d e r esu lta d os, ap er tu r a d el visor d e a yu d a , activacin d e p a n talla
de grficos, ed icin de p rogram as, editor de datos, visor d e d atos, gestor de
var iables, b otn de con tin u acin en pan talla d e r esu ltados y b otn d e in terr u pcin d e r esu ltad os.
ILUSTR ACI
2..a r r a
d e
h e r r a m ie n t a s
de
St a t a
12

n la cu ar ta fr an ja de la pan talla se u bican en tr e dos


la d e rd en es y la
d e resu ltados son in evitab lesy cin co ven tan as d e Stata
las otr as tr es, op tativas y flotan tes, son la de variab les, la d el h istorial y la de p rop iedadesqu e
ser n d escritas con m s detalle en el pr im o ap artad o.
inalm ente, en la fran ja inferior, con el m ism o color de fondo que las lneas
de m en s e iconos, se encu entra la lnea de estado, en la que se e
pon e el nom bre del directorio de trabajo donde se guardarn y leern los distintos ficheros,
a m enos que se especifique un directorio distinto, adem s de los pilotos que
indican en el e
trem o derech o si se en cuentran pulsadas las teclas de fijacin
de m aysculas (C
, teclado num rico (e insercin de caracteres (
.

2 ..La s
ve n t a n a s
d e
St a t a
a se h a dich o en el apartad o an ter ior qu e Stata trab aja con on ce ven tan as
d istin tas, cin co in tern as y seis etern as. o todas son igu al d e im p or tan tes,
n i tod as estn pr esen tes al m ism o tiem po. e h ech o, al em p e
ar u n a sesin
con Stata slo apar ecen las cin co in tern as. n tr e ellas, las m s cen trales
p ara el tr abajo son las de resu ltados y las d e r den es.
a ven ta n a de rden es (Sta ta Com m a n d
, u b ica d a p or d efecto (idescreen layou ten la parte in ferior d e la cu ar ta fr an ja d el progr am a, es u n

02_primeros pasos(nuevo).indd 25

06/06/12 09:23

CS
CS

r ecu adr o en b lan co don de deben escrib ir se las in str u ccion es u rd en es de


Stata. n a in stru ccin bsica p ara em pear es dir, p ar a sab er los fich eros
con ten idos en el directorio de tr ab ajo. Si se escribe en la ven tan a en cu estin esta palabr a segu ida por la tecla de retor n o com o fin al de la ord en , in m ediatam en te apar ecer u n teto en la ven tan a de resu ltados.
d ir

n este caso, ap arecer u n teto sim ilar al d e la ilu stracin .


ILUSTR ACI
2..R e slt a d o
d e
la
in st r c ci n
d ir

a ven tan a de r den es, don de se escr ib i la in stru ccin , se qu ed a en


b lan co despu s de ejecu tar la. Sin em b ar go, la or den qu eda gu ardad a en otra
p an talla, m ostr ada aqu en la p ar te su p er ior der ech a de la ilu str acin , en la
llam ad a ven tan a de historia (evie
. d em s, en la ven tan a de resu ltados
(Stata esu ltsaparece el pr odu cto d e la pr im era in stru ccin , esto es, u n
listad o con tod os los fich eros u bicados en el directorio p or defecto. Si h ay
m s fich er os qu e ln eas p er m ite el tam a o d e la pan talla, aparece el teto
m ore en color difer en te al d el r esto. n te este m en sa je, h a y tr es posib ilid ad esla p r im er a es ap r etar la tecla l o
n tr o (n ter
en cu yo caso, en la
p an talla d e r esu ltad os ap ar ecer u n a ln ea m s. a segu n da op cin es ap r etar otr a tecla distin ta d e la s d os an ter ior es o el p en ltim o icon o (Clear
m ore--con dition
. e este m od o, el teto, en lu gar de avan ar u n a ln ea,

02_primeros pasos(nuevo).indd 26

06/06/12 09:23

ANLIS IS DE DATOS CON S TATA

avan
ar tod a u n a pan talla. in alm en te, si se desea in terr u m pir la salida de
r esu ltad os, en el caso de qu e n o se h aya ob ten id o lo d eseado, se p u ede pu lsar , la com b in acin de teclas Ctrl, o el ltim o icon o de la bar ra de h er r am ien tas. s se d eten d r la or den , n o ap ar ecer n m s ln eas en pan talla
y se estar en con dicion es de escr ib ir u n a n u eva in str u ccin . n a ln ea con
u n solo p u n to en la p an talla de r esu ltad os in dica qu e el sistem a est listo
p ara recibir otr a or den .
Par a ver a lg n con ten ido en la ven tan a de variables (aria bleses p r eciso cr ear o r ecu p er ar u n con ju n to d e d atos. Com o la segu n da d e estas d os
tareas es m s fcil, se p on d r com o p rim er ejem p lo la r ecu per acin de u n a
b ase d e d atos in cor por ad a en el pr ogram a y se d eja la creacin d e u n fich er o de d atos p ara u n captu lo poster ior. Con el fin de recu p erarla, en la ven tan a d e rd en es h ay qu e escr ib ir sysu se au to, sien do esta ltim a palab ra el
n om b re con el qu e es con ocida esta b ase d e d atos, qu e con siste en u n listad o de au tom viles com ercialiados en los a os seten ta en stados n idos
acom pa ado con u n a serie de variab les cu yo con ten ido son las car acter sticas de los m od elos.
sysu se au to

esd e el m o m en to en q u e se in tr o d u ce esta in str u ccin , a p a r ece en la


ven ta n a d e va r ia b les la lista d e ella s q u e est n in clu id a s en el fich er o
a u to. s f cil a d ver tir qu e ca d a ln ea co r r esp o n d e a u n a va r ia b le y est
d ivid id a en cu a tr o co lu m n a sla p r im er a r efleja su p r op io n om b r e, la segu n d a co n tien e su etiqu eta , es d ecir u n teto qu e la a co m p a a y qu e
p r op o r cio n a u n a d escr ip cin m s eten sa d e su co n ten id o, la ter cer a in fo r m a d el tip o , m ien tr a s q u e la cu a r ta r efleja su for m a to . sta s p r op ied a d es d e la s va r ia b les ser n d escr ita s co n m s d eta lle en la s seccion es
.., ..y ...
an to la ven tan a d e h istor ia com o la d e var iables per m iten trasladar su
con ten id o a la p an talla de rd en es. e este m od o, si se lleva el cu rsor a la
ln ea dir de la pr im er a d e las ven tan as, apar ecer el teto en la ven tan a de
r den es y, si se p u lsa
n tro en esta, o si se p u lsa u n par de veces el teto en
la ven tan a de h istor ia, la in stru ccin m en cion ada ser ejecu tada de n u evo.
n cam b io, si se d esea elim in ar d e la ven tan a d e r d en es p or h ab er la in clu ido p or er r or, p u ed e h a cer se m edian te la tecla sc. n el caso d e la s
variab les, el fu n cion am ien to es sim ilar, salvo en qu e el dob le clicen lu gar
d e ejecu tar la in stru ccin , traslada el n om br e de la variable a la ven tan a de
r den es.

a presen tacin de la ven tan a de variables con cuatro colum n as


ilustracin .n o se
obtien e por defecto. Para qu e apare
can las dos ltim as
type y form atse h a de colocar el
cursor en la barra de con tenido
ariable
abel
, h acer clic posteriorm en te en el botn derecho
del ratn y, fin alm en te, m arcar la
scolu m n a
sdeseada
s
.

02_primeros pasos(nuevo).indd 27

06/06/12 09:23

CS
CS

ILUSTR ACI
2 ..e n t a n a s
de
h ist o r ia

va r ia le s

tr a ven tan a d e fr ecu en te u so en Stata, ya m ostrada en la ilu stracin .,


es el visor de ayu da. Con la in str u ccin h elp ord en
dir, por ejem p lose obtien e la in for m acin cor resp on d ien te en u n a ven tan a in depen dien te. am b in , en lu gar de escribir la in stru ccin , se pu ede solicitar ayu d a m edian te
el tem Help
Stata Com m an d d e la b arr a d e m en s. e este m odo, aparece
u n cu ad ro d e d ilogo qu e p id e al u su ar io u n a ord en d e Stata y m u estra de
ella pr cticam en te tod a la in form acin con ten ida en el m an u al en u n a ven tan a in depen dien te. sta posee adem s var ios b oton es e icon os qu e reali
an
oper acion es com o b squ eda de otras rd en es, eplor acin de con ten idos
(searchy b squ eda de caden as en el in terior del visor.
a ven tan a visor n o slo se em p lea p ar a visu aliar la ayu d a, tam bin
p u ed e u tiliarse par a ver u n fich er o en SC
o en for m ato sm cl, p ropio d e
los r esu ltad os gr ab ados de Stata, com o se eplica con m s detalle en la seccin ..
asta el m om en to, los tetos gen erados p or las in stru ccion es in tr od u cid as en la ven tan a de rd en es h an ap arecido en la ven tan a m ayor de Stata,
esto es, en la d e resu ltados, o en el visor. dem s, h ay otro tip o de in stru ccion es, las gr ficas, qu e m u estran su r esu ltad o en u n a ven tan a diferen te. e
este m odo, si se escr ibe la sigu ien te in str u ccin
h istogram p rice, freq

02_primeros pasos(nuevo).indd 28

06/06/12 09:23

ANLIS IS DE DATOS CON S TATA

a p a r ece u n a n u eva ven t a n a p o r en cim a d e la d e r esu lt a d o s. s la ven ta n a gr fica d e S t a t a , q u e se su p er p o n e a la a n ter io r. o s r esu lt a d o s


p u ed en ser vu elt o s a p o n er en p r im er p la n o , p u lsa n d o su p r im er a fr a n ja . lt er n a tiva m en t e, el gr fico p u ed e a p a r ecer d e n u evo p u lsa n d o el
set o ico n o d e la b a r r a d e h er r a m ien t a s d e la p a n t a lla p r in cip a l d el p r o gr a m a .
ILUSTR ACI
2.1 .e n t a n a
de
r e slt a d o s
r fic o s

am bin pu ed en ser con siderad os otro tipo de ven tan as d e Stata los cu adros de dilogos qu e apar ecen al solicitar cu alqu ier tar ea m edian te el m en .
as ilu str acion es .y .m u estr an u n p ar de ejem plos d e este tipo de
ven tan as, qu e tien en la p ropied ad eclu siva de gen erar in str u ccion es d e Stata qu e se acu m u lan en la ven tan a de h istor ia y, u n a veejecu tadas, m u estran
su pr odu cto en la ven tan a d e resu ltados. Casos esp eciales d e este tipo de
ven tan as, p resen tes slo a p ar tir de la ver sion es y , son el gestor d e
variab les y el m d u lo d e p ropied ades, cu yo u so se ver al fin al d e este cap tu lo.
a u tilid ad qu e en Sta ta cr ea o m od ifica la in for m acin a n aliab le,
con ocid a com o editor de da tos (a ta ditor
, o la qu e los in sp eccion a
(roser
, gen er a n el octavo tip o d e ven ta n a . Su fu n cin es m ostr a r y p erm itir h a cer m od ificacion es
esta ltim a fu n cin slo en la p r im er a op cin
d e los d a tos car ga d os en la m em or ia . Com o p u ed e ap r ecia r se en la ilu str a cin ., se tr ata d e u n a ven ta n a, sim ila r a la d e u n a h oja d e c lcu lo,
en la qu e los ca sos se r ep r esen ta n en la s ln eas y las var iab les en la s co lu m n a s. s, los tr es p r im er os casos cor r esp on d en a los m od elos Con cord,
a cer y Spirit d e la ca sa d e au tom viles C, qu e ten a n en p r ecios

02_primeros pasos(nuevo).indd 29

06/06/12 09:23

CS
CS

respectivos de ., .y .dlares. n el caso de qu e se qu iera realia r a lg n ca m b io , b a sta lleva r el cu r sor a la ca silla cor r esp on d ien te y
r eem p la a r el va lor an tigu o con u n o n u evo. r a s r ealia r los ca m b ios d esea d os, se p u ed e cer r a r la ven tan a con el b otn situ a d o en su etr em o su p er ior iqu ier d a qu e tien e u n a figu r a d e a sp a o, si se p r efier e, m a n ten er la
a b ier ta .
edit

ILUSTR ACI
2.11 .e n t a n a
d e l
e d it o r

a r ios so n lo s ca m in os p a r a a cced er a la ven ta n a d el ed ito r. l m s


r p id o es p u lsa r el octa vo b o tn d e la b a r r a d e h er r a m ien ta s (a ta ditor
- dit
. a m b in p u ed e h a cer se escr ib ien d o la o r d en edit en la ven ta n a d e
in str u ccion es, m ed ia n te m en , seleccio n a n d o a ta
a ta ditor
dit, o
p u lsa n d o la co m b in a cin d e tecla s Ctr l. n lo s cu a tr o ca so s a n ter io r es,
se p er m ite a l u su a r io r ea lia r m o d ifica cio n es. h o r a b ien , si el p r o p sito
es s lo con tem p la r los ca so s, sin r ea lia r n in g n ca m b io , es p r efer ib le
en tr a r a l ed ito r m ed ia n te la o r d en brose, p u lsa n d o el n oven o b o tn
(a ta ditor - rosero seleccio n a n d o d el m en la en tr a d a a ta
a ta
editor
roser.
Par a fin ali
ar la d escr ipcin de ven tan as de Stata, es p reciso ep licar d e
an tem an o qu es u n program a, ya qu e la ltim a qu e se con tem p la en este
apar tado es la d e su ed itor. n progr am a de Stata se com p on e de u n con ju n to de in str u ccion es r eu n idas en u n fich ero. a for m a m s cm od a d e gen e-

02_primeros pasos(nuevo).indd 30

06/06/12 09:23

ANLIS IS DE DATOS CON S TATA

r arlo es con vir tien d o la h istoria de in stru ccion es en u n fich er o qu e las con ten ga. Sigu ien do con este p rim er ejem p lo, es d ecir, las cu atr o rd en es par a
ep licar las d istin tas ven tan as d e este p aqu ete estadstico, es fcil con ver tirlas a u n fich ero de pr ogr am as h acien d o clic con el b otn der ech o del ratn
en la ven tan a d e la h istoria y se alan d o la op cin Save ll o Save Selected.
ras ello, sale el m en de gr abacin d e fich er os p ropio d el sistem a operativo
con el qu e se tr ab aje y se p u ed e p on er el n om b re qu e se d esee. u tom ticam en te Stata le pon d r la eten sin do, qu e es con la qu e se recon oce a este
tipo de ar ch ivos. espu s d e gr abado, u n fich er o de p rogr am a pu ede r evisar se o ejecu tar se cu an tas veces se d esee. tr a opcin m s p rctica es m an d ar este con ten ido d e la ven tan a de la h istoria al ed itor d e fich eros de p rogr a m a s d e Stata m ed ian te la ln ea d el m en con tetu a l Sen d to o-file
editor.
l editor de estos fich er os tam b in pu ede p on er se en m ar ch a ab rien d o
su ven tan a, bien escrib ien do en la ven tan a de r den es la palabr a doedit,
b ien a travs de m en (in do
o-file ditor
, bien h acien do clic en el sp tim o icon o de la bar ra d e h er ram ien tas (o-file ditoro p u lsan do la com b in acin d e teclas Ctrl.
d oedit
ILUSTR ACI
2.1 2.e n t a n a
d e l
e d it o r
con
e l
co n t e n id o
d e l
"P r im er p r ogr a m a .d o"

n a veejecu ta d o el p r ogr am a y a b ier ta su cor r esp on d ien te ven ta n a,


h a y qu e ab r ir el fich er o ya gu a r d a d o
o em p ea r a escr ib ir u n o n u evo

02_primeros pasos(nuevo).indd 31

06/06/12 09:23

CS
CS

m ed ia n te el m en (ile
pen
el segu n d o icon o d e las h er r am ien ta s (pen
o b ien la com b in acin d e tecla s Ctr lo. esp u s se seleccion a el fich er o
con eten sin do d esead o en el d ir ector io d on d e se en cu en tr e y tod as la s
in str u ccion es d e la s qu e se com p on en ap ar ecer n en la n u eva p a n talla , d e
ta l m od o qu e a p ar ecen r em a r ca d os con d ifer en tes color es, en tr e otr os elem en tos, las in str u ccion es, la s cad en a s, los op er ad or es, la s fu n cion es y los
com en tar ios .
en tr o d e esta ven tan a, p u eden h acerse cu an tas m od ificacion es se con sid er en op ortu n as escrib ien do, bor ran d o, copian d o, cor tan do y p egan do
com o en cu alqu ier editor, y ejecu tarlas cu an tas veces se desee.
Pa r a esto ltim o h a y d os m od o sel p r im er o es do, en cu yo ca so a p a r ecen la s r d en es en la p a n ta lla d e r esu lta d os, y el segu n d o es ru n , se
ejecu ta n la s r d en es p er o su co n ten id o y r esu lta d os se o cu lta n . m b a s se
en cu en tr a n b a jo el r tu lo d el m en Tools, y so n r esp ectiva m en te el ltim o (ecu te (do
y el p en lt im o (ecu te u ietly (ru n
ico n o d e la b a r r a
d e h er r a m ien ta s p r o p ia s d el ed ito r, cu yo a sp ecto el lecto r a ten to h a b r
n ota d o d ifer en t e d el q u e a p a r ece en la p a n ta lla gen er a l d e Sta ta . a m b in es p osib le r ea lia r la m ism a o p er a ci n co n la s r esp ectiva s co m b in a cio n es d e tecla s Ctr ld o Ctr lr. m b o s m od o s fu n cio n a n co n el co n ju n to d el fich er o o co n u n a selecci n p a r cia l d e la s r d en es q u e se co n sid er en m s a p r op ia d a s p a r a u n a d eter m in a d a ta r ea . d em s, con el fin d e
q u e tod a s la s m o d ifica cio n es q u ed en gu a r d a d a s p a r a u so p oster io r, ta m b in se p er m ite en esta ven ta n a la gr a b a cin d e su co n ten id o, sea m ed ia n te m en (ile
Sa ve
, icon o
el ter cer o, Sa ve
, o tecla s
Ctr lso

Ctr la ysen el ca so d e q u e se q u ier a d a r u n n om b r e d istin to a l fich er o q u e se gr a b a .


esu m ien d o el con ten ido d e este ap ar tado, son on ce los tipos d e ven tan as d e Stata. Cin co de ellas son in ter n as y aparecen directam en te al in iciar
el p rogram ala de rden es, don de el u su ario pu ede ir escrib ien do u n a a u n a
cu an tas in str u ccion es con sider e relevan tesla de resu ltados, d on d e aparecer la ejecu cin de la in str u ccin la d e historia, en la qu e se acu m u larn
tod as las in stru ccion es ejecu tadas d esde el com ien o d e la pu esta en m arch a del p rogr am ala d e variables, don de se m u estr a la lista d e ellas del fich er o de datos qu e en cada m om en to se en cu en tre car gad o en m em oria y la
de propiedades, cu yo u so se ver en la seccin ... os otr os seis tip os d e
ven tan as, las eter n as, aparecen cu an do se r ealia u n a op eracin qu e las
n ecesita. n esta categor a se en cu en tran el visor, qu e es capad e m ostr ar

n la pesta a Syn taColor del cu adro de dilogo qu e aparece con el m en dit


referen ces del editor de program as aparecen todos los elem en tos rem arcables y se perm ite cam biar su
color y otras propiedades de su fuen te.

tra posibilidad im portan te para la elaboracin , com paracin y ejecucin de program as


en la capacidad de dispon er de varios fich eros a la veen distintas pesta as de la m ism a ven tan a. Para lograr abrir m s fich eros, se pu ede pu lsar Ctrlo, el segu n do icon o u obten erlo
m ediante m en (ile
pen
.

02_primeros pasos(nuevo).indd 32

06/06/12 09:23

ANLIS IS DE DATOS CON S TATA

ayu d a del pr ogr am a y resu ltados gr ab adosla pan talla d e grficos, d on d e se


m u estran r esu ltad os qu e n o son r epresen tables m edian te car acter es de tetoel editor de datos, p ar a ver o m odificar los d atos car gad os en el pr ogr am alos cu adros de dilogo, par a escr ibir in stru ccion es con m s facilidad el
editor de program as, par a la con feccin , grab acin y ejecu cin de u n a secu en cia de in str u ccion es qu e p er m ita resolver peticion es com p lejas y el gestor de variables, qu e p er m ite asign ar o m odificar las p rop ied ades d e las var iables.

2 ..o d o s
de
t r a a
o
en
St a t a
ay tr es form as d istin tas de p ropor cion ar las in str u ccion es a la aplicacin
Stata p ar a ob ten er los r esu ltad os desead os. n este ap ar tado se con tem pla
cm o se em plea cad a u n a d e ellas. u n qu e p rcticam en te tod o p u ed a r ealiarse con estos tr es m od os de trab ajo, la eleccin de cu l u sar depen der de
la tar ea qu e se h aga y d e las pr eferen cias del u su ar io. os tr es m odos son el
d e in stru ccin , cu an do se in tr od u cen literalm en te u n a a u n a cada or den el
d e m en , cu an d o se u tili
a u n cu ad ro de d ilogo para efectu ar u n a p eticin ,
y el de program acin , en el caso de qu er er ejecu tar au tom ticam en te u n
con ju n to d e in stru ccion es.

... odo in stru ccin


ste m od o de tr ab ajo se basa en la in ser cin m an u al de in str u ccion es en la
ven tan a d e r den es. Se caracteria por ser in ter activo ya qu e cada ln ea in trod u cid a p or el u su ario gen er a u n resu ltado y, h asta qu e este n o se com plete, n o se pu ede in tr odu cir la sigu ien te ord en .
od a in stru ccin d e Stata est com pu esta al m en os p or u n a p alabr a, qu e
es la orden pr opiam en te dich a, a veces p reced id a por u n a prein stru ccin , d e
la qu e se separ a por dos pu n tossegu id a gen eralm en te por u n as especificacion esm ati
ad a, si p roced e, p or u n os calificadoresy am p liad a, si cabe, con
u n a serie de opcion es pr opias de cad a ord en , qu e deben sep ararse del r esto
d e la in str u ccin m edian te u n a com a.
a estr u ctu r a, p or tan to, d e tod a in str u ccin p r esen ta el sigu ien te esqu em a

p rein stru ccin


o r d en
especificacion es
calificadores
,opcion es

P u est o q u e lo ep u est o en co r ch et es es o p t a t ivo , p o r la sin t a is em p lea d a ca b e d ed u cir q u e lo n ico o b liga t o r io en ca d a in st r u cci n es la


o r d en . h o r a b ien seg n sea esta , la s esp ecifica cio n es ser n o b liga t o -

02_primeros pasos(nuevo).indd 33

06/06/12 09:23

CS
CS

r ia s u o p t a t iva s. P o r ejem p lo , p u ed e d a r se la o r d en h elp sin n in gu n a


esp ecifica ci n , p er o n o p u ed e em p lea r se h istogra m segu id a d e n in g n
n o m b r e, ya q u e a l m en o s r eq u ier e q u e se le in clu ya el d e u n a y s lo u n a
va r ia b le.
ijn d ose en las cu atr o ltim as in str u ccion es qu e qu edan pr esen tes en
la ven tan a d e h istoria de rd en es, stas er an
h elp
sysu se a u to
h istogram p rice, freq
edit

Com o fcilm en te p u ed e apr eciar se, la pr im era y la ltim a slo con stan
d e r den es, m ien tras qu e las d os cen trales tien en especificacion es. n la
segu n d a la esp ecificacin es el n om br e del fich er oen la ter cer a el n om b re
d e u n a var iable. la ter cera in stru ccin con tien e tam b in u n a op cin freu en cy, qu e h a sid o ab reviada con su s cu atro p rim er as letr as. s fu n d am en tal reten er qu e tod as las op cion es h an d e figu rar detr s de la com a, sep ar adas en tre s al m en os p or u n espacio en blan co.
d em s d e la or d en , su s esp ecifica cion es y op cion es, la m a yor p a r te
d e ella s p u ed en in cor p or a r p r ein str u ccion es, qu e m od ifica n el fu n cion a m ien to d e la in str u ccin , com o, p or ejem p lo, a p lic n d o la a d istin ta s
su b m u estr a s, y ca lifica d or es qu e r estr in gen el u so d e la in str u ccin a ca sos con u n a d eter m in a d a ca r a cter stica . od a s esta s p osib ilid a d es son ta n
im p or ta n tes qu e ser n tr a ta d a s con a lgo m s d e d eten im ien to en el ca p tu lo .

... odo m en
l segu n d o m od o de p rop orcion ar in stru ccion es al p rogram a es m ed ian te
los m en s. Cu an do se h abl de la in ter fade Stata y se m en cion la p rim era
on a h or ion tal de su ven tan a, se dijo qu e d esde el tercer al qu in to de su s
apar tados
ata, raph ics y Statisticsse p od an en con tr ar p rcticam en te la
totalid ad de las in stru ccion es p ropias d el paqu ete, m ien tr as qu e aqu ellas

as abreviatu ras en Stata pueden em plearse en la in m en sa m ayor parte de las ocasion es, siem pre que no produ can am big edad. e este m odo, pu eden abreviarse n om bres de
variables y opcion es. as rden es slo pu eden recortarse de la form a qu e se in dica en el m an u al o en la ayu da del program a. Por ejem plo, el program a entien de histpero in terpreta com o
error histo o histogra. Sin em bargo, en el fich ero au to, la variable price pu ede ser escrita com o
p, pr, pric y price, ya qu e n ingu n a otra variable com ien a por p. e la m ism a form a, la opcin
freu en cy pu ede ser abreviada, al m enos, con fre. am bin en tendera bien el program a frecu en c.

02_primeros pasos(nuevo).indd 34

06/06/12 09:23

ANLIS IS DE DATOS CON S TATA

ad icion ales qu e el u su ario con siderar a con ven ien tes p od an ser a adid as en
el sigu ien te elem en to (ser
.
ste m od o d e tr a b a jo, qu e fa cilita la p r od u ccin d e in str u ccion es a
qu ien es n o con ocen la sin ta is d el p r ogr a m a , fu e in cor p or a d o a p a r tir d e
la ver sin , p or lo qu e m u ch os u su a r ios a n ter ior es d e esta a p lica cin
p r efier en segu ir u tilia n d o el a n ter ior m od o d e tr a b a jo, p or qu e es m s
r p id o d e u sa r si se con oce b ien . a m b in tr a ta n d e evita r este m od o d e
tr a b a jo qu ien es p r ogr a m a n , ya qu e n ecesita n r ecor d a r con tin u a m en te la s
d istin ta s p a la b r a s cla ves qu e h a y qu e u tilia r en la con feccin d e los p r o gr a m a s.
Con el sistem a d e los m en s se h an tr aslad ad o todas las posibilid ad es de
u n a ord en a u n cu adr o de dilogo, tan to m s com plejo cu an to m s lo es la
in stru ccin , qu e se obtien e b ien p resion an do la ln ea corr espon dien te del
m en , b ien escrib ien do u n a or den qu e lo p on ga en fu n cion am ien to.
Por ejem p lo, si se desea u n h istogr am a de la variab le price, h ab r qu e
op tar por especificar raph ics
Histogram tr asladan do el cu r sor m ed ian te el
r atn a los cor r esp on d ien tes elem en tos qu e lo com p on en
p rim er o a raphics, a con tin u acin a Histogram y h acien d o clic, u n a veobten ido este
ltim o. l resu ltado es u n cu adro de d ilogo u bicado en u n a n u eva ven tan a
ILUSTR ACI
2.1 .Ca d r o
de
d i lo o
d e
la
or d en
h isto gr a m

n la ilu str acin .ap ar ece el cu adr o de dilogo en el qu e se h a in ser tado el n om b re de la var iable en el corr esp on dien te recu adro (ariabley
se h a cam biado la opcin -ais, m arcan do reu en cy, en lu gar d e en sity,
qu e es con la qu e oper a p or om isin . a or den histogram posee m s p osib ilid ades qu e las qu e se m u estr an en el cu adr o d e d ilogo pr in cipal (m ain
.
Por ello en la ln ea su p er ior h ay otras p esta as refer en tes de otros con ju n tos
de opcion es. Slo a m odo de ejem plo se m u estr a a con tin u acin el cu adro de
d ilogo de la p esta a en sity lots

02_primeros pasos(nuevo).indd 35

06/06/12 09:23

CS
CS

ILUSTR ACI
2 .1 .Ca d r o
de
d i lo o
de
la
p e st a a
Den sity P lots

Pu ede apreciarse asim ism o qu e en la ln ea in ferior de cu alqu ier cu adro


de dilogo eisten seis boton es. r es pequ e os en la parte i
qu ierda, el prim ero

, p ara obten er ayu dael segu n do

, para lim piar el con ten ido de


todos los cam pos del cu adro y dejarlos en su s op cion es por defecto. l tercero es para copiar en el portapapeles el teto de la in stru ccin qu e se est
con stru yen do m edian te el m en . n la parte derech a, son tres los boton es
rectan gu lares con fon do clar o. l prim ero y el ltim o m an dan la in stru ccin
u n o, , cerran do el cu adro de dilogo, el otro, Su bm it, m an ten in dolo
abierto. l del m edio, Can cel, sirve para cerr ar el cu adro de dilogo sin n in g n efecto. s, pu es, tan to el prim er com o el tercer botn de la parte derech a sirven par a obten er u n h istogram a com o el m ostrado en el grfico ..
R IC
2.1 .is t o r a m a
d e l
p r e c io
d e
lo s
co ch e s

02_primeros pasos(nuevo).indd 36

06/06/12 09:23

ANLIS IS DE DATOS CON S TATA

o m s com n es u tiliar los cu ad ros de dilogos com o se acab a d e ep licar, es d ecir, bu scn dolos a travs d el m en . Sin em bargo, u su arios eper im en tad os de Stata podr an h acer lo d e otro m od o, em pe
n dolos desd e la
ln ea de in stru ccion es, sobr e todo, en el caso en el qu e las rd en es sean m u y
com p lejas y n o se recu er den todas su s m od alidades y op cion es. Para ello
h ay qu e escrib ir db segu id o de la ord en , cu yo cu adr o de d ilogo se desea
ob ten er. e esta form a, si se qu ier e qu e apareca el cu adr o de d ilogo d e la
in stru ccin sysu se, se escr ib ir u n a ln ea com o sigu e
db sysuse

n m ed iatam en te aparecer el cu ad ro de la ilu stracin ., m u ch o m s


sim ple qu e el an terior, en la m edida de qu e se trata d e u n a or den con m en os
p arm etr os y opcion es qu e la d e histogram . n este cu adr o de dilogo se
ofrecen dos p osibilidadesab rir u n fich ero (Select ile
cu yo n om bre h ay
qu e escr ib ir en el cu adr ado ile to select, o m ostrar todos los fich eros d e
d atos in corp orados en el pr ogr am a disp on ibles par a el u su ario (Sho datasets available in th e adoptath
. Por ltim o, pu ede m ar car se la op cin d e descartar d atos pr eviam en te car gad os en m em oria (u tom atically discard data
in m em ory
ya qu e si eistieran u n os datos p revios m od ificados con el pr ogr am a, n o p od ra abr ir se el n u evo fich er o, a m en os qu e se grabar an las
m od ificacion es o se esp ecificar a la opcin en cu estin .
ILUSTR ACI
2 .1 .Ca d r o
de
d i lo o
de
la
ord en
sysu se

Stata n o perm ite trabajar con dos fich eros al m ism o tiem po. n su lugar, se puede ejecu tar el program a varias veces con archivos de datos distin tos. bviam en te, no h abra interferen cias n i in tercam bios en el trabajo en tre ellos.

02_primeros pasos(nuevo).indd 37

06/06/12 09:23

CS
CS

... odo program acin


a t er cer a p o sib ilid a d d e t r a b a jo co n S t a t a es el m o d o d e p r o gr a m a ci n , q u e co n sist e en escr ib ir u n a ser ie d e in st r u ccio n es n ecesa r ia s p a r a
lleva r a ca b o u n a t a r ea , gr a b a r la s en u n fich er o y d esd e est e ejecu t a r la s
cu a n t a s veces se d esee co n o sin ca m b io s en la s r d en es q u e lo n ecesit en . n el a p a r t a d o a n t er io r, cu a n d o se d escr ib i la ven t a n a d el ed ito r
d e p r o gr a m a s, se ep lic q u e h a y d o s fo r m a s d e ejecu ci n d e esto s fich er o su n o , m ed ia n t e la in str u cci n ru n , en cu yo ca so n o se m u est r a n
la s ln ea s d e in str u cci n el o t r o , m ed ia n t e la in st r u cci n do, p a r a o b t en er el m ism o r esu lta d o , p er o co n la s r d en es in clu id a s. ist e u n t er cer
m o d o d e ejecu t a r u n p r o gr a m a escr it o co n el len gu a je d e S t a t a . S e t r a ta
d e h a cer lo d esd e el sistem a o p er a t ivo . Cu a lq u ier fich er o co n et en si n
do, co n s lo a p lica r le u n d o b le clic, es ca p a d e ca r ga r se co n S t a t a y
ejecu t a r se.
Si adem s se in clu ye en el fich ero la in str u ccin set m ore off, el u su ar io
p u ed e desen ten derse d el pr oceso y el pr ogram a ejecu tar sin in terr u pcin
tod a s la s in str u ccion es in clu id a s. a m b in p u ed en a ad ir se com en ta r ios
apon ien d o u n asterisco al in icio d e cu alqu ier ln ea, b colocan d o los com en tar ios en tre
y
, cd esp u s d e esp acio segu id o de dos b ar ras h asta el
fin al de la ln ea y dd el m ism o m od o qu e en cp er o con tr es b arr as, en
cu yo caso la ln ea sigu ien te ser con siderad a d e la m ism a ord en . sta ltim a opcin es u n m od o p tim o en los pr ogram as par a disp on er en varias
ln eas las in str u ccion es m u y lar gas.
Por ejem p lo, si con el editor prefer ido se escrib e u n fich ero con las sigu ien tes in str u ccion es llam ad o listau to.do
ILUSTR ACI
2.1.Co n t e n id o
d e l
fich e r o
lista u to.d o

**********************************
* M. Escobar, E. Fernndez, F. Bernardi
* Anlisis de datos con Stata
* Madrid. CIS. 2009
* Ejemplo de primer programa (listauto.do)
***********************************
set more off //Esta instruccin sirve para que no se pare la pantalla.
sysuse auto, clear /* Lee uno de los ficheros ejemplos de Stata* /
list make /// Con tres barras entiende que la orden contina en la siguiente lnea.
price
set more on //Vuelve a parar la pantalla de resultados cuando se llene.

n clu so p u ed e em p lea r se u n p r ocesa d or d e teto, siem p r e y cu a n d o a la h or a d e


gr a b a r se ten ga la p r eca u cin d e gr a b a r el fich er o en for m a to SC
y se le p on ga la eten sin .do.

02_primeros pasos(nuevo).indd 38

06/06/12 09:23

ANLIS IS DE DATOS CON S TATA

Se ob ten dr u n listado de las d os variables ep resadas (m ae y price


p ara todos los casos d el fich er o au to del qu e a con tin u acin se ofrece u n
etracto, escr ib ien d o la in str u ccin
d o listau to
ILUSTR ACI
2.1 .List a d o
d e
ca so s

1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.

66.
67.
68.
69.
70.
71.
72.
73.
74.

+- - - - - - - - - - - - - - - - - - - - - - - - - - - - +
| make
pr i c e |
| ----------------------------|
| AMC Conc or d
4, 099 |
| AMC Pacer
4, 749 |
| AMC Spi r i t
3, 799 |
| Bui c k Cent ur y
4, 816 |
| Bui c k El ect r a
7, 827 |
| ----------------------------|
| Bui c k LeSabr e
5, 788 |
| Bui c k Opel
4, 453 |
| Bui c k Regal
5, 189 |
| Bui c k Ri v i er a
10, 372 |
| Bui c k Sk y l ar k
4, 082 |
| ----------------------------|
| Cad. Dev i l l e
11, 385 |

| ----------------------------|
| Subar u
3, 798 |
| Toyot a Cel i c a
5, 899 |
| Toyot a Cor ol l a
3, 748 |
| Toyot a Cor ona
5, 719 |
| VW Das her
7, 140 |
| ----------------------------|
| VW Di esel
5, 397 |
| VW Rabbi t
4, 697 |
| VW Sc i r oc co
6, 850 |
| Vol v o 260
11, 995 |
+- - - - - - - - - - - - - - - - - - - - - - - - - - - - +

ste m od o d e p rogram acin pu ede h acerse tan fleible com o se qu iera,


tan to por la posibilid ad de in ter cam b iar p arm etr os
en viar al pr ogr am a
in form acin , qu e lu ego es devu elta p ara su u so en la ven tan a pr in cipal
com o por la de in clu ir in str u ccion es d e con tr ol de flu jo, qu e p erm ite p on er
en m an os del u su ar io la posibilid ad de escr ibir con u n len gu aje sen cillo su s
p rop ias r u tin as, su peran do de este m od o la r igid equ e im p on en otras aplicacion es estad sticas qu e n o per m iten obten er estadsticos distin tos d e los
qu e ya vien en pr ep rogram ados en el paqu ete .

u ien es estn in teresados en este tipo de procesos pu eden con sultar los captu los -
de la gua del u su ario
Stata Corporation , cy el volum en del m an u al de Stata dedicado a
la program acin
Stata Corporation , i
.

02_primeros pasos(nuevo).indd 39

06/06/12 09:23

CS
CS

2..l
fich e r o
de
r e slt a d o s
u ien h aya trabajado u n a larga sesin con Stata y h aya qu er ido volver a
m irar los resu ltados de los p rim eros an lisis h ab r ad ver tid o qu e la pan talla
d e resu ltados tien e u n a capacidad lim itad a, p u es n o es capad e alm acen ar
m s all d e u n a determ in ada can tid ad de caracteres
.por defecto en
la ver sin de Stata
, au n qu e p u ed e ser am pliada en dit
referen ces
en eral referen ces
in doin g h asta m illon es. n tr abajos lar gos esto es u n
en orm e in con ven ien te. dem s, cu alqu iera qu e sea la lon gitu d de los resu ltad os, Stata n o es cap ad e grab ar la m edian te u n a in str u ccin . Si se desea
gu ard ar total o parcialm en te su con ten ido, es pr eciso m arcar el b loqu e deseado, y op tar m ed ian te m en de cab ecer a (dit
Copy Teto m en con tetu al (Copy Tetsu tr aslado a otr o pr ogr am a, u n pr ocesador d e teto, p or
ejem p lo .
Sin em bar go, el m odo en qu e Stata h a p revisto qu e n o se ten ga qu e r ealiar esta tarea d e cor tar y pegar, cada vequ e se gen era u n resu ltado qu e se
qu iera gu ar dar, es m edian te la gr abacin d e la pan talla de resu ltados en u n
fich er o. sta operacin n o es au tom tica y h a d e ser el u su ario qu ien in icie
el p roceso, lo deten ga, lo con tin e o lo cierr e.
ILUSTR ACI
2 .1.P a n t a lla
d e
in icio
d e
fich e r o s
de
r e slt a d o s

Com o otr as operacion es fr ecu en tes de Stata, la cr eacin d e u n fich ero


d e r esu ltados se pu ede reali
ar d e cu atr o m od osm edian te in stru ccin in te-

Caso de qu e se copie u n resu ltado de Stata a u n procesador de teto, es im prescin dible


darle u n a fu en te con tipo de letra de espacios fijos
Courier o u cida
, ya qu e las fu en tes proporcion ales
im es, rial, Cen tu ry, en tre otras m uch asprodu cen tetos de tam a o variable y,
por tan to, n o generan tetos o n m eros alin eados verticalm ente.

02_primeros pasos(nuevo).indd 40

06/06/12 09:23

ANLIS IS DE DATOS CON S TATA

r activa o p rogram ada (log u sin g


con icon o
el cu ar to de la b ar ra d e h err am ien tas, og begin
, teclado
Ctr lo m ed ian te m en (ile
og
egin
. Con
las tres ltim as m od alidades, aparece u n a ven tan a
ilu stracin .con u n
listad o de fich er os con eten sin sm cl, qu e son aqu ellos en los qu e Stata
gu arda su s resu ltados con u n form ato propio, en todo m om en to con vertibles
a fich er os con form ato plan o en SC

. n la m en cion ada ven tan a, d eb e


escribir se en la casilla om bre el ttu lo qu e se qu ier a dar al fich er o don de a
p artir de ese m om en to se gr ab arn todos los r esu ltad os. am bin pu ede
elegir se el for m ato d e este fich er o. u n qu e, si n ad a se in dica, Stata u tilia
su for m ato p ropio (sm cl
se pu ede cam biar d esde el pr in cipio de la gr ab acin , op tan do en la casilla Tipo p or la eten sin log.
sta operacin tam bin p u ed e h acerse m ed ian te in stru ccin , sea en la
p an talla de rd en es, sea en u n pr ogr am a. Por ejem plo, si se desea gen er ar

u n fich ero d e resu ltados llam ad o pr im ero


.sm cl
, h abr qu e escrib ir la
sigu ien te ln ea
log u sin g p rim ero

Si n o eiste ya ese fich er o en el dir ector io actu al d e tr abajo y si n o se h a


ab ierto con an ter iorid ad alg n otro fich er o d e r esu ltad os, apar ecer en la
ven tan a d e r esu ltad os u n teto qu e ad vierte la oper acin realiad a
ILUSTR ACI
2 .1 .Ca e c e r a
d e
la
a p e r t r a
de
n
fic h e r o
de
r e s lt a d o s
l og:
C: \ Doc ument s and Set t i ngs \ . . . \ Mi s doc ument os \ s t at a\ pr i mer o. s mc l
--------------------------------------------------------------------l og t ype:
s mc l
opened on:
Jan 2004, 12: 37: 07

partir de este m om en to, todo lo qu e ap arece en la ven tan a d e r esu ltad os, salvo la ayu d a, ser grab ad o en el fich ero, directorio y disco del or den ad or esp ecificad o. a gr abacin p u ed e ser revisad a, su sp en d id a o fin aliad a. Si se in ten ta h acer cu alqu iera de estas op er acion es m edian te m en (ile
og
m edian te icon o d e la b ar ra d e h er r am ien tas (Close
Su spen d
o con el
teclado
Ctr l
, aparece u n cu ad ro d e dilogo para qu e el u su ar io op te por
la frm u la desead a.

Caso de que el fichero con ten ga espacios en blan cos, es obligatorio qu e su n om bre sea
escrito entre com illas.

esde la versin se pu ede a adir com o opcin u n n om bre interno al fich ero de resu ltados
, nam e
n om bre
in tern o

. e este m odo se pu ede ten er abierto m s de un o al m ism o


tiem po. l con trol del u so sera con la instru ccin log
off
on n om bre
in tern o. am bin son
tiles las opcion es replace y appen d, que sirven respectivam en te para regen erar u n fich ero ya
eisten te o para a adirle los nu evos resu ltados.

02_primeros pasos(nuevo).indd 41

06/06/12 09:23

CS
CS

ILUSTRACI
2.2.Cad ro
d e
d iloo
p a ra
n
fich er o
d e
reslta d os
a
aierto

od as esas oper acion es tam bin pu eden reali


ar se m edian te in stru ccion es en la ven tan a d e r den es. stas son
vie n om brefich ero.sm cl
lo
clo se
lo
o ff

l igu al qu e se pu ede gr ab ar u n fich er o d e r esu ltad os, tam bin pu ede


h acer se algo sim ilar con todas las in stru ccion es de u n a sesin de Stata. a
se h a visto cm o p u ed e h acerse a posteriori, h acien d o aparecer el m en de
con teto en la ven tan a de h istor ia. Pero tam b in pu ede reali
arse a priori,
m edian te la in str u ccin cm dlog u sin g n om b refich ero . Si se qu ier e crear u n
fich er o llam ado p rim er as in stru ccion es, con eten sin do h ab r qu e escr ib ir
la sigu ien te ord en .
cm d log u sin g
p rim eras in stru ccion es.d o

p ar a su sp en d er, r ean u d ar o ter m in ar la grab acin , h a d e u sarse la


in stru ccin cm dlog acom p a ad a d e off, on o close resp ectivam en te.
an to en fich eros d e resu ltados com o en fich er os de in stru ccion es, otro
aspecto qu e h a de ten er se en cu en ta es qu e, en el caso de qu e se qu iera dar
u n n om br e de fich ero ya eisten te, si se in ten ta con u n a ln ea d e in stru ccin , dar u n er ror, a m en os qu e se a ad a la op cin appen d, si se qu ier e

Si n o se especifica n in gun a eten sin al fichero, el program a le pon dr .tt. Si se desea


repetir u na sesin , con vien e cam biarle la eten sin por la de .do. e este m odo podrn ejecu tarse de n u evo.

02_primeros pasos(nuevo).indd 42

06/06/12 09:23

ANLIS IS DE DATOS CON S TATA

a adir lo n u evo a lo eisten te, o replace, si se p refier e su plan tar el an tigu o


con ten id o p or el n u evo.
n cu alqu ier m om en to, p or otr o lad o, se pu ede visu aliar cu alqu ier fich ero de resu ltados, com an d os e in clu so d e ayu da con la in stru ccin vie
n om b refich ero. sta p osibilidad se en cu en tra tam bin en el m en ile
ie.
Si, a con tin u acin , se ap rieta en el b otn rose, ap arece el eplor ad or d e
fich er os, d esd e el qu e p u ed e seleccion arse cu alqu ier arch ivo escr ito en
SC
o en SCp ara su visu ali
acin . n cu alqu ier caso, tam b in p u ed e
llam arse directam en te al fich er o si en la in stru ccin vie se esp ecifica su
n om b re y eten sin .
vie prim ero.sm cl
ILUSTR ACI
2.21 .iso r
de
n
fich e r o
d e
r e slt a d o s

2 ..La s
va r ia le s
de
la
m a t r i
de
d atos
Com o la m ayora de pr ogram as in for m ticos, Stata es bsicam en te u n a h er ram ien ta par a m an ip u lar datosd atos estadsticos en este caso. l fu n cion am ien to d e Stata con siste en m an ip u lar, m odificar y realiar op eracion es
m atem ticas sobr e u n a m atr id e datos qu e se alm acen a en la m em or ia d el
or den ador. Par a qu e Stata p u ed a trabajar con estos datos, tien en qu e estar
en el for m ato ad ecu ado, en el for m ato d e Stata. n el p rim o cap tu lo, se
ver cm o con str u ir o tr adu cir los fich eros p rop ios d e este pr ogr am a, bien

a de ten erse en cu en ta qu e se perm ite la visin de varios ficheros al m ism o tiem po,
tanto en n uevas ven tan as com o en n u evas pesta as (Tab
.

02_primeros pasos(nuevo).indd 43

06/06/12 09:23

CS
CS

sea in trodu cien do los datos m an u alm en te o tradu cin dolos d esd e fich eros
con stru idos p or otros p rogram as
com o SPSS o celal for m ato de Stata.
Per o, p rim er o, es con ven ien te eplicar operacion es m s fciles com o su u so,
el form ato y la d isp osicin d e d atos qu e en ellos se con tien e.
l igu a l qu e la m a yor p a r te d e p r ogr a m a s esta d sticos, Sta ta tr a b a ja
con u n fich er o d e d a tos estr u ctu r a d o p o r ca sos y va r ia b les. ste fich er o
h a d e r esid ir en u n d eter m in a d o d ir ector io d e u n a u n id a d d el or d en a d or.
Pa r a h a cer u so d e l y a p lica r le cu a n ta s o p er a cio n es esta d stica s se d esee,
h a d e ca r ga r se en la m em or ia cen tr a l d e la m qu in a . llo se con sigu e
a b r ien d o el fich er o m ed ia n te el m en ile
pen , el p r im er icon o d e la
b a r r a d e h er r a m ien ta s (pen
la com b in a cin d e tecla s Ctr lo, o la in str u ccin u se n om b r efich er o. n ter io r m en te se h a u tilia d o la in str u ccin
sysu se, p er o esta slo sir ve p a r a fich er o s su m in istr a d os p or el p r ogr a m a
p a r a m ostr a r ejem p los in cor p or a d os en el m a n u a l. Si se qu ier e, en con secu en cia , a b r ir u n fich er o p r evia m en te cr ea d o p or el u su a r io, com o p u ed e
ser el fich er o con in for m a cin d e p a ses, a l q u e se titu l con el n om b r e
m u n d o, la in str u ccin d eb er a in clu ir la o p cin clea r, si se d esea d esca rta r p osib les m od ifica cio n es r ea lia d a s en u n con ju n to d e d a tos ca r ga d os
en m em or ia .
u se m u n do, clear

p ar tir d e ese m om en to, si el p r ogr am a h a localiad o cor r ectam en te el


fich er o, la m atr id e d a tos se car ga en la m em oria d el or den ad or y, com o
p r u eb a d e ello, ap ar ecen la s var ia b les en su ven tan a cor r esp on d ien te, siem p r e qu e se en cu en tr e ab ier ta. Com o se h a visto an ter ior m en te, en la p an talla d el ed itor d e d atos, esta m a tr ise r ep r esen ta h ab itu alm en te com o u n a
tab la d e d atos en la qu e las filas son casos y las colu m n as va r iab les
as se
r ep r esen ta p or ejem p lo en el ed itor d e d atos d e Stata, com o se ver con
aten cin en el sigu ien te ap ar tad o
. os casos son los in d ivid u os d e los qu e
se dispon e in for m acin , y las var ia bles son las categor as en las qu e se organ ia esa in for m a cin . n este ejem plo, al d isp on er d e u n con ju n to d e
in d icad or es d e p ases, los casos ser n cad a u n o d e los p ases in clu idos, y
las var iab les ca da u n o d e los in d icad or es d isp on ibles com o la su p er ficie, la
p ob lacin , el P
, etc.
Pa r a con ocer la s ca r a cter stica s d e la s va r ia b les qu e est n con ten id as
en u n fich er o, Sta ta p o see u n a in str u ccin q u e con str u ye u n a lista d e
to d a s ella s, sa lvo q u e se esp ecifiqu e tr a s la in str u cci n u n su b con ju n to

Si se u sa un a versin de Stata an terior a la , podra ocu rrir qu e el fich ero fu era dem asiado grande para qu e cupiera en la m em oria qu e Stata reserva por defecto
egabytesal
in iciarse el program a. Con la orden set m em , el u su ario pu ede cam biar la capacidad reservada. partir de dich a versin , el usu ario n o tiene qu e preocu parse de la am pliacin de la
gestin de la m em oria, pu esto qu e el program a la gestiona au tom ticam en te.

02_primeros pasos(nuevo).indd 44

06/06/12 09:23

ANLIS IS DE DATOS CON S TATA

d e var iab les. sta or d en es describe. sa d a sin a r gu m en to n i op cin , p r op or cio n a d e ca d a va r ia b le in for m a cin sob r e el tip o d e a lm a cen a m ien to,
el for m ato d e p r esen ta cin y las etiqu eta s. p licad a sob r e el fich er o m u n do d el p r esen te ejem p lo, m u estr a el r esu lta d o p r esen ta d o en la ilu str a cin ..
Se ad vier te en pr im er lu gar qu e el fich er o con sta d e observacion es,
cada u n a d e ellas corr esp on de a u n pas. am bin se in dica qu e est com p u esto p or variab les y qu e el tam a o qu e ocu p a en d isco
y actu alm en te
en m em oriaes de .b ytes.
n la ilu str acin .se lista el con ju n to d e variab les disp on ibles en el
fich er o, ah ora cargadas en la m em or ia d el p rogram a. Cad a u n a d e ellas
ap ar ece, ju n to con su n om br e, con su tipo d e alm acen am ien to, su form ato
d e pr esen tacin y su s etiqu etas, con cep tos todos ellos qu e se ep lican en los
tres pr im os ap artad os. e estas pr opiedad es d e las variab les, la m s sen cilla, til, n ecesar ia y em p leada es el etiqu etaje. Por ello, se ab ord a en p r im er lu gar. as otras d os, el tip o y el form ato, son m s com plejas y n o tan
n ecesar ias, por lo qu e si n o se en tien d en en u n pr im er m om en to, el lector
p u ed e con tin u ar con los sigu ien tes cap tu los de este libr o sin tem or a
p erder se algo im prescin d ible.
ILUSTR ACI
2.22 .e sc r ip ci n
de
va r ia le s
Cont ai ns dat a f r om mundo. dt a
obs :
213

I ndi c ador es de l os pai s es . Mundo ( 2002)


Fuent e: The Wor l d Bank
v ar s :
17
13 Aug 2009 20: 02
s i z e:
20, 661 ( 99. 9% of memor y f r ee)
---------------------------------------------------------------------------------s t or age di s pl ay
v al ue
v ar i abl e name
t y pe
f or mat
l abel
v ar i abl e l abel
---------------------------------------------------------------------------------pai s
st r 24 %- 24s
Pai s
c api t al
st r 19 %19s
Capi t al
c ont i nent e
by t e
%7. 0f
c ont i
Cont i nent e
oc de
by t e
%2. 0f
per t e
Per t enec e a l a OCDE
f i oc de
f l oat
%d. .
Fec ha de i ngr es o en l a OCDE
ue
by t e
%5. 0f
per t e
Per t enec e a l a UE
f i ue
f l oat
%d. .
Fec ha de i ngr es o en l a Uni n Eur opea
s uper f i c i e
doubl e %12. 0f c
Super f i c i e
pobl ac i on
f l oat
%9. 3f c
Pobl aci n
dens i dad
f l oat
%8. 0f c
* Dens i dad
ev n
f l oat
%3. 0f
Esper anz a de v i da al nac er
t mi
i nt
%8. 0g
Tas a de mor t al i dad i nf ant i l
anal
by t e
%8. 0g
Tas a de anal f abet i smo
t asc r ec
f l oat
%6. 2f
Tas a de cr ec i mi ent o
pi b
l ong
%12. 0f c
Pr oduct o i nt er i or br ut o ( mi l $)
r nbpc
l ong
%9. 0f c
Rent a per c pi t a ( $)
r nbppa
l ong
%9. 0f c
Rent a per c pi t a ( poder de c ompr a)
* i ndi c at ed v ar i abl es have not es
---------------------------------------------------------------------------------Sor t ed by :

02_primeros pasos(nuevo).indd 45

06/06/12 09:23

CS
CS

... tiu etas de variables y de valores


n Stata pu eden asign ar se etiqu etas a la base de d atos, a las variables y a
los valor es. stas etiqu etas h ar n m s fcil la com pr en sin d e los an lisis
estadsticos, por lo qu e es con ven ien te pon erlas.
a in stru ccin gen eral par a etiqu etas es label, tras la cu al se esp ecifica
qu es lo qu e se qu ier e etiqu etar y la etiqu eta. Para p on er u n a etiqu eta a la
b ase de datos, h a de escr ibirse label data y la etiqu eta qu e se d esee
la bel da ta

n d icad ores de los p ases. u n do

as etiqu etas de las var iables se p on en con la in str u ccin com pu esta
label variable
la bel va ria ble pib
Produ cto in terior b ru to

Com o p u ed e dedu cir se, la etiqu eta debe ir en tr ecom illad a, obligator iam en te si tien e esp acios en blan co.
n poco m s com plejo es pon er etiqu etas a los valor es. as etiqu etas de
valor es se defin en p or listas, y lu ego se asign an a las var iables deseadas.
sto p erm ite qu e se asign e u n a m ism a lista de etiqu etas de valores a var ias
variab les con igu ales r espu estas. Por ejem plo, es posib le asign ar al m ism o
tiem po etiqu etas a los valores de u n con ju n to d e p regu n tas qu e ten gan las
m ism as posib ilidad es de r esp u esta, com o m u y d e acu erd o, d e acu erd o, en
d esacu er do y m u y en desacu erd o.
o prim ero que debe hacerse es definir una lista de etiquetas de valores, al
que se denom inar conti
por continente
. sto ha de hacerse del siguiente m odo
la bel defin e con ti
u ropa
sia
frica
m rica
cea n a

Com o pu ede apr eciarse, tras la ord en label va la especificacin defin e, el


n om b re de la lista de etiqu etas d e valores y lu ego los valor es segu idos p or
su s resp ectivas etiqu etas. n a vequ e se in trodu ca esta in stru ccin , la lista
d e etiqu etas d e valor es qu edar en m em or ia ju n to con los d atos. Si se gu ard an estos, las listas de etiqu etas qu ed arn tam b in grabad as, de tal m od o
qu e se recu peran en sesion es su bsigu ien tes de Stata.
n a vedefin ida u n a lista de etiqu etas, se p u ede asign ar a tan tas variab les com o se d esee, en cu alqu ier m om en to. n este caso con cr eto, la in str u ccin es
la bel va lu es con tin en te con ti

02_primeros pasos(nuevo).indd 46

06/06/12 09:23

ANLIS IS DE DATOS CON S TATA

ste p roced im ien to tien e im por tan tes ven tajas cu an do h ay varias var iab les con el m ism o tip o d e etiqu etas, com o su cede con las variab les ocde y
u e, am bas relacion adas con la p er ten en cia o n o a estos organ ism os. Par a
etiqu etar su s valores, p rim er o se d efin en las etiqu etas y d espu s se asign an
a cad a u n a de las variab les de este m od o
label d efin e perte
o
S
label valu es ocd e perte
label valu es u e p erte

n cu alqu ier m om en to, el u su ar io pu ede ver las listas de etiqu etas qu e


estn d efin id as en u n deter m in ado con ju n to d ispon ib le d e d atos. Par a ello
h ay qu e u tili
ar la or den labelboo, o p ara u n resu ltado m s escu eto label
list, qu e slo m u estr a cdigos y etiqu etas par a cada lista.
label list

ILUSTR ACI
2.2 .List a
de
e t ie t a s

tr as in str u ccion es tiles p ar a trabajar con etiqu etas son label drop
qu e
elim in a las listas de etiqu etas qu e se d eclaren ep resam en tey label save

qu e gu ard a la defin icin d e las etiqu etas en el ar ch ivo .do qu e se in diqu e


.
eclean d o label valu es segu ido slo p or u n n om b re de var iable, se qu itar n
las asign acion es qu e tu vieran su s valores a u n a lista de etiqu etas.
label valu es ocd e

ed ian te la an ter ior in str u ccin , la etiqu eta perte dejar d e estar asign ad a a la variab le ocd e. a lista de etiqu etas perte n o se bor ra d e la base d e
d atos, slo deja d e estar asign ada a ocde
segu ir asign ada a la otra var iable
asign ada, a u e
. m en os qu e se escrib a la ord en especfica para h acer lo

con label drop


, si u n a etiqu eta n o est asign ad a a n in gu n a var iab le n o
d esap ar ece del arch ivo, con lo qu e pu ede ser u sad a siem p re qu e se requ iera.

02_primeros pasos(nuevo).indd 47

06/06/12 09:23

CS
CS

... Tipos de alm acen am ien to de las variables


n Stata, cada var iable tien e u n form ato seg n el tipo d e d atos qu e con ten ga. os valor es d e las var iables p u ed en com p on er se d eau n a caden a d e
caracteres
strin g
, b n m er os o cfech as. stos son los tr es tip os p rin cip ales d e variab les en Stata.
as var iables n u m ricas y d e caden a n o slo con tien en la in form acin
d e su tipo, sin o tam b in el tam a o m im o d e d gitos d e la var iable. n las
variab les de caden a la n orm a y el pr oced im ien to son sen cillosau tom ticam en te Stata asign ar a cad a variab le el tipo str y el n m er o de car acter es
qu e con ten ga el con ju n to d e car acter es m s lar go. Por ejem plo, en u n a var iable qu e in clu yera las provin cias esp a olas, la caden a d e caracteres m s
larga ser a San ta Cru de en erife, qu e se escrib e con car acter es, por lo
qu e Stata asign ara a la variab le provin cia la eten sin d e el tip o sera
str.
Par a las var iables n u m ricas es algo m s com p licad o, pu esto qu e el tip o
n o d epen de d ir ectam en te del n m ero de d gitos sin o del valor m im od esd e byte, qu e p u ed e alm acen ar d esde el valor h asta el h asta dou ble,
qu e pu ede alm acen ar desde el n m er o . h asta el .. n el cu ad ro .
p u ed en ver se los distin tos n om br es y caractersticas d e los tip os d e variab les
n u m ricas qu e u tili
a Stata.
CUAR
2.2 .Tip o s
d e
a lm a c e n a m ie n t o
d e
va r ia le s
n m r ica s 2

Tip o
va r ia le

a lo r
m n im o

a lo r
m im o

a lor
m s
ce r ca n o
a

sin
ser

t e s

long

...

...

float

dou ble

byte
int

u enteStata Corporation
c
.

n pr in cip io, n o es n ecesar io pr eocu par se p or el tip o de las variab les,


p or qu e Stata asign a au tom ticam en te el tipo ad ecu ado, e in clu so lo cam b ia
si es n ecesar io
si se in trod u ce u n valor m ayor qu e el m im o
. Por ejem plo,
si se a ade u n caso con el valor en u n a variab le byte
qu e p u ed e alm a
os valores m nim os y m im os de las variables flotan tes y dobles h an sido redu cidos a
u n decim al para sim plificar su eposicin . l valor eacto puede con su ltarse en la seccin
..de la gua del u suario.

02_primeros pasos(nuevo).indd 48

06/06/12 09:23

ANLIS IS DE DATOS CON S TATA

cen ar h asta el valor , vase el cu ad ro .

, au tom ticam en te Stata cam b ia el for m ato d e la variab le y la con vier te en in t, qu e s pu ede alm acen ar
u n valor m ayor qu e la cen ten a. Per o, au n qu e n o sea n ecesar io asign ar d ir ectam en te el for m ato a las var iables, p orqu e Stata ya lo h ace au tom ticam en te, pu ede ocu r rir qu e los form atos sean d em asiad o gr an des par a los d atos,
p or lo qu e estos ocu pen dem asiada m em oria. Por ejem plo, en el su p u esto d e
qu e a u n a var iable de ed ad , p ara la qu e en p rin cip io el for m ato byte
qu e
p u ed e alm acen ar d e a es m s qu e su ficien te, p or u n er ror en la
in trod u ccin de d atos, se in trod u jera el valor au tom ticam en te, Stata
cam biara el tip o d e la var iable a in t. Si lu ego se ad vier te el er ror y se corr ige
cam bian d o el valor a
, el tipo de la variab le segu ir sien do in t, au n qu e los datos qu e alm acen a la var iable edad n o su peren en n in g n caso la
cen ten a
y p or tan to el tip o byte es su ficien te
. sto es as porqu e Stata m od ifica el form ato al ala per o n o a la b ajacu an do se in tr odu ce u n valor
su p er ior al m im o p er m itido por el tip o d e var iable, cam bia el form ato
p ara qu e se pu eda alm acen ar el valor corr ectam en te, p er o a m en os qu e se
esp ecifiqu e n u n ca cam bia el for m ato, si se redu ce el valor m im o. sto es
im por tan te p or qu e el form ato de la variable determ in a cu n ta m em oria
ocu pan los d atos. Si los for m atos de los datos son m ayores de lo n ecesar io,
p u ed e qu e la m atriocu p e tan to qu e n o qu epa en la m em oria de trabajo y,
en con secu en cia, su p roceso se ralen tia por la n ecesidad de u sar el disco
d u ro com o m em or ia virtu al.
a in str u ccin com press est esp ecficam en te dise ada par a este p roblem a. Cu an d o se in tr odu ce esta ord en , Stata com pr u eb a u n o a u n o los form atos de todas las var iables de la m atr iy asign a a cada u n a de ellas el for m ato m s p equ e o posible. s u n a in str u ccin qu e n u n ca m odifica los con ten idos d e la m atr i, slo el tipo de las variab les. Caso d e qu e este ya sea tan
p equ e o com o p osible, n o m odificar n ada. Pero, en m u ch os casos, este
com an do pu ede h acer m ejorar osten siblem en te el fu n cion am ien to d e Stata,
al redu cir el tam a o qu e ocu p an los datos en m em or ia.
in alm en te h ay qu e con ocer el pecu liar m odo con qu e Stata tr ata las
fech as. stas pu eden ser u n a variab le d e tetoar , u n con ju n to
d e tr es var iables n u m r icas, p ar a el da, par a el m es y par a el a o,
o u n a sola var iable n u m rica, en cu yo caso se n ecesita u n a refer en cia, u n a
fech a d e p artida qu e repr esen te el valor , qu e en Stata es el de en ero de
. n cu alqu ier caso, para qu e este pr ogr am a las tr ate com o var iable d e
fech a, esp ecialm en te en los an lisis de ser ies tem por ales, slo es vlid a la
ltim a form a de alm acen am ien to.
esu lta evid en te qu e el u su ar io n o va a in trodu cir la variable d e fech a
seg n los d as qu e h ayan tran scu rr ido desde com ien os d el a o . Par a
la con ver sin se dispon e de m u ch as fu n cion es qu e per m iten tan to pasar del
form ato u su al al m odo de trab ajo com o a la in versa.
n a de las op er acion es m s em plead as en este sen tido es la de prop orcion ar u n deter m in ado for m ato d e pr esen tacin a u n a variab le. e este

02_primeros pasos(nuevo).indd 49

06/06/12 09:23

CS
CS

m od o, u n a var iable con el valor n u m rico tem por al de pu ede aparecer liter alm en te com o jan u ary , si se le in d ica d ich o for m ato tal com o se
se ala en el p rim o ap artad o.

... orm atos de presen tacin de las variables


Com o en la m ayor p ar te d e las ap licacion es in for m ticas, h ay qu e distin gu ir
en tr e el m od o en el qu e son alm acen ad os los valores d e las var iables qu e
p resen tan los casos y el for m ato en el qu e son p resen tados en la p an talla. l
p rim er o est d eter m in ado por el tip o de alm acen am ien to, m ien tr as qu e el
segu n d o es el qu e es d en om in ad o for m ato de pr esen tacin .
n a in stru ccin para la qu e es im portan te la u tili
acin de los for m atos
de pr esen tacin es list. Com o ya se h a visto, su fu n cin es la de m ostrar los
valor es qu e tien en los casos en u n as deter m in adas variables. l m odo de
cam b iar la presen tacin de las variables es m edian te otra orden an terior a la
m en cion ada. Se trata de form at, qu e h a de presen tar la sigu ien te estru ctu ra
fo r m a t listavariables form ato

on de aparece listavariab les, h a d e figu rar u n a o varias variab les m ed ian te las con ven cion es pr opias d el p rogram a y don de apar ece for m ato se
especifica m edian te claves el aspecto con el qu e se desean m ostrar las variab les. esd e el p u n to de vista d el form ato tam bin es til distin gu ir los tres
tipos de var iableslas n u m ricas, las tetu ales y las de fech a.
as variables n u m ricas pu ed en p resen tarse a su vede acu erd o a
u n a de las sigu ien tes m odalidad es
p.d g, para m ostrar tod o tipo d e for m atos.
p.d f, p ar a m ostr ar for m atos de u n n m ero deter m in ado d e d ecim ales.
p.d e, para m ostr ar los n m er os en n otacin cien tfica.
d on d e p sign ifica el n m er o de posicion es qu e se d esean obten er d e u n d eter m in ado n m ero y d epr esa el n m er o d e d ecim ales qu e se qu ieren m ostr ar. tod as ellas se le pu ede a ad ir u n a c, si se desea qu e se a ad a u n a
com a cada tres dgitos par a m ejorar la legib ilid ad de las cifras lar gas. Por
d efecto, Stata em p lea los p u n tos par a epr esar los decim ales y las com as
p ar a los m illar es. sto pu ede cam b iarse con la in str u ccin set dp com m a.
n r ealidad , slo eisten d os tip os de for m atos para los n m eros, el decim al (fy el cien tfico (e
. l form ato (gh ace qu e sea el m ism o p rogram a
qu ien se en car gu e de seleccion ar la p restacin m s ad ecu ada seg n las car acter sticas del n m er o m ostrado.

02_primeros pasos(nuevo).indd 50

06/06/12 09:23

ANLIS IS DE DATOS CON S TATA

Pa r a qu e qu ed e m ejor a cla r a d o es im p r escin d ib le u n b u en ejem p lo


con d istin to s tip os d e fo r m a to . e la b a se d e d a tos d e los p a ses d el m u n d o se h a n seleccion a d o la s va r ia b les su perficiepibtm i y ta screc. l form a to r esp ectivo d e ca d a u n a d e ella s es el sigu ien teta n to en su perficie
co m o en pib se h a n p u esto d oce ca r a cter es sin n in g n d ecim a l. n a m b a s
ta m b in se h a a a d id o el ca r cter c a fin d e m ejor a r la legib ilid a d . n
la ta sa d e m or ta lid a d se h a fija d o u n for m a to d e p osicion es sin n in g n
d ecim a l
est m ed id a en ta n tos p or m il
. , fin a lm en te, la ta sa d e cr ecim ien to se ep r esa en for m a to d e seis p osicion es y d o s d ecim a les. od a
esta in for m a cin est gu a r d a d a en el fich er o, p or lo qu e n o es n ecesa r ia
su in tr od u ccin , a m en os qu e se d esee ca m b ia r.
n listado d e los d iepr im eros p ases de las var iables con los for m atos
an ted ich os p u ed e solicitar se con la sigu ien te in str u ccin
list pa is su perficie pib tm i ta screc in

tese qu e a la or den list se le h a a ad id o la lista de var iables y la partcu la in segu id a d e


, lo qu e sign ifica d esd e el caso p rim ero h asta el
d cim o.
ILUSTR ACI
2.2 .List a d o
p a r c ia l
d e
c a so s

1.
2.
3.
4.
5.
6.
7.
8.
9.
10.

+- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - +
|
pai s
s uper f i ~e
pi b
t mi
t asc r ec |
| -------------------------------------------------------------|
|
Af gani s t n
652, 090
4, 100
163
2. 60 |
|
Al bani a
27, 400
4, 114
20
0. 40 |
|
Al emani a
349, 300
1, 873, 854
4
0. 30 |
|
Andor r a
500
950
.
. |
|
Angol a
1, 246, 700
9, 471
128
3. 10 |
| -------------------------------------------------------------|
|
Ant i gua y Bar buda
400
640
16
1. 40 |
| Ant i l l as Hol andesas
800
2, 360
13
0. 86 |
|
Ar abi a Saud
2, 149, 690
173, 287
18
2. 80 |
|
Ar gel i a
2, 381, 700
53, 009
33
1. 90 |
|
Ar gent i na
2, 736, 700
268, 773
17
1. 30 |
+- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - +

n cam bio, si an tes de realiar ese m ism o listado se le h u b iera cam b iad o el form ato d e u n m od o sim ilar a este
form a t .g su perficie p ib tm i tascrec

el resu ltado h u b iera sid o d ifer en te en las var iables su perficiepib y tascrec.

02_primeros pasos(nuevo).indd 51

06/06/12 09:23

CS
CS

ILUSTR ACI
2.2 .List a d o
fo r m a t e a d o
d e
ca s o s

1.
2.
3.
4.
5.
6.
7.
8.
9.
10.

+- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - +
|
pai s
super f ~e
pi b
t mi
t as c r ec |
|----------------------------------------------------------|
|
Af gani st n
652090
4100
163
2. 6 |
|
Al bani a
27400
4114
20
.4 |
|
Al emani a
349300
1. 9e+06
4
.3 |
|
Andor r a
500
950
.
. |
|
Angol a
1. 2e+06
9471
128
3. 1 |
|----------------------------------------------------------|
|
Ant i gua y Bar buda
400
640
16
1. 4 |
| Ant i l l as Hol andes as
800
2360
13
. 86 |
|
Ar abi a Saud
2. 1e+06
173287
18
2. 8 |
|
Ar gel i a
2. 4e+06
53009
33
1. 9 |
|
Ar gent i na
2. 7e+06
268773
17
1. 3 |
+- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - +

n esto s r esu lta d o s, en lo s qu e se h a a p lica d o a t od a s la s va r ia b les


n u m r ica s el for m a to .g, se p u ed e ver qu e h a y ca sos d e la s va r ia b les
su perficie y pib n gola en la p r im er a y lem a n ia en la segu n d a , en tr e
o tr os q u e so n m o str a d o s en n o ta ci n cien tfica , p u es d e otr o m od o n o
ca b r a n en lo s esp a cios. Po r o tr o la d o, en la va r ia b le d e la ta sa d e cr ecim ien to se d etecta o tr a d e la s p ecu lia r id a d es d el tr a ta m ien to d el for m a to q u e h a ce Sta ta . s d e n ota r c m o , a p esa r d e q u e estn p u esta s en
fo r m a to d e cer o d ecim a les, Sta ta lo s m u estr a to d os siem p r e y cu a n d o
estn a s a lm a cen a d os, sin efectu a r op er a ci n d e r ed o n d eo co m o lo h u b ier a h ech o en el ca so d e h a b er u tilia d o el for m a to p .d f d e p r esen ta ci n . Por ello, en el ca so d e la s n tilla s ola n d esa s a p a r ecen d o s d ecim a les. n el ca so d e qu e h u b ier a a lg n p a s sin d ecim a les, o b via m en te n o
los m o str a r a .
os form atos d e las variables tetu ales tam b in pu eden ser cam biad os. Per o, en lu gar d e u tiliar los caracteres f, g o e, h ay qu e em plear
s, abr eviatu r a de strin g. bviam en te, en este caso, n o h an d e ap ar ecer cifras d ecim alesen cam b io, es m u y til u tiliar la opcin del
alin eam ien to a la i
qu ier da, qu e se logra m edian te el sign o m en os
delan te de la cifra qu e in dica el n m ero de posicion es n ecesarias para
la p resen tacin del teto. e este m od o, con las dos sigu ien tes in stru ccion es, se m ostr ar a los cin co pr im eros pases acom p a ad os de
su corr espon dien te tasa de m ortalid ad in fan til
form at -s p ais
list pais tm i in
, clean

Por defecto Stata asign a el form ato .g a todas las variables alm acen adas com o byte
o integer, con .g a las variables float, .g a las dou ble y .g a las long.

02_primeros pasos(nuevo).indd 52

06/06/12 09:23

ANLIS IS DE DATOS CON S TATA

s p reciso n otar cm o en los resu ltados d e la ilu str acin ., el tam a o


d e la colu m n a de la var iable pais n o con tien e colu m n as. m en os qu e se
le esp ecifiqu e la opcin fastel p rogram a eam in a la lon gitu d d e los casos
qu e va a m ostrar y au tom ticam en te aju sta el tam a o d e la colu m n a al
m im o de car acter es. tra opcin in ter esan te d e la orden list es clean , qu e
h ace qu e en el listad o los casos n o qu ed en separ ad os por ln eas h or ion tales.
ILUSTR ACI
2.2.List a d o
fo r m a t e a d o
d e
c a so s

II
1.
2.
3.
4.
5.

pai s
Af gani s t n
Al bani a
Al emani a
Andor r a
Angol a

t mi
163
20
4
.
128

in alm en te, h ay qu e r efer ir se a los com p lejos for m atos d e variables


de fecha (date
. Com o se dijo an ter iorm en te, Stata alm acen a los d atos r elacion ad os con fech as com o u n n m er o de tal m odo qu e el
repr esen ta el d e en ero de . n valor n egativo es u n a fech a
an terior a la m en cion ada y tod o positivo, en corr espon den cia, p osterior. s, com o dich o a o fu e b isiesto, el n m er o equ ivale al
de en ero de y el n m er o r epr esen ta el pr im er da del
a o .
od o ello es fcilm en te apr eciab le u tilian do la or den display, qu e m u estra el con ten ido de u n a var iable o con stan te con la p osibilid ad de aplicar le
u n form ato tem poral. e este m od o, si se escr ibe la sigu ien te ln ea en la
ven tan a d e r den es
d isplay d -, d , d

se m ostrar en la pan talla d e resu ltados tres fech as con secu tivas corr espon d ien tes a los pr im eros das d e los a os , y .
ILUSTR ACI
2.2 .p o s ici n
d e
fe ch a s

I
01j an1959 01j an1960 01j an1961

Com o p u ed e a p r ecia r se, la s fech a s se m u estr an en in gls con d os d gitos p ar a el d a, segu id os p or tr es ca r a cter es p a r a el m es y cu atr o d gitos
p ar a el a o. sto ta m b in p u ed e ser ca m b ia d o a l esp ecifica r el for m ato
d segu id o con u n a lista for m ad a p or u n a com b in a cin d e la s sigu ien tes
con ven cion es.

02_primeros pasos(nuevo).indd 53

06/06/12 09:23

CS
CS

CUAR
2..o r m a t o s
de
fe ch a
c C

u estra el siglo sin


con ceros a la i
qu ierda

u estra los dos dgitos del a o sin


con ceros a la iqu ierda

u estra el m es en m ay scula abreviado con letras


sin abreviar

u estra el m es en m in scu la abreviado con letras


sin abreviar

u estra el m es n u m ricam ente sin


con ceros a la i
quierda

u estra el da del m es sin


con ceros a la iqu ierda

u estra el da del ao

sin
con ceros a la i
qu ierda

u estra la sem an a

del a o sin
con ceros a la iqu ierda

.,
-

Caracteres perm itidos directam en te en el form ato de fech a

Prefijo para in trodu cir cu alquier otro carcter

a m ism a in stru ccin an terior pu ede ser em plead a con otr os for m atos
p ar a qu e la pr esen tacin d e cad a u n a d e las fech as sea totalm en te difer en te.
l p rim o ejem p lo m u estra tr es for m atos d istin tos en los qu e p u ed en pr esen tarse los segu n dos das de los a os , y .
d ispla y d d
c , d
d
, d d-n -C
ILUSTR ACI
2 .2 .p o sic i n
de
fe ch a s

II
2 Januar y 1959

J anuar y / 2/ 60

2- 1- 1961

... l gestor de variables


Se podr an sin tetiar las tr es ltim as seccion es, eplican d o u n a de las n oved ad es in tr odu cidas en la ver sin de Stata. Se trata d el gestor de variab les,
qu e pu ede ser llam ad o m edian te m en (ata
ariables m an ager
icon o
el
d cim o, ariab les m an ager e in clu so d esd e la ven tan a de rd en es, m ed ian te la in stru ccin varm an age.
sta in stru ccin gen er a u n cu adr o de d ilogo qu e con tien e tan tas ln eas
com o variab les se en cu en tran en la m atride datos y seis colu m n as corr esp on d ien tes al n om bre d e la variab le, su etiqu eta y las de su s valor es, su tip o,
su for m ato y las n otas qu e el u su ario d esee in cor por ar a cada u n a d e ellas.

s preciso aadir qu e Stata tam bin pu ede con siderar las fech as sem an al, m en su al,
trim estral, sem estralm en te e incluso fechas con h ora in clu ida. n cualqu ier caso, siem pre el
pun to de referen cia es el de en ero de y la variable qu eda gu ardada com o n um ricapero
en estos casos el n m ero, en lu gar de das, significa sem anas, m eses, trim estres, sem estres o
m ilisegu n dos. Sin em bargo, com o este libro n o trata de series tem porales, se con sidera que n o
es til eplicar su u so. Se su giere pedir ayu da en Stata m edian te la in stru ccin help dates.

02_primeros pasos(nuevo).indd 54

06/06/12 09:23

ANLIS IS DE DATOS CON S TATA

ILUSTR ACI
2 .2.e n t a n a
d e l
e st o r
d e
va r ia le s

a s var iab les d e esta lista p u ed en ser or d en ad as p or su p osicin en la


m a tr i

, p or su n om b r e, el d e la etiqu eta o el d e la lista d e etiqu etas d e


los va lor es. el m ism o m od o, esto es, ap r etan d o en su cab ecer a , p u ed en
qu ed ar or d en a d a s p or su tip o, for m a to o la p osesin o n o d e n otas. a m b in la s va r ia b les p u ed en ser clasifica d a s p or cu a lqu ier a d e su s car acter stica s m en os el n om b r e y su or d en , siem p r e y cu a n d o se a r r a str e su en ca b eam ien to a la fr an ja situ ad a p or en cim a d e las ca b ecer a s.
n clu so, en el
caso d e con ta r con m u ch a s va r ia b les, p u ed e r ealia r se u n a seleccin d e
ella s, escr ib ien d o los car acter es d esead os en la casilla situ a d a ar r ib a a la
iqu ier d a in m ed ia ta m en te d eb a jo d el m a r co d e la ven ta n a . od os estos
cam b ios m en cion ad os en este p r r a fo a fecta n slo a l gestor, ya qu e la ca n tid a d d e va r iab les y el or d en en la m atr iqu ed a r n in a lter a d os .
tr a ca r a cter stica sob r esa lien te d el gestor d e va r ia b les es la p osib ilid ad d e tr a sla d a r el n om b r e o la lista d e u n su b con ju n to d e va r ia b les a la
ven ta n a d e r d en es, a l ed itor d e p r ogr a m as o d on d e se r equ ier an . p r etan d o la tecla m a y scu la o con tr ol a l tiem p o qu e se p u lsa el b otn iqu ier d o
d el r a tn en la s r esp ectivas ln ea s d e la s va r ia b les, qu ed a r a ctiva d a m s
d e u n a va r ia b le. n a vequ e se h a n seleccion ad o la s va r ia b les p er tin en tes,
a p r eta n d o el b otn d er ech o d el r atn a p a r ecer u n m en con tetu a l, cu ya
ltim a ln ea h ace qu e tod os los n om b r es d e la s va r ia b les seleccion a d as
a p a r ecan en la ven tan a d e r d en es. lter n ativa m en te, si se seleccion a la
ln ea Copy varlist o se p u lsa n las tecla s Ctr lc, se a lm a cen ar n en el p or ta p ap eles y, d e este m od o, p od r n p ega r se all d on d e se r equ ier a con la com b in acin Ctr lv.

Si se desea borrar variables de la m atripodr h acerse m ediante las opcion es eep y


drop del m en con tetual que se obtien e pu lsan do el botn derech o del ratn sobre u n a seleccin de variables. m bas opciones son tam bin in stru ccion es que pueden ejecutarse en la ventana de rden es para m anten er o borrar un a lista de variables.

02_primeros pasos(nuevo).indd 55

06/06/12 09:23

CS
CS

l gestor d e variab les perm ite tam bin in tr odu cir y editar las car acter sticas d e las variab les. n la p arte d er ech a, se en cu en tr a u n a ven tan a in ter n a
qu e con tien e n om br e, etiqu eta, tip o, for m ato, etiqu eta de valor es y n otas d e
la variab le seleccion ad a. odas estas car acter sticas p u ed en ser m od ificad as
p or el u su ar io, del m ism o m od o qu e tam b in pu eden efectu arse cam bios
d esd e la ven tan a in ter n a d e las pr opied ad es de las variab les, qu e aparece en
la p ar te in ferior i
qu ier da d e la p an talla p or defecto d e la ver sin de Stata
vase la ilu str acin .
, sin n ecesid ad de en tr ar en el gestor de variab les,
siem p re y cu an d o apar eca abier to el can d ado situ ado d eb ajo del ttu lo
(ropertiesd e la ven tan a.
ILUSTR ACI
2..e n t a n a
in t e r n a
d e
la s
p r o p ie d a d e s
d e
la s
va r ia le s

2..
e r cicio s
am iliar
ate con los fich er os d e ejem p lo con los qu e cu en ta Stata
m ed ian te la in str u ccin sysu se. ir a qu variab les con tien e, el m odo
en qu e estn gr abadas, su for m ato d e pr esen tacin y las etiqu etas
qu e con tien e. in alm en te h au n listado de los diep rim eros casos.

ich er os pr opu estoscen su s, citytem p , edu cgd p, gn p , lifeep,


p op, u slifeep, voter
.
Cop ia los fich er os qu e se p ropor cion an con este libr o a u n director io. r ran ca Stata d esde ese d irectorio
o al m en os, u n a ved en tro
d e Stata, escr ib e la in stru ccin cd d ir ector io
. ista tod os los fich eros qu e sean del tipo .dta. b relos e in sp eccion a tam bin las
variab les, su form ato y etiqu etas p ara term in ar h acien do eam en de
ellos con la in str u ccin brose.
n el fich er o qu e p refier as de los dos ejer cicios an terior es, cam bia
las etiqu etas d el fich er o, d e las variab les y de los valor es. Por ejem -

02_primeros pasos(nuevo).indd 56

06/06/12 09:23

ANLIS IS DE DATOS CON S TATA

plo, todos los fich eros d el pr im er ejer cicio tien en etiqu etas en in gls,
coge u n o de ellos y reem pl
alas p or otr o id iom a. Si qu ier es con servar los cam b ios, n o olvides term in ar con la in str u ccin savereplace,
qu e se eplica en el cap tu lo .

02_primeros pasos(nuevo).indd 57

06/06/12 09:23

02_primeros pasos(nuevo).indd 58

06/06/12 09:23

3
In t r o d u cci n
d e
d atos
3 .1 .In t r o d u cci n
m a n u a l
d e
d atos
Ra r a vez se in tr od u ce in for m acin m a n u a lm en te en Sta ta. H a b itu a lm en te
se u tiliza n d atos p r eviam en te p r ep ar ad os en otr os p r ogr am a s, p or lo qu e
es im p or tan te sab er p asa r a l for m a to d e Sta ta los d a tos gr ab ad os en otr os
for m atos (en for m ato SPSS, E xcel, o S

, p or e
em p lo
. E so se con tem
p la r en el sigu ien te ap ar tad o. con tin u a cin , slo d e m od o som er o, se
in d ica cm o se in tr od u cen los d atos m an u a lm en te, u n o a u n o, en Sta ta .
ILUSTR ACIN
3 .1.Ve n t a n a
de
in t r o d u c ci n
m a n u a l
d e
d atos

Si se u tiliza Stata para in dos, la m e


or altern ativa es m edian te la or
den edit . E sta ace aparecer u n editor de datos tipo o
a de clcu lo (com o

E sta operacin tam bin pu ede realizarse a travs de m en (Win dow


Data Editoro a
travs del teclado pu lsan do la com binacin de teclas trl(trlen la versin
.

03_Introduccion de datos(nuevo).indd 59

06/06/12 09:19

E R S E
S

E xcel, por e
em plo, o la vista de datos de SPSS
, con el qu e pu ede in trodu cir
se m odificarse la m atriz de datos (vase la ilu stracin .
. E n Data Editor,
cada fila es u n caso cada colu m n a u n a variable.
n trodu cir datos es tan
sim ple com o teclear en la casilla correspon dien te el valor qu e sea presion ar
la tecla In tro. Stata crea au tom ticam en te n om bres para las variables, qu e
aparecen en la parte de arriba de cada colu m n avar1, var2, etc. bviam en te,
pu eden cam biarse estos n om bres para darles m s sen tido. Para ello, a de
pu lsarse el n oven o icon o (Properties) de la barra de erram ien tas del editor, o
acceder a la ven tan a de propiedades a travs del m en del editor (View/Properties), o directam en te acien do clic en el recu adro situ ado a la dereca de
Nam e en el apartado de Variables de la ven tan a llam ada Properties, situ ada
por defecto en la parte in ferior dereca de la ven tan a de edicin . tra opcin
es acer los cam bios con el gestor de variables, qu e aparece m edian te el m en
Tools/Variables an a
erE n esta n u eva ven tan a, se en cu en tra a la dereca u n
cu adro de dilogo (vase la ilu stracin .en el qu e se pu ede cam biar el
n om bre de cu alqu ier variable, pon erle u n a etiqu eta, cam biar su tipo, m odifi
car el form ato de visu alizacin de los datos o a adirle n otas.
ILUSTR ACIN
3.2 .Cu a d r o s
de
d i lo o s
en
Va r ia b le P r o p er ties
d e l
e st o r
d e
a r ia le s
d e
St a t a

03_Introduccion de datos(nuevo).indd 60

06/06/12 09:19

ANLIS IS DE DATOS CON S TATA

E l n om b r e d e la var iab le p u ed e ten er a sta ca r a cter es d esd e la ver


sin d e Stata (a n ter ior m en te el n om b r e n o p od a ten er m s d e car ac
t er es
, lo q u e im p lica q u e se p u ed a n p o n er n om b r es a la s va r ia b les r a zo
n a b lem en te com p r en sib les. Sta ta p er m ite qu e se a ga r efer en cia a la s va
r iab les d e for m a a b r evia d a , siem p r e cu an d o n o aa otr a va r ia b le qu e
com ien ce con los m ism os car acter esp or e
em p lo, p u ed e lla m ar se a u n a
var ia b le n m erodei
os, p er o u tiliza r se a b itu a lm en te n m p a r a a cer le
r efer en cia , si n o existe n in gu n a otr a va r ia b le qu e em p iece p or estos tr es
car acter es. E sto es m u con ven ien te, p u esto qu e p er m ite u sar n om b r es
m u d escr ip tivos (en lu ga r d e los tp icos n om b r es in com p r en sib lessin
n ecesid a d d e teclea r d em a sia d o cu a n d o a a qu e n om b r a r los p a r a solici
tar a lg n a n lisis .
tr a m an era de cam biar el n om b re de las var iables es teclean do la in s
tru ccin ren am e en la ven tan a don de se in tr odu cen las rd en es. Sim p lem en
te se in tr odu ce la palab ra ren am e segu id a d el n om br e d e la var iable qu e se
qu ier e cam biar despu s del n u evo n om b re qu e se le desea asign ar. Por
e
em plo, si se qu ier e p on er u n n om br e m s com pr en sible a la variab le var1
gen er ada p or defecto al escrib ir el p rim er d ato en la p rim er a fila colu m n a,
p u ed e acer se m ed ian te la in str u ccin
ren am e varsexo

E s p reciso adver tir tr es asp ectos qu e aqu e cu id ar al pon er n om br e a


las var iablesen p rim er lu gar, qu e los n om b res n o pu eden em p ezar con u n
carcter qu e sea n u m r ico. e este m odo, 1pre
n ta n o es u n n om br e vlid o
para Stata. E n segu n do lu gar, aqu e ten er en cu en ta qu e n o se adm iten es
p acios en blan co en los n om br es d e las var iables, n i pu eden u sar se sign os
esp eciales com o la com a el p u n to. S p u ed e in clu irse el gu in b a
o
este p u ed e ser u tilizado com o u n su stitu tivo del espacio en b lan co. E n la
in stru ccin an ter ior au n bu en e
em plo d e ello con el n om b re n m ero
de
i
os. in alm en te, es pr eciso n otar qu e Stata es sen sib le a la difer en cia en tr e
m a scu las m in scu las. e este m od o, si se opta p or pon er el n om br e
Nm ero, si poster iorm en te se escribe n m ero, n o recon ocer el n om br e an
ter ior.
E n el cu a d r o d e d i lo go q u e se a p r ecia en la ilu str a ci n .p u ed e
ta m b in a sign a r se u n a etiq u eta a la va r ia b le p a r a id en tifica r la m e
o r. a s
etiqu eta s tien en m en o s r estr iccio n es q u e lo s n o m b r es en cu a n to a lo s
ca r a cter es qu e p u ed en in clu ir (p o r e
em p lo , p u ed en con ten er esp a cio s
.
u a n d o se soliciten ta b la s o cu a lq u ier tip o d e a n lisis d e d a tos, Sta ta

Pese a su conven ien cia, en este libro se em plearn nom bres cortos en las variables para
sim plificar la lectu ra tan to en los e
em plos de rden es qu e aparecen en el texto com o en los
prrafos qu e la explican .

03_Introduccion de datos(nuevo).indd 61

06/06/12 09:19

E R S E
S

m ostr a r la s etiq u eta s en vez d el n om b r e, p er o en la s in str u ccion es siem


p r e a b r qu e r efer ir se a la s va r ia b les p o r su d en om in a ci n n o p o r su
etiq u eta .
Pu ed e ta m b in ca m b ia r se en este cu a d r o d e d i logo el tip o d e var iab le
el for m ato d e visu aliza cin d e d atos. E ste ltim o n o a fecta n a d a a l m od o
en el qu e est n a lm a cen ad os los d atos, sin o a cm o son m ostr a d os en p an
ta lla . E l for m a to d e visu a lizacin d e d atos se u sa sob r e tod o p a r a con tr o
lar cm o se m u estr an los d ecim ales. Por e
em p lo, el for m ato d e visu a liza
cin qu e ap ar ece en la ilu str a cin .(.gsign ifica n u eve esp a cios en
con
u n to sin n in g n d ecim a l. E l sign o d e p or cen ta
e qu e a p a r ece al p r in ci
p io es la con ven cin u sa d a p or Stata p a r a d esign a r for m a tos d e visu aliza
cin d e d a tos. E l n m er o qu e vien e d esp u s esp ecifica el con
u n to d e es
p a cios qu e se va n a em p lear, el n m er o qu e se m u estr a tr a s el p u n to es
p ecifica cu n tos d ecim a les se van a exp on er. a a l fin al in d ica qu e el
for m a to es el gen er a l, lo qu e qu ier e d ecir qu e el p r op io p r ogr am a d ecid e
qu m ostr ar en fu n cin d e los d a tos. om o se vio en la seccin .., a
d os tip os m s qu e p er m iten esp ecificar el for m a to d e can tid ad es n u m r i
cas
ien t
i
o (p a r a n otacin cien tfica , e
i
o (qu e siem p r e m ostr ar
exacta m en te el n m er o d e d ecim a les esp ecifica d o, a u n qu e sean in n ecesa
r ios o d em a sia d o im p r ecisos,

. E n este e
em p lo, a l ten er el for m ato
, si
u n ca so tu vier a el va lor ,, p od r a a p ar ecer en p an ta lla com o ,
(Sta ta r ed on d ea u n d eter m in a d o n m er o d e d ecim ales en fu n cin d el lu
gar qu e d isp on ga p a r a m ostr a r la ca n tid ad en cu estin
. Per o lo qu e se
a lm a cen a r ealm en te es ,, lo qu e a ce qu e los c lcu los estad sticos
sea n m u co m s p r ecisos.
E n la parte su perior de la ven tan a del editor de Stata se en cu en tra tan to
u n m en com o u n a barr a de erram ien tas diferen tes a la de la ven tan a prin
cipal. o m s caracterstico en el prim ero es el tem Tools, en este com o en
la barra de erram ien tas destacan dos operacion es pecu liares del editorel
filtro de observacion es, m edian te el cu al se pu eden seleccion ar las filas de la
m atriz qu e cu m plan con determ in adas car actersticas, el gestor de varia
bles, descrito al fin al del captu lo an terior. E n el ltim o icon o de la barra de
erram ien tas se en cu en tra el creador de in stan tn eas (n apsots), qu e per
m ite acer grabacion es tem porales de los datos, por si u biera qu e recu perar
datos en u n determ in ado m om en to por aber com etido alg n error en la
edicin o m od ificacin de variables, o por traba
ar in distin tam en te con dis
tin tos con
u n tos de datos . n a vez estn in trodu cidos los datos, o si se a

E n el captu lo anterior se detall cm o poner las etiqu etas m edian te la in stru ccin label
variable.

Pueden acerse tan tas grabaciones parciales de datos com o se qu iera, inclu en do los
proceden tes de distin tos ficeros, n um erndose autom ticam en te a m edida qu e se producen .
E stas instan tn eas se m an ten drn en tanto qu e no se salga de Stata o se elim in en in ten cional
m en te por el u su ario. Si se qu iere preservar perm an entem en te alg n cam bio realizado, es pre
ciso realizarlo m edian te la orden save, repla
e. Para recuperar las in stantneas, basta con acer

03_Introduccion de datos(nuevo).indd 62

06/06/12 09:19

ANLIS IS DE DATOS CON S TATA

realizado algu n a m odificacin , al cerrar el editor, se gu ardan au tom tica


m en te los datos tal com o estn en ese m om en to, n o pu din dose recu perar
el estado in icial, a m en os qu e se aa eco algu n a in stan tn ea con an ter io
ridad. u n qu e los datos estn en el editor, se pu ede traba
ar con ellos. Pero
aqu e ten er en cu en ta qu e asta qu e n o se d la orden a Stata de gu ardar
los cam bios en el disco, los datos slo estarn en la m em oria in tern a del
orden ador, m ien tras Stata est en fu n cion am ien to . Para alm acen ar los datos
en disco, de m odo qu e se pu edan recu per ar en otra sesin de Stata, es preci
so dar la in stru ccin save, segu ida por el n om bre qu e se desee dar al arcivo
sa ve
n om b reficero

e este m odo, se gu ar dar n los datos en el d isco d u r o d el or den ador, en


el arcivo n om br ad o en tre com illas. a exten sin .dta es asign ada au tom
ticam en te p or Stata a su s ar civos, p ar a iden tificarlos com o tales. E l n om
b re del arcivo en la in stru ccin save slo es obligatorio expr esar lo la pr i
m er a vez qu e lo gu ardem os. n a vez qu e el arcivo a sid o creado en el
d isco du r o, si se m odifica, es d ecir, si se in tr odu cen n u evos casos, variab les,
etc., se qu iere gu ard ar los cam b ios, a de a adirse la op cin repla
e. aso
d e qu e n o se in d iqu e el n om br e d el ficero, Stata le d a el qu e ten a an tes de
ser m od ificad o. as se gu ar dan los cam b ios sobr e el arcivo a existen te
en el disco d u r o.
s a ve

r ep la ce

n asp ecto im portan te a ten er en cu en ta cu an d o se gr ab a, o cu an do se


lee, u n ficero es el d irector io p or defecto don de Stata r ealiza su s operacio
n es. Se pu ede sab er fcilm en te, m edian te la ord en
d m edian te esta tam
b in pu ede cam biar se la car peta de tr aba
o. e este m od o, si el lector qu ier e
u b icar todos su s ficeros de tr aba
o con Stata en u n d ir ector io llam ad o d

d ocu m en tos
datos Stata, al com ien zo d e la sesin d eb er a verificar qu e se

u n doble clic en la in stan tn ea deseada en tre las presen tes en el listado qu e se obtien e al apre
tar el m ism o icon o qu e sirve para generarlas. as in struccion es, caso de qu e se deseen realizar
en la con sola de Stata, son snapsot save sn apsot restore, respectivam en te.

Esta es un a de las peculiaridades de Stata frente a otros program as de estadstica, com o el


SPSS, que traba
an con los datos en el disco duro. Stata alm acen a procesa los datos en la m e
m oria central del ordenador. Slo utiliza el disco duro para recuperar los datos para guardar
los. a venta
a es que traba
a m uco m s rpido (la velocidad de procesam iento de datos en
m em oria es m uco m aor que en disco duro
. E l inconveniente, que requiere m uca m s m em o
ria en el ordenador que otros paquetes estadsticossin em bargo, oen da cuan do las capaci
dades de los ordenadores superan los tres dgitos de egas, casi cualquier base de datos puede
alm acenarse en m em oria R. Por otro lado, si esta es insu ficiente, el program a la genera din
m icam en te en el disco, pero de este m odo los procesos se ralentizan considerablem ente.

03_Introduccion de datos(nuevo).indd 63

06/06/12 09:19

E R S E
S

en cu en tr a en ese d ir ector io
, caso de n o estarlo, cam biarlo m edian te la si
gu ien te or den
cd
d

d ocu m en to
datos Stata

3.2.Le ct u r a
de
d atos
co n
St a t a
E n la m aor par te d e las ocasion es, los d atos con los qu e se tr aba
a n o son
in trodu cid os d irectam en te p or el an alista, sin o qu e pr ovien en d e in stitu tos
u or gan ism os d edicados a la r ealizacin de en cu estas. E n estos casos, los
d atos p u ed en estar en dos for m atos
. orm ato S

se tr ata de ar civos de texto en el qu e los datos es


tn alm acen ados sigu ien do algu n a pau ta, qu e n or m alm en te se p ro
p orcion a aparte en el llam ad o libr o de cdigos,
u n to con el cu estio
n ar io. Par a p od er traba
ar con estos datos, ab r qu e tran sform ar los
al for m ato de Stata, lo qu e se pu ed e acer en el pr opio pr ogr am a,
com o se ver m s ad elan te con m s deten im ien to.
. or m ato b in ario o m ixtolos datos tam b in p u ed en en con tr arse en
el form ato de alg n pr ogr am a d e estad stica, de o
a d e clcu lo o de
base d e datos, com o SPSS, E
el o

es. E n estos casos, para leer


los d atos avar ias alter n ativas n o siem p re posibles. a m s d ir ecta
es qu e sea el m ism o Stata qu ien se en car gu e de la lectu ra, solu cin
slo p osible en el caso d e ficeros E xcel, , , SS o u n a
base d e datos de aver n aliti
s. a segu n d a solu cin es qu e el p ro
pio progr am a sea cap az d e tr adu cir su p rop ia base d e datos en otr a
legible por Stata. E ste es el caso m s directo para el u su ario en el
caso de disp on er de u n a b ase de datos cargada en u n a ver sin de
SPSS su p er ior a la .. in alm en te, par a casos n o con tem plados
an ter iorm en te, ab r qu e u tilizar alg n p rogr am a esp ecializad o en
con ver sin , com o Stat
ran sfer. am b in m s adelan te se descr ib e
brevem en te cm o u tilizar este p rogr am a com plem en tario.

l in stalar Stata puede in dicarse el ficero de traba


o con los datos. n a vez in stalado
puede cam biarse el directorio por defecto en las propiedades del acceso directo del program a,
propias del sistem a operativo. Si se pulsa el botn dereco en el icon o con el qu e se com ien za
el program a en su m en contextu al se opta por propiedades, en la pestaa

eso dire
to
puede in dicarse la ru ta de com ien zo del program a en la casilla Ini
iar en .

E sta orden es cru cial, sobre todo, cu an do pasan los datos de un orden ador a otro, por
qu e n o siem pre la estru ctu ra de las carpetas de los ficeros es idn tica en u no u otro, o porque
las opciones por defecto de Stata sean diferen tes. Para qu e los e
ercicios in cluidos fu n cion en
bien , el u su ario ten dr qu e especificar en qu directorio a colocado los ficeros de traba
o.
E sto slo lo ten dr qu e acer u na vez en cada ficero, pu esto qu e se em plea el recu rso de los
m acros globales, para evitar tener que realizarlo repetidam en te.

03_Introduccion de datos(nuevo).indd 64

06/06/12 09:19

ANLIS IS DE DATOS CON S TATA

2
1 eer datos en
orm ato II
on tata
ep en d ien d o d e cm o estn alm a cen a d os los d atos en el ar civo d el qu e
se d ispon ga, abr qu e u tilizar u n a u otr a in str u ccin d e Stata. E n el cu a
d ro .pu eden verse u n as in d icacion es fu n dam en tales p ara sab er qu ord en
a de u tilizarse en fu n cin del form ato de la b ase de datos dispon ib le. H a
cu atr o p osibilidades pr in cipales, de crecien te com ple
idad versatilidad
d esde la in str u ccin in seet (relativam en te sen cilla d e u sar asta in
ile con
d iccion ar io (bastan te com p licad a p er o m u co m s poten te
.
CUAR
3.1.i
e r e n t e s
in st r u ccio n e s
a r a
la
le ct u r a
d e
d a t o s
en
St a t a
Reu ier e
Reu ier e
Reu ie r e
el
Ne ce sita
un
Sea r a cin
com illa s
en
u e
ca d a

ila
n om r e
de
d iccion a r io
d e
a r ia les
a r ia les
de
r e r esen te
la s
a r ia les

.ct
teto
un
ca so

n seet

n file
form ato libre

n fix

n file
an co fi
o

abu ladores o
com as
E spacios o
com as
ingu n a
(an co fi
o
ingu n a
(an co fi
o

o (opcion al S

o (opcion al o

E n todos los casos, u n a vez qu e se aan ledo los datos en m em oria,


p odr n gu ard arse en el d isco en el form ato pr op io d e Stata, esto es, en u n
ficer o con exten sin .dta. E s con ven ien te qu e an tes de gu ard ar d atos n u e
vos se in trodu zca la or den
om press par a in ten tar ocu p ar el m en or tam a o
p osible d e m em or ia disco para tr ab a
ar m e
or con los datos. om o a se
a in d icad o an ter ior m en te, p ara gu ar dar los datos en el d isco, basta con
acom pa ar el n om b re del ficer o a la in stru ccin save
p artir d e ese m om en to, se podr n r ecu p er ar los d atos siem pre cu an
d o se estim e con ven ien te, sim p lem en te ab rin d olos en Stata.
a

I n seete las cu atro p osibilidades, in seet es la m s sen cilla, p er o


tam b in la qu e im pon e m s restr iccion es a la base de datos qu e se
qu iere leer. ada ln ea d el ar civo de texto d eb e r ep resen tar u n caso,
los valores de los in d ividu os en las variab les d eb en estar separ ados
p or tab u lad or es o com as o cu alqu ier otr o car cter especificado en la
opcin delim iter(). Si u n ar civo cu m ple estas restr iccion es, se po
d r leer con in seet, del sigu ien te m od o
in seet

listavaru sin nom breficero

clea r
ta
com m a
d elim iter
carcter

03_Introduccion de datos(nuevo).indd 65

06/06/12 09:19

E R S E
S

a op cin
lear perm ite car gar en m em or ia u n n u evo ficer o, sin
per
u icio d e qu e est car gad o alg n otr o. E n in seet, pu ede especifi
carse tam b in los n om b res de las variab les qu e an de leer se, p ero
n o es n ecesar io. E n el caso de qu e la pr im era ln ea del ar civo re
p resen te los n om br es de las var iables separad as por tabu lad ores o
com as, in seet as lo en ten d er dar esos n om b res a las var iables.
Por e
em plo, las tr es ln eas del ar civo ficer o.dat, qu e in clu e la
m atriz de datos d e la ilu stracin ., an de ser las sigu ien tes
ILUSTR ACIN
3.3 .ic e r o
d e
d a t o s
co n

orm ato
de
o
a
de
c lcu lo
(fich er o.d a t)
sexo, ed ad
,
,

a prim era ln ea del arcivo


i
ero
dat contien e los n om bres de las
variables separados por com as. a segunda lnea es el prim er caso, u n
om bre de veintin aos, que com o pu ede com probarse tiene los valo
res de las variables separados por com as. e este m odo, la in stru ccin
in seet u sin g
ficero.d at
, clea r

leer los datos d el arcivo


i
ero
dat en Stata pon ien do a las varia
bles los n om bres qu e ap ar ecen en la p rim era ln ea.
u su ced e si n o existe u n a pr im er a ln ea con los n om b res de
las variab les, com o el ficero repr esen tad o en la ilu stracin .E n
ese caso pu eden ocu rr ir dos cosas. Si n o se esp ecifican los n om b res
de variab le en la in stru ccin , com o se izo an ter ior m en te, Stata
asign a au tom ticam en te n om b res estn d ar es a las var iablesla p ri
m er a ser v1, la segu n d a v2 as su cesivam en te. Si in ter esa, p or el
con tr ario, qu e las variab les ten gan u n n om br e m s lgico, pu ede
drseles n om b re en la m ism a in str u ccin , del sigu ien te m od o
in seet sexo edad u sin g
ficeroa.d at
, clea r

on lo cu al Stata leer las var iables del arcivo asign n d ole los
n om br es qu e se esp ecifican en la in stru ccin . ora b ien , si se expli
cita el n om b re d e las variab les, aqu e n om b rar todas las qu e aa
en el ar civo, por qu e si n o, Stata dar u n m en sa
e d e err or.

on vien e recordar la distin cin en tre ficeros bru tos de datos (con exten sin dat o tt
los ficeros de datos defin icion es grabados por Stata (con extensin dta
.

03_Introduccion de datos(nuevo).indd 66

06/06/12 09:19

ANLIS IS DE DATOS CON S TATA

b In
ile
on
orm ato libre

en este caso, los valores de las variables deben


estar separados por espacios en el ficero. Es preciso especificar los
nom bres de las variables, bien sea en el propio com ando o en un arcivo
de diccionario. El funcionam iento de los arcivos de diccionario es bas
tante com ple
o, se explicar en los ltim os prrafos de esta seccin.
Realm ente, para utilizar in
ile con arcivos de datos de form ato libre no
es necesario crear un arcivo de diccionario, se le pueden dar todas las
especificaciones en la instruccin, que es com o se explica a continuacin.
E n este caso, es n ecesar io qu e se especifiqu e el n om br e de las
var iables qu e con tien e el ar civo qu e se d esea leer. om o en in seet,
abr qu e especificar todas las var iables qu e aa en el ar civo de
datos, au n qu e en este caso si n o se realiza de m od o com pleto, n o
dar u n m en sa
e de er ror, sin o qu e sim plem en te leer m al los d atos.
Si n o avariab les tip o cad en a (strin
, qu e con tien en texto
, este
com an d o es casi tan sen cillo com o in seet. Su fr m u la gen er al es
in
ile listava r u sin
n om b reficero

sea, aque escribir la orden in


ile seguida por los nom bres de varia
bles
, tras la suborden sin
, el nom bre del arcivo donde estn los datos.
E n el caso d e qu e aa variab les d e tipo cad en a, com o por e
em
plo si se a ad e al ficer o an terior el n om br e d e las p er son as, el ar
civo de datos de or igen d eb er ten er los valores alfab ticos en tr e
com illados obligatoriam en te si in clu en espacios. E sto es lgico
por qu e Stata n ecesita diferen ciar el espacio del valor del espacio
qu e sep ara los distin tos valores d e la var iable. Por e
em p lo, en el
arcivo ficer ob.d at, existe u n a ter cer a variab le.
ILUSTR ACIN
3..ic e r o
d e
d a t o s
co n

orm ato

i
o

a r ia le
ca d e n a
(fich er ob .d a t)
1 21 J uan
2 20 " Mar a J os "

om o pu ede ver se, los valores estn sep arados p or espacios. Sta
ta, al leer los d atos con in
ile, p on d r el pr im er valor en la pr im era
var iable, el qu e est tras el pr im er espacio en la segu n da, etc. E n
cam bio, la ln ea d e la m u
er de a os tien e u n esp acio en tre a
ra
os, p or lo qu e tod o el n om br e d eb e estar en trecom illado.
s Stata sab e qu e tod o lo qu e est en tr e las com illas, in depen dien
tem en te de los espacios, va en la tercera var iable.
Por tanto, si en el arcivo de datos avariables alfanum ricas, la
orden cam bia ligeram en te. En este caso, abr qu e especificar antes

E ste com an do tam bin se puede u tilizar si los valores estn separados por com as, pero
en ese caso es m s sen cillo u sar in seet en la m aor parte de los casos.

03_Introduccion de datos(nuevo).indd 67

06/06/12 09:19

E R S E
S

del nom bre de la variable qu e la variable es strinel nm ero de ca


racteres m xim o (siguiendo la frm ula vista en la seccin ..
. En el
e
em plo actual, para leer el arcivo
i
erob
dat, a de aparecer una
instru ccin sim ilar a la siguiente
in file sexo eda d strn om bre u sin g
ficerob.d at
, clea r

Pu ede verse cm o la ter cer a variab le (n om bre) va pr ecedid a de


str1, lo qu e qu iere decir qu e es u n a variab le tipo alfan u m r ico de
tam a o (el n m ero m xim o de caracteres qu e con tien e es
.
Para las variab les n u m ricas n o ace falta esp ecificar el tip o, pu es
Stata lo asign a au tom ticam en te.
c In
iesta instru ccin est especficam ente diseada para leer arcivos
de datos con form ato de an co fi
o. E sto pu ede im plicar qu e n o aa
nin gun a separacin en tre los valores de las variables. Para asignar los
valores a las variables correctam ente, es preciso saber el n m ero exac
to de colum n as qu e ocu pa cada variable, e in cluirlo en la orden para
qu e Stata pu eda leerlas correctam en te. E n el e
em plo an terior de dos
person as, el arcivo de datos puede presen tarse del m odo sigu ien te
ILUSTR ACIN
3..ice r o
d e
d a t o s
con

orm ato

i
o

una
so la
ln e a
o r
ca so
(fich er o c.d a t)
121J uan
220Mar a J os

Se obser va cm o n o existe n in g n tipo d e sep aracin en tre los


valores. os d atos estn alm acen ados por colu m n as (o caracteres

la p rim er a var iable ocu pa la p rim er a colu m n a, la segu n d a, las dos


sigu ien tes, la tercera, las ltim as. E n la ord en de lectu r a, aqu e
in dicar a Stata pr ecisam en te esotodo lo qu e est en la prim era co
lu m n a aqu e asign ar lo a la p rim er a var iable, lo qu e est en las
sigu ien tes en la segu n d a, el resto a u n a var iable cad en a. a form a
con cr eta p ar a este e
em p lo del com an d o sera
in fix sexo eda d
str n om bre
u sin g
ficeroc.d at
, clear

om o en la orden in
ile de form ato libre, tam bin aqu e especi
ficar el form ato de las variables de texto, au nqu e aqu no aga falta
poner su tam a o porqu e est im plcito en el anco de la variable. E n
este caso, se a pu esto an tes de la variable n om bre la palabra str, para
qu e Stata la iden tifique correctam en te com o variable de texto. E sto no
es n ecesario para las variables nu m ricas. ras el nom bre de cada va
riable, a de especificarse su an co, indicando de qu colu m n a a qu

03_Introduccion de datos(nuevo).indd 68

06/06/12 09:19

ANLIS IS DE DATOS CON S TATA

colum n a van los datos qu e le correspon den . E n este caso, los n om bres
de los su
etos estn alm acen ados desde la colu m na a la colu m na .
anto en in
icom o en in
ile con anco fi
o pueden leerse m enos va
riables que las que realm ente aen el arcivo si as se desea. Sim ple
m ente, saltando unas determ inadas colum nas del arcivo en la secuencia
de la instruccin, esas colum nas no sern ledas ni incluidas en ninguna
variable. Por e
em plo, si en el ltim o e
em plo que se a citado se quitara
edad 2-, el arcivo se leera perfectam ente, pero sin esta variable.
ILUSTR ACIN
3 ..ice r o
de
d a t o s
co n

or m a to

i
o

m s
de
una

ila
o r
ca so
(fich er od .d a t)
121
J uan
220
Mar a Jos

E sta in stru ccin tam bin es til, si cada caso ocu p a m s d e u n a


ln ea. E n el su pu esto d e qu e los d atos de los d os su
etos estu viesen
alm acen ados en form ato de an co fi
o, per o cad a per son a n o ocu pa
r a u n a sola ln ea, sin o d os com o aparece en la ilu str acin ., sera
p reciso escribir la in str u ccin in
icom o sigu e
in fix lin es sexo ed ad
str n om bre
u sin g
ficerod.d at
, clear

r as el com an d o in
i, se especifica el n m er o de ln eas (lin es
lu ego se pr ecede cad a n u eva ln ea por su n m er o d os pu n tos (

.
Realm en te, par a ar civos com plicados con m u cas m s var ia
b les es m s con ven ien te u tilizar u n d iccion ar io en lu gar d e dar r de
n es de lectu ra en el prop io com an do. In
ip u ed e u tilizarse con u n
d iccion ar io, p er o su verd ad er a u tilidad es com o u n m odo sen cillo d e
leer ar civos con for m ato de an co fi
o. Para leer arcivos verd ad e
r am en te com p licad os, el com an do m s poten te es in
ile con u n d ic
cion ario, cu o for m ato se explica a con tin u acin .
d In
ile de an
o
i
o (
on di

ion ario)para arcivos d e d atos com p li


cad os con m u cas var iables, lo m s con ven ien te es u tilizar esta
in str u ccin . l u tilizarla de esta m an er a, todas las esp ecificacion es
rd en es p ara qu e Stata lea el ar civo de datos estn en u n arcivo
aparte, llam ado d iccion ar io. e este m odo, la in stru ccin en s qu e
dar a exp resada de la sigu ien te sim p le m an er a
in
ile
u sin
ficerodiccion ario

asta con in dicar el n om br e del arcivo de diccion ario qu e con


ten d r la s r d en es d e lectu r a d e los d atos. E l ar civo d e d iccion a
rio d eb er llevar la exten sin .d ct, segu ir las sigu ien tes pau tas

03_Introduccion de datos(nuevo).indd 69

06/06/12 09:19

E R S E
S

om ien za con la or den in


ile di
tion arsin n om br eficer o
(esto es, el a r civo d on d e est n los d atos a leer
, segu id o p or u n
cor cete (
qu e m arca el com ien zo de las rd en es de lectu r a, qu e
se cerr ar (
cu an d o fin alicen las especificacion es.
E n tr e los cor cetes estar n las in str u ccion es par a leer el ar civo.
on vien e u tilizar u n a ln ea d e esp ecificacion es par a cada variab le,
del sigu ien te m od o
. Pr im er o, se exp on e la p osicin d e los d atos d e la var iab le
en el ar civo.
. Segu n d o, el tip o de datos (op cion al
.
. ercer o, el n om b re d e la var iable.
. u ar to, el for m ato de visu alizacin (op cion al
.
. Por ltim o, se pu ede escribir la etiqu eta de la variable en tre
com illas.
ase u n p ar d e e
em p los para en ten d er lo m e
or. E n pr im er lu
gar, p ara leer el ficer o de d atos r efle
ado en la ilu str acin ., el
con ten ido del ficer o d iccion ar io deber a ser com o sigu e
ILUSTR ACIN
3..Co n t e n id o
d e
un

ice r o
d iccio n a r io
d e
la
in st r u cci n
in file (d iccion a r io .d ct)

infile dictionary using "ficherod.dat" {


_lines(2)
_column(1) byte sexo %1f "Sexo"
_column(2) byte edad %2f "Edad"
_line(2)
_column(1) str10 nombre %10s "Nombre de pila"
}
E s p reciso n otar qu e ad em s de las r den es corr esp on d ien tes a
las variab les, com p u estas por p osicin (

olm n (

, tipo (b
te, str
,
n om br e (seo, edad n om bre
, for m ato (f o s
, etiqu eta (eo,
Edad Nom bre de pila
, ados in stru ccion es im prescin dibles para
la lectu ra d e ficer os con m s d e u n a ln ea p or casoon lin es(
,
se ord en a la lectu r a de ln eas p or in divid u o, en este caso. con
lin e(se in d ica qu e las colu m n as poster iores corr espon den o estn
situ ad as en la ln ea in d icad a en el n m ero .
n a vez con stru id o grabad o el ficero d iccion ar io, es im pr es
cin dible u tilizarlo m edian te la or den in
ile sin segu ida d el n om bre
qu e se le a asign ado al ficer o, di

ion ario
d
t, en este caso
in file u sin g
d iccion ario
, clear

03_Introduccion de datos(nuevo).indd 70

06/06/12 09:19

ANLIS IS DE DATOS CON S TATA

E n el segu n do e
em p lo se tr ata de leer en Stata las d os pr im eras
p regu n tas del cu estion ario d el
S , la en cu esta postelectoral
d e m ar zo de .
E l arcivo de datos se en cu en tra en form ato de an co fi
o, en el
cu estion ario se especifican los an cos las posicion es de cada varia
ble en el arcivo. Se dispon e, por con sigu ien te, de u n a prim era pre
gu n ta con u n a sola variable, qu e ocu pa la posicin de la prim era
fila de u n a segu n da pregu n ta con cu atro variables, qu e ocu pan res
pectivam en te u n a posicin desde la asta la . E l m ism o cu estio
n ario qu e proporcion a el
S da in form acin acerca de cm o fu eron
ecas las pregu n tas, cm o estn codificados los valores de las varia
bles tam bin in dica en qu posicin fu e grabada cada variable, a
travs de u n n m ero en tr e parn tesis qu e represen ta en qu colu m n a
de la ln ea del arcivo de d atos est la variable. s, se sabe qu e la
pregu n ta est en la colu m n a , las cu atro sigu ien tes variables de
la segu n da pregu n ta en las , , . on esa in form acin , pu e
den leerse los datos en Stata con la orden in
ile u n diccion ario.
ILUSTR ACIN
3..o s
r im e r a s
r e u n t a s
d e l
e st u d io
d e l
CIS
23

2
P. 1 Par a empez ar , podr a Ud. dec i r me s i r ec uer da, c uando er a ni o o adol es c ent e,
c on qu f r ec uenc i a s ol a habl ar se de pol t i c a en su c as a: c on mucha f r ecuenc i a, de
v ez en c uando, pocas vec es o pr c t i cament e nunca?
-

Con muc ha f r ec uenc i a


De v ez en c uando . . . .
Poc as v eces . . . . . . . . .
Pr c t i c ament e nunc a .
No r ec uer da . . . . . . . . .
N. C. . . . . . . . . . . . . . . . .

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

1
2
3
4
8
9

( 28)

P. 2 I nd queme, por f av or , has t a qu punt o es t Ud. muy de ac uer do, de ac uer do,
en des ac uer do o muy en des ac uer do c on cada una de l as s i gui ent es f r as es ?
Muy
de ac .

De
ac .

- Por l o gener al , l a pol t i c a es


t an c ompl i cada que l a gent e
c omo y o no puede ent ender
l o que pas a . . . . . . . .

( 29)

- A t r av s del v ot o, l a gent e
c omo y o puede i nf l ui r en l a
pol t i ca . . . . . . . . . . .

( 30)

- Los pol t i c os no s e pr eoc upan mucho de l o que pi ensa


l a gent e c omo y o . . .

( 31)

- Est qui en es t en el poder ,


s i empr e busc a s us i nt er eses
per sonal es . . . . . . . . .

( 32)

En
desac .

Muy en
des ac . NS

NC

as caractersticas de este estu dio se en cuentran en ttp

.cis.es.

03_Introduccion de datos(nuevo).indd 71

06/06/12 09:19

E R S E
S

H a de crearse u n ar civo al qu e pu ede den om in ar se cis.dct


(dct es la exten sin de los ar civos de d iccion ar io
, qu e con ten ga lo
sigu ien te
ILUSTR ACIN
3..Co n t e n id o
d e
un

ice r o
d iccio n a r io
d e
la
in st r u cci n
in file (cis23 84 .d ct)

Pu ede apreciarse qu e el contenido de este ficero com ien za con la


in struccin in
ile di
tion ar
, segu ida por sinel nom bre del arcivo
donde se en cu en tran los datos qu e aque leer. ras el corcete, se
an especificado varias ln eas en las qu e se den om in an las variables
que aqu e leer (polin
, pol1, pol2, polpol) cm o. Prim ero se
coloca

olm n la colu m na donde se localizan los valores de cada


variable en tre parn tesis. E n el caso de la prim era variable, qu e se
denom ina arbitrariam ente polin
, se en cu en tran en la colu m n a del
arcivo de datos. uego se indica el tipo de datosen este caso, dado
que los valores slo van de a , puede em plearse el tipo b
te, qu e es
el qu e m en os m em oria ocupa. espu s, el n om bre de la variable, por
ltim o, se expresa el form ato de visu alizacin de los datos, qu e ace
que Stata presen te los datos a gusto del usu ario. E n el presen te e
em
plo, se a pu esto el tipo f, qu e qu iere decir tipo fi
o con u n a cifra
sin decim ales (vase la seccin ..
. ras todo lo an terior pu ede po
n erse, en trecom illadas, etiqu etas para las variables que as se desee .
on las p alabr as claves qu e se acaban d e exp licar, se pu eden leer
la gr an m aora de los ar civos d e datos qu e abitu alm en te se u tili
zan . Pero p u ed e ab er casos m s especficos o arcivos d e d atos
m s com p le
os. H am u cas otras posib ilid ad es en el com an d o in
ile con diccion ario qu e n o se explican en este m an u al p or b reved ad.
aso d e qu e sea n ecesar io, las dem s posib ilidades de este com an do
se pu eden con su ltar en los m an u ales de r eferen cia de Stata o, de
m odo m s rp ido, u tilizan do la or den elp in
ile2 .

E n el su pu esto de qu e se dispu siera de m s de u n a ln ea por caso, abra qu e especificar


cu n do em pieza u n a n ueva ln ea la palabra
n ewlin e.

Se u tiliza elp in
ile1 para la orden de lectu ra con datos con form ato libre o con varia
bles separadas por com as. Se en cu en tra un a detallada explicacin con n u m erosos e
em plos en
el m an u al de gestin de datos en las entradas in
ile, in
ie in seet (Stata d

03_Introduccion de datos(nuevo).indd 72

06/06/12 09:19

ANLIS IS DE DATOS CON S TATA

o aqu e olvid ar qu e los d iccion ar ios n o se in tr odu cen en las


ven tan as de r den es d e Stata, n i tan siqu ier a en u n ficero de in s
tr u ccion es (do)eben ir en u n ficero in depen dien te deben ser
ledos con la ord en in
ile sin
. e este m odo, se p u ed e ver el resu l
tad o de la lectu ra d e los diez p rim er os casos d el e
em p lo m ed ian te
las d os ln eas sigu ien tes
in file u sin g
cis
list in
, clean

t
ileStata tam b in in cor por a la ord en ot
ile para el caso de qu e
se d esee acer lo con tr ar io a lo qu e se a explican d o an teriorm en te
gu ard ar d atos qu e se en cu en tr en abier tos en Stata en form ato S

,
d e tal m od o qu e pu edan lu ego ser ledos p or cu alqu ier p rogr am a d e
estadstica o b ase de datos. on la sigu ien te in str u ccin
ou t
ile
u sin
n om b reficero

Stata gu ar dar los d atos sep arados p or espacios en u n ar civo


con exten sin r a. E s con ven ien te u tilizar la opcin di
tion arpar a
qu e Stata gu ar de con los d atos u n d iccion ar io qu e lu ego aga m s
fcil la lectu r a d e los datos.
ou t
ile
u sin n om b reficero
, d ict io n a r

am b in p u ed e r esu ltar til la opcin


om m a, qu e separ a las
variab les con com as en lu gar d e con esp acios, especialm en te en de
ter m in ados pr ogram as qu e r equ ier an d e las var iables sep ar adas por
este delim itad or.
ou t
ile
u sin
n om b reficero

co m m a

2
2 e
tra es
ritra de datos en
orm ato E
el
esd e su s ltim as version es, Stata es capaz de leer tradu cir ficer os qu e
n o estn escr itos en form ato S

. esde la , in corp or a la posibilid ad de


in cor porar al form ato de ficer os de Stata los datos gu ar dados con for m ato
d e m atriz en E xcel.

Se en tiende por form ato de m atriz aqu el en el qu e los casos son colocados en las filas
las variables, con sus correspon dien tes nom bres en la prim era fila, en las colu m n as.

03_Introduccion de datos(nuevo).indd 73

06/06/12 09:19

E R S E
S

Para llevar a cabo este com etido basta con escribir la siguien te instruccin
im ort ecelnom breficero
, seet
nom breo
a

ir stro
cellra n e

rango

E sta operacin p u ed e r ealizarse tam bin a tr avs de m en . E n ese caso,


se debe m ar car ile/Im port/E
el spreadseet. con tin u acin , ap arecer u n
cu ad ro de d ilogo d on d e se le deber in dicar el n om b re d el ficer o, a travs
d el b otn rowse, el n om b re d e la o
a en el m en d esp egable Worseet
,
si pr oced e, in d icar le el ran go d e celdas (ell ran
e), si la p rim er a fila con tie
n e los n om br es d e las var iables, a qu e si n o estu vier an en la o
a d e clcu
lo, Stata se los gen er ar a au tom ticam en te.
E n la ilu str acin .apar ece el cu adr o de d ilogo corr espon dien te a la
im portacin d e ficeros E xcel, en el m om en to en el qu e se despliega u n
cu ad ro secu n dario para in ser tar el r an go d e la o
a qu e qu ier e ser tr aslada
d o al for m ato d e Stata. Pu ed e obser var se qu e, en la p ar te in ferior d el cu adr o
p rin cip al, aparece u n a vista pr evia de los resu ltados a fin d e cer ciorarse de
qu e los datos se im por tan cor rectam en te.
ILUSTR ACIN
3.1 .Cu a d r o s
d e
d i lo o
d e
la
im o r t a c i n
de

ice r o s
ce l
a
St a t a

2
i
eros pro
eden tes de P
Stata n o es ca p az d e leer ficer os b in ar ios d e SPSS. Sin em b ar go, SPSS
p u ed e leer sin d ificu lta d los ficer os d e Stata , siem p r e cu an d o se a an
gu a r d ad o en for m ato an tigu o (saveold), p u es los ficer os d e la s ltim a s
ver sion es tien en u n for m ato d istin to n o in cor p or a d o en las r u tin a s d e lec

03_Introduccion de datos(nuevo).indd 74

06/06/12 09:19

ANLIS IS DE DATOS CON S TATA

tu r a . Pa r a ello, al ab r ir d a tos m ed ian te el m en SPSS (r civo


b r ir
atos
, en la p esta a en el m en exten sib le d el tip o d e a r civos d el cor r es
p on d ien te cu a d r o d e d i logo, a p a r ece la op cin Stata(.d ta
, qu e u n a vez
m a r ca d a n os m ostr ar los ficer os con esa exten sin en el d ir ector io p or
d efecto p r esen te .
el m ism o m odo, SPSS es cap az d e trad u cir su s p rop ios datos en u n
ficer o legib le por Stata. E llo qu ier e decir qu e todos aqu ellos qu e tu vier an
su s datos pr eparad os en aqu el pr ogr am a, los podr n leer cm odam en te en
Stata con servan d o las etiqu etas de variab les valores, as com o su s for m a
tos. Par a acom eter esa tr an sform acin , se pu ede r ealizar tan to con m en
(rcivo
u ardar d atos com o
, tr as lo cu al aqu e cam biar el tipo d e ar ci
vo con su cor resp on d ien te m en exten sible, com o se in dica en la ilu stracin
.. ltern ativam en te, se pu ede r ealizar con cdigo, em p lean do la ord en d e
SPSS save tran slate ot
ile n om b re de ficero
t
pestata
ILUSTR ACIN
3 .11 .Cu a d r o
d e
d i lo o
a r a
e o r t a r
a
St a t a
d a t o s
d e
SSS

esde la versin de Stata existen dos tipos de version es que gen eran ficeros ligera
m ente distin tos. os de la versin especial (SE tien en un a m aor capacidad en el alm acen a
m iento de variables. sim ism o, n o acom patibilidad en tre los ficeros de la versin , ni de
la versin de Stata, con los program as de version es an teriores. Para solven tar este ltim o
problem a, desde u n a versin reciente pu eden grabarse los ficeros para que puedan ser ledos
en version es anteriores m edian te la orden saveold n om breficero.

E sta operacin tam bin pu ede acerse m edian te sintaxis, em plean do la instru ccin de
SPSS
et stata
ile nom breficero.

03_Introduccion de datos(nuevo).indd 75

06/06/12 09:19

E R S E
S

2
e
tra de datos en
orm ato bin ariotat/Tran s
er
Si u n a deter m in ada b ase d e datos est en u n for m ato n ativo d e otro p rogra
m a estadstico, o ap licacin , su in for m acin n o p od r ser leda a n o ser qu e
se em plee u n a u tilidad esp ecializada en con versin d e datos estad sticos,
com o es Stat
r an sfer, d el qu e se explicar a con tin u acin m u som er am en
te su u so. lter n ativam en te, si se d isp on e d e este pr ogr am a, pu eden gu ar
d ar se los d atos en for m ato S

, siem pr e qu e exista algu n a in stru ccin d e


expor tacin , lu ego leerlos con Stata. Por e
em plo, si desea con vertir d atos
d e SPSS a Stata n o se d isp on e del Stat
ran sfer, caso d e dispon er de u n a
ver sin d e SPSS an ter ior a la , se pu eden grabar los datos com o arcivo
S

, en for m a to fi
o, p ar a p od er r ecu p er ar los d esp u s en Sta ta con in seet, in
io in
ile, seg n se a explicado en el apar tado an ter ior. for tu n a
d am en te, desd e la ver sin del SPSS, a es p osible gu ard ar los ficer os
con la estru ctu r a d e Stata.
Per o si n o se disp on e del p rogram a m en cion ado
, en cam bio, se cu en ta
con u n ficer o gr abado en form ato sav, ab r qu e u tilizar Stat
r an sfer,
p ar a tr an sform ar lo en dta p oderlo u tilizar en Stata. asta u n e
em p lo para
obten er u n a id ea de cm o se u tiliza este pr ogram a.
ILUSTR ACIN
3.1 2.Cu a d r o
d e
d i lo o
r in cia l
de
St a t
Tr a n s
er

03_Introduccion de datos(nuevo).indd 76

06/06/12 09:19

ANLIS IS DE DATOS CON S TATA

Supngase que se tiene un arcivo, guardado en form ato SPSS, tal com o lo
ofrece el entro de
nvestigaciones Sociolgicas, que contiene los datos de la
encuesta postelectoral de m arzo de (cis.sav
, se desea pasar al for
m ato de Stata para traba
ar con este otro program a. En la ilustracin .pue
de observarse el aspecto de la ventana principal de Stat
ransfer. Esta se divide
en dos partes, la de arriba para el arcivo de origen (el que a de convertirse a
Statala de aba
o para el arcivo de destino (el nom bre que se quiera dar al
nuevo arcivo convertido
. Se elige, en prim er lugar, el arcivo de datos de ori
gen, el que se desea convertir. Stat
ransfer es capaz de determ inar autom tica
m ente su tipo, no ace falta ponrselo. E n este caso, el arcivo de origen es
cis.sav, que se a seleccionado a travs del cuadro de dilogo ele

ionar
arcivo que aparece al pulsar rowse. na vez elegido el arcivo de origen, a
que seleccionar el tipo de arcivo en el que quiere convertirse, donde pone
tpt ile T
pe. En este caso, se a elegido Stata version . utom ticam en
te Stat
ransfer pone al arcivo de destino el m ism o nom bre que al de origen,
aunque con diferente extensinla extensin del form ato que lleve, en este caso
dta, la extensin de los arcivos de Stata. na vez especificados el ficero de
entrada el tipo de ficero de salida, se puede pulsar el botn Trans
er que est
en la esquina izquierda inferior para que Stat
ransfer cree un nuevo arcivo
con toda la inform acin del arcivo de origen pero en el form ato propio de Sta
ta, de m odo que
a pueda traba
arse con el nuevo ficero sin problem as.
ILUSTR ACIN
3 .1 3.Cu a d r o
de
d i lo o
de
a r ia le s
en
St a t
Tr a n s
er

03_Introduccion de datos(nuevo).indd 77

06/06/12 09:19

E R S E
S

E ste pr ogram a de con ver sin tien e m u cas d iferen tes opcion es con las
qu e pu ede con trolarse cm o se con vierten los arcivos de u n tip o a otro.
as opcion es m s com u n es son las qu e se en cu en tran en la p esta a Variables d e la ven tan a d e Stat
r an sfer (vase la ilu stracin .
. E n la p ar te d e
la izqu ierd a, pu eden seleccion arse las var iables qu e se qu ieran tradu cir las
qu e n o (por om isin , estn tod as seleccion ad asespecificar su s tip os en
Tar
et T
pe. E n la p ar te dereca, ar riba, se en cu en tran las opcion es de i

Variable ele
tor, qu e perm ite seleccion ar (m an ten er o elim in ar var iables en
fu n cin de deter m in adas con dicion es . Pero lo qu e es esp ecialm en te til es
el b otn qu e est
u sto d eb a
o, en el recu ad ro de Tar
et T
pe ptim i
er. Stat
r an sfer, en pr in cipio, asign a a casi tod as las var iables el tipo float, esto
ocu pa m u ca m em or ia. Si se seleccion a el botn ptim i
e, se an alizan los
d atos del ar civo d e or igen se d eter m in a p ar a cad a variab le el tip o m s
p equ e o p osible . E sto es m u im por tan te p u es p er m ite crear arcivos p e
qu e os con m s posib ilid ad de qu e qu epan en m em oria
, en con secu en cia,
con los qu e Stata tr ab a
a con m u ca m s r ap id ez.

3.3.u si n
de

ice r o s
n a vez qu e se disp on e de u n ficer o, se le pu ede a adir in form acin sim i
lar de otros ficeros, tan to de casos, operacin a la qu e se den om in ar n in ,
com o de variables en este su p u esto se ablar d e
om bin a
in .

1 n in de
i
eros
E n la pr im era d e las opcion es, es pr eciso qu e las var iables (todas o par te
sean igu alesm ien tras qu e en la segu n da, es n ecesar io qu e los casos (todos
o u n su b con
u n tosean id n ticos.
u n qu e esto par ezca com ple
o, con u n p ar d e e
em p los, se com p ren der
con facilid ad . Par a ello, se tien e, por u n lad o, la m atr iz d e datos qu e figu ra
en la ilu str acin .gr ab ada en u n ficer o de datos Stata con el n om br e de
ficer o.dta. Por el otro, se d ispon e de otr a m atriz alm acen ada en ficer o
.
d ta, qu e con tien e dos casos m su n om b re d e a os u n a m u
er de .
Par a p on er u n o a con tin u acin de otro son p recisas d os oper acion es. a
prim era es cargar en m em oria el pr im er ficerola segu n da, a adir los casos
n ecesarios, en tan to qu e am b os ficer os ten gan algu n a variab le en com n
seo edad, en este e
em p lo.

qu pu eden em plearse los caracteres com odines (


con el m ism o significado qu e
se u tilizan en el Sistem a perativo. Por e
em plo P
, in clu ira variables com o Pa, Po
P, Ptam bin con siderara en la in clu sin o exclusin , adem s de las an teriores, varia
bles com o PPab.

E ste botn realiza exactam en te la m ism a fu n cin que el com an do


om press de Stata.

03_Introduccion de datos(nuevo).indd 78

06/06/12 09:19

ANLIS IS DE DATOS CON S TATA

a or d en qu e p er m ite r ea liza r la p r im er a o p er a ci n es sela q u e es


n ecesa r ia p a r a a a d ir lo s ca so s es a ppen d, q u e u tiliza la sigu ien te sin
ta xis
a e n d
u sin
n om b reficero
, n o la e l
e e (listava ria bles

E n con secu en cia, para acop lar, espacialm en te ab lan d o, u n ficero de


b a
o del otro, abr qu e escr ibir estas in str u ccion es
u se ficero, clea r
a pp en d u sin g ficero
list, clean

e este m odo, el listado d e los cu atro casos qu e pr oced en d e la u n in de


am b os ficer os es el sigu ien te
ILUSTR ACIN
3.1 .List a d o
d e
ca s o s
d e
lo s

ice r o s
u n id o s
1.
2.
3.
4.

s exo
1
2
1
2

edad
21
20
20
19

2 om bin a
in de
i
eros
Si, en lu gar d e a adir casos, se desea ad
u n tar variab les, se ablar d e com
b in acin d e ficeros
, en lu gar de em p lear la in stru ccin appen d, ten dr
qu e u tilizarse m er
e, cu a sin taxis m s elem en tal es la sigu ien te
m e r e 1
1

n u sin n om breficero
, opcion es

Par a e
em plificar esta op er acin , se u tilizar com o b ase el ficer o an te
r ior de cu atr o casos dos var iables. este se le com b in ar el ar civo den o
m in ado ficerox.d ta, qu e con tien e en el m ism o or den los m ism os cu atro
casos d el otro ar civo, con u n a var iable de texto d en om in ada n om b re .

Para qu e el ficero en m em oria se fu sion e con el gu arda do en u n ficero, este ltim o


a de ten er el m ism o orden n m ero de casos. E n el captulo se explica con detalle cm o
pu eden ordenarse los ficeros, m edian te la instru ccin sort. e todos m odos, la in stru ccin
m er
e, desde la versin , posee otras m u cas posibilidades, com o la de em plear u n a variable
para la correcta com bin acin de los casos la de fu sion ar u n registro con otros m ltiples o
viceversa. Se su giere a qu ien es n ecesiten un a u otra fu n cionalidad qu e consu lten la au da dis
pon ible en el program a.

03_Introduccion de datos(nuevo).indd 79

06/06/12 09:19

E R S E
S

Par a con segu ir esta fu sin , es p reciso em p lear la or den m er


e de la qu e con
vien e ver su resu ltado a ad in dole la in stru ccin list.
m erge
n u sin g
ficerox
list, clean

E n el listado pu ed e ap reciar se u n a n u eva var iable (


m er
e
, en este e
em
p lo con tod os los casos con u n valor de , por qu e con tien en valores p roce
d en tes tan to del ficer o b ase com o d el com b in ado. Si el p rim ero u biera
ten id o m s casos qu e el segu n d o, los ltim os abr an ten ido en esta variab le
el valor d e 1 (sin d atos com bin ad os
m ien tr as qu e si es el segu n d o el m s
com pleto, la n u eva variab le ad op tara el valor d e 2 (sin datos en el ficero
d e b aseen los casos ad icion ales qu e slo tien en valores en las variab les
a adid as.
ILUSTR ACIN
3 .1 .List a d o
de
ca so s
de
lo s

ice r o s
c o m in a d o s
1.
2.
3.
4.

s ex o
1
2
1
2

edad
21
20
20
19

nombr e
J uan
Mar a J os
Al f r edo
I s abel

_mer ge
3
3
3
3

E xiste otra posibilidad de fu sin de ficeros, de n atu raleza sim ilar a la


com bin acin de ficeros. Se trata de
u n tar los dos arcivos n o por el orden
en el qu e estn situ ados los casos, sin o por la coin ciden cia de u n a o u n con

u n to de variables. a in stru ccin correspon dien te es


oin bcon la sigu ien te
sin taxis.

oin
varlistu sin
nom breficero

, u n m a tced
n on e

ot

m a ste r

u sin
m e r e (n om b revaru d a t e

E l e
em p lo d e esta in str u ccin u sa co m o b a se el ficer o lista d o en la
ilu str a cin ., a l qu e se le com b in a en fu n ci n d e d os va r ia b les la si
gu ien te m a tr iz d e d a tos gu a r d a d a en el a r civo ficer ou .d ta , d on d e a d e
m s d el n o m b r e ( n ico
, se en cu en tr a u n a ter cer a va r ia b le d en o m in a d a
r egio n . a m a tr iz d e d a tos d e este n u evo ficer o p r esen ta esta d isp o si
ci n
Para u n correcto fu n cionam ien to de la com bin acin de ficeros el con
u nto de valores
de las variables que siguen al
oinba de ser n ico con el fin de que se produ zca u n a com bi
n acin de caso por caso. E l caso m s frecu en te para ello es u n a variable de iden tificacin pero
tam bin puede utilizarse u n par de variables com o en el e
em plo, o en el caso de qu e dispon ga
de dos bases de datos tem porales por pases. E n este ltim o supu esto, la u tilizacin de las va
riables pais a o pu eden gen erar iden tificaciones n icas qu e perm itan un correcto aparea
m ien to de los datos de u n o otro ficero.

03_Introduccion de datos(nuevo).indd 80

06/06/12 09:19

ANLIS IS DE DATOS CON S TATA

ILUSTR ACIN
3 .1 .a t r i
de
d a t o s
d e l
a r cio
fich er o u .d ta
nombr e
J uan
Al f r edo
Mar a J os
I sabel
Car men
J os
Ter es a
Pedr o

r egi on
Sur
Nor t e
Sur
Nor t e
Sur
Nor t e
Nor t e
Sur

n a m an era de com bin ar adecu adam en te am bos ficer os es la sigu ien te

oin b sexo ed ad u sin g ficerou , m erge(com b in a


list, clean

Se le a a ad ido la op cin m er
e, par a qu e n o se su p er pon ga la var ia
b le m er
e gen er ada en el an terior e
em p lo. e este m od o, tras u n a ord en d e
listad o se obtien e el r esu ltad o p lasm ad o en la ilu str acin ..
ILUSTR ACIN
3 .1.List a d o
de
c a so s
de
la
co n
u n ci n
de
d o s

ice r o s

o c i n
o r
de
e ct o
1.
2.
3.
4.

sex o
Hombr e
Muj er
Hombr e
Muj er

edad
21
20
20
19

nombr e
J uan
Mar a J os
Al f r edo
I sabel

_mer ge
3
3
3
3

bot
bot
bot
bot

h
h
h
h

i
i
i
i

n
n
n
n

mas t
mas t
mas t
mas t

er
er
er
er

and
and
and
and

us i
us i
us i
us i

c ombi
ng dat
ng dat
ng dat
ng dat

na
a
a
a
a

r egi on
Sur
Sur
Nor t e
Nor t e

E s p r eciso n ota r q u e slo a p a r ecen cu a tr o ca sos, p u es cu a n d o n o se


exp licita la op cin n m a t
ed, Sta ta a d o p ta su m od a lid a d n on ep or lo
q u e el ficer o s lo co n tien e los in d ivid u os qu e est n p r esen tes en lo s d o s
ficer os co n
u n ta d os. a m b in a qu e a d ver tir qu e a d em s d e la va r ia
b le m er
e, a p a r ece la d en o m in a d a om bin a , etiqu eta d a p o r el p r o gr a m a
in d ica n d o qu e estos cu a tr o ca sos se en cu en tr a n ta n to en el ficer o en
u so (m a sterco m o en el con
u n t a d o (sin da ta
. in a lm en te, es f cil
com p r o b a r qu e los ca sos sin a b er le in d ica d o n in gu n a or d en p a r a
ello a p a r ecen or d en a d o s p o r la s d o s va r ia b les q u e se em p lea n p a r a la
con
u n cin .
E l r esu ltad o sera diferen te in clu ir a los oco casos del ficero con
un
tad o si se op tara por la opcin la m odalidad boto sin d e la op cin
n m at
ed, tal com o se r ecoge en la p rxim a in stru ccin .

oin b sexo ed ad u sin g ficerou , m erge(com b in au n m atced(botu p da te


list n om b re sexo eda d region com bin a, clean

03_Introduccion de datos(nuevo).indd 81

06/06/12 09:19

E R S E
S

s ap ar ecen oco casos, tan tos com o aen u n o u otr o arcivo. la


n u eva variab le
om bin a2 in d ica en qu cir cu n stan cia com bin atoria est
cada u n o de ellos. Se advierte qu e las filas , , cor respon d en a los
casos au sen tes en el ficer o m aestr o .
ILUSTR ACIN
3.1 .List a d o
d e
ca so s
d e
la
co n
u n ci n
d e
d o s

ice r o s

o ci n
bo th
1.
2.
3.
4.
5.
6.
7.
8.

nombr e
J uan
Mar a J os
Al f r edo
I sabel
Car men
Pedr o
J os
Ter es a

s exo
Hombr e
Muj er
Hombr e
Muj er
Muj er
Hombr e
Hombr e
Muj er

edad
21
20
20
19
22
.
23
24

r egi on
Sur
Sur
Nor t e
Nor t e
Sur
Sur
Nor t e
Nor t e

i
i
i
i

n
n
n
n

bot
bot
bot
bot

h,
h,
h,
h,

mast
mast
mast
mast

er
er
er
er

agr ees
agr ees
agr ees
agr ees
onl
onl
onl
onl

wi
wi
wi
wi
y
y
y
y

t
t
t
t
i
i
i
i

h
h
h
h
n
n
n
n

combi na2
us i ng dat a
us i ng dat a
us i ng dat a
us i ng dat a
us i ng dat a
us i ng dat a
us i ng dat a
us i ng dat a

3..
e r cicio s
rea con Stata u n a b ase d e d atos sen cilla con los d atos de sexo, ed ad
n om br e d e p ila de su fam ilia o de u n gr u p o de am igos.
E n tr a en la pgin a del
E (.in e.es
, con su lta el cen so del
(bu sca, p or e
em plo, las cifras d e los abitan tes de las capitales
de pr ovin cia. escrgalas com o u n ficer o
sv
, a con tin u acin , lelo
con Stata. ota qu e el
E pon e en cab ezados pie a los d atos
, an tes
de ser ledos con el com an do d el pr ogram a estadstico, deber a ed itar se
el ficero ba
ad o con u n ed itor d e textos (n otepad, p or e
em ploa fin de
elim in ar las pr im er as las ltim as ln eas. tr a cu estin a ten er en
cu en ta es qu e el
E ter m in a los r egistr os con u n a com a, com o si u
bier a u n a ltim a var iable sin d ato. Por ello, en el caso d e qu e se lea con
n om br es d e variab les, abr a qu e a adir u n a, qu e poster iorm en te p u ed e
elim in ar se.
H az lo m ism o con la pob lacin p or pr ovin cias. espu s in ten ta com bi
n ar (m er geam bos ficer os.
escar ga u n barm etr o de la pgin a d el
S, por e
em plo el estu dio
de m ar zo de . en er alm en te los estu dios del
S se com p o
n en d e siete ficer os
la fica tcn ica (t
, el cu estion ario (cu es
,
el libr o d e cdigos (cod igo
, las tar
etas (tar
etas
, el p rogram a
en SPSS (E S
, en SS (Saslos datos en form ato S

(
. Para los e
er cicios de los sigu ien tes cap tu los, se va a u tilizar
el b arm etr o de m ar zo. on str u e u n ficer o do con in
ile. ptativa

om o se a expresado la opcin pdate, in corpora en la variable ideolo


a los valores
del ficero con
u n tado, en lu gar del qu e est en u so, con slo cu atro casos fru to de la anterior
con
u n cin .

03_Introduccion de datos(nuevo).indd 82

06/06/12 09:19

ANLIS IS DE DATOS CON S TATA

m en te tam b in coloca las etiqu etas d e var iables valor es con las in s
tr u ccion es apr en d idas en el cap tu lo an ter ior. om o su ger en cia, u tiliza
com o gu as el pr ogram a d e SPSS (p ar a in
ile label de
in eel d e SS
(par a label variable
.
Realiza la m ism a op eracin qu e en el e
er cicio an terior con otr o b ar
m etr o, com o el de ab ril de (estu dio
. n e los d os estu dios
m edian te la in str u ccin appen d, m an ten ien do slo las variab les qu e
sean com u n es a am bos.

03_Introduccion de datos(nuevo).indd 83

06/06/12 09:19

03_Introduccion de datos(nuevo).indd 84

06/06/12 09:19

4
E st a d st ica s
de
una
so la
va r ia b le 1
4 .1 .Cla s ifica ci n
d e
va r ia b le s
Au n qu e in form ticam en te las variab les se d istin gan por su lon gitu d y su cod ificacin textu al o n u m rica (vase seccin 2.6.2
desde u n p u n to de vista
estad sticola m e
or clasificacin se fi
a en las car acter sticas in tr n secas
qu e ten gan los valor espor m s qu e estos su elan codificar se n u m ricam en tein depen d ien tem en te d e su s pr opiedad es. n el p rim er e
em p lo d e m atri
d e datos (ilu str acin .ap arecier on dos variab les con cdigos n u m ricos
qu e en el fon do son difer en tes. n la pr im er asu s cdigos ( y 2
au n d e
n atu r alea cu an titativar ep resen taban cu alidadesarn y u
er. a segu n da pr esen taba valores con sign ificad o pr opiam en te n u m r ico2
y 2. o cab e la m en or d u d a de qu e el tr atam ien to qu e se p u ed e aplicar a
u n a y otr a variab le a d e ser m u y d istin to. n a p rim er a clasificacin sim ple
es la qu e se acab a de m en cion ar en tre las var iables cu yos valor es son cu alid ades o categor astam bin llam adas atribu tosy aqu ellas cu yos valores son
n m er os con pr opiedad es ar itm ticas. l sexo y la ed ad son e
em plos clar os
y r espectivos d e am bos tipos de variab le. er o tam bin lo son la clase social
(con su s d istin tas categor asy los in gr esos (exp resados en dlaresp esetas
o eu rosp er oen tod o casocan tidades
.
n tre las variables cu alitativas se d istin gu en las n om in alescu yos valores
slo p oseen la p rop ied ad d e la iden tid ad (cu alqu ier valor es igu al a s m ism o
y diferen te d el resto
y las ordin alesen las qu e p u ed e establecerse u n a
erarqu a com pleta en tre valoresd e m an era qu esi u n valor llam ado a est situ a-

o son cen ten aressin o m ileslos libros y m anu ales de estadstica bsica qu e se an
escrito desde la segunda m itad del siglo x x . n este contexto se recom ienda a quienes em pie
an
a aproxim arse a la estadstica qu e com plem enten este captulo y el de grficos (6con u n bu en
m an ual de la m ateria. n tre ellosse sugieren com o clsicos laloc(66y piegel (
.
am bin son bu en as in troduccion es arca errando (
e a y om o (2
as com o
u adras (6
. n un a ln ea m u y sim ilar a estos captu loscon program a distintose en cu en tra scobar (
. tiles tam bin son eter et al. (
as com o am ilton (2
. ste
ltim o con tien eadem scom o este librolas rden es de tata.

04_Estadsticas.indd 85

06/06/12 09:20

d o an tes de u n segu n do den om in ado ba su veeste p reced e a u n tercero


al qu e se con ocer con cn ecesariam en te el prim ero a d e estar u bicado por
d elan te del tercero. Am b as p rop iedades pu eden form u larse com o sigu e
r in cip io d e iden tid ad

(.
r opied ad or din al de los valor es
(.2
or su ladolas variables cu an titativas pu eden clasificarse en variables de
in tervalo o de razn , seg n carecan o ten gan u n valor qu e represen te la
au sen cia total de la calidad qu e estn represen tan do. l cocien te in telectu al
slo pu ede ser clasificado de variable de in tervalopu es el valor es arbitrario
y n o equ ivale a la caren cia absolu ta de in teligen ciaen cam biopu ede catalogarse com o variable de ran a los in gresos m edidospor e
em ploen eu rosya
qu e en este caso el in dica la au sen cia total de lo qu e expresa la variable. o
se tratacom o a veces su ele con fu n dirsede qu e la variable ten ga o n o el valor
para catalogarla de u n a u otra form asin o del sign ificado qu e tien e este valor.
tra clasificacin til para variables cu an titativas es la qu e sep ara a las
variables discretas d e las variables con tin u as. ericam en telas prim eras son
aqu ellas con lim itad o n m ero de valoresde m od o qu e en tre dos valores con tigu os es im p osible en con trar em pricam en te u n tercero con u n valor in term edio. n a p erson a p u ed e ten er d os o tres erm an ospero n o dos erm an os
y m ed io. n cam bioen las variables con tin u as siem p re ser posib le im agin ar
valores in term ediosp u es el n m ero de ellos es in fin ito. Asen tre u n a p erson a qu e p esa 6g y otra qu e pesa 6ges posible en con trar otra con 6
g
la n ica lim itacin estara en la precisin d e los in stru m en tos de m edid a.
tata con tien e u n a ord en en la qu e se m u estr a u n resu m en de los valores
qu e p resen tan todas las variables d e u n a m atr i(o ficer oo u n con
u n to de
variab les esp ecificadas. e tr ata d e la in str u ccin codebook.
u se ficeroa
codeboosexo edad

Ap licad a a los datos m ostr ados com o p rim er e


em plo en este cap tu lo
m u estr a los distin tos valores qu e pr esen tan las var iables y su s cor respon d ien tes fr ecu en ciasesto eslas veces qu e se r epiten en tre las u n idades qu e
com pon en la m atr i.

04_Estadsticas.indd 86

06/06/12 09:20

ANLIS IS DE DATOS CON S TATA

ILUSTR ACI
4.1 .Lib r o
de
c d io s
d e
la s
va r ia b le s
s exo

ed a d
-----------------------------------------------------------------------------s exo
( unl abel ed)
-----------------------------------------------------------------------------t y pe:
numer i c ( by t e)
r ange:
uni que v al ues:

[ 1, 2]
2

t abul at i on:

Fr eq.
2
2

uni t s :
mi s si ng . :
Numer i c
1
2

1
0/ 4

Label
Hombr e
Muj er

-----------------------------------------------------------------------------edad
( unl abel ed)
-----------------------------------------------------------------------------t y pe:
numer i c ( by t e)
r ange:
uni que v al ues:
t abul at i on:

[ 19, 21]
3
Fr eq.
1
2
1

uni t s :
mi s si ng . :

1
0/ 4

Val ue
19
20
21

s preciso in sistir en qu e la variable sexoau n qu e sea cu alitativatien e su s valores gu ardados en form ato n u m rico (y 2
. or ellose recu rre
a etiqu etarlosel prim ero con om bre y el segu n do con u
er. Am bos
valores tien en u n a frecu en cia de dos casos. or otro ladoa las variables literalm en te cu an titativas n o procede pon erles etiqu etas a los valores. am poco
se les a pu esto en este e
em plo a las variablespu esto qu e su n om bre (sexo
y edadson lo su ficien tem en te aclaratorios com o para qu e n o requ ieran u n
ttu lo m s explcito.

4 ..La
t a b la
de
d ist r ib u ci n
d e
fr e cu e n cia s
a fo r m a m s elem en ta l d e r esu m ir la in for m a cin d e u n con
u n to d e
d a tos es la ta b la d e d istr ib u cin d e fr ecu en cia sq u e con siste en p r esen ta r p a r a ca d a va lor d e u n a y slo u n a va r ia b le el n m er o (fr ecu en cia d e ca sos qu e lo co m p a r te. igu ien d o el e
em p lo d e la ilu str a ci n .
d e lo s cu a tr o ca sos p r esen tes en la m a tr id e d a to sd o s so n va r o n es y
dos m u
er es. e igu a l m od o en la va r ia b le eda d existen d os ca sos con el
m ism o va lor (2a o s
p er o a y o tr o s d os con va lor es n ico s (y 2
.
a d isposicin tpica d e u n a tabla de distr ibu cin d e frecu en cias con siste en
a xpon er com o en cab eam ien to el n om b re de la var iable.
b istar en la pr im er a colu m n a el reper torio d e los d istin tos valor es
qu e p resen ta la var iable en tr e los su
etos en estu d io.

04_Estadsticas.indd 87

06/06/12 09:20

c ostr ar en la segu n da colu m n a la frecu en cia (fi) cor resp on d ien te a


cad a valor. sta segu n d a colu m n a se fin alia con la su m a d e todas
las frecu en ciaslo qu e equ ivale a expr esar el n m er o total d e casos
an aliados.
d rear u n a ter cera colu m n a con las pr op orcion es o fr ecu en cias relativas (p i)qu e con sisten en el cocien te en tr e las fr ecu en cias sim ples
y el n m ero total de casos.

(.
s til a n es tran sfor m arlas en p orcen ta
esp u es de esta form a son de m s fcil in ter pr etacin y la com u n icacin con el lector
u oyen te resu lta favor ecid a (ilu str acin .2
.
e Ad em sp ar a variab les or din ales o cu an titativastam b in r esu lta
til a ad ir u n a colu m n a con los p or cen ta
es acu m u lados (P i)qu e
con sisten en la su m a pr ogr esiva de los por cen ta
es sim ples d e la an terior colu m n a.

(.
a r a qu e ta ta ela b or e la ta b la d e d istr ib u cin d e fr ecu en cia de u n a
sola va r ia b le a y qu e u tili
a r la in str u ccin ta bu la te n om b r e
d eva r ia ble.
i d e d esea con u n a sola in str u ccin solicita r m s de u n a va r ia blea y
qu e u tili
a r la or d en ta b1 n om b r es
d e
va r ia b lesen lu ga r d e la or igin a l
ta bu la te. Asp a r a obten er la s fr ecu en cia s a b solu ta sr ela tiva s y a cu m u la da s d e la s va r ia b les sexo y eda dd el a ctu a l e
em p loa b r qu e escr ib ir la
or d en
tabsexo ed ad

l resu ltado m u estra u n a variab le segu ida de la otr a.

04_Estadsticas.indd 88

06/06/12 09:20

ANLIS IS DE DATOS CON S TATA

ILUSTR ACI
4 ..Ta b la s
d e
d ist r ib u ci n
d e
fr e cu e n cia s
d e
se o

edad
- > t abul at i on of s exo
s exo |
Fr eq.
Per c ent
Cum.
- - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - Hombr e |
2
50. 00
50. 00
Muj er |
2
50. 00
100. 00
- - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - Tot al |
4
100. 00
- > t abul at i on of edad
edad |
Fr eq.
Per c ent
Cum.
- - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - 19 |
1
25. 00
25. 00
20 |
2
50. 00
75. 00
21 |
1
25. 00
100. 00
- - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - Tot al |
4
100. 00

a ilu str acin .2 con tien e las d os variab les. e los cu atr o su
etos en
estu d ioel son om bres y el m u
eres. n r elacin con la ed ad
u n 2 tien en otr o 22y u n an cu m p lido 2a os. am bin
p u ed e decirse qu e el de los su
etos tien en 2a os o m en ossi d e in terp retar u n p or cen ta
e acu m u lado se trata.
n este tip o de tab las la n otacin qu e se em plea para d esign ar a los
valor es es xicon fi se d en om in an las frecu en cias absolu taslas frecu en cias
r elativas se recon ocen p or p i y el n m ero d e casos se exp resa bien con n si
los datos corr espon den a u n a m u estrao con N si se trab a
a con los datos
d e u n a pob lacin . or ltim oI den ota el n m ero d e valores d istin tos qu e
p osee la variab le. u an do los valores de u n a tab la son exau stivos y m u tu am en te exclu yen tesson eviden tes las sigu ien tes igu aldades

(.
oco frecu en tem en te se realia u n estu dio estadstico con tan slo cu atro
casos. A vecesla estadstica a sido defin ida com o la cien cia de los gran des
n m erosporqu e gen eralm en te trata de describir gran des con
u n tosau n qu e
para ello n o n ecesite dispon er de los datos de todos y cada u n o de su s elem en tos. e den om in a poblacin a ese gran con
u n to del qu e se desea obten er u n a
in form acin m ien tras qu e recibe el n om bre de m u estra u n su bcon
u n to de esa
poblacin extrado con u n as determ in adas con dicion es qu e asegu ren qu e el
an lisis qu e se efect e con su s datos n o difiera excesivam en te del qu e se u biese realiado ten ien do la in form acin de toda la poblacin . l tam a o qu e an
de ten er las m u estras depen de prin cipalm en te de cu n om ogn ea u eterogn ea sea la poblacin yen m en or m edidadel tam a o de esta ltim a.

04_Estadsticas.indd 89

06/06/12 09:20

a m atr ide d atosa p artir d e la qu e se ob tien en las tablas de distr ib u cin de fr ecu en ciascon tien e tan tas filas com o casos ten ga la m u estr a y
tan tas colu m n as com o variab les aya en la in vestigacin . am poco es u su al
organ iar u n a in vestigacin con slo d os variab lesa m en os qu e sean m u y
d ifciles de m edir. or regla gen er alu n estu d io com pr en d e u n m n im o de
d ievar iables y u n m xim oen ocasion es escasasd e varios m iles.

4..E st a d st ico s
r e s e n e s
de
d ist r ib u cio n e s
as distribu cion es son u n resu m en de los datos dispon ibles de las m u estras gen eralm en tepu es pocas veces se cu en ta con los datos de la poblacin . e pu ede
con den sar a n m s la in form acin con la ayu da de los estadsticosdatos calcu lables en la distribu cin qu e dan cu en ta de algu n a caracterstica n otable. in co
son las prin cipales caractersticas qu e pu eden resu m irse en u n a distribu cin
la ten den cia cen tralla posicin la dispersin la sim etra y el apu n tam ien to.

..1.

edidas de ten den cia cen tral

or ten den cia cen tral se en tien de u n valor qu e represen ta al con


u n to de valores
de la distribu cin de u n a variable. n el caso extrem o de u n a distribu cin en
la qu e todos los su
etos tu vieran el m ism o valorese dato dara cu en ta de todos
ellos. erocom o su propio n om bre in dicalas variables n o se caracterian por
presen tar valores n icos. or elloay diversos procedim ien tos para obten er
u n a m edida de ten den cia cen tral. as m s con ocidas y em pleadas son
a a m odavalor qu e p osee la m ayor frecu en cia de u n a distr ibu cin .
i en u n gr u p o de cin co p er son astr es son varon es y dos m u
eres
la m oda es ser om br e. n la p rim er a d istr ibu cin de la ilu stracin .2d on de ay cu atr o casosn o existe m oda p or qu e los dos
valores poseen la m ism a fr ecu en cia. n cam b ioen la segu n da distr ibu cin en la de la edad la m oda es ten er 2a os. ara qu e aya
m oda a d e existir u n valor con m ayor frecu en cia qu e el r esto.
b a m edian a es el valor qu e ocu pa la posicin cen tral de u n a d istr ibu cin or den ada p or su s valores. n con secu en cian o tien e sen tido
su clcu lo en el caso d e variab les n om in ales. ar a ob ten er la ay
qu e b u scar en u n a tabla de distribu cin de fr ecu en cias el pr im er
valor cu ya frecu en cia relativa acu m u lada su p er e el . Assi se
disp on e de tr es valores
6
la m ed ian a es 6pu es p reviam en te
or den adoses el qu e ocu pa el m edio de la distribu cin y es el p rim er o cu yo p orcen ta
e acu m u lado (66
6est p or en cim a d el .
n la variab le edad de la ilu stracin .2la m edian a cor resp on d e a
dos valorespu es posee u n n m ero par d e casos. or con ven cin se
ad opta qu e la m edian a sea la sem isu m a de los d os valor es cen tr ales.
n este caso (22

2es decir2. or tan top ara obten er la m e-

04_Estadsticas.indd 90

06/06/12 09:20

ANLIS IS DE DATOS CON S TATA

dian a cu an do u n determ in ad o valor posea u n a fr ecu en cia acu m u lad a igu al al es p reciso calcu lar la sem isu m a con el sigu ien te
valor de la tab la. n el caso d e var iables n om in ales es im p roced en te
tan to el clcu lo d e la m ed ian a com o el de la m edia ar itm tica.
c a tercera m edida de ten den cia cen tral es la m edia aritm ticaqu e es
u n prom edio de los valores de la distribu cin obten ido m edian te la
divisin de la su m a de todos los valores por el n m ero de casos. a
can tidad ofrecida por la m edia esu tilian do u n aforism oel valor qu e
ten dran todos los valores en el su pu esto de qu e todos los valores tu vieran el m ism o valor. i en u n gru po u m an o u n a person a tien e u n
erm an ootra dos y la tercera tresposeen en total seis erm an osqu e
si se distribu yeran equ itativam en te correspon deran a dos por person a. a obten cin de este estadstico respon de a la sigu ien te frm u la

(.6
Asla m ed ia de edad en el gru p o del e
em p lo con sider ad o sera
de 2a osqu e es el cocien te en tre la su m a d e las edad es (d e las
cu atro person as y el n m ero de m iem b ros qu e la com p on en (
.

... edidas de localizacin


on m edidas de localiacin aqu ellas qu e in dican el valor qu e ocu pa u n a d eterm in ada posicin en u n a distribu cin orden ada. as m edidas m s sim ples
de localiacin son los valores m n im o y m xim oaqu ellos qu e se u bican en
la prim era y ltim a posicin de la tabla. n el caso de la edadestos valores
correspon den al y al 2respectivam en te. tra m edida de localiacin es
la m edian atam bin m edida de ten den cia cen tralpu es es el valor qu e ocu pa
la posicin del cen tro de la distribu cin odico de otro m odoel de las
observacion es de la distribu cin tien en valores m en ores o igu ales al de ella y el
otro tien e valores m ayores o igu ales. a m edian a tam bin pu ede ser con cebid a com o aqu el valor qu e divide a la distribu cin en dos partes igu ales.
tr as m edid as d e localiacin son los cu ar tilesqu e p u ed en ser defin id os com o tr es valores qu e divid en a la distrib u cin en cu atr o par tes igu ales.
Asel p rim er cu ar til tien e u n 2 los d e casos por deb a
o d e d ico valorel
segu n do cu ar til coin cide con la m edian a y el tercero p resen ta u n 2 d e los
casos con valor es su p erior es. ara obten er losse calcu lan en p rim er lu gar
las posicion es d e los cu artiles (y (
y a p ar tir de ellas se extraen
los valores cor respon d ien tes. as p osicion es resp ectivas del p rim ersegu n do
(es igu al a la m edian ay tercer cu ar til son

04_Estadsticas.indd 91

06/06/12 09:20

(.
n a veobten idas las posicion esse bu scan los valores qu e las ocu pan . n
el caso de qu e (xd u n valor decim alse obtien e la sem isu m a de los valores
qu e ocu pan la parte en tera de la posicin y el qu e ocu pa la sigu ien te. Asen el
e
em plo de la edad en la ilu stracin .2dado qu e son cu atro casosal prim er
cu artil le correspon dera la posicin
2y al tercero la
. n con secu en cia
los valores del prim er y tercer cu artil seran respectivam en tede
y 2
.
e la m ism a fam ilia son los deciles y p er cen tiles. n el p rim er casoson
n u eve los valor es qu e dividen la distr ibu cin en d iep artes igu ales yen el
segu n d olos qu e par ten los datos en su b con
u n tos d el m ism o tam a o. ar a allar lo n -tiles se pr ocede de m odo sim ilar a cu an d o se obtien en
los cu ar tiles. e b u sca la p osicin corr esp on dien te al n -n til y si esta es d ecim alse su m an los d os valor es con tigu os y se divid en en tre 2. n gen eralla
p osicin d e u n n -n til (xse a
u sta a la sigu ien te frm u la

(.
e este m odoel qu in to sextil de u n a d istr ibu cin con casos ocu par a
la p osicin trigsim a(

6.

... edidas de dispersin


l tercer tipo de m ed id as son las llam ad as m edidas d e dispersin .
n d ican
cu n ale
ados estn los valores d e la distr ibu cin d el valor qu e la repr esen ta
gen er alm en te u n a m ed ida de ten den cia cen tr al. os estadsticos de d isp ersin m s u tiliados son
a a dispersin m odal es la pr opor cin (o porcen ta
ed e su
etos de
u n a distrib u cin qu e n o tien en el valor m od al. ste sim p le estadstico es u n o de los escasos qu e se pu eden u tili
ar p ar a estu d iar la
dispersin en var iables n om in ales u or din ales. u fr m u la se repr esen ta del sigu ien te m odo
(.
Asbasta restar a la proporcin de casos qu e tien en la m oda.
n el ya con ocido e
em plo del gru po de cu atro person asla dispersin
m odal de la edad sera de
oexpresada com o es com n en porcen ta
esdel pu es esta es la proporcin de person as qu e n o tien en 2
a osqu e es la m oda. tata n o calcu la este estadsticopero es fcil de
obten er con el clcu lo de la proporcin o porcen ta
e com plem en tario.

04_Estadsticas.indd 92

06/06/12 09:20

ANLIS IS DE DATOS CON S TATA

b l ran
o es la difer en cia en tr e los valores extr em os de u n a variable.
n el caso de la var iable edad en el gr u po de cu atro m iem br os qu e
sir ve d e e
em ploel ran go tom a el valor de 2 a ospu es es la diferen cia en tre la ed ad (2d el m ayor y la del m en or (
.
(.
sta m edid a pu ede estar m u y con d icion ada p or u n solo valor extrem o p oco represen tativo d e lo qu e se estu dia.
m agn ese u n gru p o
de 2person as de ed ades com p ren didas en tre y a ossalvo
u n a qu e tien e 6. n este caso d ecir qu e el ran go es d e a os dara
u n a im agen sesgad a de este agregad o. or ello se u tilia frecu en tem en te el llam ad o ran go in tercu artlicoqu e es la diferen cia en tre los
valores corresp on dien tes al tercer y p rim er cu artil. Asen el caso del
gru p o pequ e o d el e
em plosera de a oy en el d e los d os cen ten ares de person as el ran go in tercu artlico sera tam bin de a o.
(.
c a desviacin m edia es u n prom edio de los valores absolu tos de las
desviacion es de los valores con respecto a la m edia aritm tica. a de
advertirse qu e se trata de prom edio de valores absolu tospu es si n o
se prescin diese del sign o de las desviacion espor u n a im portan te propiedad de la m edia aritm ticasiem pre arro
ara el valor de . n la
distribu cin de la edad de los m iem bros del gru po ay dos desviacion es sobre la m edia (2a os
el m s
oven se desva m en os a o de
la m ediael m ayor m s a om ien tras qu e los otros dos tien en la
m ism a edad qu e la m ediapor lo qu e n o se desvan n ada. a su m a de
estas cu atro desviacion es es a m en os qu e se a adan los valores sin
con siderar el sign o qu e les precedeen cu yo caso la su m a es de 2 a os.
e a se obtien e el prom edio con la divisin de esta can tidad en tre las
cu atro person as qu e com pon en las observacion es realiadas
qu e
represen ta lo qu e se desva en prom edio cada caso de la m edia aritm tica. llo es obviopu es dos casos se ale
an de la m edia en a o y otros
dos en n in gu n o. a frm u la para su clcu lo en valores agregados es

(.2
d a varian za es u n a m ed ia aritm tica d e las desviacion es al cu ad rado
de los valores con resp ecto a la m edia. n lu gar de prom ediar los valores absolu tos de las d esviacion esestas se elevan al cu ad rado para

04_Estadsticas.indd 93

06/06/12 09:20

qu e su su m a n o sea yd e este m odose p en alian las d esviacion es


m s ale
adas de la m ed ia. Asel cu ad rado de u n a u n idad de desviacin sigu e sien d o el d e dos desviacion es es el de tresel d e
y assu cesivam en teva au m en tan do en p rogresin geom trica
a m edida qu e las d esviacion es se acen m ayores. n la distrib u cin
del gru po d e
ven estan to el m ayor com o el m en or se desvan a o
al cu adrado de la m ediam ien tras qu e los dos restan tes n o se desvan
n ada. n con secu en ciael p rom ed io d e a os al cu adrado qu e se d esvan estos cu atro su
etos d e la m ed ia de 2es d e
. Aqu igu ala el
resu ltado d e la desviacin m ed iap orqu e para los valores d e de y
de -el valor al cu adrado es exactam en te igu al al valor al cu ad rado.
ero lo n orm al es qu e la varian a sea m ayor qu e la desviacin m edia
salvo qu e las distan cias de los valores al prom edio sean m en ores qu e
la u n id ad pu es slo en esos casos el cu ad rad o es m en or qu e el valor
absolu to. sta operacin se form u la d el sigu ien te m odo

(.
e a desviacin tpica es la racu adrada de la varian a. e u tilia para
devolver el valor de la varian a a su s u n idades origin ales. om o acaba
de versela varian a de
est referida en a os cu adrados. ara poder
ablar en trm in os de a osay qu e allar la racu adrada de este valorresu ltan do ser de
. u clcu lo se obtien e m edian te la expresin

(.
f l coeficien te de variacin es u n a m edida d e disp ersin relativa. s
el cocien te en tre la d esviacin tpica y el valor absolu to d e su corr esp on dien te m edia ar itm tica. Al ser u n a r an o cocien tecar ece de
u n idades yen con secu en ciase u tili
a para com p arar la dispersin
en tr e variab les qu e ten gan d istin tas u n id ades d e m edida. om o la
varian a y la d esviacin tpica son siem pre p ositivaseste coeficien te
tam poco tien e sen tido qu e sea n egativoau n qu e la m ed ia lo sea. u
valor es com o el de las tr es m ed idas de dispersin p reced en tesen
el caso d e qu e todos los valores de la variab le sean idn ticos ysalvo
d istrib u cion es m u y d isper sassu valor su ele ser in fer ior a .

04_Estadsticas.indd 94

06/06/12 09:20

ANLIS IS DE DATOS CON S TATA

(.

... edidas de sim etra


xisten otras m ed idas cu yo pr op sito es expresar a tr avs d e u n n m ero
la for m a de la d istr ibu cin . stas se clasifican a su veen dos tiposlas
d e sim etr a (qu e atien den a la for m a orion tal de la distr ibu cin si la iqu ier da d e la distribu cin es sem e
an te a su d er ecay las de ap u n tam ien to
(qu e in dican la distribu cin vertical de los valor essi las frecu en cias de los
valor es cen tr ales son m ayor es qu e las de los valor es extrem os
.
ara variab les con tin u as existe u n p atr n o m od elo de d istrib u cin de la
estad stica llam ad o distribu cin n orm al qu ea pr im era vista 2 se car acter ia
p oraten er idn tica la m ediala m od a y la m edian ab ser sim tricaes
d ecirla distribu cin de los valores p or d eb a
o d e la m ed ia se refle
a com o
en u n espe
o en la distribu cin d e los valor es p or en cim a del p rom ed io (o
vicever sa
y cposeer u n alto n m er o d e casos en los valor es cen trales e ir
d escen dien d o esta fr ecu en cia a m ed ida qu e los valores se van ale
an do del
cen tr o d e la d istr ib u cin esto esde la m edian a.
as dos prim eras p ropied ad es estn m u y ligad as en tre spu es en tod a distrib u cin sim trica u n im odal los tres estadsticos d e ten den cia cen tral tien en
los m ism os valores. ara estim ar la sim etra de u n a distrib u cin se calcu la el
m om en to d e orden con resp ecto a la m ed iaesto esel prom edio d el cu b o
d e las d esviacion es de los valores con respecto a la m ed ia d e la variable

(.6
a fr m u la del m om en to es d e tal n atu ralea qu e si ay pr ed om in io d e
valor es p or deba
o (a la i
qu ier dad e la m ediasale n egativoy si ay p red om in io de valor es por en cim ar esu lta p ositivo. ar a ob ten er u n coeficien te
d e sim etr a estn dar con el qu e poder acer com paracion es en tre variab les
se d ivid e este m om en to de or den cu yas u n id ades son c bicaspor la d esviacin tp ica al cu b o

(.

ase la ilu stracin .com o e


em plo grfico de la distribu cin norm al.

04_Estadsticas.indd 95

06/06/12 09:20

... edidas de apu n tam ien to


a otra m edid a sobre la form a de la distribu cin es el apu n tam ien toqu e in dica cu n cen trad as o d ispersas estn las frecu en cias de los valores en relacin
con el p u n to m edio d e la distribu cin . i las frecu en cias estn con cen trad as
en el cen troen ton ces la distribu cin se llam ar leptoc rticasi las frecu en cias m ayores se u b ican en los extrem os d e la d istribu cin la d istrib u cin ser
platic rtica, yen el caso in term ediosera u n a d istribu cin m esoc rtica.
ar a calcu lar el ap u n tam ien to d e u n a d istr ib u cin tam b in den om in ado
cu rtosisse u tili
a el m om en to de ord en con respecto a la m edia dividid o
p ar a qu e qu ed e d espr ovisto d e u n idadesp or la d esviacin tp ica a la cu arta.
n algu n os pr ogr am as y m an u ales a este cocien te se le r estan tr es u n id ad es
p ar a qu e este estadstico arr o
e u n valor de en el caso de qu e se trate d e
u n a distrib u cin n or m al. in em b ar goen tata el r esu ltad o se calcu la sin
la su straccin d e este m odo

(.
an to la m edida an terior (asim etracom o estala cu rtosisson tiles porqu e
proporcion an claros in dicios de cu ndo la distribucin de u na variable cu antitativa es n orm al. ara qu e lo seala asim etra debe ser y el apu ntam ien to igual
a . i algu n a de estas m edidas en u na determ in ada variable n o se a
u sta a este
patrn n um ricono cabr du da de qu e n o est distribuida norm alm ente.

4.4.
b t e n ci n
de
la s
e d id a s
ca r a ct e r st ica s

d e
una
d ist r ib u ci n
as m edidas m s im por tan tes en tre las qu e se acaban de en u m erar en el
apar tado pr eceden te p u ed en ser ob ten idas m ed ian te la ord en su m m arize.
u sin taxis elem en tal con siste en acom pa arla de las var iables de las qu e
se d esea ob ten er los estadsticos en cu estin peroen el caso d e qu e n o se
especifiqu e n in gu n a d e ellasse sob reen tien de qu e se p id e los de todas.
su a r ie lista va riab les
opcion es

ar a ver su fu n cion am ien to se va a u tili


ar u n a p ar te d e la base d e datos
d e los pases. n con cretose u tili
a la ver sin r edu cidacon sisten te en la
in clu sin d e slo los p ases qu e form an par te d e la a p rin cip ios de

04_Estadsticas.indd 96

06/06/12 09:20

ANLIS IS DE DATOS CON S TATA

2. An tes qu e n ada es n ecesar iou n a vep u esto en fu n cion am ien to el


p rogram aab rir el ficer oyan tes d e pedir los estadsticosen la m edid a
en qu e son pocos casostam b in se solicita u n listado d e u n su b con
u n to de
variab les del ficero
u se eu ropaclea r
list p ais su perficie pob lacion evn

l con
u n to de los qu in ce pases tien e los sigu ien tes valores en las tr es
variab les solicitadas
ILUSTR ACI
4..List a d o
de
tres
va r ia b le s
en
u in ce
a se s

1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.

+- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - +
|
pai s
s uper f ~e
pobl ac~n
evn |
| -----------------------------------------|
|
Al emani a
349, 300
82. 200
77 |
|
Aust r i a
82, 700
8. 100
78 |
|
Bl gi ca
33, 200
10. 300
78 |
|
Di namar ca
42, 400
5. 400
76 |
|
ESPAA
499, 400
39. 500
78 |
| -----------------------------------------|
|
Fi nl andi a
304, 600
5. 200
77 |
|
Fr anc i a
550, 100
59. 200
79 |
|
Gr ec i a
128, 900
10. 600
78 |
|
Hol anda
33, 900
16. 000
78 |
|
I r l anda
70, 283
3. 800
76 |
| -----------------------------------------|
|
I t al i a
294, 100
57. 700
79 |
|
Lux embur go
2, 586
0. 438
77 |
|
Por t ugal
92, 082
10. 200
76 |
| Rei no Uni do
241, 600
59. 900
77 |
|
Suec i a
449, 964
8. 900
80 |
+- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - +

a solicitu d de los pr in cipales estad sticos se logra con la ya m en cion ad a in str u ccin su m m arize
su m m arie su perficie p oblacion evn

l resu ltado obten id o m u estra u n a ln ea p ara cad a variab le


ILUSTR ACI
4.4 .Ca r a ct e r st ica s
d e
la
d ist r ib u ci n
de
t r e s
va r ia b le s
Var i abl e |
Obs
Mean
St d. Dev.
Mi n
Max
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - pobl ac i on |
15
25. 16253
26. 77402
. 438
82. 2
super f i ci e |
15
211674. 3
185736. 7
2586
550100
ev n |
15
77. 6
1. 183216
76
80

os p rin cip ales estadsticos qu e ap ar ecen par a cada variab le son la m ed ia y la desviacin tp icapero tam bin se m u estra el n m er o de obser vacion es de las qu e se dispon eel valor m n im o y el valor m xim o.

04_Estadsticas.indd 97

06/06/12 09:20

om o pu ede ap reciarse en la ilu stracin .la m ed ia poblacion al de los


p ases de la n in u rop ea es de 2
2 m illon es (la variable est in trodu cid a en estas u n idades
el tam a o m edio es d e 2.6m 2y la esp eran
a
de vida al n acer p rom edio es d e
6. or su ladolas d esviacion es tpicas
in for m an de qu e por tr m in o m edio los p ases se ale
an d e la m ed ia d e la
pob lacin en 26
m illon esd e la d e la su p erficie u n os 6.m 2 y d e la
esperan a d e vid a al n acer
2 a os.
a op cin m s u tiliab le en la in stru ccin su m m arize es detailqu e sirve
p ara au m en tar el n m ero de estad sticos m ostrad os com o resu ltad os. As p u ed en obten erse estadsticos ad icion ales de la variable poblacion a ad in dola.
su m m a rie p obla cion detail

n con secu en ciadeb er a ap arecer u n listad o d el sigu ien te ten or


ILUSTR ACI
4..Ca r a ct e r st ic a s
d e
la
d ist r ib u ci n
d e
una
va r ia b le
pobl ac i on
------------------------------------------------------------Per c ent i l es
Smal l est
1%
. 438
. 438
5%
. 438
3. 8
10%
3. 8
5. 2
Obs
15
25%
5. 4
5. 4
Sum of Wgt .
15
50%
75%
90%
95%
99%

10. 3
57.
59.
82.
82.

7
9
2
2

Lar gest
57. 7
59. 2
59. 9
82. 2

Mean
St d. Dev .

25. 16253
26. 77402

Var i anc e
Skewnes s
Kur t osi s

716. 8482
. 9399792
2. 344765

n la pr im era colu m n a ap ar ece la ser ie d e los n om b res d e los p er cen tiles


qu e se calcu lan de la var iableen la sigu ien te ap arecen los valores ob ten idos
d e los m en cion ados p er cen tilesen la ter cer a colu m n a se listan tan to los
cu atro valor es m en ores com o los cu atro m ayor es. en la ltim a colu m n a
se m u estr an adem s d el n m er o d e ob servacion esla m edia y la desviacin tp icala var ian
ala asim etra y la cu rtosis.
as estadsticas m ostradas pu eden leerse com o sigu elos pases de la n in
u ropea con m en os poblacin tien en ....2.y ..
abitan tes. os cu atro pases m s poblado s tien en desde ..abitan tes
asta 2.2.. l prim er cu artil se en cu en tra en los ..abitan tesel
tercer cu artilen los ... a m edian a est represen tada en ..
abitan tes. in em bargola m edia es bastan te m s altam s de 2m illon es
de abitan tesy el prom edio de las desviacion es ascien de por en cim a de los
26 m illon es. e tratapor tan tode u n a variable m u y dispersa (la desviacin tpica es m ayor in clu so qu e la m edia
. or otro ladose trata de u n a distribu cin
asim trica a la dereca (el coeficien te de asim etra es positivocercan o a

pu es son m s n u m erosos los pases por deba


o de la m edia qu e los qu e estn

04_Estadsticas.indd 98

06/06/12 09:20

ANLIS IS DE DATOS CON S TATA

por en cim a de ellay platic rtica (la cu rtosis est por deba
o de
pu es n o
existe abu n dan cia de pases con poblacin en torn o a la m edia.

4 ..La
o n d e r a ci n
de
lo s
datos
or ponderacin estadstica se en tiende la m odificacin del peso igualitario que
origin alm en te poseen las observaciones en el con
unto de datos. on un e
em plo
sen cillo se pu ede entender este procedim iento. ea un exam en que consta de cin co pregu ntas cortas y dos preguntas largas. ada un a de ellas est puntuada de
a . i a todas estas preguntas se les da el m ism o pesola sum a de las preguntas
nos dar puntos. ara que el resultado se encu entre en u n rango de a
pueden en contrarse m ltiples solu cion es. as m s sim ples sonponderar igu al
cada respuestapara ello abra qu e m u ltiplicar la puntuacin de cada un a por la
constante
. tro sistem a sera que se diera m s peso a las pregun tas largas.
or e
em plola m itad de la nota para las dos preguntas largas y la otra m itad
para las pregun tas cortas. i se opta por esta solucin desigual para preguntas
cortas y largaslas cinco prim eras preguntas cortas tendran cada una u n peso
de pun tom ientras qu e a las dos pregun tas largas abra que otorgarles un
peso de 2
pun tos. e este m odocada observacin en este caso cada pregun ta
abra que transform arla m ultiplicndola por su peso del siguiente m odo

(.

ien do i el p eso de cad a ob ser vacin la n ota fin al obten id a en el exam en con las siete p regu n tas se obten d ra con la sigu ien te frm u la

(.2
n este e
em plo los cin co prim eros pesos (desde 1 a ten dran u n valor
u n itariom ien tras qu e los dos ltim os ( y seran igu al a 2
. a su m a de
todas las pon deracion es es igu al a por lo qu e en el su pu esto de qu e u n su
eto pu n t e con las siete pregu n tasel resu ltado P tam bin sera igu al a .
on la m ism a lgicaes de fr ecu en te aplicacin estadstica la den om in ad a m ed ia p on derad aqu e con siste en ob ten er los pr om edios m u ltip lican d o
cada valoradem s de p or su frecu en ciap or su pon der acin . Apar te de ello
tam bin ay qu e in clu ir en el d en om in ad or de este pr om edio las pon der acion es a fin de equ ilib rar las frecu en cias

(.2

04_Estadsticas.indd 99

06/06/12 09:20

tata cu en ta con cinco m odos distintos de ponderar los datos. u atro de


ellosqu e se expondrn en tres apartados son sim ples y se vern a con tin uacin m ientras qu e el otro responde a la lgica de dise os m u estrales com ple
os
y se explicar en el ltim o captulo de esta obra. s preciso tener en cu en ta qu e
no todos los procedim ientos de ponderacin son posibles en las instrucciones de
tatapor lo que para su u so es a m en udo con ven ien te solicitar la ayuda de cada
ordenpu es en su con tenido se in dica qu posibilidades de pesos perm ite .
. l procedim ien to de pon deracin m s adm itido por las rden es es
fei
tqu e en realidad es u n m u ltiplicador de los casos p or u n a con stan te. ste tipo de pon deracin a de serp or tan toen tera y positiva.
a ocasin m s frecu en te y oportu n a para el u so de esta in stru ccin es para cu an do se dispon e de datos ya tabu ladosqu e se desean
in trodu cir en el orden ador p ara el clcu lo de determ in ados estadsticos. or e
em plose sabe qu e en u n a clase cin co alu m n os an obten ido u n dieu n 2u n u n 6u n dieu n dosu n
y u n ou n . e este m odola m atride partidaen lu gar de con ten er
en cada fila u n in dividu odispon e de u n valor distin to de u n a o varias
variablesy u n a de las colu m n asen lu gar de ser u n a variable propiam en te dicaes el pesoo frecu en ciade los valores m en cion ados. on
la orden list se m u estra la estru ctu ra de esta m atride partida
u se ca lificacion esclea r
listclean

e pu ede apreciar en la ilu stracin .6 la colu m na donde aparece la


variable (n ota) y la que presenta su s correspon dien tes pesos (frecu ea).
ILUSTR ACI
4..a t r i
d e
d a t o s
a r e a d o s
1.
2.
3.
4.
5.
6.
7.
8.

not a
3
4
5
6
7
8
9
10

f r ec ue~a
5
10
28
19
15
10
2
1

lo consta de oco casosque se corresponden con las oco distin tas calificacion es otorgadas (desde el asta el
y estas estn acom
a ra
n de redu cirlos a tres es porque dos de elloslos an alticos y los m u estralesson
tan parecidos que explicar su s diferen cias est por encim a del n ivel de esta in trodu ccin . Adem spara las rden es asta aora anali
adas en este m an ual no se perm ite el uso de pei
t y
ay qu e u tiliarpor tan tocom o recu rso el otro m edio de pon deracin qu e es aei
t.

or e
em plotabu late slo perm ite las ponderacion es de frecu en ciade im portan cia y
an alticaen cam biola orden re
ress perm ite adem s la ponderacin probabilstica.

04_Estadsticas.indd 100

06/06/12 09:20

ANLIS IS DE DATOS CON S TATA

paadas de sus correspondientes frecu encias. ara que estas funcionen


com o variable ponderadoraa de a adirse a la instruccin entre corcetes la palabra clave fei
t, seguida del signo igual y del n om bre de
la variable que con tiene el pesodenom inada en este e
em plo frecu encia.
tab n ota
feigtfrecu en cia

e este m od ola in stru ccin tab1 se e


ecu ta con la variable n ota
pon d er ada con la llam ada frecu en cia. or elloen lu gar d e oco casosaparecen en el total .
ILUSTR ACI
4 ..Ta b la
d e
d ist r ib u ci n
d e
fr e cu e n cia s
d e
d a t o s
a r e a d o s
not a |
Fr eq.
Per c ent
Cum.
- - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - 3 |
5
5. 56
5. 56
4 |
10
11. 11
16. 67
5 |
28
31. 11
47. 78
6 |
19
21. 11
68. 89
7 |
15
16. 67
85. 56
8 |
10
11. 11
96. 67
9 |
2
2. 22
98. 89
10 |
1
1. 11
100. 00
- - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - Tot al |
90
100. 00

a m ayor p arte d e las rd en es qu e pr odu cen resu ltad os estadsticos perm iten u tiliar la p on deracin fei
t. igu ien do con el e
em p lo an terior para solicitar los estad sticos de la distribu cin con todo
d etallela in str u ccin deber a escribir se com o sigu e
su m m arie n ota
feigtfrecu en cia
d etail

alvo los valor es m n im os y m xim ospara cu yo clcu lo n o se


tien e en cu en ta la pon der acin el r esto de los estadsticosdesde los
per cen tiles asta la cu r tosisse obtien en con los p esos otor gad os
ILUSTR ACI
4 ..Ca r a c t e r st ic a s
de
lo s
d a t o s
a r u a d o s
not a
------------------------------------------------------------Per cent i l es
Smal l es t
1%
3
3
5%
3
4
10%
4
5
Obs
90
25%
5
6
Sum of Wgt .
90
50%
75%
90%
95%
99%

04_Estadsticas.indd 101

6
7
8
8
10

Lar ges t
7
8
9
10

Mean
St d. Dev .

5. 8
1. 493055

Var i ance
Sk ewness
Kur t os i s

2. 229213
. 3047134
2. 766698

06/06/12 09:20

2.

a segu n d a posib ilidad de p on d eracin es pei


t o aei
t. sta
a de exp resar la in ver sa de la p rob abilid ad d e u n su
eto de ser extr ado en la m u estrao bien esta can tidad dividid a p or n .
on u n e
em plocom o en el pr im er tipo d e pon d er acin se ve
m s claram en te el pr oceso y el r esu ltado d e esta operacin .
u p n gase qu e se a realiado u n m u estr eo aleator iosob re u n a
pob lacin de person asse an seleccion ado die. n la m u estra
sin em b argoan salid o cu atro om b res y seis m u
er espese a qu e
la pr oporcin en el u n iver so es d el . ar a devolver a la m u estr a
el p eso qu e tien en am b os sexos en la p oblacin p u ed e pon der arse p or el coeficien te de elevacin d e cada u n a d e las su bm u estr as.
ste coeficien te de elevacin se obtien e m edian te el cocien te en tr e
el tam a o d e la poblacin d e u n d eter m in ado estrato (N k) y el d e la
m u estr a (n k)

(.22
n la ilu str acin sigu ien te se p resen ta el listado de estos die
casos con su s corr esp on dien tes elevacion es.
ILUSTR ACI
4..List a d o
d e
e le va cio n e s
o r
ca so
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.

s exo
Hombr e
Hombr e
Hombr e
Hombr e
Muj er
Muj er
Muj er
Muj er
Muj er
Muj er

el ev ac~n
12. 5
12. 5
12. 5
12. 5
8. 333
8. 333
8. 333
8. 333
8. 333
8. 333

as cor respon d ien tes a los om b res son el r esu ltado de d ividir
el n m ero d e om b res en la poblacin (en tre los cu atr o de la
m u estram ien tras qu e la elevacin de las m u
er es es el cocien te en tr e las del u n iver so y las seis seleccion adas.
i se d em an d an fr ecu en cias y m edia d e la variab le sexocon la
pon der acin an altica se obtien en las frecu en cias de la m u estr a y la
m edia pon d er ada por este coeficien te de pon d er acin
u se ficerobclear
tabu la te sexo
a eigtelevacion
su m m a rie sexo
aeigteleva cion

04_Estadsticas.indd 102

06/06/12 09:20

ANLIS IS DE DATOS CON S TATA

om o puede com probarse a continuacinla m edia de la variable


sexo m uestra la proporcin de om bres en la poblacinal tiem po se
conserva el tam ao de la m uestraaunque los pesos sum en una cantidad
cercana a . sto ocurre as porque con este procedim iento se norm ali
zan los pesos a fin de que el total coincida con el tam ao de la m uestra.
ILUSTR ACI
4 .1.Ta b la
de
fr e c u e n cia s

e st a d st ic o s
o n d e r a d o s
a n a lt ic a e n t e
s exo |
Fr eq.
Per c ent
Cum.
- - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - Muj er |
4. 9999999
50. 00
50. 00
Hombr e |
5. 0000001
50. 00
100. 00
- - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - Tot al |
10
100. 00

Var i abl e |
Obs
Wei ght
Mean
St d. Dev .
Mi n
Max
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - s ex o |
10 99. 9999981
. 50001
. 5270463
0
1

s p reciso ad vertir de qu e n i la orden tabu late n i la in stru ccin


su m m arize perm iten la p on deracin prob abilstica (pei
t). tata recom ien d a u tiliar en los casos en qu e se d esee u n a m e
or estim acin
los proced im ien tos prop ios d e en cu estaqu eau n sien do m s com ple
osprop orcion an u n clcu lo m s robu sto de las d esviacion es y los
errores tpicos. ara m s d etalles de este tipo de p on deracion es van se
las rd en es sven el cap tu lo de este lib ro .
. in alm en te se explica a con tin u acin el procedim ien to iei
t por el
qu e a cada dato se le otorga u n a im portan cia discrecion al. n el su pu esto de qu e se em plee en este m odo de pon deracin el coeficien te de
elevacin la frecu en cia total m ostrada es la de la poblacin y n o la de
la m u estracom o ocu rra en los procedim ien tos aei
t o pei
t. as
rden es para este tipo de pon deracin son idn ticas a las preceden tes
slo con el cam bio de la palabra clave situ ada en tre corcetes. e este
m odopara obten er la tabla y los estadsticos de la ilu stracin an terior
con el n u evo m todoabra qu e dictar las sigu ien tes rden es
tab u late sexo
ieigteleva cion
su m m arie sexo
ieigtelevacion

n realidadel e
em plo que se acaba de expon er debera aberse reali
ado con la opcin
pei
tporqu e se a em pleado com o variable de pon deracin el coeficien te de elevacin . tata recom ienda el u so de aei
t en aqu ellos casos en los qu e los datos de los que se dispone
son m edias o sum as de u n con
u nto de observacion escom o su cede si se dispon e de in form acin agregada de pasesen cu yo caso el n m ero de casos de cada m edida es el qu e a de
em plearse com o criterio de pon deracin.

04_Estadsticas.indd 103

06/06/12 09:20

roba bilstica

recu en cial

e it

a e it

. en teras

in n orm aliar

orm a li
adas

CUAR
4.1.r o c e d iie n t o s
sile s
de
o n d e r a ci n
en
St a t a

fe it

ie it

l r esu ltado m u estra u n total d e casos en la tab la y u n a


d esviacin tpica algo m en or en este casop orqu e p ar a ob ten er la
est divid ien do por casosen lu gar d e n u evecom o en el an ter ior
(vase in fra
.el m otivo d e r estar al n m er o d e casos
.
ILUSTR ACI
4.11 .Ta b la
d e
fr e cu e n c ia s
con
o n d e r a ci n
d iscr e cio n a l
s ex o |
Fr eq.
Per c ent
Cum.
- - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - Muj er | 49. 9999981
50. 00
50. 00
Hombr e |
50
50. 00
100. 00
- - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - Tot al | 99. 9999981
100. 00
Var i abl e |
Obs
Wei ght
Mean
St d. Dev .
Mi n
Max
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - sex o |
10 99. 9999981
. 50001
. 5025189
0
1

04_Estadsticas.indd 104

06/06/12 09:20

ANLIS IS DE DATOS CON S TATA

e pu eden r esu m ir estas pon deracion es afir m an do qu ep or u n lado


se en cu en tra la p on deracin p robab ilstica (pei
t) yp or otro lad olas
frecu en ciales (el r esto
. am bin ay qu e se alar qu e tan to pei
t com o
aei
t son pon d er acion es n or m ali
ad asd e m odo qu e el resu ltado fin al
qu eda con el m ism o n m ero de casos qu e la m u estram ien tras qu e las otras
d os (fei
t e iei
ttr an sfor m an el n del an lisis. fin alm en teestas
d os ltim as se d istin gu en porqu e la prim era n ecesita p on deracion es en teras
p ara pod er se llevar a cabo. l cu adr o .m u estra estas difer en cias esqu em ticam en te.

4 ..E l
error
t ico
n tod o este cap tu lo se a tom ad o com o r efer en cia el an lisis d escr iptivo
d e las var iables en las m u estras. in em bargoen la casi totalidad de las
veces en qu e se tr aba
a con m u estraslos d atos qu e in teresan n o son los de
estassin o los d e la poblacin d e la qu e pr oced en .
en eralm en telos clcu los qu e se extraen d e la p ob lacin reciben el n om b re d e parm etros y se les su ele represen tar con u n a letra griega. e este
m od ou n a m edia calcu lada con los d atos de toda la pob lacin ser con sid erad a com o u n parm etro y se la n otar com o ( ). el m ism o m od oes tam bin
u n p arm etro la d esviacin tpica ( )siem pre y cu an do se obtu viera con
tod os los su
etos d e u n a p oblacin . or el con trariosicom o su ele ser u su al
estas m edid as se calcu lan con datos m u estralesreciben el n om bre d e estads
ticos y se les recon ocer con los sm bolos x y srespectivam en te.
s lgico qu e el resu ltado de u n estadstico n o coin cid a exactam en te
con el valor cor recto del parm etr o. A la d iferen cia en tre u n o y otr o se le
d en om in a error m u estral. odo estadstico tien e su cor respon dien te er ror
qu e se den om in ar eacom p a ad o del su b n dice corr esp on dien te. A m od o
d e e
em ploa con tin u acin se expon en las frm u las de los err or es em p ricos
d e la m ed iad e u n a pr op orcin y de la desviacin tp icasin d u dalos tres
estad sticos m s em plead os en el an lisis estad stico u n ivar iable

(.2
aso de qu e se realicen m u estreos aleatorios sim plesseleccion an do los
elem en tos de las m u estras u n o a u n o del con
u n to de la poblacin p u ed e p roced erse d e dos m od oscon rep osicin y sin rep osicin . n el p rim er m tod o
los su
etos d e la p ob lacin qu e an sid o seleccion ad os p ara form ar p arte de la
m u estra pu eden volver a ser elegidosform n d ose d e este m odo su bcon
u n tos

04_Estadsticas.indd 105

06/06/12 09:20

con elem en tos repetidos. n cam bioen los m u estreos sin reposicin u n a
veseleccion ado u n cason o pu ede volverse a escoger yen con secu en cialos
elem en tos d e la m u estra son n icos e irrepetib les. an to por el sen tido com o
p or el m en or error m u estral qu e gen eran son m u co m s tiles y em p leadas
las m u estras sin reposicin qu e las qu e se realian con rep osicin . Aqu p or
elloslo se ar u n an lisis de los errores de las m u estras sin reposicin .
n con cepto im pr escin d ible para abor dar el p rob lem a del er ror m u estr al d esd e u n pu n to de vista p rob ab ilsticoen lu gar de em p r icoes el de
distribu cin m u estral. on siste en el com por tam ien to de u n determ in ado estad stico en el con
u n to de m u estr as d e u n d eterm in ad o tam a o qu e pu ede
extr aer se d e u n a pob lacin dada. e com p ren de m u co m e
or a travs d e
u n pequ e o e
em p lo.
e su pon e u n a p oblacin de slo cu atr o su
etos y se desea a p ar tir de
ella ob ten er u n a m u estr a de d os per son as. l n m ero p osible d e m u estras
vien e d eter m in ado p or el n m ero com bin ator io sigu ien te

(.2
n con secu en ciad e u n a p ob lacin de cu atro elem en tos p u ed en extraerse
seis m u estras diferen tes. s con cretam en tea con tin u acin se con sidera el
con
u n to d e cu atro su
etos presen tados en la m atride la ilu stracin .2
ILUSTR ACI
4 .1.a t r i
d e
una
o b la ci n
co n
cu a t r o
e le e n t o s
1.
2.
3.
4.

s ex o
1
2
1
2

edad
21
20
20
19

i este con
u n to es con sid er ado u n a poblacin y u bier a qu e r ealiar
tod as las m u estr as posibles de tam a o dos sin reposicin las seis p osibilid ad es seran las sigu ien tes
ILUSTR ACI
4 .1.ist r ib u ci n
u e st r a l
s in
r e o sici n
de
la
o b la c i n
a n t e r io r
Hombr e
Hombr e
Hombr e
Muj er
Muj er
Hombr e

de
de
de
de
de
de

21
21
21
20
20
20

c on
c on
c on
c on
c on
c on

Muj er
Hombr e
Muj er
Hombr e
Muj er
Muj er

de
de
de
de
de
de

20
20
19
20
19
19

n cada u n a de estas m u estras p u ed en calcu larse u n a serie d e estadsticos. ara m ayor con crecin a p artir de la variable sexo p u ede ob ten erse p ara
cada m u estra la p rop orcin d e om b res (o m u
erespresen tes en ellas

04_Estadsticas.indd 106

06/06/12 09:20

ANLIS IS DE DATOS CON S TATA

ILUSTR ACI
4 .14 .ist r ib u ci n
u e st r a l
d e l
e st a d st ic o
p
.
1.
.
.
.
.

5
0
5
5
0
5

A partir de estas posibles m u estras de tam a o dos con su s respectivos porcen ta


es de om bresp u ed e con stru irse su corresp on d ien te distrib u cin 6
u se
d istribu cion m u estral
tab u late pom bres

l r esu ltado p ropor cion a las frecu en cias de m u estr as en las qu e sale u n
y d e om br es. b viam en tecon m u estr as de tam a o dosn o
p u ed e salir otro resu ltado.
ILUSTR ACI
4 .1.ist r ib u ci n
d e
r o b a b ilid a d
d e l
e s t a d st ico
p
phombr es |
Fr eq.
Per c ent
Cum.
- - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - 0 |
1
16. 67
16. 67
.5 |
4
66. 67
83. 33
1 |
1
16. 67
100. 00
- - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - Tot al |
6
100. 00

in alm en tetam b in es tilad em s de con tem plar su distr ibu cin calcu lar su s car acter sticas
ILUSTRACI
4.1.Ca r a cter stica s
d el
esta d stico
p
en
la
d istr ib u cin
u estr a l
phombr es
------------------------------------------------------------Per cent i l es
Smal l es t
1%
0
0
5%
0
.5
10%
0
.5
Obs
6
25%
.5
.5
Sum of Wgt .
6
50%
75%
90%
95%
99%

.5
.5
1
1
1

Lar ges t
.5
.5
.5
1

Mean
St d. Dev .
Var i ance
Sk ewness
Kur t os i s

.5
. 3162278
.1
0
3

6
o ay que confu ndir la distribucin m uestral con la distribucin de un a m uestra. sta ltim a es la distribucin de una variable em prica en la m uestram ientras que la distribucin m uestral es una distribucin probabilstica de una variable aleatoria de los estadsticos calculables en
el con
unto de m u estras de un determ inado tam ao que se puede extraer de una poblacin dada.

04_Estadsticas.indd 107

06/06/12 09:20

om o p u ed e a pr eciar sed e la s seis posibles m u estr a su n a el 6


6
pr esen ta r a u n d e om br esotr a otro 6
6 m ostra r a el de
va r on esy fin a lm en te cu a tr o m u estr as la s dos tercer a s p ar tes ten dr a n
u n d e p er son as m ascu lin a s. e estos da tos se dedu ce qu e con u n
66
6 d e pr ob a bilid a d u n m u estr eo d e dos per son a s sob re u n a pobla cin
de cu a tr o en la qu e la m ita d p osee u n a determ in a da ca ra cterstica m ostra ra u n er ror n u lo en la pr oporcin de om br esp u esto qu e cu a tro de la s
seis m u estra s p osibles tien en u n de elloscan tida d idn tica a la de la
pobla cin .
Ad em sse com pr u eb a em p r icam en te en este e
em p lo qu e la esperan a
m atem tica (el pr om edio o m ean de la d istr ibu cin m u estral es igu al al p ar m etro d e la pob lacin . sto m ism o exp resado algeb raicam en te pr esen ta
la sigu ien te equ ivalen cia
(.2
am b in pu ede con ocer se con exactitu da par tir de los d atos d e la p ob lacin n o slo la esper an a m atem tica d e la d istr ibu cin m u estralsin o
su var ian a (arian ce) yen con secu en ciasu desviacin tpica (td ev.).

(.26
r ecisam en tela r acu adr ad a de la frm u la an terior es la d esviacin
tpica de la distribu cin m u estral d el estadstico pqu e tam bin recibe el
n om b re de error tpico.
ste er ror tp ico tien e u n a im por tan cia cen tr al en la estadstica in fer en cialp u esto qu e es la err am ien ta im pr escin d ib le p ara el clcu lo d e los
err ores m u estr ales p robab ilsticos p ara las estim acion es por in ter valo de los
p ar m etros y p ar a la reali
acin de pr u eb as estadsticas.
ar a in cid ir en su com pr en sin se expon e a con tin u acin u n n u evo
e
em p lo con la m ism a poblacin p er o en esta ocasin en lu gar d e con u n a
variab le n om in al (cu alitativa
con u n a var iable de ran com o la edad.
ab ien do qu e los valores en la p ob lacin d e cu atr o su
etos son de 2
2y 2la distribu cin m u estral de las m u estr as d e tam a o dos p resen ta la
sigu ien te disp osicin
ILUSTR ACI
4.1.ist r ib u c i n
de
r o b a b ilid a d
de
la
e d ia
medad |
Fr eq.
Per cent
Cum.
- - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - 19. 5 |
2
33. 33
33. 33
20 |
2
33. 33
66. 67
20. 5 |
2
33. 33
100. 00
- - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - Tot al |
6
100. 00

04_Estadsticas.indd 108

06/06/12 09:20

ANLIS IS DE DATOS CON S TATA

n este su pu estola pr obabilidad de qu e la m u estra ten ga u n err or d e


es d el
. ste por cen ta
e r ecibe el n om b re de n ivel de con fian za y
siem pre a de estar relacion ado con u n m ar gen de er r or. e este m od ocon
los d atos d e la distrib u cin m u estr al de la m ism a tab lapu ede d ecir se qu e
con u n de con fian a o segu r idad el err or m u estral se m an tien e en el
in tervalo de
.
n cu alqu ier casose m an tien en u n a serie de caractersticas en la distrib u cin m u estral sim ilares a las qu e se an expu esto con r especto a las
p rop or cion es o por cen ta
es. stas son
a a esperan a m atem tica d el estadstico en la d istr ib u cin m u estral
es igu al al p ar m etro d e la p oblacin .
(.2
b a desviacin tpica (o error tpicodel estadstico en la distribu cin
m u estral es igual a la desviacin tpica de la poblacin dividida por la
racuadrada del tam ao de las m uestrasm u ltiplicada por u n factor
de correccin en el caso de qu e la m uestra se realice sin reposicin.

(.2
A estas car acter sticas se su m a qu ede acu erd o con el teorem a del lm ite cen tralp ara casi todas las pob lacion esla d istr ib u cin m u estr al de u n a
m ed ia (y las pr op orcion es o por cen ta
es tam bin pu eden con sid erarse com o
m ed iases ap roxim ad am en te n orm al cu an do el tam a o de la m u estra aleatoria sim p le es lo su ficien tem en te gran de.
eb ido a esta distribu cin m u estral qu e p resen tan la casi totalid ad de
las m u estras aleator ias pr acticadas en la in vestigacin p u ed e averigu ar se
con el n ico con ocim ien to de la varian a o d esviacin tpica d e la p oblacin
el m ar gen d e er r or qu e pr esen ta u n a poten cial m u estr a con u n determ in ado
n ivel d e con fian a. sto es as porqu e se con oce qu e en u n a d istr ib u cin
n or m al existe u n deter m in ado por cen ta
e de casos con valor es com pr en d id os en tr e u n deter m in ado ran go de desviacion es tp icas. l e
em plo m s
em p leado es el corr espon dien te a 2 d esviacion es tpicaspu esto qu e el

d e las u n idad es en u n a d istr ibu cin se en cu en tr an situ ad as en u n a p osicin n o m s ale


ada d e dos d esviacion es tpicas p or ar rib a o p or d eb a
o de la
m ed iatal com o estn repr esen tad as en la on a cen tr al m s oscu r a del gr fico .. n este casolas u n idad es ser an m u estr as. l en el e
e de abscisas

N n

ara la varian
ala frm ula de este coeficien te corrector es N 1

04_Estadsticas.indd 109

06/06/12 09:20

r ep resen tara las m u estras cu yos estad sticos coin ciden totalm en te con el
p ar m etro de la pob lacin los valor es positivos in dican u n estad stico m ayor qu e el par m etrou n ad os o tres d esviacion es tp icas (o valor es in term edios e in clu so su perior esp or en cim a de l. or el con tr ariolos valor es
n egativos se r efieren a m u estr as con estadstico m s ba
o qu e el par m etro
d e la pob lacin . om o se tr ata de u n a distribu cin n orm ales m u y p oco
p robab le qu e se en cu en tr e u n a m u estr a con tres desviacion es tpicas (er ror es tpicospor d eb a
o del valor cor recto del p arm etr o.
R IC
4 .1.o n a
ce n t r a l

d e
la
d ist r ib u c i n
n o r a l

4 s

3 s

2 s

1 s

media

1s

2s

3s

4s

n el su p u esto de d isp on er de u n a poblacin in fin ita en la qu e la m edia


d e u n a var iable de valoracin a u n person a
e p blico fu er a 6 y su d esviacin
tpica tu vier a u n valor de 2al r ealiar m u estras de tam a o cien se gen er a
u n a distribu cin m u estr al cu ya m edia ser a tam b in 6p er o su desviacin
tpica ser a de
2 (2
Z
. n con secu en ciael
d e las m u estras p resen taran u n a m ed ia com pr en d id a en tre
6 y 6
esto es6(2x
2
. sto
p u ed e exp resarse form alm en te del sigu ien te m odo

(.2
n las poblacion es in fin itas (con m s de .su
etos en la prcticael coeficiente
corrector com en tado en la nota an terior se convierte en u n n m ero m u y prxim o a la u n idad
con lo qu e no tien e n in gun a in ciden cia en el error tpico.

04_Estadsticas.indd 110

06/06/12 09:20

ANLIS IS DE DATOS CON S TATA

..1.

stim acin e in tervalos de con fian za

n el apar tado an terior se a exp licado el err or m u estral y el de su corr esp on dien te n ivel d e con fian
a partien do d esde la p ob lacin . in em bar goen
el traba
o de an lisis de d atosgen er alm en ten o se d ispon e d e la in for m acin del u n iver sosin o d e la m u estra. A p artir de estase p u ed en p redecir
los ver daderos p ar m etros de la pob lacin . sta oper acin recibe el n om br e
d e estim acin qu e a su vepu ede r ealiarse d e dos m odospu n tu alm en te y
p or in ter valos.
a a estim acin pu n tu al con siste en prop orcion ar u n solo valor par a
el par m etro en cu estin . n los estad sticos m s sim p lesla estim acin pu n tu al m s certer a es el estad stico con la m ism a den om in acin qu e el parm etr o d e la p ob lacin . e este m odoel m e
or
estim ad or d e P (la pr oporcin en la pob lacin es p (la pr opor cin
en la m u estra
y el m e
or estim ad or de la m ed ia en la poblacin ()
. in em b ar goesto n o es as en el caso
es la m edia de la m u estra ( x
d e la var ian an i en el d e la desviacin tp icaporqu e las ecu acion es
(.2y (.2n o se aplican a estos estadsticos. n cam b iocon
u n a ad ecu ada dem ostr acin (e aa2pu ede com p rob ar se
qu e

(.
e este m odoen las m u estrasen lu gar de s 2se calcu la el estad stico
cu ya fr m u lasim ilar a la de la var ian
a (.
vien e d ad a p or

(.
n este casose cu m ple efectivam en te la igu ald ad sigu ien telo qu e im p lica por defin icin qu e es u n estim ador n o sesgad o d e s 2.

(.2
Adicion alm en tela estim acin por in tervalos con siste en pr oporcion ar
u n r an go de valores en el qu e con u n a determ in ada pr ob abilid ad (el n ivel
d e con fian ase en con trar el valor d e la p oblacin . a ob ten cin d e estos
in tervalos se reali
a su m an d o y restan do al estadstico d e la m u estr a su cor resp on d ien te er ror m u estral

04_Estadsticas.indd 111

06/06/12 09:20

(.
tata p erm ite con str u ir los in tervalos de con fian
a par a p ropor cion es y
m edias a p ar tir de u n a or den de em pleo in m ed iato. e trata d e la or den ci
con opcion es bin om ialpar a aplicarla a pr op orcion esy level(
para expr esar el n ivel d e con fian a con el qu e se desea con tar.
Algunos e
em plos pueden aclarar el em pleo y la in terpretacin de esta orden. os dos prim eros em plearn la frm ula inm ediata de la orden ci. sta
con siste en un m odo de proporcionar datos sin necesidad de que estos estn en
un ficero. na parte considerable de las instru ccion es de tata perm iten esta
posibilidad. ntre ellas est la orden que obtien e los intervalos de confian
a.
n tr e las rd en es in m ediatas d e in ter valos de con fian
ala m s sim ple
es la qu e se r efiere a los in tervalos cor respon d ien tes a u n a variable bin om ial. an slo ay qu e pr oporcion ar el n m er o de casos y el de favor ables
es d eciraqu ellos qu e cu m plen u n a deter m in ada car acter stica. l caso m s
com n de aplicacin ser a el de u n sim ple
u ego de a
arcom o el lan am ien to de u n a m on ed a. ea qu e de lan am ien tos se obten gan carasen la
ord en an d e figu rar en p rim er lu gar las veces qu e se reali
a el experim en to
(el n m ero de casosen el su pu esto de u n a m u estr ay p oster ior m en te el
n m ero de r esu ltados favorablesn m ero de car as en este con texto.
cii

n ton cesel in tervalo d e con fian a con u n de p robab ilidades estar


com pr en d id ocom o se ala la ilu stracin .en tre el y el .
ILUSTRACI
4.1.C lcu lo
d ir e cto
d e
los
in ter va los
d e
con fia n a
d e
una
ed ia
- - Bi nomi al Ex ac t - Var i abl e |
Obs
Mean
St d. Er r .
[ 95% Conf . I nt er v al ]
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - |
100
.4
. 0489898
. 3032948
. 5027908

s p reciso n otar en este e


em plo qu e n o u tilia la distribu cin n orm al
sin o la b in om ial. sto a de acer se as p or ser u n a var iable d icotm ica de
n atu r ale
a cu alitativa. in em bar god ado el n m er o de elem en tosel resu ltad o con la distribu cin n or m al ser a m u y sim ilar.
ara m u estras pequeasy dispon ien do del error tpico con datos m u estralesen lugar
de datos poblacionaleses m s apropiado em plear la distribucin t de tu den t qu e la n orm al
y as lo ace tata.

04_Estadsticas.indd 112

06/06/12 09:20

ANLIS IS DE DATOS CON S TATA

i se desea obten er la estim acin por in tervalos par tien do d el m odelo


n or m al ay qu e pr op orcion ar a la or den d ir ecta tres parm etr osen lu gar
d e dosn m ero de casosm ed ia y desviacin tpica d e la pob lacin a ser p osible. os m ism os datos an terior es con el m odelo n or m al seran casos
la m edia ser a de
en lu gar de ya qu e ay qu e p ar tir esta can tid ad
p or el n m er o d e u n idades de la m u estra y la d esviacin tpica ser a la r a
cu adr ad a d e p(-p
en este caso d e

6
cii .sqrt(.
.6

os resu ltados d e esta ltim a ord en son m u y sem e


an tes a la an terior
com o se p u ed e com p robar com p ar an do las ilu str acion es pertin en tes
ILUSTR ACI
4 .1.C lcu lo
d ir e c t o
d e
lo s
in t e r va lo s
de
co n fia n a
d e
una
r o o r ci n
Var i abl e |
Obs
Mean
St d. Er r .
[ 95% Conf . I nt er v al ]
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - |
100
.4
. 0489898
. 3027936
. 4972064

n el in ter valo in fer ior las difer en cias son de m ilsim am ien tras qu e
en el su per ior apen as llegan a las m ilsim as.
er ocon d atos de u n ficerod ebe u sarse la ord en pr in cipalqu e es ci
en lu gar d e la del clcu lo in m ed iato (cii).
om o e
em plo se u tili
a en esta ocasin la m u estr a postelectoral del

d e la qu e se disp on e d e m s de .su
etos. n pr im er lu garse ace
la estim acin por in tervalos de u n a var iable cu an titativala edad. n este
casob asta con segu ir la in stru ccin ci d el n om br e de la var iable d e la qu e
se desean ob ten er los in ter valos.
ci ed ad

con los p rop ios datos m u estrales se calcu la el err or tpico y los cor resp on dien tes in ter valos d e con fian a
ILUSTR ACI
4 ..C lc u lo
de
lo s
in t e r va lo s
d e
co n fia n a
d e
una
e d ia
Var i abl e |
Obs
Mean
St d. Er r .
[ 95% Conf . I nt er v al ]
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - Edad |
5283
45. 96498
. 2529001
45. 46919
46. 46077

escartan d o m s de u n decim alpu ede d ecir se a la lu d el r esu ltad o qu e


con u n de segu ridad la ed ad d e la poblacin estar com p ren dida en tr e

y 6
a os.

04_Estadsticas.indd 113

06/06/12 09:20

n el caso de variab les n om in alesay qu e acer la estim acin par a


cada u n o d e los valores o categoras. e este m odon o pu ede acer se la estim acin par a la variab le sexosin o qu e abr a qu e con vertir esta variab le en
d os dicotm icas (con valores par a u n a categora y para el r esto
om
brep or u n ladom u
erpor el otr o . con ellasse ap lica la in stru ccin ci
con la opcin bin om ial.
u se pa n el
ci om bre m u
erb in om ia l

e este m odo se gen er an d os estim acion es por in tervalos b asad as en el


m od elo b in om ialu n a p ar a cada u n a de las dos categor as con ver tid as en
variab les dicotm icas
ILUSTR ACI
4.1.C lc u lo
de
lo s
in t e r va los
d e
co n fia n a
d e
una
r o o r ci n
- - Bi nomi al Exac t - Var i abl e |
Obs
Mean
St d. Er r .
[ 95% Conf . I nt er val ]
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - hombr e |
5283
. 4768124
. 0068717
. 4632655
. 490385
muj er |
5283
. 5231876
. 0068717
. 509615
. 5367345

ste resu ltado im plica qu e en la pob lacin con u n a con fian a del
el por cen ta
e d e om br es estar com pr en d ido en tre el 6 y el m ien tr as qu e el de m u
eres lo estar en tre el y el . om o pu ede fcilm en te apr eciarselos u n os son com p lem en tar ios de los otr os.

4..E
e r cicio s
. on e
em plos de variables que puedan considerarse nom inalesordinales o de
ra
n del cuestionario del barm etro de m ar
o de 2del
(cis2
.
2. btn del con
u n to d e datos an terior la d istr ib u cin de fr ecu en cias de la
com u n idad au tn om a y del tam a o del m u n icipio. n qu com u n id ades ay m ayor n m er o de en trevistadosn qu estrato se con cen tra la
m ayor p arte de los en tr evistadosu l sera la m ed ian a d el bitat
. n el b arm etr o de m ar o de 2d edicado a los trm ites adm in istr ativos d e los ciu dadan oscom o en la m ayor par te de las en cu estasexiste
u n a m n im a p resen cia de variab les cu an titativas. e este tip oen con cretoen el cu estion ar io del m en cion ado estu d io slo existen estrictam en te cu atr o var iablesu b icadas en d os p regu n tasla .2y la .. as

m o acer esta operacin se explica en el prxim o captulodedicado a la tran sform acin de variables.

04_Estadsticas.indd 114

06/06/12 09:20

ANLIS IS DE DATOS CON S TATA

tres var iables de la pr egu n ta 2son oras y m in u tos diar ios ded icad os
al tiem po libr e y su alter n ativa or as de ocio a la sem an a. a variab le
d e la p regu n ta (edad) se en cu en tr a p rcticam en te en todos los cu estion ar ios d irigidos a per son as. alcu la e in ter pr eta todos los estadsticos
con ven ien tes a las m en cion ad as var iables qu e an sid o abord ados en
este cap tu lo.
. n ese ficero tam b in existe u n a variab leden om in ada pesocu ya fu n cin es equ ilib rar (pon derar la m u estr a por sexo y ed ad . on str u ye u n a
tab la d e frecu en cias par a el sexo y u n su m ario de estad sticas p ara la
edad con y sin pon d er acin observan do las diferen cias. alo tam bin
p ara otra variab le n om in alotra or din al y otra d e in ter valo. aon a la
seleccin del tipo de pon d er acin .
. n ese m ism o bar m etro d e m aro de 2(ficer ocis2.
calcu la
los in tervalos d e con fian a p ar a la var iable edad (
.2
.
6. el m ism o ficer o obtn los in tervalos d e con fian
a bin om iales par a
la posesin de cad a u n o de los ap aratos dom sticos con ten idos en la
p regu n ta 2.

04_Estadsticas.indd 115

06/06/12 09:20

04_Estadsticas.indd 116

06/06/12 09:20

5
Ma n ip u la ci n
y
m o d ifica ci n
de
d atos
Este captu lo explica las transform aciones que pueden realizarse con Stata sobre la m atriz de datos. Se distin gu irn dos grandes tipos de transform aciones:
1.

Man ip u lacin de d atos: n o se pr od u ce n in g n cam bio en los datos


d e la m atrizsin o qu e los d atos son r eor den adosreagr u pad os o seleccion ados para r ealizar algu n a op er acin sob re ellos.
. Mod ificacin d e d atos: los datos de la m atr iz son m odificados. a
arios tipos posib les de m odificacin : gen er acin d e n u e
as
ar iab lesm od ificacin d e las a existen tes m od ificacion es d ir ectas sob re la m atr iz.

5 .1 .Ma n ip u la ci n
d e
d atos
E n n u m er osas ocasion es es pr eciso r eor den arr eagru p ar o seleccion ar los
d atos para realizar d eter m in ad as operacion es con ellos. Stata in corpor a ar ias in str u ccion es esp ecficas p ara estas op er acion es.

5.1.1.Orden acin
de
casos
a instruccin especfica de Stata para ordenar los casos es sort. Segn se
io
en un captulo anteriorla m atriz de datos se puede representar por una re
illa
en la que los casos son filas las
ariablescolum nas. eneralm enteel orden de
los casos no im porta: es igual que un caso aparezca el prim ero en la m atriz o el
ltim olo im portante son los
alores de las
ariables en todos cada uno de los
casos. eropara algunos procedim ientos estadsticoses necesario que los casos
estn dispuestos de una determ inada m anera. or e
em ploes necesario ordenar
los casossegn sus
alores en una determ inada
ariablepara realizar anlisis
paralelos de distintos segm entos de la m uestra con la preinstruccin by,
cuo
funcionam iento se
er m s adelanteen la seccin .1..
ar a or den ar los casos de m en or a m aor seg n los alores de u n a
ar iab leslo aqu e teclear sort
segu id o del n om b re d e la
ar iable en cu estin .
or e
em p losi se dispon e d e la ltim a m atriz d e d atos d el cap tu lo :

05_Manipulacin.indd 117

06/06/12 09:25

E S ME
S

11

ILUSTR ACIN
5 .1 .Ma t
i
d e
d a t o s
con
o co
ca so s
1.
2.
3.
4.
5.
6.
7.
8.

s exo
1
1
1
1
2
2
2
2

edad
20
21
23
.
19
20
22
24

si se desea ordenar por edadaque introducir las sigu ien tes rdenes:
u se ficeroclear
sort ed ad
list sexo ed adclean

on lo qu e los datos qu edarn ord en ad os d el sigu ien te m odo:


ILUSTR ACIN
5 ..R e su lt a d o s
d e
la
in st
u cci n
list d e s p u s
d e
o
d e n a ci n
p o

edad
1.
2.
3.
4.
5.
6.
7.
8.

sex o
Muj er
Muj er
Hombr e
Hombr e
Muj er
Hombr e
Muj er
Hombr e

edad
19
20
20
21
22
23
24
.

om o se pu ede erlos casos qu edan ord en ados d e m en or a m aoren


este e
em p lod el in d iidu o m s
o
en al de m aor edad en la m atr iz de
d atos. tese qu e au n alor perd idoqu e Stata a colocad o el ltim o en
la m atriz. E sto es as por qu e el p rogr am a asign a in ter n am en te los
alores
su per iores a los alor es per did osp or lo qu e los coloca al fin al en la or den acin au n qu e n u n ca los u tilice par a los procedim ien tos estad sticos 1 .
la in str u ccin sort se le pu ede especificar m s d e u n a ariab le p ara su
ord en acin . E n ese casoord en ar p rim er o los casos seg n su alor en la
p rim er a ariab ledespu s seg n su alor en la segu n d a ariab leetc. or
e
em p losi se escr ib e
sort sexo ed ad
list sexo ed adclean

1
a in stru ccin sort
es irre
ersible. n a
ez orden ados por un criterio n o se pu ede
ol
er
al anterior. Si se n ecesitaraabra qu e abrir de n u e
o el con
u n to de datos m ediante u se
u

05_Manipulacin.indd 118

06/06/12 09:25

ANLIS IS DE DATOS CON S TATA

11

el or den en qu e qu ed ar n los casos ser el sigu ien te:


ILUSTR ACIN
5 ..R e su lt a d o
de
la
in st
u cci n
list t
a s
o
d e n a c i n
p o

d o s
a
ia le s
1.
2.
3.
4.
5.
6.
7.
8.

s exo
Hombr e
Hombr e
Hombr e
Hombr e
Muj er
Muj er
Muj er
Muj er

edad
20
21
23
.
19
20
22
24

os alor es qu edan ord en ad os en fu n cin d el sexo pr im eroden tr o de


cada sexoen fu n cin de la edad.
a in stru ccin sort slo p u ede ord en ar los casos en ord en ascen den te

d e m en or a m aor
. Si se r equ ier e or den ar los casos de m aor a m en ora
d e r ecu r rirse a la in str u ccin gsort, qu e es u n a exten sin de sort
con m s
op cion es. Sigu ien d o con el e
em p lo an terior
gsort ed ad

o r d en a r a d e m a or a m en o r los ca sos seg n la ed a d . or otr o


la d o gsort ed a d p r od u ce exa cta m en te el m ism o r esu lta d o q u e sort
ed a d .
a or den gsort in cor pora u n par d e opcion es qu e pu eden r esu ltar tiles.
a opcin gen erate
n om br ede
ar iablecrea u n a n u e
a
ar iable con los
alor es 1 para cada caso seg n su or den en la ar iable por la qu e a
sido ord en ada. or e
em p lo:
gsort eda dgen era te
ord en ed ad
list sexo ed ad orden
edad clean

orden ar de n ue
o por la ariable con la que estu
ieran clasificados an teriorm en tesiem pre
cuan do esta existieracom o el n m ero de casopor e
em plo. Ms adelan te se expon e cm o
realizar esta operacin . tra posibilidad es la de crear u n a instan tn ea de los datos an tes de
orden arlos. ase seccin .1.

05_Manipulacin.indd 119

06/06/12 09:25

E S ME
S

r odu ce el sigu ien te r esu ltad o:


ILUSTR ACIN
5..R e s u lt a d o
de
la
in st
u c ci n
list co n
a
ia le
e n e
ada
co n
gs or t
1.
2.
3.
4.
5.
6.
7.
8.

s ex o
Muj er
Muj er
Hombr e
Hombr e
Muj er
Hombr e
Muj er
Hombr e

edad
19
20
20
21
22
23
24
.

or den_~d
1
2
2
3
4
5
6
7

tr a op cin qu e in cor por a gsort es m firstqu e coloca los


alores per did os en pr im er lu garen ez de en los ltim os de la ord en acin .

5.1.2.Seleccin
de
casos
ar a este fin Stata in cor pora dos su bin stru ccion esin e if. eciben este
n om b re p orqu e n o p u ed en apar ecer aislad assin o siem pre en con
u n cin
con algu n a otr a ord en . e este m odolas clu su las in o if acen qu e la in str u ccin a la qu e acom p a en slo se realice p ar a aqu ellos casos qu e se esp ecifiqu en en ella. ien en p u esefectos tem porales porqu e slo seleccion an
casos p ar a la in str u ccin don d e se in tr odu cen .
a su b in str u ccin in se u tiliza d el sigu ien te m odo:
in stru ccin in ra n go

on de in stru ccin in d ica la or den qu e se d esea qu e slo se e


ecu te en el
r an go de casos determ in ado. E l r an go se declar a u tilizan d o los n m er os de
caso. or e
em p losi en la m atr iz de sexo edad se qu ier e m ostr ar la edad
m edia d e los cin co pr im eros casosp u ede escribir se la sigu ien te or den :
su m m arize edad in 1

e este m od ose obten d ran los sigu ien tes estadsticos:

E n el caso de qu e se desee u na elim in acin perm an ente de casosa de u tilizarse la


in stru ccin dropsegu ida de las su bin stru ccion es de seleccin pertinentes. or e
em plodrop
in
1 borra de la m atriz de datos el prim er caso. si se gu arda el ficero ba
o el m ism o n om bre
con la in stru ccin save,
replaceeste caso qu edar elim inado para siem prea m en os qu e se
dispon ga de u na copia de respaldo.

05_Manipulacin.indd 120

06/06/12 09:25

ANLIS IS DE DATOS CON S TATA

11

ILUSTR ACIN
5.5 .Su m a
io
d e
una
a
ia le
con
se le c ci n
n um e
ada
d e
c a so s
Var i abl e |
Obs
Mean
St d. Dev.
Mi n
Max
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - edad |
5
20. 4
1. 140175
19
22

om o p u ed e f cilm en te a p r ecia r seel n m er o d e ob ser a cion es es


slo sob r e ella s se a n r ea liza d o los c lcu los d e la in str u ccin su m m a rize.
aqu e ten er en cu en ta qu e la seleccin d e casos con la su b in str u ccin
in d ep en deob iam en ted el ord en qu e ten gan los casos. os cin co p rim er os
casos de la m atr iz ser n d ifer en tes seg n la
ar iable con la qu e los casos
estn or den ados
con sort o gsortseg n el ord en
ascen den te o d escen d en ted e los casos. E n este casocom o los casos estn ord en ad os p or edad
de m en or a m aor
orden sort ed ad
lo qu e m u estra la ilu stracin .est
r eferid o a la edad de los cin co in d iidu os m s
en es.
om o se a istoel r an go de casos d e in se especifica con el n m er o
m en or del ran gosegu ido d e u n a b arr a (

del n m er o m aor
p or e
em p lopar a seleccion ar los cin co pr im eros casos1

. as letr as f l se p u eden
u tilizar p ara acer referen cia a los casos pr im ero (f ltim o (l
. os alor es
con sign os n egati
os ser n in ter pr etados p or Stata com o d istan cias d esd e el
fin al d e la m atriz. or e
em p losi se escr ibe
list sexo ed ad in
lclean

se ob tien e u n listad o de los ltim os cin co casos con su s corr esp on d ien tes
alores de sexo edad .
ILUSTR ACIN
5 ..List a d o
d e
ca so s
con
se le cc i n
nu m e
ada
fin a l
4.
5.
6.
7.
8.

sex o
Hombr e
Muj er
Hombr e
Muj er
Hombr e

edad
21
22
23
24
.

or otr o lad ola su bin str u ccin if perm ite especificar los casos qu e se
an a u tilizar para e
ecu tar u n a or den en fu n cin d e si cu m plen u n a d eterm in ada con dicin lgica. a for m a gen er al d e u so es:
in stru ccin if expresin

n stru ccin es la ord en qu e se solicitaepresin es la con d icin qu e


an de cu m plir los casos par a qu e les afecte el com an do.

05_Manipulacin.indd 121

06/06/12 09:25

E S ME
S

as expresion es con ten id as en la clu su la if p u ed en ser n u m r icas o lgicas. as exp resion es n u m r icas pu eden ser tan sim ples com o u n a con stan te o tan com ple
as com o u n en tram ado su cesio d e
ar iables o con stan tes
con ectad as con fu n cion es. E n el extrem o m s sen cillou n a exp resin n u m r ica es en r ealid ad u n n m er o qu e si adop ta el
alor d e exclu e del an lisis
e in clu e en el r esto de los su pu estos. E llo im p lica qu e si se escribe if la
in stru ccin n o se e
ecu ta con n in g n casom ien tr as qu e si se especifica if
-1 o if 1la or den se cu m p le para todos los casos. E n con secu en ciala
exp resin m s elem en tal detr s d el if con sta d e u n a con stan te o u n a ariab le n u m ricaexclu e d el an lisis a todos los casos con el alor en la
exp resin e in clu e a todos los qu e ten gan d istin ta circu n stan ciatam bin
situ acion es en las qu e la exp resin n u m rica esp ecificad a ten ga u n alor
p er did o.
a expr esin sigu ien te en trm in os d e sim p licida d es a qu ella repr esen ta da m ed ia n te u n a exp resin a r itm ticaqu e se com pon e d e
a r ia bles o

a lores con ecta dos m edian te oper ad ores o fu n cion es m a tem tica s qu e d an
lu ga r a u n solo alor n u m r ico. e este m odosi se escribier a la expr esin
list
if ar ia ble-
a r ia bleel r esu ltad o es qu e slo se m ostra r a n a qu ellos ca sos con a lor p er dido en la a riab le esp ecifica da a qu e a l r estar su con ten ido de s m ism ael resu lta do es siem pr e a m en os qu e con ten ga u n

a lor p er did o.
E n cu alqu ier casolo m s com n es qu e la expresin qu e siga a if sea
lgicaen lu gar de n u m rica. Se con sidera expresin lgica aqu ella qu e pu ede m ostrar dos
aloresfalso o ciertocom o resu ltado de em plear u n operador de relacin . as m s sim ples expresion es lgicas propiam en te dicas
son aqu ellas qu e se com pon en de dos expresion es aritm ticas u n idas por u n
operador de relacin .
os operador es d e r elacin p osibles son los sigu ien tes:

gu al qu e
Ma or qu e
Men or qu e
Ma or o igu al qu e
Men or o igu al qu e

o es igu a l qu e

tese que se a pu esto el sign o igu al dos eces segu idas. om o puede com probarse
m s adelanteesto no es u n error. ara Stata n o es lo m ism o el sign o igu alem pleado en operacion es m atem ticases igu al a por e
em ploqu e los dos sign os igu al segu idosu tilizados com o operador lgico. Si se quiere produ cir u n resu ltadoaqu e em plear u n sign osi
se desea acer u na com paracin se em plean los dos sign os segu idos. om o reglaen caso de
dudase puede pen sar si el sign o igu al pu ede ser reem plazado por el sm bolo en cuo caso
se deben in clu ir los dos sign os igu ales.

05_Manipulacin.indd 122

06/06/12 09:25

ANLIS IS DE DATOS CON S TATA

e este m odo se pod ra n gen er a r expr esion es p a ra seleccion a r ca sos


qu e cu m p lan d eterm in a d as con d icion es en u n a
a r ia ble o en u n a com bin a cin a r itm tica de ella s. or e
em p losi se desea seleccion a r slo a los
om b resab ra qu e escr ibir seo1. Si se qu ier e u n a n lisis esta d stico
d e los m a or es d e a osla expr esin d eb er a ser edad2. ta m bin
p u ed e in dica r se pibsepibag
2 pa r a lista rpor e
em p lolos pa ses con d ob le pr oporcin de pr odu ccin d e ser
icios qu e de b ien es a gra r ios.
in alm en telas exp resion es lgicas se pu eden m od ificar o con ectar en tre ellas m edian te op erador es lgicos. E stos son tr es: la con
u n cin
la
d isu n cin

qu e tien en p or m isin con ectar otras exp resion esu n ter cero

la n egacin cu o com etid o es el d e in ertir la er acidad o falsedad de


la expr esin a la qu e an teced e.
or e
em p losi se qu iere acer u n an lisis qu e in clu a slo a las m u
eres
con o m en os a osla in stru ccin en cu estin debe ir acom pa ada de la
exp resin if
seo2

edad2. ssi se d esea acer u n resu m en estadstico de la ed ad de las m u


er es
en es d e la m u estr aab r qu e escr ibir u n a
in stru ccin sim ilar a la sigu ien te:
su m m arize eda d if sexo eda d

E l r esu ltad o se referir al su bgru p o esp ecificadop er o se m ostr ar com o


si d e la m u estr a total se tratar a. Slo por el n m er o d e casos se podr a ded u cir qu e se a efectu ado la op er acin con u n filtro.
ILUSTR ACIN
5..Su m a
io
d e
una
a
ia le
co n
se le c ci n
co n d icio n a l
d e
c a so s
Var i abl e |
Obs
Mean
St d. Dev.
Mi n
Max
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - edad |
2
19. 5
. 7071068
19
20

E l or den de e
ecu cin d e los distin tos operador es es el sigu ien te: en pr im er lu garla n egacin lgicaexpr esad a sea con
sea con d esp u slas
fu n cion esa con tin u acin la n egacin ar itm tica
-
segu idam en telas oper acion es aritm ticas
di
isin
m u ltiplicacin
d espu s la -
resta

su m a
lu egolos op er adores r elacion ales

fin alm en te los op erador es lgicos


por este orden .
n e
em plo de la im p ortan cia d el or den de colocacin de los op erador es
se en cu en tr a cu an do se an de seleccion ar person as con m s d e a os
sean d el n or te
1o del su r

. Sip or e
em plola con dicin se expr esa d el
sigu ien te m od o
tab u late sexo if region 1 region edad

05_Manipulacin.indd 123

06/06/12 09:25

E S ME
S

se prod u cir u n resu lta do er rn eoa qu e elegir tan to a los su r e os


con m s de a osp or u n lad ocom op or el otroa todos los n orte os.
E s decirse e
ecu ta pr im ero la con
u n cin
d esp u s la d isu n cin

.
a ra qu e p u ed a efectu a r la opera cin a decu ad a m en te se deben u tiliza r
pa rn tesis qu e fu er cen a rea liza r con a n terior ida d la s opera cion es en ellos
in clu id os.
ta bu la te sexo if
region 1 region eda d

e este m od op rim ero se estim a si el caso es del n or te o d el su r desp u s se


u zga si ad em s es m aor d e a ospara seleccion ar slo a person as de estas d os r egion es m aores de esa edad .
ILUSTR ACIN
5 ..Ta u la ci n
d e
una
a
ia le
co n
se le cci n
c o n d icio n a l
d e
ca so s
Sex o |
Fr eq.
Per cent
Cum.
- - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - Hombr e |
3
60. 00
60. 00
Muj er |
2
40. 00
100. 00
- - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - Tot al |
5
100. 00

E l operador con trario a es


qu e sign ifica desigu al. E s til para
d escartar en u n an lisis o en u n listad o a los su
etos qu e n o p osean u n deter m in ado alor en u n a ar iable. ssi slo se qu iere m ostr ar el sexo de
qu ien es ten em os el n om b reabr qu e escr ibir la in str u ccin con la clu su la if n om b re

don de el par de com illas segu idas in dica u n alor


aco en
u n a ar iable d e texto. E n cam b iosi se u bier a em plead o com o filtr o u n a
ariab le n u m r icaab ra qu e aber u sad o el sign o pu n to
.
p ar a in dicar
u n caso sin alor o per did o.
list sexo n om bre if n om b re

ta bu la te sexo if ed ad
.

5.1..gru pacin
de
casos
E xiste u n a p r ein str u cci n esp ecia l (by

qu e p er m ite a gr u p a r lo s ca so s
seg n su s a lo r es en u n a o m s a r ia b les a cer qu e la in str u cci n
a la qu e a co m p a a n se e
ecu t e p o r sep a r a d o en ca d a u n o d e los gr u p os. a r a ello by
se esp ecifica a l p r in cip iosegu id o p or el n o m b r e d e
la a r ia b le p o r la cu a l se d esea segm en ta r el a n lisis d os p u n to s
:
.
r a s esa exp r esin se escr ib e la in str u cci n p er tin en te. E s n ecesa r io

05_Manipulacin.indd 124

06/06/12 09:25

ANLIS IS DE DATOS CON S TATA

o r d en a r p r eia m en te lo s ca so s seg n lo s a lor es d e la a r ia b le qu e con fo r m a lo s gr u p o sp a r a q u e fu n cio n e a d ecu a d a m en te el p r op sito d e la


p r ein str u cci n .
E n el casop or e
em plode qu e se qu iera ob ten er u n resu m en d e la
ar iable edad p ar a cada u n o de los sexosp or separad oaqu e efectu ar en
p rim er lu gar u n a ord en acin d e los casos por sexo:
sort sexo

os d atos qu edan as or den ad os por los alores d e sexo: p rim er olos


om b resdespu slas m u
eres
al estar cod ificadosrespectiam en tecon
los alor es 1
. con tin u acin abr qu e escrib ir la or den pr ecedid a por
la pr ein stru ccin by:
b sexo: su m m arize ed ad

e esta for m ael p rogram a se en carga de rep etir au tom ticam en te la


in stru ccin para om br es m u
eres:
ILUSTR ACIN
5..Su m a
io
d e
una
a
ia le
po

u pos
- > s ex o = Hombr e
Var i abl e |
Obs
Mean
St d. Dev.
Mi n
Max
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - edad |
3
21. 33333
1. 527525
20
23
---------------------------------------------------------------------------------- > s ex o = Muj er
Var i abl e |
Obs
Mean
St d. Dev.
Mi n
Max
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - edad |
4
21. 25
2. 217356
19
24

om o pu ed e apr eciar se en la ilu str acin .lo qu e ace Stata es e


ecu tar el com an d o su m m arize d os ecesu n a p ar a om b res otra par a m u
er esde m an er a totalm en te in depen d ien te en cada caso. E l pr efi
o by

ar iable
se pu ede u sar con casi cu alqu ier in stru ccin siem pr e r ealiza in depen d ien tem en te la ord en solicitad a sob re cad a u n o d e los gru p os defin idos por
la
ar iable especificada. or otr o ladotam b in con
ien e saber qu e p u ed e
esp ecificar se m s de u n a ariab le p ara obten er los cor respon d ien tes an lisis
cr u zados.
sort sexo region
b sexo region : su m m arize edad

05_Manipulacin.indd 125

06/06/12 09:25

E S ME
S

E l r esu ltado obten id o pr esen ta tan tos an lisis com o el pr odu cto d el n m ero d e alor es d e cada u n a de las ariab les im p licad as.
ILUSTR ACIN
5.1.Su m a
io
de
una
a
ia le
p o

u p o s
c o n fo
m a d o s
p o

d os
a
ia le s
---------------------------------------------------------------------------------- > s exo = Hombr e, r egi on = Nor t e
Var i abl e |
Obs
Mean
St d. Dev .
Mi n
Max
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - edad |
2
21. 5
2. 12132
20
23
---------------------------------------------------------------------------------- > s exo = Hombr e, r egi on = Sur
Var i abl e |
Obs
Mean
St d. Dev .
Mi n
Max
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - edad |
1
21
.
21
21
---------------------------------------------------------------------------------- > s exo = Muj er , r egi on = Nor t e
Var i abl e |
Obs
Mean
St d. Dev .
Mi n
Max
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - edad |
2
21. 5
3. 535534
19
24
---------------------------------------------------------------------------------- > s exo = Muj er , r egi on = Sur
Var i abl e |
Obs
Mean
St d. Dev .
Mi n
Max
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - edad |
2
21
1. 414214
20
22

l ten er sexo d os alor es


om bre m u
erregin tam bin
n orte
su r
con by
sexo regin se crean cu atro gr u pospar a cad a u n o de los cu ales
se e
ecu ta la in str u ccin su m m arize
ed ad.
ar a n o ten er qu e escrib ir la in str u ccin sort an tespu ede u tilizar se
bysort, en lu gar d e bycon el m ism o efecto fu n cin . slas d os ln eas
an terior es p odr an ab er se escrito en u n a sola de este m od o:
b sort sexo region : su m m arize ed ad

5.1..iceros
an cos
y
alargados
asta el m om en to slo se a tr atado con ficeros an cos. Son llam ados as
aqu ellos en los qu e todas las ariab les per ten ecien tes a u n su
eto se en cu en tr an en el m ism o r egistro o ln ea. E l e
em plo qu iz m s fr ecu en te fcil d e
com pr en d er par a su tr an sform acin a u n ficer o largo es el de u n con
u n to
d e p ases de los qu e se dispon e de la in for m acin de u n a serie d e a os. E n
el form ato an co cad a u n o de los a os se exp resa en diferen tes colu m n as.

05_Manipulacin.indd 126

06/06/12 09:25

ANLIS IS DE DATOS CON S TATA

Sean tres pases con in form acin en u n a ariable a lo largo de tres a os. E n
el sen cillo e
em plo qu e se em plea se u tilizan com o pases Espa aran cia e
talialos a os u n a
ariable com o el n m ero de estu dian tes.
u se p aisesan cosclear
listclean a bb reiate
1

Median te este listado pu ede obserarse qu e se trata de u n con


u n to de
datos con tres casos cu atro ariables
los tres a os m s el n om bre del pas
.
ILUSTR ACIN
5 .11 .List a d o
de
un
fice
o
a n c o
1.
2.
3.

pai s
Espaa
Fr anc i a
I t al i a

es t udi ant es 2005


7537
12315. 4
9408. 9

es t udi ant es2006


7529. 2
12320. 5
9464. 4

es t udi ant es 2007


7555. 7
12296
9500. 2

on er tirlo al for m ato alar gad o su pon d ra ten er n u e


e casos
los tr es
p ases por los tres a osr ed u cien d o las tr es ar iables an u ales a u n a sola.
Stata llam a i
a las ar iables cu o n ico alor d en ota u n a obseracin o
casolos p ases en este e
em p lo

en cam bioes la ar iable qu e den ota las


su b obseracion es rep etidaslos a os en esta ocasin .
a sin taxis p ara con ertir u n ficero an co en otro lar go sera.

e sa p e
lo n n u eaari
ob ser
acin

su b obseracin

aqu e ten er en cu en ta qu e la ariab le d en otad a com o observacin d eb e


existir literalm en te en el ficero la su b obseracin a de ser la ariable qu e
en el n u eo ficero con ten ga los distin tos a os
del al en este caso
por tan to con ien e den om in arla as: a o
. a ariab le exp resada com o n u evavar
estu dian tesse crear au tom ticam en te en la n u ea m atriz con el n om bre qu e ten a en la origin alau n qu e sin las cifras del a o. a n u ea estru ctu ra
de datos con ten dr el n m ero d e casos de partida m u ltip licad o p or el n m ero
de ariables tem porales
tres en este e
em p lou n a por cada a o
.
ar a ap licar la a los datos qu e se acaban de m en cion arlas in stru ccion es
qu e realizan la tr an sform acin la m u estr an son :
resap e lon g estu dian tesi
pais

a o
listclean

Se a a adido la opcin abbreviate


1para qu e Stata n o abre
ie los n om bres de las
ariables qu eden expresados de m odo com pleto. a orden list
los recorta por defecto a oco
caracteres.

05_Manipulacin.indd 127

06/06/12 09:25

E S ME
S

om o pu ed e ap reciarse a con tin u acin se an creado d os n u eas


ar iables: estu dian tes a osien do esta ltim a la qu e trip lica el tam a o d el
ficerop or cu an to qu e por cada pas ain for m acin d e tr es a os.
ILUSTR ACIN
5 .1.Co n e
si n
d e
un
fice
o
a n co
a
ot
o
a la
a d o
( not e: j = 2005 2006 2007)
Dat a
wi de
->
l ong
----------------------------------------------------------------------------Number of obs.
3
->
9
Number of v ar i abl es
4
->
3
j v ar i abl e ( 3 v al ues)
->
ao
x i j v ar i abl es:
est udi ant es 2005 es t udi ant es2006 est udi ant es 2007- >est udi ant es
----------------------------------------------------------------------------pai s
ao
es t udi ant es
1.
Es paa
2005
7537
2.
Es paa
2006
7529. 2
3.
Es paa
2007
7555. 7
4.
Fr anc i a
2005
12315. 4
5.
Fr anc i a
2006
12320. 5
6.
Fr anc i a
2007
12296
7.
I t al i a
2005
9408. 9
8.
I t al i a
2006
9464. 4
9.
I t al i a
2007
9500. 2

el m ism o m odo qu e se a cam biado u n ficero an co a otro lar gose


p u ed e r ealizar la op eracin in er sa: la d e con
er tir u n a m atriz larga en otra
an ca. om o las
ar iables cu m plen la m ism a fu n cin obser
acin su bobseracin con ten idola in stru ccin slo cam bia el ad
etio d e lon g por el
d e ide.
resap e id e estu dian tesi
p ais

a o

on
er tir a el ficero lar go a otro an co. E n este caso con cretoel r esu ltad o d e la in str u ccin ser a la u elta al ficer o in icial.

5..e n e
a ci n
y
m o d ifica ci n
d e
a
ia le s
E n m u cas ocasion es an d e tr an sform ar se los d atos porqu e el an lisis requ iere qu e se traba
e con ellos de for m a distin ta a com o se en cu en tr an registr ados en el or den ador. as razon es pu eden ser m u di
er sas. aste aqu
con citar slo algu n as de las m s fr ecu en tes.
E n pr im er lu gares u n caso com n qu e los d atos estn m al grabados
qu e se en cu en tre u n cdigo qu e n o existe. or e
em plosi al solicitar u n a
tab la d e distribu cin d e fr ecu en cias de la ar iable seoap ar ecen casos
com o om b res1com o m u
eres u n caso con u n alor n o etiqu etad o
igu al a es ob io qu e se tr ata de u n er ror de grabacin d eb e ser depu r ad o. E n otr as ocasion eses p reciso cam biar la escala de u n a ar iablecom o

05_Manipulacin.indd 128

06/06/12 09:25

ANLIS IS DE DATOS CON S TATA

es el caso d e qu e se ten ga el de u n a serie d e p ases exp resados en d lares se p refier a qu e apar ezcan en eu r os. am bin pu ede su ceder qu e se
d esee trab a
ar con u n a escala logartm icaen lu gar de la ar itm tica origin al
p or lo qu e deb e tran sfor m arse esta ltim a. tr o caso d e tr an sform acin es
cu an do se desea traba
ar con
ar iables estan d arizadasen lu gar d e las ar iables origin aleso cu an d o se qu ieren pr esen tar los datos d e u n a ariab le
cu an titatia r ecodificados en in ter
alos. p ar a p rosegu ir con u n a lista in ter m in ab le de razon es par a la tran sfor m acin d e ar iablespu ede tam bin
citar se el caso en qu e se d esee con str u ir u n a ar iable con u n a com b in acin
d e ariascom o cu an do se gen er a la clase social en fu n cin de la relacin
con la acti
idadla p rofesin los estu d ioso cu an d o d ebe ob ten er se la
p u n tu acin de u n a escala m ed ian te la su m a de la ser ie de tem s d e los qu e
se com pon e.
esd e u n pu n to de ista in stru m en tal p u ed en clasificar se las tran sform acion es de las ariab les en algeb raicasde equ i
alen cias lgicas. E n las
p rim er as se obtien en los n u eos alor es d e las ar iables m ed ian te la ap licacin de u n a o arias fu n cion es m atem ticas o estadsticasen las segu n das
las r eglas del cam b io se pr odu cen m edian te u n a serie d e igu aldad es en tre
los
alores an tigu os los alores n u eosen las lgicaslos cam b ios de
alor es
sean tran sfor m ados por u n a operacin algeb raica o p or u n a r ecodificacin se p rodu cen si slo si se cu m p len d eterm in ad as con d icion es. n
e
em plo fcil de las pr im er as ser a cu an d o se posee in for m acin del a o de
n acim ien to de u n a ser ie d e per son as se desea tr an sform ar en edad es. E n
tales circu n stan cias b asta con restarle al a o en qu e se tom ar on los datos
el d e la feca de n acim ien to. Si u n estu dio se izo en el a o es obio
qu e las per son as qu e n acieron en 1cu m plieron a os a lo lar go d e d ico a o. Si faltara la ariab le edadp odr a disp on er se d e u n a aproxim acin
m ed ian te esta op eracin . tr o e
em plo d e cam b ioesta ez de tran sfor m acin lgicasera en el caso d e qu e la ariab le estu iera grabad a en la
m on ed a d e cada pas se d eseara pasar a u n a n ica m on eda. E n esas circu n stan ciasab ra qu e m u ltiplicar pr cticam en te cada p as por u n n m er o d istin topor elloan tes de la op er acin aritm tica r equ eridaaqu e
exp on er la con dicin qu e a d e aplicarse. or e
em p loen el caso d e qu e el
p as ten ga com o m on eda el eu r oaqu e m u ltiplicar su alor del por

p ar a exp resarlo en tr m in os de la m on eda am er ican a.

5.2.1.
ran sform acion es
algebraicas
os com an dos m s im por tan tes de Stata par a gen erar m od ificar
ariables
m ed ian te op er acion es algebr aicas son gen erate replace. E l fu n cion am ien to
d e am bos es bsicam en te el m ism oslo qu e el pr im ero cr ea u n a n u ea ar iable le asign a
aloresel segu n do r eem p laza los alor es de u n a ar iable
existen te.

05_Manipulacin.indd 129

06/06/12 09:25

E S ME
S

ar a crear u n a n u ea
ar iable a de u tilizar se gen erated el sigu ien te
m od o:
e n e
a t e n u eaar exp resin

om o es fcil inferiraqu se usa slo u n signo de igual

n o dos
com o
en las com p ar acion es lgicasp orqu e en esta ocasin se trata de asign aren
lu gar de com pararu n alor a u n a ar iable. E n Statau n sign o d e igu al se
u tiliza p ar a asign ar
alores a u n a
ar iabled os sign os de igu al sign ifican
es igu al qu e.
la or a d e escr ib ir la in str u cci n en lu ga r d e exp r esin a qu e
in tr od u cir cu a lqu ier fr m u la m a tem tica d esd e u n a co n sta n te
un nm er o qu e ser igu a l p a r a tod os los ca sosa sta u n a fu n cin o a r ia s
fu n cion esp a sa n d o p or la s op er a cion es a r itm tica s b sica scom o son
la su m a

la r esta
-
la m u ltip lica cin
la d i
isin

. a n se
a lgu n os e
em p los:
u se pa n elclear
gen era te tota l 1

r ea u n a ariab le om e
or dicou n a con stan te asign ada a todos los
casos con el
alor 1. E n cam b iola sigu ien te in str u ccin
gen era te ed ad- a on a cim ien to

gen era u n a ariab le llam ada edadqu e expr esa la diferen cia en tre
el a o en el qu e se recoge la in for m acin el a o de n acim ien to d e cada
in d iidu ocon lo qu e se ob tien en los a os qu e se cu m p len en algu n o d e los
d oce m eses de .
a in stru ccin replace fu n cion a exactam en te igu al qu e gen eratepero
d eb e em plear se con
ariables a existen tes. om o a est defin ida la ariab le edadp ara tr an sform ar la a fin d e exp resar el a o adecu ad o in clu so para
los qu e n o celeb rar on a n su cu m plea os en el m es de la en cu estaabr a
qu e em p lear la or den replaceen lu gar d e gen erate
repla ce ed ad -a on a cim ien to-1 if m esn acim ien to
list m esn acim ien to a on a cim ien to ed ad in 1
clean

E n este ltim o e
em plo con ien e adertir qu e tan to gen erate com om s
fr ecu en tem en tereplace pu eden ir acom p a ad as p or la clu su la ifr ealizn -

05_Manipulacin.indd 130

06/06/12 09:25

ANLIS IS DE DATOS CON S TATA

11

d ose de este m od o la operacin slo en aqu ellos casos qu e cu m p lan la


con dicin expr esad a . on la aqu exp resadael a o d e n acim ien to d ism in u e en u n a u n id ad para aqu ellos qu e aan n acido despu s de feb rer o

m esn acim ien to2


porqu e abin d ose eco la en cu esta a fin ales de d ico
m esa n n o an cu m plid o a os d u ran te el a o de la en cu esta. E n otr as pa labr asalgu ien qu e el pr im ero de m ar zo di
era qu e n aci en 1ten dr a
a ossi a u bier a celebr ad o su cu m plea oses decirsi u b iera n acid o en
en ero o feb reroper o si n o u b iera celeb rado a n su cu m p lea osten dr a
a n pu es cu m p lira los en el tiem p o qu e restar a d el a o. e los cin co
casos listad os en la ilu str acin .1los d os ltim os se en cu en tran en el pr im er su p u estom ien tr as qu e los tres pr im eros a n n o cu m p lieron su s a os
en d e a qu e la su m a d el a o la ed ad n o su m en sin o 1.
ILUSTR ACIN
5 .1.List a d o
de
la s
a
ia le s
m es, a on a cim ien to
y ed a d
en
lo s
cin co
p
im e
o s
ca s o s
1.
2.
3.
4.
5.

mesnac ~o
12
5
5
2
2

aonac~o
1965
1962
1980
1940
1973

edad
34
37
19
60
27

tr os e
em p los tiles son las tr an sform acion es de p oten cia de las ariab les cu an titatias con el fin de d ar cu en ta de r elacion es n o lin eales en tre los
d atos. as m s frecu en tes en este sen tid o son el cu adr ad o el logaritm o. E n
Statatran sfor m ar d e estos m odos u n a ariab le es tan fcil com o escr ib ir las
sigu ien tes in stru ccion es.
gen erate ed ad ceda d
gen erate ln ed ad ln
ed ad
list edad ed ad c ln eda d in -
lclean

E n este caso se p u ed e er el resu ltado de estas dos tran sfor m acion es en


los tr es ltim os casos d el ficero.
ILUSTR ACIN
5 .1 .List a d o
pa
c ia l
d e
la s
t
a n sfo
m a cio n e s
cu a d
t ica
y
lo a
t m ica
de
la
ed ad
5281.
5282.
5283.

edad
46
28
58

edadc
2116
784
3364

l nedad
3. 828641
3. 332205
4. 060443

Ms detalles de este u so del if


en in stru ccion es generate
replace
se presen tan en la
seccin ...

05_Manipulacin.indd 131

06/06/12 09:25

E S ME
S

a s exp r esion es m a tem tica s qu e se p u ed en u tiliza r en gen era te


repla ce p u ed en com p lica r se ta n to com o se qu ier a . Siem p r e qu e se r equ ier a a qu e u tiliza r p a r n tesis p a r a qu e la s op er a cion es se r ea licen
en el or d en d esea d o. om o es r egla m a tem tica e in for m tica a b itu a l
en tod a exp r esin p r im er o se ca lcu la n los p a r n tesislu ego la s p oten cia s

d esp u s la s fu n cion es ln

p or e
em p lolu ego m u ltip lica cion es o
d i
ision es
fin a lm en tela s su m a s o r esta s. en ca so d e qu e a a op er a cion es en el m ism o n i
else r ea liza n p r im er o la s qu e se en cu en tr en a
la izqu ier d a .
E s ob io q u e ta n to gen era te com o replace
p er m iten el u so d e fu n cion es m a tem tica s esp ecia les in co r p o r a d a s p o r Sta ta . a r a u n a lista
co m p leta d e ca d a u n a d e ella sse r eco m ien d a a cer u so d e la a u d a d e
fu n ction s.
elp fu n ction s

E n ella a p a r ece u n a lista d e su b fu n cion es d e la s qu e se p u ed e


ol
er
a p ed ir a u d a a d icion a l. a lista d e estos gr u p os d e op er a cion es p osib le
es la sigu ien te: m a tem tica s (m a t
fu n ction s
p r ob a b ilstica s (den sity

a lea tor ia s (ra n dom


textu a les (strin g
p r ogr a m a d or a s (progra m m in g

d e feca (da te
a n d
tim e
d e ser ies tem p or a les (tim e-seriesm a tr icia les
(m a tri
.

or e
em p lou n a fu n cin m u til es ru n iform

qu e sire par a crear


ariab les con alores p seu d oaleatorios con tin u os qu e
ar an en tre 1.
or a bien los alor es cr ead os por esta fu n cin pu ed en ser m odificados por
m edio de u n a fu n cin m atem tica par a cam biar su s in ter alos a fin de qu e
se ad apten m e
or a las n ecesidades del an alista.
or e
em plosi se desea gen erar p ar a cad a caso u n a ariab le con alor es
aleator ios en ter os en tr e 1 1p u eden u tilizar se las dos sigu ien tes in str u ccion es:
set seed 1
gen era te n a lea t in t
ru n iform

1
1

a or den set
seed
n se u sa par a cam biar la sem illa d e aleator izacin
qu e gen era la ser ie de n m er os aleator ios. Slo es acon se
able in trodu cir la
cu an d o se desee gen erar el m ism o con
u n to de n m eros aleatorios en m ltiples repeticion es d e u n pr ogr am aa qu ecaso d e qu e n o se exp licitela
fu n cin de gen eracin aleatoria pr odu ce con
u n tos d ifer en tes de n m eros
aleator ios.

05_Manipulacin.indd 132

un qu e esta fu ncin n o u tilice parm etrossiem pre a de ir segu ida de los parn tesis.

06/06/12 09:25

ANLIS IS DE DATOS CON S TATA

E xisten m u cas otr as p osibilid ades de gen eracin d e ariab les aleator ias. om o e
em p los m s u su ales pu eden citarse la gen er acin de n m eros
b in om iales d iscretos m ed ian te rbin om ial
n
p
o la p rodu ccin de u n a ar iable aleator ia con tin u a con d istr ib u cin n or m al rn orm al

m ed iadesiacin
tiles p ara la sim u lacin o la ad icin a datos em p r icos d e er ror es
aleatorios con u n a determ in ada distrib u cin .
gen erate aleatoriobin om ial in t
rb in om ia l

.
gen erate aleatorion orm alrn orm al

list n aleat a lea toriobin om ial aleatorion orm al in 1


clean abbreiate
n oobs

on la pr im era expr esin se creara u n a n u ea ar iable con alor es d iscr etos com p ren didos en tr e el el con m ed ia
n pdesiacin tp ica
1
n p
1-p

m ien tras qu e con la segu n da se gen er ar a u n a ar iable con tin u a


n or m al con m ed ia desiacin tpica .
ILUSTR ACIN
5 .15 .List a d o
pa
cia l
de
lo s
n m e
o s
a le a t o
io s
o t e n id o s
nal eat
56
20
5

al eat or i o_bi nomi al


2
1
0

al eat or i o_nor mal


1. 69696
3. 540512
5. 576273

n a exp resin u tilizab le en los com an dos de gen er acin o m odificacin


de
ariables es n qu e sire p ara acer referen cia al n m ero d e or den del
caso actu al en la m atr iz d e d atos. u ed e u sarsep or e
em p loen la in stru ccin gen erate para crear u n a ariab le qu e exp rese la p osicin d el in d iidu o
en el ficer ocon el posib le fin de deoler el or den in icialdesp u s d e u n a
or den acin p or otro criterio.
list sexo ed ad in 1

gen erate orden


n
sort eda d
list sexo ed ad in 1

sort ord en
list sexo ed ad in 1

Si el lector desarrolla este e


em plo en su orden adorad
ertir que slo le coin cide la
prim era colu m n a n o las dos ltim as. E sto ocu rre porqu e la sem illa de aleatorizacin slo
afecta a la orden in m ediatam en te posterior. Si se u bieran deseado n m eros aleatorios estables
bin om iales norm alesabra qu e aberlos precedidorespecti
am en tede la in stru ccin set
seed con o sin idn tica con stan te. ru ebe a acerlo de n u e
orepitiendo la instru ccin con la
m ism a sem illa para obten er los m ism os resultados qu e la ilu stracin .1.

05_Manipulacin.indd 133

06/06/12 09:25

E S ME
S

5.2.2.
ran sform acion es
de
eu ivalen cia
as m od ificacion es de equ ialen cia son aqu ellas en las qu e a difer en tes con
u n tos de
alores an tigu os d e u n a ariab le se les ace cor respon der d istin tos
alor es n u e
os. E n el fon dose trata d e lo m ism o qu e r ealiza la in str u ccin
replacepero en lu gar de ap licar los cam bios con u n a fu n cin lo ace con
u n a ser ie de equ i
alen cias en tre los
alores an tigu os
aalos alores
n u e
os
n u eo
alor
. a or den n ecesar ia p ar a acer esto en Stata es recode
cu a sin taxis gen er al es la sigu ien te:

e co d e listaariables
aanu eoalor
aanu eoalor

in t o
n ueaariable

E sta in str u ccin p u ed e em plear sepor ellod e dos m an eras: u n apara


alterar u n a ariab le existen teotrap ar a crear u n a n u e
a ariab lecon la
opcin in to

a partir d e los
alores de la an tigu a.
n e
em plo m u ab itu al de u tilizacin de esta in str u ccin es cu an do se
a detectado u n a m ala grab acin d e datos. aeces qu e se en cu en tr an u n
p ar d e casos con cdigos qu e n o cor respon d en a n in gu n a de las op cion es
d e r esp u esta p osiblescom o cu an do en la ariab le seo
codificada con
los alor es 1 se en cu en tr en alor es com o el el . E sta es bu en a
ocasin p ar a tran sfor m ar los er rores en casos p erdidos de m odo sim ilar al
sigu ien te:
u se pa n elbclea r
recod e sexo

..

e este m odo la ariab le seo


slo qu eda in alterada en el sen tid o de qu e
los casos cod ificados con u n alor d e o su perior pasan a ser con siderad os
com o perd idos p or el sistem a. E l resto d e los alores perm an ecen id n ticos.
tr o e
em p lo fr ecu en te es el ca m b io d e u n a escala d e ier t. u a n d o
se d eseen in er tir los tem s d e m od o ta l qu e en u n a esca la d el 1 al este
ltim o p a se a ser el m s b a
o el p r im er o el m s altoen ton ces es p er tin en te el em p leo d e esta or d en qu e p u ed e u sar se a l m ism o tiem p o en u n
con
u n to d e a r ia b les siem p r e cu an d o la s tr a n sfor m acion es se sep ar en
en tr e p a r n tesis.

ecu rdese qu e la barra

sign ifica asta que el


alor perdido se representa com o
u n pu nto es con siderado por Stata com o el
alor m s alto posible. or ello
. significa desde
el asta el alor m aorcasos perdidos in cluidos. E n tre otras palabras cla
e posibles se en cu entran m in
m a
con significados respecti
os de alor m n im o m xim o.

a de n otarse qu e al tratarse de u na tran sform acin linealesta operacin tam bin podra acerse con la in stru ccin replace. oncretam en tem edian te la expresin item 1-item 1
pero recode
ofrece la
enta
a de poderlo aplicar en la m ism a ln ea a u n con
u n to de
ariables.

05_Manipulacin.indd 134

06/06/12 09:25

ANLIS IS DE DATOS CON S TATA

recod e p1 p p
1

dem s de exp resar u n a lista segu id a d e los alor es desead os


1

tam bin p u ed en ap ar ecer expr esion es en


aa
alor es an tigu oscomo
1

qu e tr an sform a todos los alor es en tr e 1 en . sim ism o


p u ed en cam biar se los alores per did os u tilizan d o la palab ra clae m issin g
los casos lid os n o u tilizados en otr as tran sfor m acion essi se em plea
n on m issin glos alor es m n im o m xim om ed ian te m in m a, r esp ectiam en tefin alm en te tam b in pu ede u tilizarse else
p ar a referirse a todo lo
qu e n o a sid o cam biad o m ed ian te otras equ i
alen cias.
or e
em plosi qu ier e r ecodificarse la ed ad en cu atr o gr u p osp u ede escr ibirse u n a in stru ccin sim ilar a la sigu ien te:
recod e ed ad
m in
1

m a x
else.
in to
ed ad r

dem ssi se deseap u ed en pon erse etiqu etas d e alor es a la n u ea ar iable en la m ism a or den de recodificacin . ara realizar lola in stru ccin
an ter ior deb er a con ertirse en esta otra:
recod e ed ad
m in
1
asta

1

1-

m ax
Mas de

else.
in to
ed ad r

e este m od otr as pedir u n a d istr ibu cin d e frecu en cias m ed ian te la


in stru ccin sigu ien te

tab u late ed ad r

se obten d ra u n a tabla con los


alores recodificad os de la edad d el
sigu ien te ten or:
ILUSTR ACIN
5.1.Ta u la c i n
de
una
a
ia le

e co d ific a d a
RECODE of |
edadr 2|
Fr eq.
Per c ent
Cum.
- - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - Has t a 35 |
1, 902
36. 00
36. 00
36- 50 |
1, 264
23. 93
59. 93
51- 65 |
1, 096
20. 75
80. 67
Mas de 65 |
1, 021
19. 33
100. 00
- - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - Tot al |
5, 283
100. 00

05_Manipulacin.indd 135

06/06/12 09:25

E S ME
S

5.2..
ran sform acion es
lgicas
E n otr a s oca sion espa r a obten er u n a d eter m in a da tr an sform a cin d e los

a lores d e u n a o
a r ia s
a ria b lesson n ecesar ia s u n a o
a r ia s opera cion es
lgica s ap licad a s a la s in stru ccion es qu e se aca ba n d e a n a lizar. or ello

a n a ser a n aliza dos a qu todos aqu ellos ca m b ios en las


a ria b les qu e slo
tien en lu gar cu a n do se cu m p len u n a o u n a ser ie d eter m in a d a d e con d icion es. a da u n a de ella s requ iere u n a in str u ccin con d icion ad a con u n a
cl u su la d e seleccin qu e ser en la m a or pa r te de los ca sos u n con d icion a l1.
E l e
em plo m s sen cillo d e tran sfor m acin lgica se p rodu ce cu an do se
asign a u n a con stan te a u n a n u ea o an tigu a ariab le p ar a tod os aqu ellos
casos qu e satisfagan u n a con d icin .
m agn esep or e
em p loqu e se n ecesite
d ar el alor 1 en la
ar iable
oven a todos aqu ellos in d iid u os qu e ten gan
en la
ariable edad u n
alor in fer ior o igu al a . E n d ico casob astara
escr ib ir la sigu ien te in stru ccin .
gen era te
o
en 1 if ed ad

E s con
en ien te adertir de qu e con la in str u ccin an ter ior se cr ea u n a
n u e
a ariab le llam ada
oven qu e tien e el alor 1 en tod os aqu ellos casos
en los qu e el alor d e la ed ad sea igu al o m en or qu e a osen tan to qu e
ten dr el
alor p erd ido
.en el resto de los casosa qu e n o an sido d efin id os an ter ior m en te. r u eba de ello es el r esu ltad o de aplicarle la in str u ccin
su m m arize
a la ariab le
oven .
ILUSTR ACIN
5.1 .Su m a
io
d e
la
a
ia le
jo ven t
a s
su
c
e a c i n
Var i abl e |
Obs
Mean
St d. Dev .
Mi n
Max
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - j ov en |
1356
1
0
1
1

E n la m u estr a a la qu e se a a plicad o la in stru ccin a1.

en es.
or ellola
a ria b le
oven tien e 1.ca sos con m edia n ico
a lor igu a l
a 1. Sia con tin u a cin se p recisa otor gar el
a lor a los qu e tien en m s
de a ospu ede segu irse u tiliza n do la clu su la ifp ero com o a est
cr ead a la
a riab lea or a a qu e a p lica r la in stru ccin repla ceen lu ga r de
gen era te. M s con cr eta m en tela in str u ccin d eb er a ser escr ita d el sigu ien te m odo:

1
E n lu ga r d e u n a cl u su la con d icion a lse p u ed e ta m b in a cer u so d e u n con d icion a n te en fu n cin d el n m er o d e ca sos
in 1
1
. om o qu ier a qu e este ta m b in p u ed e
exp r esa r se com o u n con d icion a l
if n 1p or e
em p lo
slo se a r m en cin a la s d el
pr im er tip o.

05_Manipulacin.indd 136

06/06/12 09:25

ANLIS IS DE DATOS CON S TATA

replace
oen if edad eda d.

a segu n d a con d icin a ad ida a la pr im era es n ecesaria p ara qu e n o


atr ib u a el alor a la ariab le
oven en aqu ellos casos
los p er did osa los
qu e falta el dato de la ar iable ed ad.
on ellotr as las dos in str u ccion es con d icion adas an ter ior esu n su m ar io de la n u e
a ar iable
oven apor tara el sigu ien te resu ltado:
ILUSTR ACIN
5 .1.Su m a
io
d e
una
a
ia le
t
a s
su
t
a n sfo
m a c i n
Var i abl e |
Obs
Mean
St d. Dev .
Mi n
Max
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - j ov en |
5283
. 2566723
. 4368384
0
1

l tratar se de u n a ariab le ficticia d icotm icala m edia in d ica la p rop orcin de


en es qu e aen la m u estr a la d esiacin tpica es la r az
cu adr ad a d e p
1-p
.
on u n con ocim ien to de la lgica d e fu n cion am ien to d e las exp resion es
d e Statalas dos in stru ccion es an ter iores pu eden r ed u cirse a u n a solasi se
gen er a la n u ea ar iable con u n a expresin lgica segu id a de u n a clu su la
con dicion al. u iere ello d ecir qu e n o se dan los alor es 1 a la n u ea
ariab lesin o u n a expr esin lgica con d os estados posib les

erd adero1
falso
edaden este casoescr ita en tr e p ar n tesis para m aor clar id ad au n qu e p odr an elim in arse. E s m u con en ien te tam b in a adir a la
in stru ccin la clu su la if
p ar a eitar qu e pon ga el alor a los casos perd id os 11.
gen erate
oen
eda dif ed ad.

u a n d o en la s tr a n sfor m a cion es se n ecesita m s d e u n a


a r ia b lees
in eita b le el u so d e la con d icin ifcom op or e
em p loen el ca so d e
qu e se d esee u n a a r ia b le com p u esta d e seo eda d qu e con ten ga los
sigu ien tes a lor es: om b r es

en esm u
er es
en esom b r es m a or es
m u
er es m a or es. a r a gen er a r u n a a r ia b le con estos cu a tr o a lor es
ta b u la r la con la s cor r esp on d ien tes etiqu eta sser a n n ecesa r ia s esta s siete
ln ea s:

11
tra m anera de realizar la m ism a operacin es m ediante la in struccin recode
con tres
cam bios: uno para los alores otro para los alores 1
finalm enteun tercero para alores
perdidos:

r ecode edad ( 18/ 30=1) ( 31/ 98=0) ( el s e=. ) , i nt o( j ov en3)

05_Manipulacin.indd 137

06/06/12 09:25

E S ME
S

gen era te sexeda d1 if sexo1 ed ad


repla ce sexeda dif sexo ed ad
repla ce sexeda dif sexo1 ed ad eda d.
repla ce sexeda dif sexo ed ad ed ad.
la bel defin e sexedad 1

oen om bre

oen m u
er

om b re m aor
Mu
er m aor
la bel
a lu e sexedad sexed ad
ta bu la te sexeda d

p artir de las cu ales se m ostrar a la tabla sigu ien te:


ILUSTR ACIN
5 .1 .Ta u la ci n
d e
una
a
ia le
co m p u e st a
sex edad |
Fr eq.
Per c ent
Cum.
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - J ov en hombr e |
690
13. 06
13. 06
Jov en muj er |
666
12. 61
25. 67
Hombr e may or |
1, 829
34. 62
60. 29
Muj er may or |
2, 098
39. 71
100. 00
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - Tot al |
5, 283
100. 00

Sin em bar gocon algo de p rctica e im agin acin las p rim er as cu atro
ln eas p od ran aber se r ed u cido a d os d e este m odo:
gen era te sexeda dsexoif ed ad.
repla ce sexeda dsexo if ed ad

E s obio qu e todo lo se alado en el apar tado .1.sobr e las expr esion es


lgicas es aplicable en este con textotan to para las in stru ccion es qu e gen er an o reem plazan ar iables com o en aqu ellas qu e tr an sform an alores.
ar a m ostr ar la
er satilidad del len gu a
ea con tin u acin se r ealiza la
m ism a operacin de la qu e a se an dado dos p roced im ien tosp er o esta
ez u tilizan do la in stru ccin qu e recod ifica alor es.
recod e sexo 1in to
sexeda d
recod e sexedad 1 if ed ad

n clu so u n a sola ln ea d e cd igo p odr a gen er ar en las m ism as con dicion es la n u e


a
ar iableem p lean do la fu n cin con d,
qu e con sta de con dicin
dos expr esion esla pr im era para cu an d o la pr em isa es
er dadera la segu n da par a cu an do es falsa. E s con
en ien te a adir u n if
para n o d ar alores
lid os a casos d e los qu e n o se d ispon e de in form acin en la ariab le d e la

05_Manipulacin.indd 138

06/06/12 09:25

ANLIS IS DE DATOS CON S TATA

con dicin cu an d o se em plean los oper ad ores m aor o m en or qu eau n qu e


en este caso con cr eto n o es n ecesario p or qu e en tod os los casos se posee
in form acin de la edad.
gen erate sexed adcon d
ed ad
sexo
sexoif edad .

5.2..
ran sform acion es
eten didas
u n qu e en las pgin as an ter iores se aan d escr ito explicado las m s elem en tales in stru ccion es tran sfor m adorasel r epertor io d e Stata n o se agota
con estas. E n este apartad o se apor tan u n os pocos e
em p los u su alesseleccion ados en tre otras m u cas otr as tr an sform acion es factibles m edian te la
in stru ccin egen aried ad d e gen eratep re
iam en te explicada en ..1qu e
p erm ite el em pleo d e fu n cion es m s com ple
as de lo qu e perm ita aqu ella
en con tr apartid aslo pu ed e u tilizarse u n a slo u n a de estas fu n cion es sob re u n a ar iable o sobr e u n a lista de ariab les existen tes. Su sin taxis gen eral
es la sigu ien te:
e e n n u e
a
ariab lefu n c
lista
a r
if expresin
in ran go
opcion es

E xiste u n a am plia aried ad d e oper acion es p osiblesfu n cion es (fu n c


,
co n est a in str u cci n 1. a s m s tiles sim p les p a r a el a n lisis so n
an ycou n tstd la fam ilia d e op er acion es ro.
a fu n cin an ycou n t sir
e p ara crear u n a n u e
a ariab le con sisten te en
el r ecu en to en cada su
eto del n m ero de ariab les en las qu e a con testad o
u n deter m in ado su bcon
u n to d e alores especificados. or e
em plosi se
qu isier a obten er el n m er o d e tem s con los qu e u n su
eto a m an ifestad o
estar de acu erd o
o m u d e acu er do
1
deb er a escribir se u n a in stru ccin del sigu ien te ten or.
egen acu erdosan cou n t
p 1-p
alu es
1

E l resu ltado arro


ado es u n a ariable con alores com pren d idos en tre
para cad a su
etoen fu n cin del n m ero de u n os o d oses qu e ten ga en las
cu atro ariab les im p licad as. os su
etos con seran aqu ellos qu e n o se an
m an ifestad o faorablem en te a n in gu n a d e las cu atro p regu n tasm ien tras qu e
aqu ellos qu e aan m ostrado aqu iescen cia total ten d rn el alor d e .
1
an se para ello las au das del program a (elp
egen o las pginas 1-1de la gu a
de gestin de datos
Stata11d
.

05_Manipulacin.indd 139

06/06/12 09:25

E S ME
S

tr a fu n cin p resen te en egen es stdqu e per m ite estan d arizar u n a ar iable cu an titatia olo qu e es lo m ism or ealizar le u n a tr an sform acin lin eal p ar a qu e ten ga la m edia la desiacin tpica deseadasien dor esp ecti
am en te1 los
alores m s com u n es los establecidos por defecto. Su
for m a es:
e e n n u eaarst d
exp resion
m e a n
s t d

e este m odosi se d esea estan dar izar la ariab le edadla in str u ccin
qu e d ebera escr ib irse sera algo sim ilar a:
egen E d ad Sta n dard std
ed ad
su m m arize E d ad Sta n d ard

a segu n da ord en p erm itir a com p rob ar qu e la m edia es cercan a a


la des
iacin tpica a 1 qu e am aores desiacion es p or en cim a de la
m edia
m xim o
qu e por d eb a
o de ella
m n im o-1

:
ILUSTR ACIN
5 ..Su m a
io
de
la
e st a n d a
ia ci n
d e
una
a
ia le
Var i abl e |
Obs
Mean
St d. Dev .
Mi n
Max
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - EdadSt andar d |
5283
- 3. 06e- 09
1 - 1. 521336
2. 667577

in alm en teson tam b in tiles las fu n cion es ro. E stas calcu lan estad sticos or izon talm en te
en tre ariab les
m s qu e er ticalm en tecom o lo
acen las in str u ccion es tp icasp or e
em p lola qu e se acaba de em p lear
su m m arize.
u n to con rop u eden em p lear se las sigu ien tes op er acion es:
first,
last,
m in ,
m a,
total,
m ean ,
sd,
m iss n on m iss.
a ra
er su u tilid a d se m u estr a u n e
em plo a pa rtir de la s cu a tro
a ria bles escala sob re la pa rticipa cin poltica
p 1-p
pr e
iam en te con
er tid as p a ra qu e en tod as ellas los
alores se en cu en tr en en la m ism a
dir eccin
p or e
em ploa m aor ap a ta p oltica m a or p u n tu a cin p a ra
qu e los
alor es
o sa be
o con testa figu r en com o
a lor es perd idos 1.

1
esde la
ersin Stata adm ite asta
alores perdidos. dem s del pu n to
.

pu eden con sider arse


alores in
lidos aqu ellos com pu estos por u n pu nto segu ido de u no de
los
ein tisis caracter es sen cillos en m in scu la del alfabeto. e este m odoal o sabe al
o contesta se les pueden dar dos cdigos distin gu ibles perdidos al m ism o tiem po. ar a

er los
alores per didos en u n a tabu lacinse debe a adir la opcin m issin g
a la in stru ccin
tabu late.

05_Manipulacin.indd 140

06/06/12 09:25

ANLIS IS DE DATOS CON S TATA

11

recod e p1 p p
1

1
recod e p1-p
.a

.b
egen totalrototal
p1-p
m issin g
egen prom ed iorom ean
p 1-p
egen perdidosrom iss
p1-p
su m m arize tota l prom ed io perdidos

E n el resu ltado la ariab le total in dica la su m a de los cu atr o tem s. l


ab er pu esto la opcin m issin glos su
etos qu e n o aan r esp on d id o a n in gu n o d e los cu atr o en u n ciad os se catalogan com o casos perd idos. Sin em b argoasu
etos qu e slo tien en u n p u n toporqu e an r esp on did o con ese
cdigo slo a u n a d e las pr egu n tas. Su ele ser m s tilp or ellosolicitar la
m ed ia (rom ean
p orqu e el total es diid id o p or el n m er o de resp u estas
lidas. E n con secu en ciaen la estadstica p ertin en telos
alores m n im os
d e la ar iable p rom edio estn com p ren did os en tr e 1 en tan to qu e la
m ed ia d el pr om edio

n o coin cid e con la d e total

d iidid a p or .
in alm en tela ariab le perdidos
n m ero de n o con testacion es por in d iid u otien e com o lm ites el el . E l pr im ero es asign ad o a toda person a
en tr e
istada qu e con test a las cu atro afir m acion esel alor m xim o cor resp on d e a qu ien es n o respon d ieron a n in gu n a.
ILUSTR ACIN
5.1 .Su m a
io
de
a
ia le s
o t e n id a s
co n
m o d a lid a d e s
r ow
d e
egen
Var i abl e |
Obs
Mean
St d. Dev.
Mi n
Max
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - t ot al |
5167
9. 680085
2. 270354
1
16
pr omedi o |
5167
2. 575882
. 5283285
1
4
per di dos |
5283
. 3043725
. 7732964
0
4

5 ..Ca
a ct e
st ica s
e
in st
u ccio n e s
e sp e cia le s
Se acab ar este cap tu lo exp lican d o escu etam en te algu n as d e las car acter sticas especiales d e Stataqu e sern tiles para an lisis estadsticos qu e
ser n abor dados m s adelan te.
a p rim er a de ellas es la capacidad qu e tien en algu n as in str u ccion es
d e gu ar dar parte de su s r esu ltad os. E stos se alm acen an en listas de alor es
d en om in ad os en tres tipos de r esu ltad os: sen cillosa los qu e se les recon oce con r
n om b re
estim adoresden om in ados com o e
n om b re
los apen as
em p leados especialesqu e gen er an n om b res an tecedidos por la letr a s.
E n tre las in str u ccion es qu e se an
isto asta el m om en tolas n icas
qu e gu ar dan resu ltado son tabu late,
su m m arize ci. as tr es lo acen en
el form ato sen cillo r. om o e
em p lo de su u sose er su u tilidad slo con
el segu n do. E n tre las
ar iables gen er adas en las r den es d e m od ificacin

05_Manipulacin.indd 141

06/06/12 09:25

E S ME
S

d e d atosen este captu lo se a con stru id o la ar iable acu erdosqu e era el


n m ero d e tem s con qu e los en tr e
istados se m ostr ab an de acu erd o con la
p regu n ta d os d el cu estion ar io

ase p gin a 11
. Su s p rin cip ales estad sticos p u ed en ob ten er se m ed ian te la or den su m m arized e la qu e p u ede erse
los r esu ltad os qu e gu ar dam edian te la in stru ccin retu rn
list 1.
su m m a rize acu erd os
retu rn list

E stas d os in str u ccion es m u estr an pr cticam en te los m ism os resu ltados


au n qu e con d istin to form ato.
ILUSTRACIN
5..List a
d e

e su lta d os

a a d os
en
la
in st
u ccin
su m m a r ize
Var i abl e |
Obs
Mean
St d. Dev.
Mi n
Max
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - ac uer dos |
5283
2. 459209
1. 094543
0
4
s cal ar s :
r ( N)
r ( s um_w)
r ( mean)
r ( Var )
r ( s d)
r ( mi n)
r ( max )
r ( sum)

=
=
=
=
=
=
=
=

5283
5283
2. 45920878288851
1. 198023379915273
1. 094542543675335
0
4
12992

u ede com prob arse qu e las can tid ad es exp u estas b a


o el ep grafe scalars
corresp on den a la ln ea an terior qu e com ien za con el n om b re d e acu erdos.
od as ellas tien en u n a den om in acin en tre parn tesis precedida por la letra
r. dem s d e los cin co qu e aparecen con la in stru ccin su m m arizeaparecen
r(su m
igu al a r(
porqu e n o apon deracion es esp ecialesr(ar
qu e
es el cu adrado de la desiacin tp icar(sd
r(su m
o su m atorio d e tod os
los aloresqu e pod ra obten erse tam b in m u ltip lican do r(por r(m ean
.
a segu n da or den qu e se a a er en este apar tado est m u r elacion ada
con la an terior con la qu e se er a con tin u acin . Se tr ata de displayqu e
p u ed e ser ab reiada con slo di. Su m isin es la de m ostrar la exp resin
d eseada en tre la qu e p u ed e in clu ir se u n resu ltado 1. e este m odoescrib ien d o
1
aso de que la orden fu era del tipo de estim adoresla in stru ccin para
er los resultados gu ardados sera eretu rn
listalgo sim ilar podra decirse para la in stru ccin sretu rn
list.
1
E n la expresin puede incluirse cu alquier operacin m atem tica. e a qu e esta instru ccin se conozca tam bin com o la calcu ladora. dem sen u n a m ism a orden pu eden
escribirse
arias in stru ccion es separadas por espacios o com as
preferible esta ltim a opcin
.
u ede abreiarse con di. or e
em plodi
ln (1
,
srt(1proporciona inm ediatam en te el logaritm o n eperiano la raz cuadrada del n m ero 1.

05_Manipulacin.indd 142

06/06/12 09:25

ANLIS IS DE DATOS CON S TATA

d ispla
a m edia esr
m ean
la d es
iacin tp icar
sd

el resu ltado ser a este:


La medi a es 2. 4592088 y l a des v i ac i n t pi ca 1. 0945425

dem s de com bin ar texto resu ltados en la in struccin display


pueden in cluirseentre otras funcionalidades m s com ple
asexpresiones form atos. on
el sigu iente e
em plo se pu ede m ostrar el ran go el coeficien te de
ariacin.
displa
an go1.f r
m ax
-r
m in
. de ariacin .1f r
sd

r
m ean

e este m odoel r esu ltado sera en este caso:


Rango= 4; C. de v ar i aci n= 0. 4

n a de las car acter sticas d e las listas d e resu ltados


r,
e o ses qu e son
su p lan tad as en el m om en to en el se e
ecu ta otr a in stru ccin poster ior. ara
eitar perd er estos d atos obten idosStata ofr ece la posib ilidad de gu ardar los
en m acr os 1.
a ord en par a d ar u n
alor a u n a m acro es:
lo a l n om b rem acroexpresin

e este m odosi se d esea gu ard ar el alor de la m edia de los acu er dos


p ara d isp on er d e ella asta qu e se tr asplan te p or otro
alorse bor re o se
salga del pr ogram aab ra qu e escr ibir tras la in stru ccin su m m arize acu erd osu n a ord en d el sigu ien te ten or:
glob al m ed iaacu erd osr
m ean

ora b ien siem p re qu e se qu ier a oler a recor dar el con ten ido d e esta
m acr oaqu e p reced er su n om br e con el car cter . on sigu ien tem en te
si se desea obten er u n a n u ea ariab le qu e reco
a las diferen cias de los alo1
ados tipos de m acros: globales locales. E n este libro slo se trataran las prim eras
pu es son de u so m s sen cillo su ficien tessiem pre cu ando no se en tre en tem as de program acin. os resu ltados tam bin pu eden gu ardarse en
ariables con las rdenes generate o
replace o en otros receptcu los de con stan tes llam ados escalares (scalarsm atrices con las
in struccion es scalar m atri. n a explicacin de la diferen cia en tre un a m acro un escalar se
encu en tra en Stata
e: -
.

05_Manipulacin.indd 143

06/06/12 09:25

E S ME
S

r es con r especto a la m ed iase p odr a realizar sin n ecesidad de escr ib ir los


alor es n u m ricos de esta form a:
gen era te acu erdosa cu erd os-m ed iaacu erd os
su m m a rize acu erd os
retu rn list
displa
uea m edia: .1f r
m ean

Media anterior: .1f m ediaacuerdos

on las in stru ccion es an ter iores se cr ea u n a n u ea


ar iabler estan d o de
la an tigu a (acu erdosel
alor alm acen ado en la m acro m ediaacu er dos.
or ellola m ed ia ser pr xim a a cam bia el m n im o el m xim o.
m er o d e ob ser
acion es d es
iacin tp ica qu edan in ar iables. or alos
alor es de los resu ltad os r son distin tospu es son los cor resp on d ien tes a
acu erdosen lu gar de acu erdos.
ILUSTR ACIN
5..m p le o
de

e su lt a d o s

m a c
o s
e
in st
u cci n
d isp la y
Var i abl e |
Obs
Mean
St d. Dev .
Mi n
Max
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - ac uer dos 0 |
5283
2. 01e- 08
1. 094543 - 2. 459209
1. 540791
s cal ar s :
r ( N)
r ( s um_w)
r ( mean)
r ( Var )
r ( s d)
r ( mi n)
r ( max )
r ( sum)

=
=
=
=
=
=
=
=

5283
5283
2. 01164265823e- 08
1. 198023372394011
1. 094542540239534
- 2. 459208726882935
1. 540791273117065
. 0001062750816345

Nuev a medi a: 0. 0 Medi a ant er i or : 2. 5

as m acros n o slo siren par a alm acen ar resu ltados. am bin p u ed en


ser em plead as para gu ar dar fragm en tos d e in str u ccion es. e este m odopod ran u tilizarse p ar a repr esen tar u n a determ in ad a lista de ar iables o u n a
clu su lacom o se m u estra en las sigu ien tes ln eas d e cdigo:
globa l

p1-p
globa l con d i1
if sexo1 ed ad eda d
list sexo ed ad con d i1 in 1
clean

on las in str u ccion es an ter iores se crean d os m acr os con d il. a


p rim er a con tien e u n a lista d e
ar iablesexpr esad a m edian te el gu in p ara
in d icar qu e n o es u n a otr asin o desde la p rim era asta la segu n da referen ciada. a sigu ien te m acr o es otra caden a qu e se com pon e tan to d e u n a clu su la if
com o de u n a exp resin lgica com ple
a com p u esta de tres ariab les

05_Manipulacin.indd 144

06/06/12 09:25

ANLIS IS DE DATOS CON S TATA

tres
alorestr es operad ores d e r elacin d os sign os lgicos
qu e los
in cu lan . a ltim a or den pid e u n listad o d e dos
ar iablesm s las cu atro
con ten id as en la pr im er a m acrocon la con d icin expr esada en la segu n d a
lim itada a los cu ar en ta p rim er os casos
in 1

.
ILUSTR ACIN
5 ..List a d o
de
ca so s
e m p le a n d o
m a c
os
7.
14.
22.
36.
37.

s ex o
Hombr e
Hombr e
Hombr e
Hombr e
Hombr e

edad
40
48
36
36
44

en
de
de
de
de

p201
desac u
ac uer d
ac uer d
ac uer d
ac uer d

de
de
de
de
de

p202
ac uer d
ac uer d
ac uer d
ac uer d
ac uer d

p203
de ac uer d
de ac uer d
de ac uer d
de ac uer d
muy de ac

p204
.a
de ac uer d
de ac uer d
de ac uer d
muy de ac

in alm en teen este apar tadopor m otios d iersosse a a explicar u n a


in stru ccin descatalogad a d el m an u alpero bastan te til par a p rin cip ian tes
qu e desean ir apr en dien do n u e
as p osibilid ades del pr ogr am a qu e sim p lifican el tr ab a
o 1.
Su p n gase qu e se d esean estan darizar las tres
ariables creadas con la
orden egen a p artir de los cu atro tem s de la pregu n ta d os. as ariab les qu e
se crearon fu eron totalcon la su m a de la p u n tu acion esprom ediocon su
su m aperdidoscon el n m ero de n o respu estas a la m en cion ada pregu n ta.
Si se d esearan estan d arizar estas tres ariab lesse n ecesitaran tres ln eas.
on la in stru ccin for p u ed e realizarse d e u n a sola
ez en u n a sola ln eaqu e
gen era u n bu cle con los distin tos elem en tos qu e se le especifiqu en .
for
a r total-p erd id os : egen estd

o m s sorp ren den te de esta in str u ccin es la m a scu la qu e apar ece


d os eces. E sta es u n a m acro especial qu e se
a reem plazan d o au tom tica
secu en cialm en te con los elem en tos de la lista ap or tad a delan te de los dos
p u n tosen este casocon las tr es
ar iables com p ren did as en tre total perdidos. e este m odola ord en an ter ior es equ ialen te a las tr es sigu ien tes:
egen totalestd
total
egen prom ed ioestd
p rom edio
egen perdidos
estd
perdidos

u n cion a d el sigu ien te m od o. espu s d e la orden for


pu ede esp ecificarse var,
n u m list
o an ydepen dien d o d e si la lista
a a ser de ariab les an ti1
Se explica porqu eau n descatalogada desde la
ersin sigu e fu n cionan do es bastante m s fcil qu e aqu ellas qu e la an su plantadoesto esqu e foreacforvalu es. E n todo caso
al u suario a
an zado de Stata se le recom ien dan las dos ltim as.

05_Manipulacin.indd 145

06/06/12 09:25

E S ME
S

gu asu n a lista d e
alores u otra lista d e cu alqu ier otra cosa
n u eas ar iab lescaden as o fu n cion esp or e
em p lo
segu id a del listado cor respon d ien te. n a ez ter m in ada la listase in ser tan los d os pu n tos a con tin u acin
la su p lan tar los elem en tos de la lista en la in stru ccin sigu ien te siem p re
cu an d o apar ezca. E n el e
em p lo an terior ap ar eca dos eces: u n aal fin al
en tr e par n tesis p ar a exp resar la
ar iable existen tela otr ad elan te del sign o
igu alsegu id a d e e p ara distin gu ir las n u eas
ar iablesin dican do qu e se
tr ata de estan d arizacion es.
tr a fu n cin til d e esta in stru ccin es cr ear ar iables d icotm icas o
in d icad ores a par tir d e ariab les categricas. E n p rim er lu garse p on e u n
e
em p lo m u fcil. Se
a a con er tir en u n a sola ln ea la ariab le seo en
d os: om b re m u
er.
for n u m list 1
: gen erate sexo
sexoif sexo.

e esta m an erala in str u ccin se m u ltiplica por los dos


alores especificad os en la lista gen er a d os ariab les: seo1 seo2u b ican d orespectiam en teu n 1 en estas a om br es a m u
eres. E s deciren seo1los om b res ten d rn 1 las m u
eres m ien tr as qu e en seo2las m u
eres ten dr n
la u n id ad los om b res el
alor n u lo. u n qu e en estos d atos n o aa alores p er didossiem pre es pr eca
ido ter m in ar la in str u ccin con la clu su la
if
variable.con el fin de tran sm itir los a las ar iables dicotm icas.
con tin u acin se explica u n caso sim ilaralgo m s com p le
op u es en
lu gar d e pon er n m ero a las n u eas ar iables
seo1 seo2
se pon e u n
n om br e d istin topar a lo qu e se n ecesita u n a lista adicion al qu e se sep ar a de
la an ter ior m edian te u n a bar ra in ertida

. a prim era lista ser u tilizad a


con la m acr o m ien tras qu e la segu n da se em p lear con la m acro
tam bin m a scu la
. ara qu e qu ede m s clarose expon en d os in stru ccion es
con
ar iables distin tas
seo edad recod ificada
a fin d e cr ear in d icadores
con ellas:
for an om b re m u
er n u m list 1
: gen era te
sexoif sexo.
for an
o
en adulto m aduro m aor num list 1
: generate
edadrif edadr.
list sexo om b re m u
er edad ed ad r
oen -m a or in
clean n oobs
ILUSTR ACIN
5 .5 .List a d o
de
in d ica d o
e s
e n e
a d o s
a
pa
t i

de
a
ia le s
ca t e
ica s
s exo
Muj er
Hombr e
Hombr e
Hombr e
Hombr e

05_Manipulacin.indd 146

s exo1
0
1
1
1
1

s ex o2
1
0
0
0
0

edad
37
19
60
27
66

edadr
36- 50
Hast a 35
51- 65
Hast a 35
Mas de 65

j oven
0
1
0
1
0

adul t o
1
0
0
0
0

madur o
0
0
1
0
0

may or
0
0
0
0
1

06/06/12 09:25

ANLIS IS DE DATOS CON S TATA

5 ..
e
cicio s
1.
.

.
.

.
.
.
.

br e el ficer o cisor dn alo p or el n m ero d e cu estion ar io lista


los d iez ltim os casos. om p ru eba cm o estu ier on p lan ificados en este
estu d io .casos p er o slo se d ispon e de en treistas.
b tn con el m ism o ficero de dos m od os d iferen tes la edad m edia el
n m er o de casos d e om b res m u
eres.
E m plean d o en am b as la in stru ccin su m m arize
. on el pr ocedim ien to m s cm odoaz el m ism o
clcu lo de edad m edia n m ero d e casos p ara los distin tos estratos de
tam a o de m u n icip io.
on cu idad o d e n o su m ar la n o respu esta

con stru e con las tres


ariab les de la p regu n ta .u n a n u ea qu e expr ese los m in u tos qu e
u n a person a disp on e d e tiem po libr e a la sem an a.
ecod ifica la ed ad en in teralos de 1a osp on in d ole etiqu etas a los
alor es. sim ism or ecod ifica la
ar iable del e
er cicio an ter ior
m in u tos
qu e u n a person a d ispon e de tiem po lib reen los sigu ien tes in teralos:
asta 1 or a d iariaen tre 1 or a diar ia d e a oras diar iasd e
a oras diar iasm s de oras diar ias.
n ifica las pr egu n tas
..a en u n a sola qu e sea el n iel de estu d ios del en tr eistado.
E stan dariza la
ar iable edad
.de m odo qu e ten ga m ed ia desiacin tpica 1. az lo m ism o con la obten ida en el e
er cicio . om p ar a
los m n im os m xim os de los r esu ltados d e am bas ar iables.
on stru e u n a
ar iable con la can tidad d e equ ipam ien to qu e posee el
d om icilio del en tr eistad o
.
.
en ien d o cu idad o en la r ecod ificacin d e los alor es in icialescon str u e u n n d ice d e
aloracin de la situ acin p oltica qu e aa de a 1
com pu esto por la
aloracin pr esen te m s la pr ospectia

.
con tan do
la p rim er a el doble de la segu n da. az lo m ism o con la situ acin econ m ica
pr egu n tas
gu ard an do en m acr os la m edia des
iacin
tpica de am bas.
on u n a sola ln ea d e cd igo con
ier te los n d ices del e
er cicio an terior
en ar iables estan darizadas con m edia desiacin tpica 1
. ista
d esp u s los casos qu e estn fu era del ran go de a 1en u n a u otr a
ariab le.

05_Manipulacin.indd 147

06/06/12 09:25

05_Manipulacin.indd 148

06/06/12 09:25

6
Gr fico s co n St a t a
Un a d e la s ca p a cid a d es b sica s qu e h a d e ten er cu a lqu ier a p lica cin
esta d stica es la d e ser ca p a z d e gen er a r gr ficos. Ta n im p o r ta n te es la
ca p a cid a d d e tr a ta m ien to d e va r ia b les y la d e gen er a ci n d e esta d sticos
co m o la d e h a cer q u e se m u estr en lo s d a to s r ep r esen ta d o s m ed ia n te
u n a im a gen , qu e en m u ch a s o ca sio n es d ice b a sta n te m s q u e m il n
m er o s.
a y m u y d iver so s tip os d e gr ficos en la r ep r esen ta cin esta d sti
ca , p er o, con ob
eto d e sim p lifica r la a m p lia va r ied a d eisten te, estos
p u ed en u b ica r se en d os cla sifica cio n esp or u n la d o, la d el n m er o d e
d im en sion es qu e r ep r esen ta n y, p o r el otr o, el tip o d e va r ia b les r ep r esen
ta d o. n el p r im er ca so se p u ed en en con tr a r gr ficos u n id im en sion a les,
qu e r ep r esen ta n los va lor es y fr ecu en cia s d e ca d a va r ia b le in d ep en d ien
tem en te d e la s d em s, si la s h u b ier egr ficos b id im en sio n a les, en los qu e
se m u estr a n d istr ib u cio n es con
u n ta s d e d os va r ia b les, y r ep r esen ta cio
n es m u ltid im en sion a les, d o n d e se m u estr a n d istr ib u cion es m u ltiva r ia n
tes. s n ecesa r io p r ecisa r qu e n o siem p r e co in cid e el con cep to d e d i
m en si n con el d e va r ia b le. s, en u n gr fico u n id im en sion a l p u ed en
r ep r esen ta r se d os o m s va r ia b les, en cu yo ca so, seg n se con str u ya el
gr fico, se p od r estu d ia r la a socia cin eisten te en tr e ella s o com p a
r a r su s ca r a cter stica s r ep r esen ta d a s. o r otr o la d o , los gr ficos ta m b in
p u ed en cla sifica r se seg n el tip o d e va r ia b le qu e qu ier en r ep r esen ta r.
s, h a y gr ficos qu e se a d ecu a n esp ecia lm en te a va r ia b les cu a lita tiva s,
com o son el gr fico d e sector es o el d e b a r r a s, m ien tr a s qu e otr os, co m o
la s n u b es d e p u n to s o el h istogr a m a , est n in d ica d os p r in cip a lm en te
p a r a va r ia b les cu a n tita tiva s.
a ap licacin tata es capaz de p rod u cir gr ficos de tres m odos distin
tos

ara estu diar la asociacin en grficos u n idim en sion ales es preciso a adir a su repre
sen tacin de n ica en trada otra dim ensin . sto se logra, com o se ver m s adelante, m edian te
dos m odoscon over la operacin se realiza en los m ism os e
es del grfico, con by se constru ye
otro grfico paralelo.

06_Graficos con Stata.indd 149

06/06/12 09:28

UT

a n pr im er lu gar, eiste u n a in stru ccin qu e con tien e la m ayor p ar te


de los gr ficos m s u su ales. e tr ata de la in str u ccin graph, qu e
ser la n ica qu e ser ab ord ad a en este captu lo .
b n segu n d o lu ga r, eisten otr a ser ie d e in str u ccion es qu e son ca
p a ces d e r ea liza r gr ficos m s esp ecficos. n este ca so n os en
con tr a m os in str u ccion es com o la d e dotplot, qu e r ea liza h istogr a
m a s b a sa d os en p u n tos, o stem , qu e r ea liza u n gr fico d e ta llo y
h o
a.
c ta ta ta m b in d isp on e d e cier tos p r o ced im ien t os d e o p er a cio
n es esta d stica s q u e se p u ed en co m p lem en ta r con a lg n tip o
d e gr fico. e este m o d o, in str u ccio n es gr fica s co m o greigen ,
rvfplot o clu ster den drogra m s lo son p osib les tr a s la r ea liza ci n
d e a n lisis esta d sticos p r evio s com o factor, regress y clu ster, r es
p ectiva m en te.
on la in str u ccin m s especfica de gr ficos (graph) se pu eden r ealizar
d os m od alid ades de repr esen tacin de var iables
a as u n ivar iadas, com o son los grficos de sectores (pie), los d e b a
rr as (bar), los d e p u n tos (dot) y los d e ca
a (box).
b as bivar iadas, en grficos de d os d im en sion es (twoway) o m ltip les
(m atrix).

6.1.

Ca r a ct e r st ica s d e lo s gr fico s d e St a t a

n tes d e ep lica r los d istin tos gr ficos qu e p u eden r ea liza r se con ta ta ,


es p r eciso p resen ta r u n a b r eve in tr od u ccin a cer ca d e cm o esta a p li
ca cin los p r od u ce, ya qu e, com o se p u d o com p r ob a r en el ca p tu lo ,
la s im gen es qu e se pr od u cen n o se u b ica n en la p a n ta lla d e r esu lta d os,
sin o en u n a ven ta n a p r opia a isla d a d e los esta d sticos y de otr os gr ficos.
dem s, si n o se m a n tien en la s pr eca u cion es d eb id a s, la p rod u ccin d e
u n segu n d o gr fico h a ce d esa p a r ecer a l p r im er o. sto es a s p or qu e ca d a
gr fico es gu a r d a d o en u n esp a cio d e la m em or ia in ter n a d el or d en a d or
a l qu e p or om isin se le d om in a Graph, qu e d esa p a r ece p a r a siem p r e a l
sa lir d e la a p lica cin , o es su p la n ta d o p or u n n u evo gr fico a l solicita r lo
sin n om br e.
or ta n to, es fu n d a m en ta l sa b er cm o d a r u n n o m b r e d istin tivo a
u n gr fico y o b ten er u n a lista d e los gr ficos a lm a cen a d o s en u n d e

partir de la versin , tata im plem ent u na sin tais bastan te diferen te de las an terio
res. in em bargo, a n se perm ite qu e los vie
os program as pu edan e
ecu tarse. ara ello, h a de
cam biarse la in struccin graph por graph7, o bien , en el in terior de u n program a, advertir al
com ien zo de qu e se est traba
an do con u na versin an terior a la , con la in stru ccin version .

06_Graficos con Stata.indd 150

06/06/12 09:28

T TT

ter m in a d o m o m en to . om o d e m o m en to s lo se co n o ce la in str u ccin


h istogra m , m en cion a d a en la secci n ., se em p lea r esta p a r a e
em p li
fica r c m o el n om b r e d e cu a lqu ier gr fico se p on e m ed ia n te la op ci n
n a m e segu id a , en tr e p a r n tesis, p o r el n om b r e d esea d o y u n a co m a p a r a
in d ica r la s su b o p cin repla ce, qu e evita el er r or en ca so d e r ep etici n
d el gr fico.
sysu se au to, clea r
h istogram price
h istogram m p g, n am e
ist
p g, repla ce
grap h d ir

e este m odo, adem s d e gen er ar se d os pan tallas de gr ficos en p esta


as in d ep en d ien tes, aparece la lista de su s n om br es in tern os en la pan talla
d e r esu ltad os, gr acias a la ltim a in stru ccin
ILUSTR ACIN 6.1.

List a d o d e gr fico s e n m e m o r ia

Gr aph Hi s t _Mpg

Un a vez qu e se d isp on e d e u n a ser ie d e gr ficos a lm a cen a d os en la


m em or ia , a d em s d e lista r los, se p u ed en r ea liza r la s sigu ien tes op er a
cion esa d escr ib ir los (describe) con in for m a cion es ta les com o cu n d o
fu er on cr ea d os, con qu d a tos e in str u ccin , en tr e otr a sb r en om b r a r
los (ren a m e) p a r a qu e ten ga n otr o m od o d e lla m a r loscr evisu a liza r los
(displa y), p a r a qu e vu elva n a a p a r ecer en u n a ven ta n a visib le p a r a el in
vestiga d or d cop ia r los (copy) p a r a ten er m s d e u n e
em p la r d el m ism o
gr ficoeb or r a r los (drop) p a r a qu e n o ocu p en esp a cio en m em or ia . on
los gr ficos a n ter ior es r ea liza d os p od r a n fu n cion a r la s sigu ien tes in s
tr u ccion es, o in clu so com b in a r los (com bin e) p a r a qu e se p r esen te en u n
m ism o r ecu a d r o
grap h
grap h
grap h
grap h
grap h
grap h

d escribe rap h
ren am e ra ph ist
rice, repla ce
d ispla y ist
p g
copy istp g p g, rep lace
d rop istp g
com b in e ist
rice p g, n am e
, repla ce

l r esu ltad o d e la ltim a in stru ccin , siem p re y cu an do se h ayan con s


tru id o p reviam en te las figu ras ist
rice y pg, es el grfico com b in ado
r epr esen tado en el gr fico .

06_Graficos con Stata.indd 151

06/06/12 09:28

UT

Co m in a ci n d e gr fico s

Density
0

.02

1.0e04

.04

Density

.06

2.0e04

.08

.1

3.0e04

GR IC 6 .1.

5,000

10,000
Price

15,000

10

20
30
Mileage (mpg)

40

s im por tan te a n qu e con ocer qu e los grficos se m an tien en en la


m em or ia d el ord en ador con u n n om br e su
eto a las con ven cion es de
las variab les es sab er qu e p u ed en ser gr ab ados en el d isco, para pod er los
u sar siem pr e qu e se n ecesiten tan to con el p rogram a tata com o con cu al
qu ier otro qu e sea cap az d e leer y p rocesar fich eros d e teto. ealizar esta
ltim a oper acin es p osible de tres for m as
. edian te el m en con tetu al qu e se obtien e al pu lsar el botn der e
ch o d el ratn u bicad o en cim a de u n gr fico.
. l salir del ed itor de grficos, p u es si se qu ier en gu ar dar los cam
bios, el gr fico h a d e grab ar se en el disco.
. edian te la op cin savin g
n om b refich eroa adida a cu alqu ier in s
tr u ccin grfica.
. edian te la in stru ccin graph save, cu ya estr u ctu ra es la sigu ien te
gr a sa e
n om bregraficon om b refich ero
, r e la ce a sis

on esta orden el grfico se graba en u n fich ero del directorio indicado en


su n om bre o, si n o se in dica, en el directorio por defecto con la etensin .gph.
in em b argo, este fich er o gu ard ado slo es legible con tata. i se qu ie
r e dispon er de u n fich er o qu e p u ed a ser tratado con cu alqu ier p rogram a,
in clu yen d o especialm en te los p rocesad ores de teto y de gr ficos, h a de em
p learse la ord en graph export.
gr a e o r t n om brefich ero.et
, r e la ce n a m e
n om b regraficoa s
s
e s
m f

e m f
n g
t if
ict
d f

06_Graficos con Stata.indd 152

06/06/12 09:28

T TT

e este m odo, seg n la eten sin qu e se pon ga al n om br e del fich er o o


seg n la clave qu e se seleccion e a la op cin as, el fich ero se gr ab ar seg n
las n or m as d e los fich er os postcr ip t (ps), postcrip t en capsu lado (eps), m e
tafich er o de in dos (wm s), gr fico por ttil d e r edes (pn g), tiff, form ato
acin tosh (pict) o pdf.
Tam bin es p osib le h acer estas oper acion es
gu ar dar en for m ato n ativo
o epor tableh acien d o clic con el b otn d er ech o del r atn en cim a d e u n
gr fico. on esta op eracin sale u n m en con tetu al m edian te el qu e se
p u ede grab ar el fich er o con el form ato desead o (save graph)cop iarlo al
p ortap apeles (copy), p ar a p oderlo traslad ar a otr o p rogram a en cdigo
wm f
o em f, seg n p referen ciasm ed ian te la com bin acin d e teclas tr lv en el
p rogr am a de destin oim p rim ir lo (prin t) en la im pr esor a qu e se seleccion e, o
m odificar lo (Start graph editor), em plean d o la u tilidad cu yas caractersticas
p rin cipales se vern al fin al de este captu lo.
olicitar u n grfico con u n as determ in ad as caractersticas es u n p roceso
b astan te com ple
o, qu e requ iere largas y com ple
as in str u ccion es en in gls.
for tu n adam en te, desd e la ver sin d e tata, los m en s sim plifican m u ch o
la con stru ccin de los gr ficos. sim ism o, d esde la versin , se h a in cor
p orado u n ed itor de grficos qu e p er m ite realizar m ed ian te el ratn cu an tas
m odificacion es se con sider en opor tu n as. m bas posib ilidades son tr atad as
al fin al d e este captu lo, p er o, fieles al estilo de este m an u al, el en foqu e p rin
cip al ser la ep licacin d e las rd en es.

6 .. Gr fico s n id im e n sio n a le s
6... Grficos de sectores
os gr ficos d e sector es son rep resen tacion es de los d atos en u n cr cu lo cu
yos segm en tos r epr esen tan pr op orcion alm en te la fr ecu en cia d e los valor es
con ten id os d e u n a o varias variab les.
a in stru ccin m n im a p ara realizar grficos d e sectores es la sigu ien te
gr a ie listad evariab les

ay qu e ten er en cu en ta qu e esta in str u ccin p rodu ce u n gr fico en el


qu e cad a var iable es u n sector cu ya rea vien e d eter m in ad a por la su m a d e
los valores de var iables.
sto im p lica qu e, para ob ten er u n gr fico de sector es en el qu e u n sector
r epr esen tara a los h om br es y el otr o a las m u
er es, los datos h an de d ispo
n er se d e dos p osibles m od os
. ispon ien do d e u n fich er o con u n solo caso y dos variab lesom bre
y u
er, con valores qu e r ep resen ten su s r esp ectivas frecu en cias

06_Graficos con Stata.indd 153

06/06/12 09:28

UT

ILUSTR ACIN 6 .. iso sici n d e d a t o s a r a gr fico d e se ct o r e s

p artir de los d atos con tem p lad os en la ilu str acin ., b astara con
in d icar la in stru ccin
u se e
em ploa, clear
gra ph p ie om bre u
er, n am e
, repla ce

p ar a p rod u cir el sigu ien te grfico


GR IC 6 .. Gr fico d e se ct o r e s

Hombre

Mujer

. in em bar go, lo m s com n es dispon er los datos por in d ividu o en


u n a variab le categr ica, tal com o p u ed a ser el sexo, con .casos

06_Graficos con Stata.indd 154

06/06/12 09:28

T TT

y d os valores hom bre y m u


er, en cu yo caso h ab ra qu e escribir la
in stru ccin d el sigu ien te m odo
grap h p ie, over
seo
, n am e
, repla ce

don de sexo es la var iable qu e se qu iere repr esen tar en el grfico d e


sectores.
e este m od o se gen er a el gr fico ., d on d e pu ede advertirse qu e el
p rogram a pon e au tom ticam en te a cad a u n o de los sector es las etiqu etas d e
los valores qu e tien e la variable origin al.
GR IC 6 .. Gr fico d e se ct o r e s c o n la a r ia n t e o ver

hombre

mujer

a in stru ccin graph pie ad m ite la posibilid ad d e in tr od u cir u n a variable


categr ica para la obten cin de tan tos grficos com o valor es ten ga esta. e
este m odo, si se d esean los p er files d e seo en fu n cin de los d istin tos votan
tes, h ay qu e esp ecificar lo m edian te la opcin by
var iable

grap h p ie, over


seob y
oto
, n a m e
, replace

qu e da lu gar al sigu ien te grfico b id im en sion al, don d e se pu ede estu


d iar el p erfil d e gn er o d e los votan tes d e cada u n o d e los p artidos

06_Graficos con Stata.indd 155

06/06/12 09:28

UT

GR IC 6.. Gr fico s d e se c t o r e s se g n n a se gn d a a r ia le
PP

PSOE

IU

Otros

Blanco

NC

hombre

mujer

Graphs by Partido votado

6... Grficos de barras


os grficos de bar ras, recom en d ados en el caso de qu e se ten ga u n n m er o
m ayor d e categoras en la variab le qu e se qu ier e rep resen tar, n ecesitan in s
tr u ccion es con op cion es bastan te distin tas a las de los gr ficos d e sector es.
in em bargo, la sin tais gen eral es m u y sim ilar a la an terior
gr a a r lista devariab les

e este m od o, la in str u ccin d el p rim er gr fico realizad o con la opcin


pie ah or a qu edara d el sigu ien te m odo
u se e
em plo, clea r
gra ph b ar om bre u
er, n ola bel n am e
, rep lace

n esta instru ccin se produ ce la parado


a de qu e para qu e aparezcan en la leyen da los
n om bres de las variables
om bre y u
er
, se debe especificar la opcin n olabel. i esta n o
aparece, las etiqu etas m ostradas son las autom ticas del grfico, es decir, ean of om bre
y ean of u
er.

06_Graficos con Stata.indd 156

06/06/12 09:28

T TT

y prod u cira el sigu ien te grfico

20

40

60

GR IC 6 .. Gr fic o d e a r r a s

Hombre

Mujer

o obstan te, es m s frecu en te dispon er los datos en u n fich ero en el qu e


cada registro represen ta u n caso, en cu ya situ acin , en el caso de los grficos
de barras, n o se pu ede u tilizar directam en te la opcin over com o se aplic en
la m odalidad de sectores. ara poder h acer algo sim ilar, h ay qu e con feccion ar
el grfico en dos pasosen el prim ero, m edian te dos in stru ccion es, se gen era
u n a con stan te ficticia, equ ivalen te al peso en porcen ta
e del caso , y en el se
gu n do se pide la represen tacin del recu en to de esta cru zada con la variable
propiam en te dich a, qu e en el e
em plo sigu ien te es sexo. esto es debido a qu e
Stata con sidera el grfico de barras m s com o u n caso de variable n u m rica

de in tervalo o de razn qu e de variable con atribu tos


n om in al u ordin al
.
u se p an el
tab u late seo
gen erate ca sos
r

grap h b ar
cou n tcasos, over
seon am e
, repla ce

i se qu ieren proporcion es, en lugar de porcenta


es, basta con su stitu ir el por u n .
ara que calcu le los porcen ta
es
en vez del n m ero de casosh ay qu e u sar (su m ) en vez
de (cou n t) com o fu n cin de resum en de casos. i slo se desea el n m ero de casos, se pu ede
h acer de m an era m s sim ple su stitu yen do las dos in stru ccion es anteriores porgen casos .

Un a altern ativa al u so de in stru ccion es de tata para estos grficos es el em pleo de la


in struccin escrita por o
llam ada catplot. e pu ede in stalar m edian te la orden ssc
in stall catplot.

06_Graficos con Stata.indd 157

06/06/12 09:28

UT

Gr fic o d e a r r a s co n la a r ia n t e over

1,000

count of casos
2,000

3,000

GR IC 6 .6.

hombre

mujer

n estos gr ficos cabe tam bin la posibilid ad de r ealizar u n con tr ol por


u n a segu n d a var iable par a realizar u n grfico b id im en sion al de bar ras, qu e
es m u y til par a rep resen tar gr ficam en te tab las de con tin gen cia
vase el
captu lo
. n este caso, para cam biar d e e
em p lo, se u tiliza el seo com o
in d ep en d ien te y se em p lea la in ten cin de voto com o var iable determ in ada,
p ar a ver la d istr ib u cin d el voto d e h om b res y m u
er es

200

count of casos
400
600

800

1,000

GR IC 6.. Gr fico d e a r r a s c o n a r ia le d e co n t r o l

PP

PSOE

IU

Otros Blanco

hombre

06_Graficos con Stata.indd 158

PP

PSOE

IU

Otros Blanco N

mujer

06/06/12 09:28

T TT

n la figu ra an ter ior se h an obten id o dos gr u pos de b ar rasu n as para


los h om br es y otr as para las m u
er es. ara ob ten er los se h a ten ido qu e es
cr ibir esta in str u ccin
grap h b ar
cou n tcasos, over
otoover
seon am e
, repla ce

ay otr o m odo de qu e se pr odu zca u n resu ltado sim ilar al an ter ior. e
trata de m ostrar tan tos grficos com o valor es ten ga la variab le qu e se espe
cifiqu e detr s d e la opcin by(variable).
n clu so, si se d esea, pu ede ob ten er se
al m ism o tiem po el grfico cor respon dien te al con
u n to de la m u estra, si se
a ade despu s de la variab le la opcin total
grap h b ar
cou n tcasos, over
otoby
seo, tota l n am e
, rep lace

GR IC 6 .. Gr fico s d e a r r a s co n la o ci n b y

500 1,0001,5002,000

mujer

PP PSOE

IU

Otros Blanco NC

PP PSOE

IU

Otros Blanco NC

500 1,0001,5002,000

Total

count of casos

hombre

PP PSOE

IU

Otros Blanco NC

rahs bseo

s obvio qu e las etiqu etas del e


e que el program a crea por om isin n o es la deseable en el
caso de qu e se quiera publicar el grfico en castellan o. ara arreglarla es preciso leer el apar
tado del editor de grficos
.
.

06_Graficos con Stata.indd 159

06/06/12 09:28

UT

sp ecialm en te en este grfico se n ota cm o h asta ah or a lo qu e se repr e


sen tan son frecu en cias y n o por cen ta
es. ar a obten er los o p ar a r ep resen
tar pr opor cion es , en lu gar d e fr ecu en cias, h ay qu e solicitar la estadstica
(su m ), en lu gar d e cou n t, qu e apareca en los an ter iores grficos.
gra ph b ar
su m casos, over
oton am e
, repla ce

10

sum of casos
20

30

40

GR IC 6 .. Gr fic o d e a r r a s co n fr e ce n cia s

PP

PSOE

IU

Otros

Blanco

NC

Un a va r ia n te in elu d ib le d el gr fico d e b a r r a s es la a p ila d a , en la qu e


en lu ga r d e a p a r ecer p a r a lela s la s b a r r a s co r r esp on d ien tes a la s ca tego
r a s d e la va r ia b le, a p a r ecen con tigu a s en la m ism a colu m n a . sta a lter
n a tiva p er m ite, en la m a yor p a r te d e los ca so s, fa cilita r la com p a r a cin
en tr e ca tegor a s. a r a ob ten er la , es n ecesa r io a a d ir a la in str u ccin d os
op cion esla p r im er a es a syva r, qu e tr a ta la va r ia b le ep r esa d a en over()
com o si fu er a n va lor es d e d istin ta s va r ia b les. or eso la s b a r r a s a p a r e
cen d ib u
a d a s con d istin tos color es. a segu n d a op cin es sta c, qu e,
com o su p r op io n om b r e in d ica , es la qu e h a ce qu e la s b a r r a s qu ed en
a p ila d a s.
graph bar
countcasos, over
oto
asyvar by
seostacnam e
, replace

acar porcen ta
es o frecu en cias seg n se h aya constru ido la variable ficticia con la qu e
se constru yen los grficos de barras
casos, en este e
em plo
. om o m s arriba se constru y di
vidien do por el tam a o de la m u estra

, enton ces se obtienen porcen ta


es. i se h u biera
u tilizado , en lu gar de , se h abran obten ido proporcion es.

06_Graficos con Stata.indd 160

06/06/12 09:28

T TT

GR IC 6 .1. Gr fico d e a r r a s a ila d a s


mujer

2,000
1,000
0

count of casos

3,000

hombre

PP
IU
Blanco

PSOE
Otros
NC

Grahs bse
o

om o pu ede fcilm en te ap reciarse, por el h ech o de acu m u lar el n m ero


d e casos, las altu ras n o alcan zan el top e y la d e las m u
er es, m s n u m er osas
en la m u estr a, es m s alta qu e la d e los h om br es. ar a igu alar las bases d e
la com par acin , es p reciso a adir la opcin percen t, en cu yo caso la escala
qu e r epr esen tan las frecu en cias cam b ia h asta ten er el m im o d e y, en
con secu en cia, todas las bar ras se igu alan .
graph bar
cou ntca sos, over
otoasyvar by
seostacpercent

n am e
, replace

GR IC 6.11 .

Gr fico d e a r r a s a ila d a s e iga la d a s


mujer

80
60
40
0

20

percent ocount ocasos

100

hombre

PP
IU
Blanco

PSOE
Otros
NC

raphs bse
o

06_Graficos con Stata.indd 161

06/06/12 09:28

UT

in a lm en te, h a y q u e se a la r q u e t o d o s lo s gr ficos d e b a r r a a q u
ep u esto s p u ed en d ib u
a r se h o r izo n t a lm en te. a r a ello , slo es p r eci
so ca m b ia r la segu n d a p a la b r a d e la in str u cci n p o r h ba r en lu ga r d e
ba r.
or e
em plo, si se desea, dib u
ar la in ten cin de voto en b ar ras h orizon
tales, se deb er a escr ibir la sigu ien te ln ea
gra ph h ba r
su m ca sos, over
oto
asyva r n a m e
, repla ce

e este m odo, se obtien e el sigu ien te gr fico con b ar ras d e d istin to color
p or h ab er especificado la opcin asyvar
GR IC 6.1. Gr fico d e a r r a s o r io n t a le s

10

20
sum of casos
PP
IU
Blanco

30

40

PSOE
Otros
NC

6... istogram as
os h istogr a m a s son gr ficos qu e se em p lea n p a r a la r ep r esen ta cin d e
va r ia b les cu a n tita tiva s con tin u a s. on sisten en d ivid ir los va lor es en u n a
ser ie d e in ter va los y r ep r esen ta r ca d a u n o d e estos con u n r ea p r op or
cion a l a su ta m a o. en er a lm en te, los va lor es se ep r esa n en el e
e de
a b scisa s d e u n gr fico d e coor d en a d a s, m ien tr a s qu e, en el ca so d e qu e
tod os los in ter va los ten ga n a m p litu d con sta n te, en la s or d en a d a s se e
p r esa n la s fr ecu en cia s a b solu ta s o r ela tiva s cor r esp on d ien tes a ca d a gr u
p o d e va lor es.

06_Graficos con Stata.indd 162

06/06/12 09:28

T TT

n tata b asta con d os palab ras p ar a gen erar u n grfico de este tipoel
com an do histogram segu id o d el n om br e d e la var iable qu e se qu iere rep re
sen tar
h istogram ed ad , n a m e
, repla ce

in n in gu n a otra esp ecificacin a adid a, el h istogr am a ap ar ece del si


gu ien te m odo

.01

Density

.02

.03

GR IC 6.1 . ist o gr a m a a t o m t ico

20

40

60
edad

80

100

ar a obten er u n n m er o n o au tom tico d e in tervalos en el h istogram a,


eiste la op cin bin

, sien do el n m er o d e ellos qu e se qu ier e qu eden


d ib u
ados. e este m odo si se desean och o in ter valos, en lu gar d e los
an ter iores, deber a escribir se
h istogram ed ad , b in
n am e

sta (histogram ) es u na de las in stru ccion es especficas


diferen tes a graphpara reali
zar grficos. in em bargo, en este caso se pu ede obten er el m ism o resu ltado con el sigu ien te
bloqu e de rden esgraph twoway histogram , especialm en te til cu an do se qu ieren integrar los
h istogram as con otro tipo de represen tacin bivariada. or eso, en este conteto don de se estn
vien do los grficos de u n a sola variable, y por razon es de brevedad, slo se seala la prim era
form a de solicitarlos.

06_Graficos con Stata.indd 163

06/06/12 09:28

UT

.005

Density
.01

.015

.02

GR IC 6 .1. ist o gr a m a c o n o co in t e r a lo s

20

40

60
edad

80

100

er o tam b in es posib le esp ecificar, en lu gar d el n m er o de in tervalos,


el an ch o qu e se d esea ten gan las bar ras a travs de la opcin width
e
in clu so el pu n to de p ar tida con start

. ob vio es qu e am b as se pu eden
com bin ar para obten er u n h istogr am a a gu sto d el u su ario
h istogram eda d, start
idth
n a m e

on esta ltim a in stru ccin , el h istogr am a adop ta la sigu ien te form a

.005

Density
.01

.015

.02

GR IC 6 .1. ist o gr a m a c o n in t e r a lo s co n st a n t e s

20

40

60

80

100

edad

os opciones adicion ales perm iten m e


orar la presentacin del h istogram a.
or un lado, freu ency hace m ostrar las frecuencias, en lu gar de los porcenta
es.

06_Graficos con Stata.indd 164

06/06/12 09:28

T TT

or el otro, norm al sobrescribe sobre el histogram a la curva de auss para que


pueda com pararse la distribucin em prica con la distribucin n orm al.
h istogram ed ad , sta rt
id th
frequ en cy n orm al n a m e

l resu ltado es m s qu e evid en te


ist o gr a m a c o n cr a n o r m a l

500

Frequency

1000

1500

GR IC 6 .16 .

20

40

60

80

100

edad

6... Grficos de den sidad


Un a altern ativa de los h istogr am as a la repr esen tacin de las var iables con
tin u as son los grficos de d en sid ad, qu e p u eden ser con sid er ados com o u n
m tod o de su avizacin d e las frecu en cias de u n a variab le.
s com o el h istogram a divide la distribu cin en u n con
u n to de tram os
a los qu e se les represen ta por u n a frecu en cia atribu ida con stan te, en el caso
de los grficos de den sidad tam bin se procede a u n a divisin del ran go de la
variab le r ep resen tada en u n a ser ie de in tervalos, pero en lu gar d e asign ar
u n a p robab ilidad con stan te, atrib u ye a cada valor u n peso con el qu e se asign a
la p rob ab ilidad fin al. l resu ltad o es u n polgon o d e frecu en cias su avizado.
isten m uy distintos m odos de obten er representaciones de densidad para
la m ism a variable. sicam ente depende de dos parm etrossobre todo, del an
cho de los intervalos, pero tam bin influye el m todo para calcular los pesos .
ste grfico u n id im en sion al p u ed e r ealizar se con tata d e d os m od os
u n o es m ed ian te u n a in stru ccin p rop ia llam ada den sity, en la qu e p u ed en

l algoritm o u tilizado por defecto es el de pan echn iov, pero tam bin em plea, siem pre
que se especifique en las opcion es, los sigu ien tesbiweight, cosine, gau ssian , par
en, rectan gu lar
y trian gu lar.

06_Graficos con Stata.indd 165

06/06/12 09:28

UT

especificarse com o opcion es el an ch o de los in tervalos


width

, el m todo

vase n ota
, la com par acin con u n a distr ibu cin n or m al (n orm al) o d e
tu den t (stu den t) e in clu so la gen er acin d e d os n u evas var iables, gen erate

var iable
con valores, var iable
con fr ecu en cias
, p ar a ver el r esu ltado n o
slo gr ficam en te, sin o tam b in n u m r icam en te.
tra m an era de realizarlo es a travs de la in stru ccin graph twoway, m e
dian te la cu al se pu eden com bin ar en los m ism os e
es u n h istogram a y u n gr
fico de den sidad, con ob
eto de qu e se aprecie el pap el su avizador qu e tien e la
estim acin de las frecu en cias con el sistem a proporcion ado por el segu n do.
gra ph toay
h istogram tm i
d en sity tm i
, n a m e

.01

.02

.03

GR IC 6.1 . Co m in a ci n d e ist o gr a m a gr fico d e d e n sid a d

20

40

60
Density

80

100

kdensity edad

n el h istogr am a se apr ecia cm o las altu r as se ven afectadas por la


acu m u lacin d e casos en u n a deter m in ada categor a. n este caso, esp ecial
m en te la pr im er a barr a qu ed a su avizada m ed ian te la ln ea qu e se gen er a
con la pon der acin de pan ech n iov.

6... Grficos de ca
a
os grficos de ca
a poseen u na pecu liar im portan cia en el anlisis eploratorio
de datos. on sisten en la represen tacin de los datos en u n rectn gu lo de an
chu ra arbitraria y lon gitu d igu al al rango in tercu artlico. sto se logra dibu
an
do u n o de los lm ites del rectn gu lo en el prim er cuartil y el otro en el tercero.
n tre el u n o y el otro tam bin se dibu
a en el rectn gulo otra ln ea qu e repre
sen ta la m edian a. e cada etrem o del rectn gulo h a de salir tam bin u n a lnea
con longitu d n u nca su perior a vez y m edia el ran go intercu artlico, que llegu e

06_Graficos con Stata.indd 166

06/06/12 09:28

T TT

h asta el caso qu e cu m pla esa con dicin . inalm ente, siem pre que h aya al m enos
u n caso fu era de esos rangos
casos etrem os
, se epresa en form a de pu ntos.
a form a de obten er estos gr ficos con tata es sim ilar a la de los otros
gr ficos ya con tem p lad os. am b ia, en este caso, la palabr a clave qu e sigu e
a la in stru ccin graph
gr a o lista devariab les

s, para ob ten er la repr esen tacin d e la variab le edad, b asta con escr i
b ir la sigu ien te in stru ccin .
grap h b oed ad , n a m e
, repla ce

l r esu ltado m u estra el m n im o en , el m im o en , u n a m edian a


p rim a a y cu ar tiles r espectivos d e y a os.

20

40

edad
60

80

100

GR IC 6.1 . Gr fic o d e ca
a

l n m ero de var iables pu ede ser m ayor qu e u n o, en cu yo caso para


cada u n a d e ellas se dib u
a u n a ca
a p ar alela a fin d e qu e se p u ed an com pa
r ar las d istr ibu cion es. on las r eser vas p rop ias del car cter or din al de estas
variab les, se p u ed e pon er com o e
em p lo com p arativo la atrib u cin id eol
gica qu e h acen los en cu estados a los partidos esp a oles con rep resen tacin
p arlam en tar ia en el con
u n to n acion al
tab sta t ideopp
id eoiu , statistics
ppp
grap h b oideopp
id eoiu , n a m e
, repla ce

06_Graficos con Stata.indd 167

06/06/12 09:28

UT

10

GR IC 6.1. Gr fico d e c a
a s co n a r ia s a r ia le s

pp
iu

psoe

s t at s | i deopp i deoi u i dps _e


- - - - - - - - - +- - - - - - - - - - - - - - - - - - - - p25 |
2
6
3
p50 |
2
7
4
p75 |
3
8
5
-------------------------------

n este gr fico se obser va cm o el prim er r ectn gu lo, corr esp on dien te


a
zqu ier da Un ida (ideoiu ), n o tien e ln ea m edian a en el r ectn gu lo, por qu e
este estadstico coin cide con el pr im er cu artil. a ln ea in ferior del rectn
gu lo llega a por qu e es el valor em p rico in ferior, per o la su p er ior slo
llega h asta el , por qu e al ser var iable discr eta n o eiste em p r icam en te el
su pu esto m im o
,
, esto es, el tercer cu artil

, m s vez y m edia el r an
go in ter cu ar tlico
,
. n cam bio, h ay cu estion arios n o se sab e cu n tos
p or m ed io del grfico qu e h an r ecogid o p ar a esta var iable valor es desde
el h asta el .
l r ect n gu lo d el m ed io, el cor r esp on d ien te a l (ideopp), tien e u n
r a n go in ter cu a r tlico d e d os p u n tos
en tr e el y el con m ed ia n a en
el . or eso la ln ea d e a b a
o a lca n za h a sta el , esto es, m en os vez y
m ed ia el r a n go, qu e tien e en este ca so el va lor d e . la d e a r r ib a llega
h a sta el m im o va lor p osib le, es d ecir, el , p or qu e p a r te d esd e el ter
cer cu a r til.
n el sigu ien te e
em plo, en lu gar d e r ep resen tar d istin tas var iables, se
d ibu
a u n a sola
la u b icacin en la escala id eolgica del , ideopp
, pero en
tan tos gru p os com o valor es ten ga u n a var iable d e con trol
el p ar tido p olti
co al qu e se vot, oto

gra ph b oid eop p, over


oto
n am e
, rep lace

06_Graficos con Stata.indd 168

06/06/12 09:28

T TT

pp

10

GR IC 6.. Gr fico d e ca
a s co n a r ia le d e co n t r o l

PP

PSOE

IU

Otros

Blanco

NC

n logam en te pu ed e repr esen tar se m s de u n a var iable


en este caso,
las valor acion es de las ideologas de dos partidospor u n a o var ias variab les
d e con tr ol
en este e
em p lo, el voto en las ltim as eleccion es y el seo

grap h b oideopp id eop soe, over


otoover
seon am e
, rep lace
Gr fico d e c a
a s c o n d o s a r ia le s d e co n t r o l

10

GR IC 6.1 .

PP PSOE IU

OtrosBlanco NC

PP PSOE IU

hombre

OtrosBlanco NC

mujer
pp

psoe

6 .. Gr fico s id im e n sio n a le s
a versin de tata agrupa ba
o la orden graph twoway m odalidades dife
rentes de grficos. lgunas poseen caractersticas m uy sim ilares, pero otras son
etrem adam ente diferentes e incluso difciles de considerar com o bidim ensiona
les. l program a considera bidim ensional todo aquel grfico en el que los dos
e
es o escalas
la , o e
e horizontal, y la , o e
e verticalson num ricos. egn

06_Graficos con Stata.indd 169

06/06/12 09:28

UT

esa definicin, un histogram a siem pre es considerado bidim ensional, del m is


m o m odo que a ciertos grficos de barras y puntos, aunque propiam ente sean
unidim ensionales, el program a los puede tratar com o bidim ensionales, siem pre y
cuando estn representndose variables cuantitativas
en un e
e se representa el
valor de esta variable y en el otro, segn sea el caso, su frecuencia o el valor en
otra variable
. Una caracterstica esencial y verstil de esta instruccin es la de
poder com binar en el m ism o grfico distintas representaciones, sean de la m ism a
o de diferente m odalidad. asta para ello separar las rdenes de los distintos gr
ficos por parntesis, com o ya se hizo en la instruccin que gener el grfico ..
n gen er al, la in str u ccin p ar a realizar grficos bid im en sion ales p resen
ta la sigu ien te sin tais
gr a t o a m oda lid ad
listade
variab les
e igt variab le
if ep

in ra n go
,
op cion es
com u n es
opcion es especficas

as m odalidades de grficos bidim en sion ales p osibles en la versin


d e tata p u ed en ser agru pad as en los sigu ien tes gr u posn u b es d e pu n tos,
m atr ices gr ficas, gr ficos de ln eas, grficos d e rea, grficos de a
u ste,
grficos de fu n cin y grficos d e ran gos. an se a con tin u acin las car acte
r sticas e in stru ccion es d e cada u n o d e ellos.

6... u bes de pu n tos


as n u bes de pu n tos son los grficos esp ecficos para el estu dio de la relacin
en tre dos variables cu an titativas y con tin u as. on ideales cu an do eiste u n n
m ero in term edio de casos, aproim adam en te en tre y . en os casos pu e
den arro
ar poca lu z sobre u n a relacin robu sta en tre los datos y m s casos
produ cen su perposicion es de pu n tos de tal n atu raleza qu e n o perm iten valorar
claram en te dn de se produ ce el gru eso de la asociacin en tre las variables.
unqu e la sintais com pleta de este tipo de grficos es graph twoway scatter,
basta con la ltim a palabra para que tata reconozca la instruccin y genere
inm ediatam en te una nube de pu ntos que relacion a dos variables de n atu raleza
cuan titativa. s, con la base de datos m undial, se pu ede represen tar la relacin
eisten te entre el producto n acion al bruto y la esperanza de vida al nacer por
pases. asta con escribir estas tres palabras para produ cir la siguien te im agen
u se m u n d o
scatter evn pn bp pa , n a m e

pesar de eso, en este captulo la m odalidad del histogram a ha sido considerada entre
los grficos unidim ensionales. a orden que se eplic fue histogram . ero, de ahora en adelante,
es conveniente saber que esta es una abreviatura de graph twoway histogram . sto es im portante
porque este tipo de grficos puede m ezclarse con otros de naturaleza propiam ente bidim ensional.

06_Graficos con Stata.indd 170

06/06/12 09:28

T TT

40

Esperanza de vida al nacer 1998


50
60
70

80

GR IC 6 .. Ne d e n t o s

10000

20000
30000
PNB por unidad de compra

40000

om o la principal u tilidad de las n ubes de pu ntos es estudiar la relacin y


asociacin en tre variables cu an titativas, m edian te u n eam en de la distribucin
de los casos en el grfico pu ede observarse si dos variables poseen relacin, es
decir, si son independien tes o no un a de otra o, dich o con otras palabras, a valo
res altos de u n a de ellas n o le correspon den valores altos
o ba
osde la otra.
sca tter tm i p n bp pa , n a m e
a, replace
sca tter lin tfn o p n bp pa, n am e
b , replace
sca tter evn tm i, n am e
c, replace
sca tter evn pn b pp a, n am e
d, rep lace
grap h com b in e a b c d, n am e

uede h aber m uy distintos tipos de asociaciones. n el grfico .se epo


nen cuatro m odelos diferen tes y reales de asociacin entre variables. n prim er
lugar, se epone la relacin entre el producto nacion al bruto
y la tasa de
inflacin. om o pu ede apreciarse, la m ayor parte de los pases se con centran
entre el y el . lo un os pocos, pero todos en la fran
a de renta ba
a,
estn por encim a o por deba
o de estos topes. a distribu cin bivariable es m uy
distinta en el grfico superior derecho. n este se relaciona el con las ln eas
telefnicas por m il habitantes, y puede verse claram ente cm o a valores ba
os
de la prim era variable le corresponden valores tam bin pequeos de la segun da,
m ien tras que los pases de alta renta tien en en contrapartida tasas de lneas tele
fnicas elevadas. n este caso se est ante u na asociacin lin eal positiva, pu esto
qu e los puntos siguen u na pauta recta ascendente. n el tercer grfico sucede lo
con trario. a pauta sigue sien do u na lnea recta, pero los valores ba
os de la tasa
de m ortalidad infantil estn asociados lgicam ente con valores altos de esperan
za de vida al n acer y, a m edida qu e va aum en tando esta tasa, va dism in uyen do la

06_Graficos con Stata.indd 171

06/06/12 09:28

UT

altura en el e
e vertical en la que estn situados los pases qu e tienen esperanza
de vida m en or. n esta situacin tam bin eiste un a asociacin lineal, pero nega
tiva. in alm ente, el grfico inferior derecho m uestra una asociacin particu lar en
la m edida en qu e fcilm en te se aprecia que n o es lineal, sino cu rvilnea. Tam bin
ocu rre que las altas esperanzas de vida al n acer se en cuentran en pases con alta
renta y las ba
as en los de ba
o , pero se aprecia que entre los de ba
o nivel
econ m ico u n ligero ascenso del producto produce un considerable aum ento de
la esperan za de vida, m ientras que, entre los pases de alto n ivel econm ico, el
enriquecim iento en sim ilares cuantas conlleva m u chos m enores progresos en el
n m ero de a os que la gente vive.

10000
20000
30000
PNB por unidad de compra

40000

50
100
150
200
Tasa de mortalidad infantil /1000 1998

Lneas telefnicas (x 1000 hbs) 1998


0
200 400 600 800

Esperanza de vida al nacer 1998


40
50
60
70
80

Esperanza de vida al nacer 1998


40
50
60
70
80

Tasa de mortalidad infantil /1000 1998


0
50
100 150 200

GR IC 6.. Gr fic o s d e d ist in t o s t io s d e r e la c io n e s

10000
20000
30000
PNB poniae cop
a

40000

10000
20000
30000
Ppor nidad de compra

40000

n este apar tado se con sideran tam bin cu atro gr ficos sim ilar es a las
n u bes de p u n tos, de los qu e se diferen cian en qu e p oseen u n a gu a qu e u n e
el pu n to
repr esen tad o o n ocon el e
e d e abscisas. or tan to, au n qu e algu
n os d e ellos se h ayan visto en el apartado d e gr ficos u n idim en sion ales, en
el fon d o son m u y distin tos, p u es en lu gar de r epr esen tar u n a variable cu ali
tativa con su fr ecu en cia o con otro estadstico de otr a var iable, se estn r e
p resen tan d o los valores de dos variab les cu an titativas, la m ayor parte d e las
veces sien do la in d ep en d ien te
ep resada en el e
e h or izon talel tiem p o.

06_Graficos con Stata.indd 172

06/06/12 09:28

T TT

stas cu atro m odalidad es son b ar ras (bar), en el caso d e qu e lo qu e u n a


al pu n to sea u n a colu m n aln eas con o sin pu n tos
droplin e o spie
, cu an d o
en lu gar de u n a colu m n a se u n e el pu n to r ep resen tado con los e
es m ed ian te
u n a ln ea r ecta y p u n tos gu iados, y p u n tos (dot), en el caso de qu e se qu ie
r a qu e qu ede com o gu a todo el e
e ver tical
in clu id o el espacio su per ior
al pu n to
. Un m ism o e
em p lo al qu e se le ap lican las cu atro m odalidad es
m u estra la sim ilitu d d e tod os estos tipos de grficos.
grap h
grap h
grap h
grap h
grap h

toa y bar p ob su pm , n am e
a, rep lacetitle

a rra s

toa y drop lin e pob su p m , n am e


c, replacetitle

la vos

toa y spie p ob su pm , n am e
b, rep lacetitle

n eas cada s

toa y dot pob su pm , n am e


d, repla ce
, title

u n tos

com b in e a b c d, n am e

GR IC 6 .. t r o s gr fic o s id im e n sio n a le s

Poblacion (millones) 1999


0
500
1000 1500

Poblacion (millones) 1999


0
500
1000 1500

5000000 1.00e+07 1.50e+07 2.00e+07


Superficie km2 1996

Grfico e lneas caas (ropline)

5000000 1.00e+07 1.50e+07 2.00e+07


Superficie km2 1996

Grficos e cla
os (spike)

5000000 1.00e+07 1.50e+07 2.00e+07


Superficie km2 1996

Grficos e pun
os

Poblacion (millones) 1999


0
500
1000 1500

Poblacion (millones) 1999


0
500
1000 1500

Grfico e barras

5000000 1.00e+07 1.50e+07 2.00e+07


Superficie km2 1996

n estas cu atro represen tacion es de m s de pases aparece la variable


eten sin territorial en el e
e h orizon tal, y la altu ra de los pu n tos, ln eas o
barras in dica el tam a o de su s respectivas poblacion es. om o en el fon do son
igu ales, en todos ellos destacan del resto los siete pases m ayores del plan e
ta. n sen tido decrecien te, son u sia, stados Un idos, h in a, an ad, rasil,

06_Graficos con Stata.indd 173

06/06/12 09:28

UT

u stralia y la
n dia. ste ltim o tien e u n a poblacin aproim ada de .m i
llon es de h ab itan tes, slo su perados por los .de h in a. os cin co restan
tes pases de gran eten sin tien en u n a poblacin m u ch o m s redu cida, por
deba
o d e los m illon es de h abitan tes. , en tre los pases pequ e os, destaca

n don esia por su poblacin por en cim a de lo m illon es de h abitan tes.

6... Grficos de m atri


ar a u n an lisis ep lor atorio d el con
u n to de relacion es en tr e m s d e dos
variab les, el p rogram a tata d isp on e d e la m odalidad m atrix en su pr ogr a
m a de grficos . sta pr od u ce tan tos gr ficos d e dispersin com o par es de
con trastes se pu edan realizar en tr e u n a serie de var iables. e este m od o, si
se escr iben tr es var iables, tres son los posib les grficos n o r ed u n dan tes qu e
se gen eran en el gr fico ..
gra ph m atritm i p n bp pa evn , h alf n am e

GR IC 6 .. Gr fico s d e m a t r i
Esperanza
de vida
al nacer
1998
200

Tasa de
mortalidad
infantil
/1000 1998

100

0
40000

PNB por
unidad
de
compra

20000

0
40

60

80 0

100

200

u an do se dispon e d e u n a variab le depen d ien te y u n con


u n to de varia
bles in d ep en d ien tes, lo m s ad ecu ado es u b icar la prim era al fin al d e la lista.
e este m od o, en la ltim a fila de la m atriz de grficos se disp on e d el con

u n to de cru ces d e las variables in depen d ien tes


u bicadas en el e
e h orizon tal

arad
icam en te, au n qu e represen te relacion es bivariadas entre variables, este grfico
n o es tratado com o bidim en sional por tata. a razn es sen cilla, por su propia naturaleza de
in clu sin de m ltiples grficos bivariados n o pu ede in crustarse con otros grficos sen cillos.
perativam en te, la in stru ccin graph twoway slo es aplicable a grficos qu e pu edan in tegrarse
en tre ellos. in em bargo, este tipo de grfico se in clu ye en este apartado por su alta sim ilitu d
de con ten ido y u so con los grficos de dispersin .

06_Graficos con Stata.indd 174

06/06/12 09:28

T TT

de abscisascon la variable depen d ien te


situ ada en el e
e vertical
. a op
cin half, u tilizada en el recien te e
em plo, sirve para qu e slo se rep rodu zcan
los grficos d e la p arte in ferior d e la m atriz, p u es el resto es red u n dan te.

6... Grficos de ln eas


os casos d ibu
ados en u n a n u b e de p u n tos p u ed en con ectarse en tr e s si
gu ien do d istin tas reglas a fin de qu e m e
or e la apr eciacin de la pau ta qu e
sigu en los p u n tos o a fin d e qu e se d u n a sen sacin de con tin u id ad en los
d atos, com o pu ede ser en el caso de d atos qu e r epresen ten fu n cion es o en el
caso de repr esen tacin de ser ies tem por ales.
isten dos in stru ccion es qu e p erm iten desarrollar este tipo d e grficos.
a prim era (con n ected) dib u
a los pu n tos y los con ecta. a segu n d a (lin e) tan
slo h ace la con ein y de
a in visib les los pu n tos. am b as es recom en dable
acom p a arlas con la opcin sort, qu e orden a los casos en fu n cin d e la va
riab le in d ep en d ien te
en el e
e h orizon talp ara qu e la con ein se p rodu zca
en tre casos con tigu os y n o se produ zcan cru ces en tre las ln eas dib u
ad as.
con tin u acin se epon en las d os in stru ccion es qu e gen er an los grfi
cos com pu estos repr esen tad os en la pr im a figu r a
grap h toa y con n ected evn tm i, sort n a m e
a , replace
grap h toa y lin e evn tm i, sort n am e
b, repla ce
grap h com b in e a b, n a m e
, rep lace

om o pu ede apr eciar se, las d ifer en cias en tre am bos grficos estn en la
p resen cia o au sen cia de los pu n tos qu e repr esen tan a los casos

80
Esperanza de vida al nacer 1998
50
60
70
0

06_Graficos con Stata.indd 175

Gr fic o s d e ln e a

40

40

Esperanza de vida al nacer 1998


50
60
70

80

GR IC 6.6.

50
100
150
200
Tasa de mortalidad infantil /1000 1998

50
100
150
200
Tasa de mortalidad infantil /1000 1998

06/06/12 09:28

UT

6... Grficos de rea


on u n a m od a lid a d d e los a n ter ior es, p u esto qu e lo n ico qu e los d i
fer en cia es qu e a p a r ece r ellen a el r ea eisten te en tr e la ln ea for m a d a
p or la con ein d e los p u n tos y el e
e h or izon ta l. on id n eos cu a n d o se
qu ier e r ep r esen ta r fr ecu en cia s o ta m b in cu a n d o se r ep r esen ta n ca n ti
d a d es, p u esto qu e p r op or cion a n a l lector u n a con sid er a b le sen sa cin d e
volu m en .
d em s de la op cin sort, siem pr e recom en d a ble en este tip o de gr
ficos, tien e otr a s dos im por ta n tesla pr im era es h ori
on tal, qu e perm ite
ca m b ia r la orien tacin del gr fico, p on ien do en el e
e vertica l la segu n d a
va r ia ble
la in depen dien tey en el e
e h orizon ta l la p rim er a
la d epen
dien te
la segu n da es ba se

, qu e perm ite in d ica rle a l gr fico el pu n to de


ar ra n qu e d el rea .
om o e
em p lo d e u so, se u tilizan los m ism os d atos de los gr ficos d e
ln ea p ar a qu e se ap recien su s sem e
an zas.
gra ph toay a rea evn tm i, sort n a m e
, repla ce

l gr fico de r ea p resen ta el sigu ien te aspecto

40

Esperanza de vida al nacer 1998


50
60
70

80

GR IC 6.. Gr fic o d e r e a

50
100
150
Tasa de mortalidad infantil /1000 1998

200

6... Grficos de a
u ste
n lu ga r d e d ib u
a r ln ea s qu eb r a d a s qu e u n a n tod os los p u n tos d e u n a
d istr ib u cin b iva r ia d a , se p u ed e op ta r p or tr a za r u n a ln ea r ecta o cu r
va qu e tr a te d e p a sa r lo m s cer ca p osib le d e los p u n tos con el fin

06_Graficos con Stata.indd 176

06/06/12 09:28

T TT

d e d a r cu en ta sim p lifica d a d e la r ea lid a d , esto es, gen er a r u n m od elo


d e r ela cin en tr e la s va r ia b les qu e ep liqu e d e m od o sim p le cm o u n a
va r ia b le ca m b ia su s va lor es, en la m ed id a en qu e otr a va r ia b le m od ifica
los su yos.
l a
u ste m s sim ple y u tilizad o, au n qu e n o el n ico, com o se ver m s
ad elan te, es la ln ea r ecta. el criterio m s com n qu e se u tiliza
vase el
p rim er captu lo dedicad o a la regresin es el d e m n im os cu adrad os, esto
es, se tr aza la recta cu ya d istan cia cu adr tica respecto a los pu n tos em pri
cos reales sea m n im a .
p esar de la ap aren te com p licacin d el pr oceso de a
u ste de la r ecta,
m ed ian te el p rogram a grfico de tata, el trazad o de esta ln ea es etr em a
d am en te sim p le. asta con p ed ir u n grfico b idim en sion al con la m od alidad
lfit y apor tar las variables qu e h an d e u b icar se, respectivam en te, en el e
e
vertical y h orizon tal. s, escribien d o la sigu ien te in stru ccin
grap h toa y lfit evn tm i, n a m e
, repla ce

en lu gar de d ib u
arse los p u n tos em p ricos, se tr aza la ln ea qu e m e
or
a
u sta la distan cia cu adr tica de estos a la recta. s p reciso n otar qu e en el
e
e vertical ap ar ecen los valores a
u stados d e la esper an za de vid a al n acer,
en lu gar d e la var iable p ropiam en te d ich a.

30

40

Fitted values
50
60

70

80

GR IC 6.. Gr fico d e a
st e lin e a l

50
100
150
Tasa de mortalidad infantil /1000 1998

200

u ch o m s til qu e d ib u
a r slo la r ecta a
u sta d a es r ep r esen ta r
un
to con ella los p u n tos qu e r ep r esen ta n los va lor es m ed id os d e a m b a s
va r ia b les. om o se h a d ich o a l in icio d e los gr ficos b id im en sion a les, la

l m todo de a
u ste de ln eas es con tem plado con m s detenim iento en el captu lo
destin ado a la regresin .

06_Graficos con Stata.indd 177

06/06/12 09:28

UT

in str u ccin gra ph twowa y p osee la fa cu lta d d e d ib u


a r en los m ism os e
es
va r ios gr ficos a l m ism o tiem p o con u n a gr a n fa cilid a d b a sta con e
p r esa r los d istin tos gr ficos en tr e p a r n tesis o sep a r a r los p or d os ln ea s
ver tica les

. or ello, la s d os sigu ien tes in str u ccion es d a n el m ism o r e


su lta d o
gra ph toay
lfit evn tm i
scatter evn tm i
gra ph toay lfit evn tm i
scatter evn tm i, n a m e
, repla ce

e esta for m a, adem s d e los pu n tos qu e r ep resen tan cada u n o d e los


casos em p ricos d e los qu e se dispon en d atos, aparece la ln ea r ecta qu e
m e
or a
u sta los valor es em pr icos de la tasa d e m ortalid ad in fan til y la es
p er an za de vida al n acer

30

40

50

60

70

80

GR IC 6.. Ne d e n t o s a
s t e lin e a l

50
100
150
Tasa de mortalidad infantil /1000 1998
Fitted values

200

Esperanza de vida al na
er 1998

d em s d el a
u ste lin eal, la opcin gr fica d e tata p er m ite otr os a
u stes
in m ed iatos. l cu ad rtico (fit) y el p olin m ico (fpfit) , por u n lado, son
a
u stes en ltim a in stan cia lin eales. l a
u ste lowess es u n su avizad o basado
en regr esion es p on d eradas localm en te d e los valor es yi. os a
u stes m ban d
y m splin e d ivid en la d istr ibu cin d e la variab le in depen dien te en distin tos
sectores
ban dasy, a travs d e la m ed ian a, en cada u n a de ellas con stru ye
u n a
u ste n o su avizad o, com o en el pr im er caso, o su avizado, com o en el
segu n d o.

ste a
u ste im plica la realizacin de u n a regresin fraccional polinm ica en la qu e
el program a bu sca las m e
ores potencias sobre la variable in depen diente para qu e a
uste los
valores de la variable depen diente. ase para m s detalle la instru ccin fracpoly en el m an u al
de tata
f
.

06_Graficos con Stata.indd 178

06/06/12 09:28

T TT

ed ian te las cu atro in str u ccion es sigu ien tes p osterior m en te com bi
n ad as se ob tien en los cu atro grficos de la p rim a figu ra, don de pu eden
com p robar se las diferen tes caractersticas d e los a
u stes epu estos en su s
r espectivos ttu los
toay
qfit evn pnbppa
scatter evn pnbppa
, nam e
atitle

uste qfit

toay
fpfit evn pnbppa
scatter evn pnbppa
, nam e
btitle

uste fpfit

toay
loess evn pnbppa
scatter evn pnbppa
, nam e
ctitle

uste loess

toay
m spline evn pnbppa
scatter evn pnbppa
, nam e
dtitle

uste m spline

graph com bine a b c d, nam e


, replace

GR IC 6 .. Gr fico s d e ca t r o a
st e s d ist in t o s

uste
p
it

40 50 60 70 80

40 50 60 70 80

uste
it

10000
20000
30000
PNB por unidad de compra
Fitted values

40000

Esp.vida
1

10000
20000
30000
PNB por unidad de compra
predicted evn

Esp.vida
1

40 50 60 70 80

us
e mspline

40 50 60 70 80

us
e lowess

40000

10000
20000
30000
PNB por unidad de compra
lowess evn pnbppa

6..6.

40000

Esp.vida
1

10000
20000
30000
PNB por unidad de compra
Median spline

40000

Esp.vida(1

Grficos de ran go

on aqu ellos qu e al m ism o tiem p o, p ara cada valor de la variable in d ep en


d ien te, r epr esen tan dos p u n tos d istin tos corr espon dien tes a d os valores de

06_Graficos con Stata.indd 179

06/06/12 09:28

UT

sen das variab les depen dien tes. ay var ias for m as d e pr esen tacin , pero to
d as ellas se caracterizan por lo qu e se acaba de defin ir.
or u n lado, las d os var iables r ep resen tadas pu eden estar u n id as en tr e
ellas, sea por b ar ras (rbar), p or ln eas ver ticales (rspie), p or ln eas r em a
tad as
rcap o rcapsim o por reas (rarea). tra p osibilidad es qu e se r e
p resen ten las dos series con dos ln eas con ectadas, pero paralelas en tr e s,
in ser tan do o n o los p u n tos qu e r ep resen tan los d iver sos casos
rcon n ected
y rlin e
.
a sin tais de este tipo de gr ficos com ien za con la or den gra ph
twowa y, d esp u s con tin a con la m od a lid a d d e gr fico d esea d a y segu i
d a m en te h a n d e p on er se en p r im er lu ga r la s d os va r ia b les r ep r esen ta d a s
en el e
e ver tica l y, a con tin u a cin , la va r ia b le in d ep en d ien te, es d ecir, la
d el e
e h or izon ta l. l or d en d e la s d os p r im er a s es ir r eleva n te, p u esto qu e
m ed ia n te la b a r r a o el r ea se r ep r esen ta la d ista n cia a b solu ta en tr e los
d os va lor es.
con tin u acin se pr esen tan , para m ostrar las d istin tas m odalidades d e
r ep resen tacin de los gr ficos de r an go, cu atr o m odelos distin tos ob ten idos
con las sigu ien tes in stru ccion es
gra ph
gra ph
gra ph
gra ph
gra ph

toay rb ar lin tfn o p cp n bp pa, n am e


atitle

rb ar

toay rcap lin tfn o p cpn b pp a, n am e


btitle

rca p

toay ra rea lin tfn o pcpn b pp a, sort n a m e


ctitle

ra rea

toay rlin e lin tfn o pcpn b pp a, sort n a m e


d title

rlin e

com b in e a b c d , n am e
, replace

a com bin acin de estas cu atr o in stru ccion es da lu gar a los sigu ien tes
grficos

06_Graficos con Stata.indd 180

06/06/12 09:28

T TT

GR IC 6.1.

Gr fico s d e r a n go s

Pcs/Tfnos
200 400 600 800

rcap

Pcs/Tfnos
200 400 600 800

rbar

10000
20000
30000
PNB por unidad de compra

40000

40000

Pcs/Tfnos
200 400 600 800

rline

Pcs/Tfnos
200 400 600 800

rarea

10000
20000
30000
PNB por unidad de compra

10000
20000
30000
PNB por unidad de compra

40000

10000
20000
30000
PNB por unidad de compra

40000

as var iables qu e defin en el ran go son el n m ero de ln eas telefn icas

m im oy el n m er o de ord en ad ores person ales


m n im op or m il h abi
tan tes. a var iable in dep en d ien te es el p rod u cto n acion al br u to per cp ita.
os grficos m u estr an b a
o d iver sas form as cm o los dos in d icad ores de
d esar rollo tecn olgico cr ecen a m ed ida qu e lo h ace el per cpita y
d e
an en trever qu e d on d e m s d ivergen cias se da en tre telfon os y or den a
d ores es en algu n os p ases con ren ta per cpita m ed ia.
Tam bin p odr an clasificar se en esta categora aqu ellos gr ficos qu e
a
u stan datos y dan u n determ in ad o ran go de ocu r ren cia. e corr esp on den
con los gr ficos lfit, fit y fpfit, es decir, a
u stes lin eales, cu ad rticos y p o
lin m icos fr accion ales, p ero, en lu gar d e ap or tar u n a sola cu rva, m u estr an
d os cor resp on d ien tes a la p rob ab ilidad se alada. n estos casos, la m oda
lid ad del gr fico se in dica con las palab ras claves lfitci, fitci y fpfitci. de
m s, en este tipo de grfico son im portan tes las opcion es level

, don de se
in dica el por cen ta
e de con fian za desead o para la r ep resen tacin , y stdf, en
el caso d e qu e se d esee con tar con el er ror tpico d el pr on stico, en lu gar del
de la pr ed iccin , o la opcin stdr, si se desea u tilizar p ara el clcu lo de los
in tervalos el err or tpico de los r esidu ales.

ase el captulo de la regresin .

06_Graficos con Stata.indd 181

06/06/12 09:28

UT

Un p ar d e e
em plos con las op cion es p or om isin m u estran d os grficos
con los in tervalos b asad os en el er ror tpico de la pr ed iccin y u n de
con fian za, salvo en el caso d e qu e se m odifiqu e este parm etr o con la in s
tr u ccin set level.
gra ph toay
qfitci evn pn bp pa
scatter evn pn b pp a
, n a m e
a, replace
gra ph toay
fp fitci evn p n bp pa
scatter evn pn bp pa
, n am e
b , replace
gra ph com b in e a b, n am e
, rep lace

30

40

40

50

50

60

60

70

70

80

80

GR IC 6.. Gr fic o s d e a
st e s co n in t e r a lo s d e co n fia n a

10000
20000
30000
PNB por unidad de compra
95% CI

p
vida
1999

6..7.

40000

Fitted va
ue

10000
20000
30000
PNB por unidad de compra
95% CI

40000

predicted evn

p
vida
1999

Grficos de fu n cin

on aqu ellos en los qu e se r epresen ta la cu r va r esu ltan te de ap licar u n a fu n


cin a u n a var iable de r an go estab lecid o
en tre los valor es de y , en caso
d e qu e el u su ar io n o lo in diqu e en las op cion es
.
a sin tais d e estos grficos es sen cilla
gr a t o a fn c t io n va r
d ep f

, op cion es

a epr esin var depf(x) es la qu e rep resen ta a la fu n cin qu e se


qu iere repr esen tar. s, si se desea dib u
ar u n a r ecta con par m etros ay
b ., la in stru ccin sigu ien te gen er a la ln ea desead a.

n este caso, x represen ta la variable que va a flu ctu ar u n n m ero determ in ado de ve
ces
por om isin en u n ran go dado
en tre y , si n ada se especifica
.

06_Graficos con Stata.indd 182

06/06/12 09:28

T TT

grap h toa y fu n ction y., n am e


, replace

l grfico m u estr a el valor en la var iable y al ap licar la epr esin tras el


igu al a valor es com pr en d id os en tr e el y el .

2.1

2.2

2.3

2.4

2.5

GR IC 6 .. Gr fico d e fn ci n

.2

.4

.6

.8

l u su a r io, a tr a vs d e la s op cion es, p u ed e con tr ola r ta n to el n m er o


d e estim a cion es d e la fu n cin com o el r a n go d e la va r ia b le x. s, si se
d esea r ep r esen ta r la fu n cin d e p r ob a b ilid a d d e la n or m a l slo a tr a vs
d e n u eve va lor es, la in str u ccin n ecesa r ia es la qu e se ep on e a con tin u a
cin
graph toay fu n ction yn orm alden

, ran ge

..n

, n am e
, replace

06_Graficos con Stata.indd 183

06/06/12 09:28

UT

.1

y
.2

.3

.4

GR IC 6 .. Gr fico d e la fn ci n n o r m a l

0
x

om o pu ede ap reciarse, la cu rva n or m al p ierd e su ap arien cia de cam p a


n a cu r vad a p or ten er tan pocos p u n tos de referen cia.

6.. Co m o n e n t e s d e lo s gr fico s
Un a vez visto cm o pr oced er para obten er lo b sico d e los d istin tos gr
ficos qu e tata gen er a con su in str u ccin graph , se van a con sid erar otros
elem en tos qu e, au n qu e au iliar es, son m u y im p or tan tes para la defin icin
fin al de los grficos. ara cu alqu ier tip o d e gr ficos, in depen dien tem en te
d e la in stru ccin qu e lo gen ere o de las car acter sticas pr op ias d e su for m a,
p u ed en d istin gu irse u n a ser ie de elem en tos com plem en tarios, a veces con si
d er ados secu n dar ios, pero m u y im por tan tes para la p resen tacin adecu ada.
in pr eten sin d e ser eh au stivos, aqu se pr esen ta u n a lista de ellos
tu losu m p len u n a d ob le fu n cin por u n lado, aclaran al lector qu
es lo qu e se est r ep resen tan do y, por el otro, el ttu lo p rin cip al de u n grfi
co es u n elem en to esen cial para epon er lo en u n n d ice de u n a p u blicacin
d on d e el n m er o de gr ficos sea con siderable. n m u ch as ocasion es, estos
ttu los deben acom pa arse d e u n su bttu lo, con sisten te en u n a ln ea ad icio
n al qu e com p lem en ta la in form acin del p rim er o.

o es ob
eto de u n m an u al in trodu ctorio eplicar la com ple
a estru ctu ra de rden es
y opciones a travs de las cu ales se pueden in trodu cir o m odificar estos elem en tos. ara rea
lizar cam bios en u n grfico se su giere el u so del editor de program as, eplicado al fin al de
este captu lo. e recom ien da, asim ism o, tan to el libro de itch ell

, dedicado eclusiva
m en te a los grficos, com o la pgin a eb de la U, http

www.ats.u cla.edu
stat
stata
library
Graphxam ples
defau lt.htm , don de se eponen u na serie de m odelos, con las rden es qu e h ay
qu e escribir para obten erlos.

06_Graficos con Stata.indd 184

06/06/12 09:28

T TT

eson escalas don de se u bican los valores o las frecu en cias de las varia
bles represen tadas. n teora pu ede h aber grficos sin e
es, com o los de secto
res, y los pu ede h aber h asta con seis
tres dim en sion es con dos e
es cada u n a
de ellas
, siem pre y cu an do n o se com bin en u n a serie de grficos, pero lo m s
frecu en te es qu e u n grfico slo ten ga u n o o dos. en tro de los e
es pu eden
con siderarse las m arcas y las cu adrcu las. as prim eras son pequ e os sign os,
gen eralm en te perpen dicu lares al e
e, qu e especifican dn de se en cu en tra u n
determ in ado valor. as cu adrcu las, en cam bio, son ln eas qu e tien en su origen
en u n determ in ado e
e y llegan h asta el otro etrem o del grfico con el fin de
poder u bicar la posicin de u n determ in ado elem en to den tro del con
u n to.
lem en toson cad a u n o d e los com p on en tes esen ciales de u n gr fico
p rop iam en te d ich o, qu e r ep resen tan bien u n caso o u n gr u po de casos, b ien
u n valor o con
u n to de valor es. on elem en tos, p or e
em p lo, los sector es de
u n gr fico circu lar, los r ectn gu los qu e for m an u n diagr am a de bar ras, los
p u n tos de u n a n u b e d e pu n tos o las ln eas qu e r epr esen tan u n a regresin .
n gen er al, au n ten ien do en cu en ta las ecep cion es de las d istin tas var ie
d ades, los elem en tos pu eden d ifer en ciar se de cu atro m an er as d istin tas. n
p rim er lu gar, la form a. e este m od o, par a distin gu ir distin tos tipos de ca
sos, pu ede u tilizar se u n cr cu lo, u n cu adr ado o cu alqu ier otr a for m a sim ilar,
seg n se qu ier an epr esar los de u n tip o u otro. n segu n do lu gar, el tam a o
tam bin pu ede d iferen ciar u n os elem en tos de otr os, au n qu e en la m ayor
p arte de los gr ficos el tam a o su ele em plear se par a d istin gu ir la frecu en cia
d e u n os determ in ados casos o valor es. n tercer lu gar, la posicin , pu es en
m u ch as ocasion es u n valor n o est r ep resen tado por el tam a o d el elem en
to, sin o por lo cercan o o ale
ado qu e est del pu n to de origen de u n a escala.
n cu arto lu gar, los grficos pu ed en u tilizar el color p ara diferen ciar los ele
m en tos. s, u n valor p u ed e qu ed ar r ep resen tado con u n color y el resto d e
los valor es con otr os. , fin alm en te, d e m odo altern ativo o com plem en tario
al color, se pu eden u tilizar d istin tas tram as al dibu
ar cu alqu ier elem en to,
com o p or e
em plo ln eas con tin u as, d iscon tin u as o pu n teadas, o bar ras con
su p er ficies lisas, rayadas o pu n teadas.
eyen dason el r ep ertor io de sm bolos qu e se u tilizan en u n grfico,

u n to al sign ificado qu e estos poseen . ir ven par a d escifrar el sign ificado de


las form as, color es o tram as qu e se em plean par a la r ep resen tacin de los
d atos y son volu n tarias au n qu e altam en te r ecom en dables.
tiu etason los tetos aclarator ios qu e acom pa an los elem en tos
esen ciales del gr fico. u eden ser tetu ales p ara iden tificar al ob
eto al qu e
acom pa an , o bien n u m r icas, en cu yo caso in dican el valor con cr eto qu e
p osee u n determ in ad o sm b olo o p osicin d el grfico.
arcoson rectn gu los qu e en vu elven al gr fico o a p artes de este, por
u n m otivo p rin cip alm en te esttico.
otason tetos, n orm alm en te u b icados en la parte in fer ior d el gr fi
co, qu e sirven p ar a aclarar, r esaltar o p recisar algu n as de las caractersticas
pecu liar es de los d atos, esp ecialm en te la fu en te de don de pr oceden .

06_Graficos con Stata.indd 185

06/06/12 09:28

UT

6.. se m a s
ad a la com p le
id ad d e las opcion es y su b opcion es d e los gr ficos en tata,
esta h err am ien ta estadstica h a qu er id o sim p lificar al u su ario la p rod u ccin
d e gr ficos a travs de los esqu em as. os esqu em as son con
u n tos d e opcio
n es con los qu e los gr ficos son r ep resen tados en la p an talla.
em plo d e
las esp ecificacion es qu e pu ede con ten er u n esqu em a son el tipo y tam a o
d e letr a, los colores de fon d o y d e los cu adr os, los su cesivos color es qu e in
corp or an los elem en tos
sector es, b ar ras, ln easde los distin tos tipos de
grficos, el grosor y la tetu ra de las ln eas, la presen cia y en su caso la
for m a o au sen cia de m ar cas, e
es, r e
illas, etc. or om isin , tata tr aba
a
con u n o d e la docen a d e esqu em as qu e tien e dispon ib les . ar a saber los
n om b res dispon ib les y cu l est activo en u n d eter m in ad o m om en to se em
p lean , respectivam en te, las sigu ien tes d os in str u ccion es
gra ph qu ery, sch em es
qu ery grap h ics

l r esu ltado de ella p u ed e var iar de or den ad or a orden ador, seg n los es
qu em as en l in corp or ados a travs de
n ter n et o d e la pr op ia con str u ccin .
Un e
em p lo d e listad o es el sigu ien te
ILUSTR ACIN 6 .. List a d o d e e se m a s gr fic o s
Avai l abl e s c hemes ar e
economi s t
see
s 1c ol or
see
s 1manual
see
s 1mono
see
s 1r c ol or
see
s 2c ol or
see
s 2c ol or g
see
s 2manual
see
s 2mono
see
sj
see
Gr aphi c s s et t i ngs
set gr aphi c s
set sc heme
set pr i nt c ol or
set copyc ol or

hel
hel
hel
hel
hel
hel
hel
hel
hel
hel

p
p
p
p
p
p
p
p
p
p

s cheme_economi s t
s cheme_s 1c ol or
s cheme_s 1manual
s cheme_s 1mono
s cheme_s 1r c ol or
s cheme_s 2c ol or
s cheme_s 2c ol or g
s cheme_s 2manual
s cheme_s 2mono
s cheme_s j

on
sj
aut omat i c
aut omat i c

may be aut omat i c , as i s, gs 1, gs 2, gs3


may be aut omat i c , as i s, gs 1, gs 2, gs3

n la pr im era p ar te de este r ecu adr o ap arecen tod os los esqu em as dis


p on ibles en la m qu in a. n la segu n d a p arte se ep resa qu e el esqu em a

l u su ario puede im portar n u evos esqu em as por


n tern et, y con un poco de destreza
in clu so pu ede constru ir n u evos esqu em as a partir de los eisten tes, qu e residen en los directo
rios de los ficheros .ado.

06_Graficos con Stata.indd 186

06/06/12 09:28

T TT

p u esto por d efecto (set sch em e) es el s


, qu e cor respon d e a los qu e se h an
em p leado h asta el m om en to, qu e es el u tilizado en las pu b licacion es del
Stata
ou rn al. om o p u ed e apreciarse, ad em s de este y d el pr op io d el se
m an ar io h e con om ist, aparecen dos esqu em as en b lan co y n egro
sm on o
y sm on o
, d os estilos en color
scolor y scolory dos estilos m an u ales

sm an u al y sm an u al
.
ara cam biar el esqu em a del p rim o grfico h ay qu e in tr odu cir la in s
tru ccin set sch em e n om b redel estilo. acin dolo as, el grfico .se
con vierte en este otr o con el esqu em a de he con om ist
u se e
em plo, clear
set sch em e econ om ist
grap h b oideopp
id eoiu , title

artid os
, position

n am e
, rep lace
GR IC 6 .. Gr fico d e ca
a co n e se m a e r so n a lia d o

Partidos
pp

psoe

iu
10

6... Grficos con m en s


a d o qu e con tr ola r la s m ltip les op cion es qu e ofr ecen la s p osib ilid a d es
gr fica s d e ta ta es com p lica d o y r equ ier e u n con ocim ien to p or m en or i
za d o d e op cion es y su b op cion es, r esu lta d e gr a n u tilid a d r ecu r r ir a los
m en s qu e se ofr ecen a p a r tir d e la ver sin d e este p r ogr a m a esta
d stico. o ob sta n te, h a y qu e r ep a r a r en qu e sa lvo en los gr ficos d e
sector es p a r a los qu e se d isp on e d e u n a p osib ilid a d in m ed ia ta u b ica d a
en el m en d e los gr ficos f ciles, p a r a la r ep r esen ta cin sim p le d e
va r ia b les ca tegr ica s, n o b a sta con p on er esta va r ia b le en la ca silla co
r r esp on d ien te. om o se vio en el a p a r ta d o ., p a r a la con str u ccin d e

06_Graficos con Stata.indd 187

06/06/12 09:28

UT

gr ficos u n id im en sion a les d e va r ia b les, h a y qu e gen er a r u n a n u eva con


el p eso d e ca d a ca so, qu e es la qu e a p a r ece en el e
e d e fr ecu en cia s, m ien
tr a s qu e la qu e gen er a los d istin tos va lor es d e la va r ia b le a p a r ece b a
o la
op cin over.
Un e
em plo con u n grfico d e b ar ras del seo m ostrado a tr avs de los
d iver sos m en s ayu dar a realizar la r ep resen tacin de las var iables cu ali
tativas.
u se pa n el, clear
tabu la te seo
gen era te casos
r

d b gra ph b ar

a r a n o com p lica r ecesiva m en te el e


em p lo, se r ecu r r e a la m od a li
d a d d e gr ficos d e b a r r a s (Gra ph ics
a r ch a rt). Un a vez qu e se h a n se
leccion a d o d esd e el m en esta s d os op cion es, a p a r ece u n cu a d r o d e d i
logo con on ce p esta a s
a in , p a r a ep on er la s va r ia b les d el gr fico y
su tr a ta m ien toa tegories, p a r a in clu ir la s va r ia b les qu e m a r ca n los d is
tin tos segm en tos d el gr ficoif
in , p a r a seleccion a r los ca sos qu e se d e
sea n ep on er en el gr ficoeigh ts, p a r a a d
u d ica r p esosption s, p a r a
esp ecifica r a lgu n a m od a lid a d d el gr fico
b a r r a s a p ila d a s, tr a ta m ien to
d e va r ia b les
ars, p a r a con tr ola r el for m a to d e la s b a r r a sa xis, p a r a
m a n e
a r la a p a r ien cia d e la esca la ver tica litles, p a r a p on er ttu los, su b
ttu los, a cla r a cion es y n ota s a d icion a les a l gr ficoegen d, p a r a solicita r
u n a leyen d a vera ll p a r a d a r n om b r e a l gr fico y esp ecifica r su ta m a o,
y y con el p r op sito d e sa ca r va r ios gr ficos en fu n cin d e u n a segu n d a
va r ia b le
.
e ellas las dos pr im eras son las m s im p ortan tes p ar a el gr fico desea
d o y h an de ser disp u estas d el m od o sigu ien te
ILUSTR ACIN 6.. e n s d e l gr fic o d e a r r a s

06_Graficos con Stata.indd 188

06/06/12 09:28

T TT

n el cu a d r o d e d i lo go d e la izqu ier d a a p a r ece en Sta tistic la m o


d a lid a d Su m
ou n t n om issin g, en el ca so d e q u e se d eseen fr ecu en
cia s a b so lu ta s y n o r ela tiva sy en a ria bles, se h a in ser ta d o la va r ia b le
in str u m en ta l (ca sos) q u e se cr ea a fin d e q u e a p a r ezca n p or cen ta
es o
p r o p or cion es en lu ga r d e su m a s
va se el a p a r ta d o ..
. n el d e la
d er ech a , en la ven ta n a d e la s va r ia b les d e cr u ce, es d on d e a p a r ece la
ver d a d er a va r ia b le d e la q u e se d esea la r ep r esen ta ci n . l n o m b r e q u e
p o see la va r ia b le en el fich er o es el qu e a p a r ece en la p r im er a ven ta n illa
y en este m en p u ed en ca m b ia r se su s etiq u eta s p u lsa n d o en el b ot n
roperties.
on estas dos in str u ccion es b astar a p ara con feccion ar el grfico de
seado. o ob stan te, p u ed e ser m e
or ad o slo con dos detalles. n p rim er
lu gar, d an d o u n ttu lo d istin to al e
e ver tical qu e rep resen ta en este caso los
p orcen ta
es. sto se logr a esp ecificn d olo en la casilla title d e la p esta a
axis. , en segu n do lu gar, h acien d o qu e el pr ogram a trate la var iable d e cru
ce com o variab le p rin cip al. ara ello, en la ltim a pesta a, p u ed e m ar car se
la casilla
reat first category grou p as y
variables. e este m od o, cad a b arr a,
qu e r ep resen ta cada u n o d e los valores d e la variab le, ser d ibu
ada con u n
color o ton alid ad diferen te.
ILUSTR ACIN 6 .. e n s d e l gr fico d e a r r a s (con tin u a cin )

Un a caracterstica in teresan te qu e in cor por an los m en s son los tres b o


ton es situ ados ab a
o a la izqu ierd a repr esen tad os con u n icon o. l sign o
d e in terr ogacin abre el fich er o de ayu da de la in stru ccin en con cr eto en
cu yo m en se en cu en tr e el u su ario. a lo qu e h ace es d espe
ar tod os los
cam pos de los m en s par a em pezar a dar rd en es desde el p rin cip io. or
ltim o, el sm bolo qu e repr esen ta u n a cu artilla escr ita cop ia en el portapa
p eles la sin tais de la in str u ccin qu e se est solicitan d o a travs d el m en .
s m u y til par a qu ien es n o se con ten tan con h acer todo m edian te m en y
d esean gu ar dar el resu ltado para qu e en fu tu ras ocasion es u n gr fico d eter
m in ado sep a solicitar lo m edian te p rogram a.

06_Graficos con Stata.indd 189

06/06/12 09:28

UT

l e d it o r d e gr fico s

6.6.

esd e la versin , tata h a in corp orado u n ed itor de gr ficos. a idea es


qu e, u n a vez p rodu cid o u n grfico, el cr eador p u ed a tran sfor m ar el p rod u c
to sin n ecesid ad de escr ibir com ple
as in str u ccion es.
u fu n cion a m ien to es a la vez in tu itivo y p oten te. s m u y f cil d e
u tiliza r, sob r e to d o , m ed ia n te m en s co n tetu a les y, gr a cia s a ellos, lo s
com p o n en tes d el gr fico qu e p u ed en ca m b ia r se so n p r ctica m en te to
d os.
a r a em p eza r a em p lea r lo h a y qu e ir a la ven ta n a gr fica y com en
za r el esta d o d e ed icin . llo se logr a m ed ia n te m en (ile
Sta rt Gra ph
ditor) o m ed ia n te el seto icon o, qu e tien e el d ib u
o d e u n gr fico d e
b a r r a s.
GR IC 6.6.

R e slt a d o d e la e d ici n d e n gr fico St a t a

Lineas telefnicas
200 400 600 800
0

Tasa de mortalidad infantil


0
50 100 150 200

Tipos de relaciones entre variales

40000

10000
20000
30000
PNB por unidad de compra

40000

10000
20000
30000
PNB por unidad de compra

40000

Esperanza de vida al nacer


40 50 60 70 80

10000
20000
30000
PNB por unidad de compra

Esperanza de vida al nacer


40 50 60 70 80

50
100
150
200
Tasa de mortalidad infantil /1000 1998

Un a vez en m od o ed icin , a p a r ecen en la colu m n a izqu ier d a n u evos


icon os qu e r ep r esen ta n la flech a p a r a se a la r, u n a letr a p a r a escr ib ir te
to, u n a ln ea p a r a d ib u
a r r ecta s, u n cr cu lo p a r a d ib u
a r p u n tos y u n a

06_Graficos con Stata.indd 190

06/06/12 09:28

T TT

r e
a p a r a ed ita r la s seccion es. l m od o m s fr ecu en te p a r a la ed icin es el
p r im er o, p u esto qu e es el qu e n os p er m ite seleccion a r ob
etos d el gr fico
qu e se d esea n tr a n sfor m a r. os p osib les ob
etos d e seleccin son ttu los,
m a r cos, leyen d a s, e
es, m a r ca s, etiqu eta s, p u n tos, ln ea s, b a r r a s, ca
a s
l se a la r cu a lqu ier a d e estos, a p a r ece d eb a
o d e los icon os h or izon ta les
u n n u evo m en qu e in d ica los a sp ectos m s tr a n sfor m a b les d e los ob
e
tos seleccion a d os. s, d e este m od o, si se se a la el ttu lo d e u n gr fico,
a p a r ecer el color d e la letr a , el ta m a o, el m a r gen y el con ten id o d el
teto. er o ta m b in a l fin a l d e la b a r r a a p a r ece la p a la b r a ore p a r a
qu e p u ed a n ca m b ia r se otr os elem en tos n o ta n cen tr a les d e a qu ello qu e
se qu ier e tr a n sfor m a r. u lsa r sob r e ellos, a b r e el m en d e p r op ied a d es d e
u n ob
eto, d on d e se d isp on e en d istin ta s p esta a s, tod o a qu ello m od ifi
ca b le. a s ca r a cter stica s d e tod a ca
a d e teto, ttu los in clu id os, con tie
n en la s p esta a s d e teto (text), ca
a (box), for m a to (form a t) y a va n za d o
(a dva n ced), d e ta l for m a qu e p u ed en ca m b ia r se u n a vein ten a d e a sp ectos
d ifer en tes d e los ttu los.
ILUSTRACIN 6.6. a n ta lla d e l ed itor d e gr ficos con el elor a d or d e o
etos

a estrategia a segu ir p ara editar u n gr fico d ebe ser la sigu ien tebu scar
el elem en to qu e se desea cam b iar, se alar lo con el cu r sor, a p ar tir d e lo cu al
se m arca au tom ticam en te en ro
o, averigu ar si lo qu e se d esea cam b iar
est con ten id o en el n u evo m en h orizon tal qu e su rge deba
o de la bar ra
d e icon os y, si n o lo est, p u lsar el botn derech o d el ratn , p orqu e gen e

06_Graficos con Stata.indd 191

06/06/12 09:28

UT

r alm en te en la ltim a ln ea del m en con tetu al em ergen te se en cu en tra el


acceso a las p rop iedades del ob
eto.
om o son cen ten ar es las posib ilid ad es d e ed icin , en adelan te slo se
p on d r u n e
em plo de ed icin , basado en el gr fico .par a obten er el
r esu ltado d el grfico ..
a p rim era opera cin ser la in trod u ccin del ttu lo. n el m en Gra
ph del editor se en cu en tr a n la s cin co pr opied ad es pr in cip ales d el ob
eto
gr ficottu los (itle), tam a o (Graph Si
e), a sp ecto (spect ratio), regin
(Graph region properties) y com bin a cin (y
com bin e orga n i
a tion ). e
dia n te la p rim er a se ob tien e u n cu a dr o de d i logo, u bica do en la p esta a
itles, con cu a tr o ca silla s don de escr ibir los tetos del ttu lo, su bttu lo, pie
(ca ption ) y n ota . e escr ibe el ttu lo en la p rim er a y se pu lsa su b otn de
pr op ieda des, d on de pu ed en m od ifica r se la p osicin , el tipo y ta m a o de
letr a y otr a docen a d e a sp ectos. qu in ter esa ca m b ia r el ta m a o (Si
e) y
la
u stificacin

u stifica tion en orm a t


. l pr im ero se pon e en m ed ia n o y
la segu n d a se cen tr a .
a segu n d a m od ifica cin se r ea liza r sob r e la s etiqu eta s d el e
e , ya
qu e sa lier on m u y la r ga s y llega n a a lca n za r el ttu lo. a r a m e
or a r la p r e
sen ta cin se elim in a r el a o de r ecogida d e la in for m a cin d e la va r ia b le
pr esen te en la etiqu eta . esu lta con ven ien te h a cer a p a r ecer el ep lor a d or
de ob
etos. llo se logr a p u lsa n d o el icon o qu e est a l la do de a qu el u sa
do p a r a en tr a r en el ed itor, o b ien , si se p r efier e, en el m en
ools
sh ow
ob
et browser. sta h er r a m ien ta p er m ite seleccion a r con m s pr ecisin
u n deter m in a d o elem en to d el gr fico qu e se d esea m odifica r y con ocer
m e
or la estru ctu r a qu e tien en los ob
etos. s, el ttu lo d el e
e ver tica l se
en cu en tr a en la pr im er a y n ica r egin d el gr fico (plotregion ), en el pr i
m er gr fico d e los cu a tr o (gra ph ), en el p r im er e
e ver tica l (ya xis). Un a
vez seleccion a d o el ob
eto title, con d ob le clic se a b r e su cu a d ro d e p r o
pied a d es, teto in clu id o, d on d e p u ede elim in a r se el a o. u a n d o se h a ga ,
pu ed e p u lsa r se el b otn pply, en lu ga r d e , pu es d e esta for m a , si n o
gu sta el r esu lta d o o se d esea n ca m b ia r m s p r op ied a d es, n o es n ecesa r io
volver a a b r ir el cu a dr o. p er a cin sim ila r ten d r a qu e h a cer se con la s
tr es etiqu eta s r esta n tes.
l ter cer ca m b io q u e se va a r ea liza r es ca m b ia r la o r ien ta cin d e
la s etiqu eta s d el m ism o e
e ver tica l. a r a ello se seleccio n a el e
e q u e se
qu ier e ca m b ia r, se a cced e a su s p r op ied a d es y, b a
o la s p r o p ied a d es glo
b a les (xis properties), se eligen la s etiq u eta s (abel properties). Tr a s ello
a p a r ece, en tr e o tr a s ca r a cter stica s m o d ifica b les, el n gu lo . on in d o lo
en h or izon ta l, se ob tien e el efecto d esea d o .

06_Graficos con Stata.indd 192

06/06/12 09:28

T TT

ILUSTRACIN 6.. Uso d el ed itor a r a m od ifica r la or ien ta cin d e la s etieta s

Tam bin se pu ede cam b iar el r an go de la escala de lo rep resen tado. n


los grficos tercer o y cu arto del gr fico ., la esper an za de vid a al n acer
se rep resen taba a p ar tir de los . i se qu ier e qu e el gr fico com ien ce la
escala en , pu ede in dicar se u n a r egla al e
e (xis ru le). n tr e las p osibles
op cion es, p u ed e ser la m s id n ea la de an ge
elta, en la qu e h ay qu e
esp ecificar el valor m n im o

, el m im o
y el in cr em en to (elta),
en este caso. ara p oder com par ar m e
or, con vien e qu e esta op er acin se
r ealice de m odo igu al en los dos grficos in fer iores.
in alm en te, se va a cam b iar la form a de los pu n tos qu e repr esen tan los
casos. stos se en cu en tran en el n cleo d el grfico
lot
. a operacin es
sim ilarse seleccion an , se accede a su s prop iedades y se tr an sform a lo d e
seado. n este caso, el sm bolo (Sym bol), p u din d ose elegir, en tre otros, el
p u n to, el cu adrad o, el crcu lo, el tr in gu lo, etc.
u n to con la for m a, tam bin
p u ed en alter arse en el m ism o m en el tam a o (Si
e) y el color de los p u n
tos, as com o el an ch o (u tlin e width) y el color de los b ord es o p er m etr o
d el sm bolo.
Un a vez realizadas todas las op eracion es de tr an sform acin , se sale d el
ed itor m edian te el m en (ile
Stop Graph ditor), el icon o de la bar ra d e
h er ram ien tas o el m en con tetu al obten id o en cu alqu ier zon a del grfico.
iem pr e qu e se opta por in terr u m pir la edicin , p regu n ta qu e si se qu ier e
gr ab ar
en discoel gr fico. in em bargo, caso de qu e se diga qu e n o, los
cam bios sigu en pr esen tes en la m em oria d el ord en ad or. ara volver a ob te

06_Graficos con Stata.indd 193

06/06/12 09:28

UT

n er el grfico in icial, h ab ra qu e r ep etir la in stru ccin gr fica, in tr od u cien


d o la or den de n u evo o solicitn d olo m edian te m en .

6..
e r cicio s
. Utiliza el fich ero cisd el barm etro d e m ar zo de d el
y
r ep resen ta en tr es gr ficos difer en tes el seo, la edad y los estu d ios al
can zados por el en trevistado.
on el m ism o fich ero cish az u n diagr am a d e b ar ras con los u sos
qu e la gen te h ace d e
n tern et

.
. in alm en te, con el edi
tor, m e
or a el grfico p ara u n a corr ecta p resen tacin .
u ger en ciacam
bia las etiqu etas de la leyen da en legen d
ey regin
label()).
m p lea ah or a la b ase de datos m u n dial
m u n d o
. az sen d os gr
ficos d e ca
as con las variab les esperan
a de vida al n acer y tasa bru ta de
n atalidad y com b n alos en u n solo grfico. om en ta la difer en te d istr ibu
cin de am b as. or qu n o ap ar ece n in g n p u n to en las etr em idad es
de am bos grficosm b iales el aspecto ap licn d ole u n esqu em a d istin
to del qu e ten gas por defecto.
Utilizan do la m ism a base de datos de pases repr esen ta u n a n u be de
pu n tos con las var iables telfon os por m il habitan tes y ren ta n acion al bru
ta per cpita en u n id ades de poder ad qu isitivo. ibu
a sob re la m ism a
repr esen tacin u n a
u ste lin eal y otro cu ad rtico. u l de ellos p ar ece
a
u star se m e
or a los datos

06_Graficos con Stata.indd 194

06/06/12 09:28

7
La p r u e b a e st a d st ica y la s co m p a r a cio n e s
Gen eralm en te, en estad stica se tr abaja con m u estr as, y gran p ar te del pr op sito d e los clcu los d e estad sticos es com prob ar si con los d atos dispon ibles d e u n a fraccin de la pob lacin pu ede d edu cirse algu n a con clu sin
vlida. E n otras palab ras, los in vestigadores su elen em itir h ip tesis r elacion ad as con los d atos de la pob lacin y la m u estra aporta p ru ebas d e si las
m ism as son o n o sosten ibles.
E n este cap tu lo se van a ab ordar las p ru ebas estadsticas d e h iptesis
m s sim p les y u tilizadas en la in vestigacin . on au ellas relacion adas b ien
con la distribu cin , la pr opor cin o la m edia d e u n a o dos variab les. a
form u lacin d e h ip tesis h a d e p lan tearse por p ar esen pr im er lu gar, es
p reciso em itir u n a llam ad a h iptesis n u la, en tr m in os d e igu aldad , a par tir
d e la cu al se gen er a la distrib u cin m u estr al u e se d er ivara en el caso de
u e fu er a cierta, p ara p oder obten er la p robab ilidad de u e el dato obten id o
en la m u estra p roceda d e esa su posicin , por u e, en el caso de u e sea im p rob ab le, la d ecisin m s lgica sera el r ech azo d e tal igu ald ad .
E l caso m s sim p le se da cu an do se dispon e d e u n a sola var iable cu an titativa y se em ite u n a h iptesis sob re el valor u e h a de ten er en la p oblacin . E n este caso, se dice u e el valor de u n par m etro
de la poblacin ,
la m edia, en este ejem p lo, h a de asu m ir el valor

.
s con cr etam en te, pu ede en u n ciar se u n a h iptesis n u la con u n en u n ciad o con sisten te en d ecir u e la evalu acin de u n d eterm in ad o lder p oltico en la p oblacin alcan za el valor d e en u n a escala con valores en tre el
y el .
od a h iptesis n u la h a de estar acom p a ada p or su corr espon dien te
h iptesis alter n ativa, au ella u e se aceptar a en el caso d e u e n o pu eda
m an ten erse la igu ald ad in icial. E isten d istin tas m od alidades alter n ativas.
E n p rim er lu gar, p u ed e form u larse u n idireccion alm en te
slo se r ech aza la
n u la, si los d atos m u estr ales son m ayor es o m en or es u e el valor
. , si as

E E G

fu er a, la an ter ior h iptesis ten d ra com o altern ativa u n id ir eccion al u n a d e


las d os d esigu aldad es sigu ien tes

.
o

.
bviam en te, au la altern ativa al ejem p lo p u esto ser a u e el m en cion ado lder alcan za u n a pu n tu acin in ferior
o su p er ior al valor cen tral d el
r an go de la escala u tilizad a.
tra m an era de plan tear la h iptesis altern ativa es h acin dola bidireccion al,
de tal su erte u e se rech ace la n u la, tan to si el dato m u estral se aleja sign ificativam en te por en cim a com o si lo h ace por debajo del valor h ipotetizado.

.
igu ien d o el ejem p lo d el ld er, se dir a u e la m ed ia u e le otorga la p ob lacin n o es igu al a cin co .
a h iptesis n u la pu ed e rech azarse, en cu yo caso h a de adoptarse la altern ativa, o p u ed e aceptarse. i se rech aza en el caso d e u e fu era cierta, se com etera u n error d en om in ad o de tipo
. i, en cam b io, se acep ta sien do falsa,
se com etera el llam ado error d e tipo

. as h ab itu ales p ru ebas estad sticas


ejecu tadas sobre m u estras perm iten trab ajar con el con trol del prim ero de estos errores, ya u e slo pu ede ob ten erse el valor eacto u e ad op ta el segu n d o
tipo, en el su pu esto de con ocer el valor eacto del p arm etro.
E n este captu lo, a tr avs d e ejem p los de u n son deo p reelectoral, se va
a apr en d er tan to a for m u lar com o a tom ar decision es sob re h ip tesis r elacion adas con p rop orcion es y m edias. se h ar tan to con p roced im ien tos

E l problem a prctico para u ien trabaja es determ in ar si la hiptesis ha de form u larse


u n idireccion alm en te o bidireccion alm ente. E n realidad, si nos in teresa acertar con un valor
pun tual, la altern ativa h a de ser u na desigualdad. i lo u e in teresa com probar es si se su pera

o n o se llegaal valor en cu estin , en tonces se opta por la un idireccion al. E n u n caso electoral,
por ejem plo, si in teresa ver si la inten cin de voto va a ser del , en ton ces se form u lara bidireccion alm en te, pero si lo ue se desea es averigu ar si se va a superar esa can tidad, en ton ces
es preferible la altern ativa u nidireccional.

E n realidad, el caso de las proporcion es o porcen tajes es u n a eten sin del de las m edias, puesto ue el prom edio de un a variable con valores y coin cide con la proporcin de
casos u e poseen el valor . s, en u n a m u estra con cu atro casos, tres de ellos casados
y
u n o soltero

, la m edia sera
de cu atro personas tres casadas
, esto es, ,, u e m u ltipli
cado por , m uestra ue el del con ju n to es casado.

p aram tr icos, con dicion ados a u e los datos cu m plan d eterm in ad os r eu isitoscom o con los llam ados n o p aram tr icos, en los u e las con dicion es de
las distribu cion es im plicad as p u ed en ser m en os rigu r osas.
e em p ezar con la h ip tesis de u n a sola variab le em plead a con p rop orcion es, m edias y m edian as. egu id am en te, se ab ord an tesis con d os var iab les, tiles p ara la com p ar acin de estad sticos, pr oceden tes de la m ism a
p oblacin
m u estr as d ep en d ien teso de pob lacion es d ifer en tes
m u estr as
in depen dien tes
.

7 .1 .

P r u e b a s d e u n a so la va r ia b le

7.1.1.Pru eba
param trica
de
proporcion es
u pn gase u e se desea pr ed ecir el voto de u n as eleccion es y se sostien e u e
u n p ar tid o con m s del d e los votos sobr e el con ju n to de la pob lacin
ob tien e en u n sistem a n o p rop or cion al y m u ltipar tid ista com o el espa ol la
m ayor a p arlam en taria. or tan to, in teresa p robar u e en la poblacin u n
p orcen taje m ayor d el se alad o optar por u n a d eter m in ada op cin poltica

el , en las ya celebr ad as de
. om o u ier a u e, par a pod er con stru ir
la distribu cin m u estral del estadstico, la h ip tesis n u la siem p re h a d e form u larse en tr m in os d e igu aldad, en este caso h a de ser la sigu ien te

.
a h iptesis alter n ativa en este caso h a de ser u n id ireccion al, por u e el
in ters est cen tr ad o slo en u n lado d e la distrib u cin . lo in teresa saber
si el m en cion ado partido obtien e m s de la can tidad an tes en u n ciad a. or
tan to, la h ip tesis altern ativa h a de ser epresada de este m odo

.
n tes de pr oceder a la ejecu cin d el p rogram a pr opio de la p ru eba de
h iptesis, es n ecesar io r ealizar ciertos aju stes a la var iable con la u e se est
trabajan do. u es, in icialm en te, en el cu estion ar io se tr ata de u n a var iable
n om in al con m u ch os valor es, algu n os de los cu ales n o deben ser ten id os en
cu en ta.

ILUSTR ACI 7 .1.

E E G

P r e u n t a so b r e in t e n ci n d e vo t o e n e l e st u d io d e l CIS
n m e r o

P.1 u p on ien do u e m a a n a se celeb rasen eleccion es gen erales, es decir, al


a rlam en to esp a ol, a u pa rtido o coalicin vota ra d .
-
...........................
- .............................
- .............................
- ...........................
-
-..........................
- .........................
- E ....................
- G
...........................
- ........................
- E ..........................
- ...........................
- tro ..........................
- .......................
- ..........................
- E n b lan co .............
- i........................
- -E .................
- o votara .............
- E .......................
- ............................
- o sa be ..................
- G ......................
- ..........................
- .. ..........................
- ...........................
- -..................
- ..........................
- .........................

E n esta pregu n ta el valor corr espon dien te al , partido sobr e el u e se


va a com pr obar la h iptesis es el , p or ello se debe gen er ar u n a var iable
ficticia con valor es
, sob re tod os au ellos u e su p u estam en te van a votar.
or ello, se con sider an com o datos per did os los valor es y d e la var iab le , y con el resto se con str u ye la n u eva dicotom izad a, m ed ian te las
sigu ien tes in str u ccion es
u se pa n el, clear
gen era te in tp p
in tvotoif
in tvoto in tvoto
la bel va r in tpp

n ten cin de voto al

ar a com pr obar el resu ltado de las in str u ccion es an ter iores es til u n a
tab la u e cru ce la an tigu a con la n u eva var iable
tabu la te in tvoto in tpp , m issin g

E n la tabla r esu ltan te


ilu str acin .se p u ed e ver cm o slo tien en el
valor en la n u eva variab le au ellos u e ten an en la or igin al y, adem s,
slo son con siderad os casos n o vlidos en la n u eva var iable .in d ividu os
d e la m u estra u e n o con testan a la pr egu n ta o u e dicen u e lo m s
p robab le es u e n o voten en las p rim as eleccion es.

ILUSTR ACI 7 .. Ta b la d e d ist r ib u ci n d e


r e cu e n cia s d e l vo t o
|
I nt enc i n de v ot o al PP
i nt vot o |
0
1
. |
Tot al
- - - - - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - +- - - - - - - - - iu |
919
0
0 |
919
pp |
0
7350
0 |
7350
ps oe |
4437
0
0 |
4437
ea |
58
0
0 |
58
eh |
43
0
0 |
43
pnv |
310
0
0 |
310
ci u |
463
0
0 |
463
er c |
108
0
0 |
108
bng |
199
0
0 |
199
pa |
109
0
0 |
109
cc |
108
0
0 |
108
uv |
27
0
0 |
27
i c/ v |
83
0
0 |
83
gi l |
37
0
0 |
37
par |
27
0
0 |
27
c ha |
46
0
0 |
46
ps m/ en |
14
0
0 |
14
um |
6
0
0 |
6
upl |
14
0
0 |
14
t c / pnc |
11
0
0 |
11
c dn |
5
0
0 |
5
pr |
5
0
0 |
5
bnv |
18
0
0 |
18
ot r os par t i dos |
191
0
0 |
191
en bl anc o |
674
0
0 |
674
no vot ar a |
0
0
1917 |
1917
no s abe t odav a |
4162
0
0 |
4162
n. c . |
0
0
2699 |
2699
- - - - - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - +- - - - - - - - - Tot al |
12074
7350
4616 |
24040

par tir de este p u n to, ya se p u ed e realizar la p ru eba d e sign ificacin


en r elacin con las h ip tesis n u la y alter n ativa. ar a ello basta in dicar la
p rim er a precedid a d e la or den prtest.
p rtest in tpp .

E l r esu lta d o m u estr a , a d em s d el test p r op ia m en te d ich o , lo s sigu ien tes esta d sticos d e la m u estr a n m er o d e ca sos, m ed ia , d esvia cin
tp ica , er r o r tp ico e in ter va lo s con u n n ivel d e co n fia n za d el , p or
d efecto .

E E G

ILUSTR ACI 7 .. P r u e b a d e u n a p r o p o r c i n e n u n a m u e st r a
One- sampl e t est of pr opor t i on
i nt pp: Number of obs =
19424
-----------------------------------------------------------------------------Var i abl e |
Mean
St d. Er r .
[ 95% Conf . I nt er v al ]
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - i nt pp |
. 3783979
. 0034799
. 3715775
. 3852183
-----------------------------------------------------------------------------p = pr opor t i on( i nt pp)
z =
8. 2978
Ho: p = 0. 35
Ha: p < 0. 35
Pr ( Z < z ) = 1. 0000

Ha: p ! = 0. 35
Pr ( | Z| > | z | ) = 0. 0000

Ha: p > 0. 35
Pr ( Z > z ) = 0. 0000

a clave d e la p ru eba de h ip tesis param tr ica est en el er r or tp ico,


u e se h alla d ividien d o la desviacin tpica por la r az cu adr ad a d el n m ero
d e casos, o de m an era m s d ir ecta a tr avs d e la sigu ien te frm u la

.
E se err or tp ico (Std.
E rr.),
en este caso m u y b ajo
,p or el alto
n m ero d e en trevistados, r epr esen ta la desviacin tpica d e la distr ibu cin
m u estr al del estadstico y, p or tan to, se u tiliza en la con str u ccin de los
in ter valos d e con fian za. E n la salid a del ejem plo, con el , de los en trevistad os u e tien en in ten cin d e d ar su voto al en la m u estr a, se pu ede
pr on osticar u e en la poblacin ese valor debe estar en tr e el , y el
,, u e se ob tien e su m an do y r estan d o al valor d e la m ed ia ,veces el
err or tpico, ya u e se est an te u n a distribu cin n or m al y en esta el de
los casos se en cu en tr a en tr e ,y -,d esviacion es tp icas.
ecapitu lan d o, en la pr im er a par te de la ilu stracin .se en cu en tra
el n m ero d e casos y m s ab ajo la m edia en este caso pr oporcin y el
err or tpico ju n to con el in tervalo d e con fian za d e la m ed ia.
a segu n da p ar te es la corr esp on dien te al test de h ip tesis pr opiam en te
dich o. p ar ece tan to la h iptesis n u la, en u n ciada en la in str u ccin , com o
las tr es posib les alter n ativas. E l valor de z
la m ed ia r eal m en os la m edia
de la h iptesis dividid a por el err or tp icoes idn tico en los tres su pu estos,
esto es ,.

E n la salida del program a, al pon er el valor a los u e m uestran su in ten cin de voto al
, los resu ltados aparecen en proporcion es y n o en porcen tajes. asta con m ultiplicar por
para consegu ir los datos epresados en porcen tajes.

in em b argo, lo u e var a es la sign ificacin . om o en este caso la alter n ativa es u n id ir eccion al se h a estab lecido u e fu er a m ayor u e se h a
d e pr estar aten cin a la colu m n a de la der ech a. e obtien e u e, en el caso
d e u e la h iptesis n u la fu era cierta, la p robab ilidad d e en con tr ar en u n a
m u estra ese valor es n fim a
m en or u e ,
, por tan to, se p u ed e r ech azar con bajo r iesgo de eu ivocacin .

7.1.2.Pru eba
param trica
de
m edias
E sta m ism a h iptesis con u n a sola variable tam b in pod ra fu n cion ar con
m ed ias en lu gar de pr op orcion es, pero, en lu gar d e oper ar con p ropor cion es, se trabaja con p rom ed ios y, com o n o su ele d ispon erse d e la varian za
d e la pob lacin , se r ecu r re a la cu asivarian za obten ida con los d atos de la
m u estra. or ello, la fr m u la del er ror tpico p resen ta n otables d iferen cias
con el de las p ropor cion es.

.
om o a par tir d el er ror tpico el proceso es sim ilar, slo se pr oceder a
form u lar las h iptesis y a an alizar los r esu ltados. E n este caso, en lu gar d e
la var iable estim acin
de
voto, se va a tom ar la de probabilidad
su bjetiva
de
voto. se p lan tea com o h ip tesis u e la p rob ab ilid ad del m ism o partido es
d e , en u n a escala d e a .
E n con secu en cia, la form u lacin d e las h iptesis n u la y altern ativa ser a
com o sigu e

.
on secu en tem en te, a estas h ip tesis se debe in trodu cir la sigu ien te in stru ccin , a la u e se le a ad e la opcin level, para u e aparezcan los in tervalos con u n n ivel de con fian za d el , en lu gar del u e aparece p or
d efecto
ttest pvotop p, level

E l resu ltado de la in stru ccin se m u estr a en la sigu ien te ilu stracin

E E G

ILUSTR ACI 7.. P r u e b a d e u n a m e d ia e n u n a m u e st r a


One- sampl e t t es t
-----------------------------------------------------------------------------Var i abl e |
Obs
Mean
St d. Er r .
St d. Dev .
[ 99% Conf . I nt er val ]
- - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - pvot opp |
20533
4. 708956
. 0257672
3. 692276
4. 642578
4. 775335
-----------------------------------------------------------------------------mean = mean( pv ot opp)
t = - 11. 2951
Ho: mean = 5
degr ees of f r eedom =
20532
Ha: mean < 5
Pr ( T < t ) = 0. 0000

Ha: mean ! = 5
Pr ( | T| > | t | ) = 0. 0000

Ha: mean > 5


Pr ( T > t ) = 1. 0000

E n este ejem plo se ve cm o, au n con sideran do u n riesgo d e eu ivocacin in ferior al


el com p lem en tar io del del in tervalo d e con fian za
,
la h iptesis n u la h a d e ser r ech azad a, pu esto u e lo m s pr ob able es u e el
d ato d e la p ob lacin est com pren d ido en tr e ,y ,. E sto m ism o se h ace
p aten te en la colu m n a cen tr al del segu n do blou e de la salid a, d on d e se ve
u e con u n valor d e t de -,, su sign ificacin es tan b aja u e es posible
el r ech azo de la h iptesis n u la pr cticam en te sin n in g n er ror. or tan to,
p u ed e decir se u e en la poblacin la p robab ilidad d e votar al n o p u ed e
ser igu al a .

7.1..E l
test
de
los
si
n os
i se desea u tilizar en el caso de u n a m u estr a u n test n o p ar am trico, es d ecir, u e n o p ar ta de la su p osicin d e u e la var iable or igin al en la p oblacin
tien e d istr ib u cin n or m al, p u ed e u tilizarse el test de los sign os, u e est
su sten tad o en la pr obabilidad bin om ial.
E n este caso, la h iptesis n o se r efiere a la m ed ia, sin o a la m edian a. e
este m odo, la for m u lacin d e la h iptesis n u la sera com o sigu e

.
i la m en cion ad a h iptesis fu er a cier ta, en ton ces la m itad d e los casos
d e la m u estra caeran por d eb ajo del valor y la otra m itad por en cim a.
ar a ver la d istrib u cin h a de em plear se la in str u ccin tabu late.
tabu la te pvotop p

on sid er an d o el ejem plo an terior y par tien do d e la d istr ib u cin de fr ecu en cias d e la variab le pvotopp
pr obabilidad otor gada de voto al
, se ve

u e, d e los .casos de los u e se com pon e la m u estr a, .coin cid en


con la m edian a (zero
si
n ), cu yo valor es el d e .
I LUS TR ACI 7 .. is t r ib u c i n d e
r e c u e n c ia s d e la va r ia b le a
com p rob a r
pp |
Fr eq.
Per cent
Cum.
- - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - 0 |
5680
27. 66
27. 66
1 |
600
2. 92
30. 58
2 |
828
4. 03
34. 62
3 |
781
3. 80
38. 42
4 |
859
4. 18
42. 60
5 |
2871
13. 98
56. 59
6 |
1365
6. 65
63. 23
7 |
1483
7. 22
70. 46
8 |
2028
9. 88
80. 33
9 |
876
4. 27
84. 60
10 |
3162
15. 40
100. 00
- - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - Tot al |
20533
100. 00

or debajo del valor m ed ian o (n e


ative
si
n ) h ay en la d istr ib u cin em p r ica de la m u estra .casos
.
, m ien tr as
u e por en cim a (positive
si
n ) d el se sit an .observacion es
.
...
. E s ob vio u e en el caso d e u e la m edian a
fu er a, com o se h a establecid o en la h iptesis, igu al a , en ton ces se ten dr a
u e h ab er en con trado igu al n m er o d e casos por d eb ajo u e por en cim a del
m en cion ado valor. E l test d e los sign os averigu a cu l es la p robab ilidad d e
en con trar u n n m er o igu al o su per ior d e casos por en cim a d e la m edian a

ob ser vacion es de sign o positivo


, p ara el caso de u e la h iptesis alter n ativa sea u n idireccion al d e sign o m ayor u e o p or d ebajo de la m ed ian a

ob ser vacion es d e sign o n egativo


, en el su p u esto d e u e la altern ativa sea
d e n atu r aleza m en or u e.
a pr obabilid ad de la p ru eba con altern ativa u n idireccion al se obtien e
ap lican do la distrib u cin b in om in al al n m ero d e ob ser vacion es positivas

.o n egativas
.con u n n m er o d e casos igu al al d e los u e n o
sigu en la m edian a
.., en el ejem plo u e se con sider ay u n a
p rob ab ilidad de ,. or su lad o, la p ru eba bidir eccion al se ob tien e m u ltip lican d o p or el valor d e la prob abilid ad m en or de las an ter iores
,, en
este caso, u e se con vier te en ,
.
a in terp retacin es sim ple y sigu e la n or m a d e tod os los test de h ip tesis. iem pr e y cu an d o la pr obab ilidad obten id a sea m en or de ,, se pu ede
r ech azar la h iptesis n u la con u n a segu rid ad m ayor del . E n el ejem plo
con tem p lado se ve u e n o pu ede ser r ech azad a la h ip tesis de u e la m ed ian a en la pob lacin h aya sido igu al a , en n in g n caso, sea cu al fu er e la
altern ativa pr opu esta.
ar a ob ten er d el ord en ador este test, deb e escr ibirse la or den si
n test
segu id a del n om br e de la variab le, el sign o igu al y el valor d e la h iptesis

E E G

n u la. iem p re la salid a en pan talla m u estra el r esu ltad o del test en los tr es
su pu estos d e h ip tesis alter n ativa.
sign test pvotop p

ILUSTR ACI 7.. P r u e b a d e lo s sin o s c o n u n a so la va r ia b le


Si gn t est
s i gn |
obs er v ed
expect ed
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - pos i t i ve |
8914
8831
negat i ve |
8748
8831
z er o |
2871
2871
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - al l |
20533
20533
One- si ded t es t s :
Ho: medi an of pv ot opp - 5
Ha: medi an of pv ot opp - 5
Pr ( #pos i t i ve >= 8914)
Bi nomi al ( n = 17662,
Ho: medi an of
Ha: medi an of
Pr ( #negat
Bi nomi
Two- si ded t es t :
Ho: medi an of
Ha: medi an of
Pr ( #pos i t
mi n( 1,

pv ot opp - 5
pv ot opp - 5
i ve >= 8748)
al ( n = 17662,

= 0 vs.
> 0
=
x >= 8914, p = 0. 5) =

0. 1072

= 0 vs.
< 0
=
x >= 8748, p = 0. 5) =

0. 8956

pv ot opp - 5 = 0 v s .
pv ot opp - 5 ! = 0
i ve >= 8914 or #negat i ve >= 8914) =
2* Bi nomi al ( n = 17662, x >= 8914, p = 0. 5) ) =

0. 2144

7.. Co m p a r a ci n d e d o s va r ia b le s
u an do se desea com par ar dos variab les pr oced en tes d e la m ism a pob lacin se est an te el caso d e p ru ebas en m u estr as d epen dien tes. ecib en este
n om b re por u e cada caso posee u n par de valores con ectad os de cad a u n a
d e las variab les en cu estin .
e m odo p ar alelo al de los test an ter ior es, se van a pr esen tar estos an lisis en tr es apar tadosen el pr im ero se com p aran pr op orcion es, en el segu n d o se eu ipar an m edias y en el tercer o se con tem p la el test n o param tr ico
d e ilcoon o p ru eba de los r an gos con sign o.

7.2.1.
om paracin
de
dos
proporcion es
en
m u estras

depen dien tes


E n lu gar de con trastar u n a pr opor cin con u n valor, se tr ata de com p arar
d os p ropor cion es ob ten id as de la m ism a b ase, esto es, con id n tico d en om in ad or. E n esta ocasin , en lu gar d e form u lar la h iptesis con u n a can tid ad,
se u tilizan d os var iables ficticias, p u esto u e al igu al u e ocu r r a en la pr u eb a con u n a variab le, se h a d e p roced er com o si fu er an m ed ias de var iables
con dos valores

. atem ticam en te, la for m u lacin d e la h iptesis n u la es la sigu ien te

.
u pn gase u e se desea con tr astar con los datos d e la m u estra si la in ten cin de voto a d os p ar tidos es igu al o si sigu e h abien do d iferen cia a favor
d el u e en tiem p o p asad o era su per ior
d e este m od o la altern ativa es u n idir eccion al
. a var iable u e r ep resen ta la pr op orcin d el p ar tido pr eviam en te
su p er ior ser llam ad a y la d el in fer ior com o
. or tan to, la alter n ativa
d eb e ap ar ecer com o

.
m bas pu eden con vertirse en igu ald ades o desigu ald ades en las u e en
u n o de los d os tr m in os aparezca el valor n u lo.

.
ar a efectu ar con tata el cor respon d ien te test estadstico es p reciso u tilizar la in str u ccin ttest, segu ida de las d os variab les-pr opor cin separad as
p or el sign o igu al.
gen erate in tpsoe
in tvotoif
in tvotoin tvoto
p rtest in tpp in tp soe

E l resu ltado es sim ilar al ob ten ido en el caso de u n a sola m u estr a.

E E G

ILUSTR ACI 7.7 .

P r u e b a d e co m p a r a c i n d e d o s p r o p o r c io n e s

m u e st r a s d e p e n d ie n t e s

Two- sampl e t est of pr opor t i on

i nt pp: Number of obs =


19424
i nt ps oe: Number of obs =
19424
-----------------------------------------------------------------------------Var i abl e |
Mean
St d. Er r .
z
P>| z|
[ 95% Conf . I nt er v al ]
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - i nt pp |
. 3783979
. 0034799
. 3715775
. 3852183
i nt ps oe |
. 2284287
. 0030123
. 2225248
. 2343327
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - di f f |
. 1499691
. 0046025
. 1409483
. 1589899
|
under Ho:
. 004665
32. 15
0. 000
-----------------------------------------------------------------------------di f f = pr op( i nt pp) - pr op( i nt ps oe)
z = 32. 1478
Ho: di f f = 0
Ha: di f f < 0
Pr ( Z < z ) = 1. 0000

Ha: di f f ! = 0
Pr ( | Z| < | z | ) = 0. 0000

Ha: di f f > 0
Pr ( Z > z ) = 0. 0000

a d iferen cia b sica respecto a la ilu stracin .es u e, en lu gar de


apar ecer u n a sola ln ea con la variab le, ap ar ecen cu atrou n a par a cada var iable con tr astada, u n a ter cer a para u n a n u eva variab le, u e es la difer en cia
en tr e am bas, lo u e slo se m an ifiesta en la m edia y en los in ter valos, ya
u e el n m er o de observacion es es lgicam en te el m ism o, y u n a cu arta u e
calcu la el err or tpico en el su p u esto de u e las m edias d e am bas fu eran
igu ales, lo u e gen er a u n peu e o cam bio en valor , cu yo clcu lo respon d e
a la sigu ien te frm u la

.
E l tien e u n a in ten cin de voto d el ,, m ien tras u e la d el E
es d el ,, la diferen cia es cercan a al . ir an d o los in tervalos de con fian za par a la d iferen cia se ap recia u e estn situ ados en tre el , y el
,. b viam en te, es in asu m ib le la h ip tesis n u la d e u e la pr op orcin de
in ten cin de voto d e am b os p artidos pu d iera ser idn tica.
esta m ism a con clu sin se llega con el eam en aten to d el estadstico
z calcu lado y d e su sign ificacin . om o la h iptesis altern ativa era del tipo
m ayor u e, se h a d e p restar aten cin a la colu m n a de la derech a, don de
apar ece u n a sign ificacin su stan cialm en te in fer ior al con ven cion al lm ite
d el ,. or tan to, estos datos d icen u e en la pob lacin , en el m om en to

E l cam bio se debe a su pon er de partida u e las dos m edias son igu ales, en lu gar de asum ir en contra de la hiptesis u e cada variable tien e u na m edia distin ta, tal com o ocu rre en la
m u estra. ara satisfacer esta su posicin, se obtien e p com o prom edio de las proporcion es de
u n a y otra variable. E n este ejem plo tendra el valor de ,.

d e r ealizacin d el estu dio, h aba u n a difer en cia sign ificativa en la in ten cin
d eclarada de voto a favor del .

7.2.2.om paracin
de
dos
m edias
en
m u estras
depen dien tes
E l test de com paracin de m edias sigu e eactam en te las m ism as p au tas u e
el d e pr op orcion es, p u esto u e en realidad este es u n a ad aptacin d e au el,
u e se con sigu e con virtien do u n o de los valor es d e u n a var iable cu alitativa
en otr a d icotm ica con valores y . ara m edias, h iptesis n u la y altern ativa
b idireccion al, en el ejem plo, pero tam b in p u ed e form u larse u n idireccion alm en tese epr esan del sigu ien te m od o

.
e trata, p or tan to, en este tipo de p ru ebas de com par ar las m ed ias de
d os var iables distin tas, d en om in ad as e
au n u e, en el fon d o, lo u e se
r ealiza es con str u ir u n a n u eva variab le, den om in ada , u e es la su straccin en cad a caso de los r espectivos valor es de e y verificar la h iptesis
d e u e el valor d e la n u eva m edia sea igu al a . E l er ror tpico de esta variab le se ob tien e m ed ian te la epr esin

.
i se tom an las pr obabilidades d e a u e cad a p er son a se atribu ye de
votar a d os p ar tid os d istin tos en u n as pr im as eleccion es, con tin u an do con
el ejem plo an ter ior, y E , se pu ede ad optar u n a h ip tesis claram en te
u n idir eccion al u e d ep en d er d el m om en to poltico en el u e se plan teen
los com icios. E n el a o , el u e se est u tilizan do, es obvio u e la altern ativa h aba u e asu m ir la en dir eccin favor able al .
ar a ob ten er los r esu ltados estadsticos, se h a de r ecu r rir a la m ism a in stru ccin u e en el ejem plo an ter ior, u tilizan do la in str u ccin ttest
par a com p arar d os variab les cu an titativas
pvotopp
y pvotopsoe, en esta ocasin
.
ttest pvotop pp votopsoe

E E G

r as lo cu al ap arece u n a tabla con sim ilar asp ecto al d e la difer en cia de


p ropor cion es

ILUSTR ACI 7 .. P r u e b a d e co m p a r a ci n d e d o s m e d ia s

m u e s t r a s d e p e n d ie n t e s
Pai r ed t t es t
-----------------------------------------------------------------------------Var i abl e |
Obs
Mean
St d. Er r .
St d. Dev .
[ 95% Conf . I nt er v al ]
- - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - pv ot opp |
20310
4. 693156
. 0258863
3. 689135
4. 642417
4. 743895
pvot op~e |
20310
4. 345987
. 0229813
3. 275143
4. 300942
4. 391032
- - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - di f f |
20310
. 3471689
. 0394482
5. 62189
. 2698472
. 4244906
-----------------------------------------------------------------------------mean( di f f ) = mean( pvot opp - pv ot opsoe)
t =
8. 8006
Ho: mean( di f f ) = 0
degr ees of f r eedom =
20309
Ha: mean( di f f ) < 0
Pr ( T < t ) = 1. 0000

Ha: mean( di f f ) ! = 0
Pr ( | T| > | t | ) = 0. 0000

Ha: mean( di f f ) > 0


Pr ( T > t ) = 0. 0000

E stos r esu ltad os m u estr an cm o la m ed ia para el (pvotopp)


es sign ificativam en te m s alta u e la cor respon dien te al E (pvotopsoe). e
d iferen cian en tr e ellas cen tsim as, p er o, al tratar se de u n a m u estr a d e
tam a o su p er ior a .casos, esa p eu e a d iferen cia n o pu ede h ab er se
d eb ido a err ores de m u estr eo, siem pr e y cu an d o este h aya sido aleator io.
bsr vese, adem s, cm o los in ter valos de con fian za d e u n a y otra variab le
n o se su p er pon en . a p u n tu acin d el in ter valo in ferior par a el es de ,,
m ien tras u e la del su per ior para el E es de ,. E n con secu en cia, los
etr em os d e los in ter valos d e las difer en cias son am b os positivos, p or lo u e
p u ed e r ech azar se la h iptesis n u la.

7.2..om paracion es
n o
param tricas
de
dos
variables
ar a estas cir cu n stan cias, el p rogram a tata ofrece u n par de altern ativas.
om o en el caso de u n a sola var iable, p u ed e u tilizar se la pr u eb a d e los sign os y pu ede tam b in em p learse u n a p ru eba de ran gos.
E n el p rim er caso, el p rocedim ien to es sim ilar al u e ya se estu d i en la
p ru eba param tr ica d e u n a sola var iable. ero en lu gar de com p ararse los
d atos con u n solo valor el d e la h ip tesis com o pu n to de referen cia, se
com par a con el de la otra variab le en el m ism o caso. om o r esu ltad o de la
com par acin p u ed e ob ten erse u n em pate, caso de u e am bos valor es sean
id n ticos, u e la pr im er a variab le ten ga el valor m s alto o p or el con tr ar io u e sea la segu n d a la d e m ayor valor.
i se sigu e con el ejem p lo con tem p la d o en la com p a r a cin p a r a m tr ica d e m ed ia s con la s va r ia b les r ela tiva s a la p r ob a b ilid a d p er son a l en

u n a esca la d e a d e vota r a d os p a r tid os, ca d a ca so


in d ivid u op u ed e
ser cla sifica d o en tr es tip osa u ellos u e d a n la m ism a p r ob a b ilid a d d e
voto a los d os p a r tid os (zero),
los u e d a n m a yor p r ob a b ilid a d a l p r im er o
(positive)
y, en ter cer lu ga r, los u e d a n m a yor p r ob a b ilid a d a l segu n d o
(n e
a tive). E s evid en te u e si h u b ier a eu ilib r io en tr e la s d os va r ia b les,
el n m er o d e su jetos d el segu n d o y d el ter cer tip o d eb er a ser sim ila r, si
n o id n tico.
a r a la o b ten ci n d e este a n lisis, b a sta co n em p lea r la in str u cci n
sin test, escr ib ien d o a con tin u a cin la s d os va r ia b les u e u ier en co m p a r a r se sep a r a d a s p or el sign o igu a l.
sign test p votopp pvotop soe

E l r esu ltado
ilu str acin .clasifica d e la form a se alad a los casos y
estab lece las prob abilid ad es bin om in ales corr espon dien tes a las tres h iptesis alter n ativas p osibles.
o m o p u ed e a p r ecia r se, h a y .ca sos, d e los .u e com p on en la m u estr a , u e com p a r ten el m ism o va lor en la s va r ia b les cor r esp on d ien tes a los p a r tid os im p lica d os. er o h a y .u e a sign a n m s
p r ob a b ilid a d es d e voto a l p r im er o
u e a l segu n d o
E y slo
.u e a l con tr a r io d a n m s a l segu n d o. E n con secu en cia , se p u ed e d esca r ta r d e en tr a d a la h ip tesis a lter n a tiva d e u e la p r ob a b ilid a d
d e u e se vote a l p a r tid o d e izu ier d a sea m a yor u e a l p a r tid o d e la d er ech a , com o se p on e d e m a n ifiesto en el r esu lta d o p r ctica m en te igu a l
a la u n id a d d e la p r ob a b ilid a d d e ob ten er u n va lor igu a l o su p er ior a
.. E n ca m b io, si se o b ser va la p r im er a d e la s p r u eb a s r ea liza d a s,
la d e u e a l se le d a m a yor p r ob a b ilid a d d e ser vota d o , en ton ces la
sign ifica cin , ob ten id a a p a r tir d e los .ca sos u e d a n m a yo r va lor
a este p a r tid o, sa le in fer ior a l p u n to cr tico d el . sim ism o, sa le esta d stica m en te sign ifica tiva la p r u eb a si se op ta p or u n a h ip tesis a lter n a tiva b id ir eccion a l.

E E G

ILUSTR ACI 7 .. P r u e b a d e lo s sin o s p a r a m u e st r a s d e p e n d ie n t e s


Si gn t est
s i gn |
obs er v ed
ex pec t ed
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - pos i t i ve |
8717
7888
negat i ve |
7059
7888
z er o |
4534
4534
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - al l |
20310
20310
One- si ded t es t s :
Ho: medi an of pv ot opp - pvot ops oe = 0 v s .
Ha: medi an of pv ot opp - pvot ops oe > 0
Pr ( #pos i t i ve >= 8717) =
Bi nomi al ( n = 15776, x >= 8717, p = 0. 5) =
Ho: medi an of
Ha: medi an of
Pr ( #negat
Bi nomi
Two- si ded t es t :
Ho: medi an of
Ha: medi an of
Pr ( #pos i t
mi n( 1,

pv ot opp - pvot ops oe = 0 v s .


pv ot opp - pvot ops oe < 0
i ve >= 7059) =
al ( n = 15776, x >= 7059, p = 0. 5) =

0. 0000

1. 0000

pv ot opp - pvot ops oe = 0 v s .


pv ot opp - pvot ops oe ! = 0
i ve >= 8717 or #negat i v e >= 8717) =
2* Bi nomi al ( n = 15776, x >= 8717, p = 0. 5) ) =

0. 0000

E n defin itiva, a la vista d e los resu ltados m ostr ados, pu ed e con clu ir se
con tr an u ilidad u e en la p oblacin el n m er o d e votan tes u e dan m ayor
p robab ilidad al artid o op u lar es su p er ior al n m er o d e votan tes u e se la
otor gan al ar tido ocialista.
tr o test par a el m ism o tipo d e d atos u e in cor pora m s in form acin en
la m ed ida en u e tam b in tien e en cu en ta el ran go de las diferen cias en tr e
las d os var iables es el test del sign o d e los ran gos. on ob jeto d e estu d iar
este pr oced im ien to, ad ecu ado en el su pu esto d e u e am bas d istr ib u cion es
sean sim tricas, se va a con siderar u n a seleccin de los diez p rim eros casos
d e la m u estra.
a sigu ien te tabla m u estra los valores de probabilidad en la escala del al
atribu idos al artido opu lar
y al artido ocialista
de los diez
prim eros casos n u m erados. En la colu m n a sigu ien te (di
)
aparecen las diferen cias en tre los valores de am bas variables. ara calcu lar el ran go h ay u e con siderar el valor absolu to de estas diferen cias. Es obvio u e los casos en los u e
am bos valores de las variables son idn ticos son los u e poseen la diferen cia
absolu ta m en or, por tan to todos aparecen en la colu m n a (an
o)
con el valor
en cu r siva . om o son cin co, se les su stitu ye por el ran go pr om ed io
, ,
, , esto es, el
. dem s, se en cu en tr an tr es difer en cias positivas

,
cu yos ran gos su m an
, y y dos n egativas con u n total d e ran gos

y
.

ILUSTR ACI 7.1. R a n o s d e la s d i


e r e n cia s e n t r e d o s va r ia b le s
PP
P S

E l va lor d e los r a n go s ta n to p ositivo s co m o n ega tivos esp er a d o s en


el su p u esto d e u e fu er a cier ta la h ip tesis n u la d e u e n o h u b ier a
d ifer en cia s en tr e u n a y otr a va r ia b le se ob tien e a p lica n d o la sigu ien te
f r m u la

.
sien do el n m er o de ran gos positivos, n el n m er o de casos y
la su m a d e los r an gos
es decir, n
n

. E n este ejem plo, ten ien d o


en cu en ta u e h ay casos (n ) y em p ates (n ), la su m a de los ran gos cor resp on d ien tes a la diferen cia
es igu al a y el valor esper ad o de los
r an gos positivos E
es d e . E s ob vio u e el valor esp er ado de la su m a
d e ran gos n egativos
-h a d e ser igu al u e la de los p ositivos
y se
cu m p le la igu ald ad

.
E s d ecir, la su m a total de los ran gos de n
casos
es igu al a la su m a d e
los ran gos em p atados, la d e los p ositivos y la d e los n egativos.
E l test se ejecu ta en tata m edian te la in str u ccin si
n ran , segu ida por
las variab les pareadas sep aradas por el sign o igu al. ara com pr obar la n atu -

E E G

r aleza de esta p ru eba, se va a r ealizar en p rim er lu gar la in str u ccin con los
d iez pr im er os casos ap ar ecidos en la an ter ior tab la
sign ra n p votopp pvotop soe in

p ar tir de lo cu al apar ecen los sigu ien tes resu ltados ap licad os a los casos de la m u estr a n u m er ad os d el al .
ILUSTR ACI 7.1 1.

P r u e b a d e ilc o o n p a r a m u e st r a s d e p e n d ie n t e s

d ie ca so s

Wi l cox on si gned- r ank t est


s i gn |
obs
sum r ank s
expect ed
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - posi t i v e |
3
23
20
negat i v e |
2
17
20
z er o |
5
15
15
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - al l |
10
55
55
unadj ust ed v ar i anc e
adj us t ment f or t i es
adj us t ment f or zer os
adj us t ed var i ance

96. 25
0. 00
- 13. 75
---------82. 50

Ho: pv ot opp = pvot opsoe


z =
0. 330
Pr ob > | z| =
0. 7412

d em s de la su m a d e ran gos, el p rogr am a calcu la su varian za


aju stad a
p or posibles r an gos em p atados y p or los pr im er os ran gos pr oceden tes de
variab les con el m ism o valor p ara obten er la var iable z, u e se d istr ibu ye
n orm alm en te. or eso, en este ejem p lo, con tan slo d iez casos, n o sera
p osible rech azar la h iptesis n u la, ya u e su valor
,tien e u n a sign ificacin
,su perior a la con siderada com o n ivel aceptable d e com isin d e
err ores de tip o
,
.
er o, si en lu gar de pedir el an lisis p ar a los d iez pr im eros casos, se
solicita p ar a el con ju n to d e la m u estr a
n .
, la su m a d e ran gos es
atr on m ica, y el valor de z lo su ficien tem en te alto p ar a r ech azar la h iptesis
n u la con u n n ivel d e sign ificacin d e .
sign ra n p votopp pvotop soe

ILUSTR ACI 7.1. P r u e b a d e ilco o n p a r a m u e st r a s d e p e n d ie n t e s

con
u n to
Wi l c ox on si gned- r ank t es t
s i gn |
obs
s um r ank s
expec t ed
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - pos i t i v e |
8717
1. 067e+08
97988680
negat i v e |
7059
89260195
97988680
z er o |
4534
10280845
10280845
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - al l |
20310
2. 063e+08
2. 063e+08
unadj us t ed v ar i ance
6. 982e+11
adj ust ment f or t i es - 1. 491e+09
adj ust ment f or z er os - 7. 770e+09
---------adj ust ed var i anc e
6. 889e+11
Ho: pv ot opp = pv ot ops oe
z = 10. 516
Pr ob > | z| =
0. 0000

7 .. Co m p a r a cio n e s d e d o s m u e st r a s
in d e p e n d ie n t e s
caban de eplicarse las pru ebas con m u estras depen dien tes o paralelas, u e
com paran dos variables proceden tes de la m ism a poblacin en don de cada
valor de u n a variable est ligado al de la otra por perten ecer al m ism o caso de
estu dio. as situ acion es en las u e se h a de com parar u n a m edida de los m ism os su jetos en dos m om en tos tem porales son las m s tpicas de este tipo de
pru ebas, au n u e n o las n icas, com o se h a visto en los ejem plos epu estos. En
cam bio, si se preten de efectu ar la com paracin con el m ism o estadstico en
dos m u estras distin tas para ver si proceden de poblacion es sim ilares, se est
an te las pru ebas con m u estras in depen dien tes, com o, por ejem plo, pu ede ser
la com paracin de la in ten cin de voto en tre m u jeres y h om bres.
l igu al u e se h icier a en el apar tado an terior, se va a su bd ivid ir este
ap ar tado en d istin tas seccion es. E n p rim er lu gar, se pr oceder a la com par acin d e pr oporcion essegu idam en te, se pasar a la com paracin d e varian zas, ya u e es paso p revio p ara op tar por u n a u otr a fr m u la de com p ar acin
d e m edias, u e ser ab ord ad a en la ter cer a par te, y fin alm en te se abord ar
la con feccin d e p ru ebas par am tricas con m u estr as in d epen dien tes.

7..1.
om paracin
de
dos
proporcion es
(en
m u estras
in depen dien tes)
E n el fon d o, n o eiste u n pr oced im ien to especfico d e com p ar acin de pr op orcion es, p or lo u e pu ed en u sar se in distin tam en te prtest
y ttest, con la
p recau cin d e epr esar el por cen taje d esead o com o el valor u n o de u n a
variab le d icotm ica. l igu al u e en el ejem plo an terior, se va a tom ar com o

E E G

ejem p lo la in ten cin de voto, pero en este caso n o se n ecesita la d e d os


p ar tid os. asta con u n a sola com par ad a en dos gr u pos distin tos, u e ser n , p ara sim p lificar el ejem p lo, el de los h om br es, por u n lado, y el d e las
m u jeres p or el otr o. , d ich o de otr o m od o, se tr ata d e ver si p ara los dos
gru p os gen erad os por la variab le seo, el p or cen taje de in ten cin d e voto al
(in tpp)
es sim ilar o sign ificativam en te distin to.

.
ar a realizar esta pr u eba estadstica h a de em p learse tam bin la ord en
ttest
o prtest
, pu esto u e la difer en cia d e p rop orcion es se aju sta a esta d istr ib u cin de tu d en t, asim ilab le a la n orm al, si los gr ad os d e liber tad son
su ficien tes, apr oim ad am en te cu an d o n .
ttest in tp p, b y
seo

u n u e en este caso, p or la en orm e m u estr a u e se est em p lean do, se


est u tilizan do en r ealid ad la d istr ib u cin n orm al, el resu ltado del p rogr am a sigu e p resen tan do la d istr ibu cin de tu den t, u e con tan tos grad os de
liber tad se ap roim a a la for m a estn dar d e la cam pan a de Gau ss.
ILUSTR ACI 7.1 . P r u e b a d e co m p a r a ci n d e m e d ia s

m u e st r a s in d e p e n d ie n t e s
Two- sampl e t t es t wi t h equal v ar i anc es
-----------------------------------------------------------------------------Gr oup |
Obs
Mean
St d. Er r .
St d. Dev .
[ 95% Conf . I nt er v al ]
- - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - hombr e |
9388
. 3857052
. 005024
. 4867874
. 375857
. 3955534
muj er |
10033
. 3715738
. 0048245
. 4832494
. 3621167
. 3810309
- - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - c ombi ned |
19421
. 3784048
. 0034802
. 4850018
. 3715833
. 3852264
- - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - di f f |
. 0141313
. 0069637
. 0004818
. 0277809
-----------------------------------------------------------------------------di f f = mean( hombr e) - mean( muj er )
t =
2. 0293
Ho: di f f = 0
degr ees of f r eedom =
19419
Ha: di f f < 0
Pr ( T < t ) = 0. 9788

Ha: di f f ! = 0
Pr ( | T| > | t | ) = 0. 0424

Ha: di f f > 0
Pr ( T > t ) = 0. 0212

a tabla de resu ltados se p resen ta de m odo sim ilar a la de com paracin


d e m u estr as dep en d ien tes, p u es in clu ye las dos ln eas cor respon dien tes a las
estadsticas d e u n o y otr o gru p o
an tes u n a y otr a variab ley otr a ln ea con

las difer en cias en tr e am b as. ero, a difer en cia d e la p rim er a, in clu ye u n a


ln ea
la ter cer a d e cifr ascon los resu ltados del con ju n to (com bin ed) d e la
m u estra. E l , de las .per son as u e con testaron a esta p regu n ta
en la m u estr a d icen d ecan tarse por el voto al artido op u lar.
om o an tes de realizar el estu dio no estaba claro u gru po de personas iba
a ten er m ayor o m enor proporcin de preferen cias por este partido, es m s u e
razon able u e la h iptesis altern ativa sea bidireccion al. En este caso, el an lisis
m u estra u e el , de h om bres tien en in tencin de votar al partido en con sideracin y slo el , de las m ujeres. com o un a vez m s la m uestra es m u y
am plia, los errores tpicos en cada u no de los gru pos conform ados por la variable seo
son m u y peu eos. or ello, el in tervalo de confian za con un de
segu ridad esta com prendido slo entre pun tos porcen tu alespara los prim eros
entre el , y el , y para las segu n das en tre el , y el ,.
er o, sin du d a, los datos de m ayor in ter s en esta pr u eba apar ecen en la
ln ea de las diferen cias (di

),
don de apar ecen cu atr o cifr asla pr im era es la
d ifer en cia de las p rop or cion es corr espon dien tes a los d os gr u pos
h om br es
y m u jeres
, la segu n da el er r or tp ico, o desviacin tp ica d e la distribu cin m u estr al d e la d ifer en cia de p ropor cion es, m ien tras u e la tercer a y la
cu arta son los lm ites in ferior y su p erior cor resp on d ien tes al in tervalo d e
con fian za
p or defecto con u n de segu r idad en m u estras aleator iasd e
la diferen cia de pr oporcion es. om o en este caso, estos lm ites n o in clu yen
el valor , p u es am bos son positivos, p u ed e ser r ech azad a la h iptesis n u la
con u n a segu rid ad m ayor d el .
E sto m ism o se dedu ce al ob servar las pru eb as d e h iptesis efectu ad as
con el estadstico t d e tu den t. i se observa la colu m n a corresp on dien te a la
h iptesis altern ativa b id ireccion al
ha

, la probabilidad corresp on d ien te


al valor de la t em p rica
cocien te en tre la d iferen cia y su error tp icoes m en or u e el con sabid o , con el u e su elen trab ajar los cien tficos sociales.

7..2.om paracin
de
varian zas
(m u estras
in depen dien tes)
el igu al m odo u e se com p ar an pr oporcion es o m edias, tam bin eisten
p ru ebas estadsticas para d eter m in ar si las diferen cias en con tr ad as en los
valor es d e la varian za d e d os m u estr as h an podido ser d ebid as o n o a er ror es d e m u estr eo. er o, si en los pr im eros casos se u tiliza la d istrib u cin de
la t de stu den t, pr cticam en te n orm al a par tir d e gr ad os d e liber tad, par a
la com p ar acin de la h om ogen eidad de d os m u estr as, h ay u e u tilizar la
d istr ib u cin d e n edecor.
u esto u e se tr ab aja con dos gru p os, las varian zas o d esviacion es tp icas d e cada u n o de ellos se r econ oce m edian te la in clu sin en u n su bn d ice
d el n m ero o d el n m ero , cor respon dien tes a las d os m u estras u e se
estn com paran do. or tan to, en h ip tesis alter n ativas b idireccion ales, la
n otacin de esta p ru eba es com o sigu e

E E G

.
a in stru ccin vlida p ara esta operacin en tata es sdtest, u e tien e u n a
sin tais com p letam en te sim ilar a la de ttest,
salvo en las op cion es. or tan to,
p ara ver si la probabilidad asign ad a al voto al tien e u n a h om ogen eidad
sim ilar en tre h om bres y m u jeres, se debe escribir la sigu ien te ln ea
sd test pvotop p, b y
seo

edian te esta in stru ccin se realiza u n a pr u eb a d e com paracin de var ian zas o desviacion es tpicas m edian te la pr u eb a . E l r esu ltad o ser sim ilar al u e ap ar ece a con tin u acin
ILUSTR ACI 7 .1. P r u e b a d e co m p a r a ci n d e va r ia n a s

m u e st r a s in d e p e n d ie n t e s
Var i anc e r at i o t est
-----------------------------------------------------------------------------Gr oup |
Obs
Mean
St d. Er r .
St d. Dev .
[ 95% Conf . I nt er v al ]
- - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - hombr e |
10302
4. 593671
. 0365807
3. 712892
4. 521966
4. 665376
muj er |
10228
4. 824892
. 0362677
3. 66788
4. 753801
4. 895984
- - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - c ombi ned |
20530
4. 708865
. 025769
3. 692256
4. 658356
4. 759374
-----------------------------------------------------------------------------r at i o = s d( hombr e) / s d( muj er )
f =
1. 0247
Ho: r at i o = 1
degr ees of f r eedom = 10301, 10227
Ha: r at i o < 1
Pr ( F < f ) = 0. 8917

Ha: r at i o ! = 1
2* Pr ( F > f ) = 0. 2166

Ha: r at i o > 1
Pr ( F > f ) = 0. 1083

as tres prim eras ln eas n u m ricas coin ciden con las pru ebas de com paracin de m edias. lo se en cu en tran diferen cias a partir del en u n ciado de la
h iptesis n u la con sisten te en u e la desviacin tpica en el prim er gru po, el de
h om bres en este caso, es igu al u e la propia del segu n do gru po, m u jeres en este
ejem plo. E n la m u estra se ve u e los prim eros tien en u n a desviacin tpica algo
m ayor de ,, m ien tras u e las m u jeres tien en algo m en os de dich a can tidad.
a diferen cia es slo de cen tsim as. ero com o las m u estras son m u y gran des, el test de la in dica u e podra h aberse debido a errores m u estrales.
a salida del program a calcu la tres probabilidades distintas del valor de ,
seg n la h iptesis altern ativa sea un idireccion al
en los etrem oso bidireccion al
en el cen tro
. El prim ero
el situ ado a la izuierdaen el caso de u e la prim era desviacin tpica sea m enor ue la segu n dael segun do
en el cen tropara
la h iptesis alternativa bilateral, y el tercero
a la derech a
, cu an do la alternativa
sea u e el prim er gru po tien e u n a heterogen eidad m ayor u e el segu n do.

i se u tiliza este p rogr am a com o p aso an ter ior par a la com p ar acin de
m ed ias
u e eige com pr obar p reviam en te si las var ian zas son o n o igu ales
en tr e los gr u pos
, el valor m s in d icad o es el bilateral. or tan to, en este
ejem plo, au n sien do la m u estra b astan te gran de, n o pu ede r ech azar se la
h iptesis n u la d e la h om ocedasticid ad en los dos gr u pos.

7...om paracin
de
m edias
en
m u estras
in depen dien tes
n a vez ue se h a realizado la com probacin de si las varian zas en la variable
ue se va a com parar son igu ales o diferen tes en los dos gru pos, se pu ede proceder a form u lar el test de com paracin de m edias de m u estras in depen dientes.
ado ue ah ora se trata de m edias, la form u lacin h a de ser com o sigu e

.
eg n se h aya o n o r ech azad o la h ip tesis n u la de igu aldad de var ian zas,
eisten dos frm u las par a solicitar el an lisis pertin en te. i se h a adm itid o
la h ip tesis alter n ativa, es decir, caso de u e las varian zas sean sign ificativam en te difer en tes, se deb er in clu ir la opcin u n eu al
t t e st va ria ble
d ep en d ien te, b y
va ria ble
gru p alu n e u a l

er o en el su p u esto d e u e el resu ltado d e la pr u eba d e las var ian zas


sea n o sign ificativo, esto es, sin posib ilid ad d e r ech azar la h ip tesis n u la, tal
com o su ced i en el ejem plo pr eceden te, la in stru ccin h a d e ser sim ilar a la
an ter ior sin la op cin u n eu al
t t e st va ria ble
d ep en d ien te, b y
va ria ble
gru p al

e este m odo, para ver si la prob abilid ad d e u e se vaya a votar al es


igu al o distin ta seg n se sea h om b re o m u jer, la in str u ccin liter al es com o
sigu e
ttest pvotop p, by
seo

om ocedasticidad sign ifica igu aldad de varian za o sim ilar h om ogen eidad. u an tn im o
es eterocedasticidad.

E E G

E l r esu ltado es sem ejan te al u e se ob tien e cu an do se com p aran dos


p ropor cion es
ILUSTR ACI 7.1. P r u e b a d e co m p a r a ci n d e d o s m e d ia s in d e p e n d ie n t e s

va r ia n a s iu a le s
Two- s ampl e t t est wi t h equal var i anc es
-----------------------------------------------------------------------------Gr oup |
Obs
Mean
St d. Er r .
St d. Dev .
[ 95% Conf . I nt er v al ]
- - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - hombr e |
10302
4. 593671
. 0365807
3. 712892
4. 521966
4. 665376
muj er |
10228
4. 824892
. 0362677
3. 66788
4. 753801
4. 895984
- - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - c ombi ned |
20530
4. 708865
. 025769
3. 692256
4. 658356
4. 759374
- - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - di f f |
- . 2312213
. 0515143
- . 3321934
- . 1302492
-----------------------------------------------------------------------------di f f = mean( hombr e) - mean( muj er )
t = - 4. 4885
Ho: di f f = 0
degr ees of f r eedom =
20528
Ha: di f f < 0
Pr ( T < t ) = 0. 0000

Ha: di f f ! = 0
Pr ( | T| > | t | ) = 0. 0000

Ha: di f f > 0
Pr ( T > t ) = 1. 0000

E n la ilu str acin an terior se ve cm o la m u jer en u n a escala del cero al


d iez d a casi tr es d cim as m s d e p rob ab ilidad al voto al ar tid o op u lar.
pesar d e tan redu cid as difer en cias, salen sign ificativas p or estar trab ajan d o con m u estras tan con siderables. om o pu ede ap reciarse en la ln ea de
las diferen cias d e m edias (di

), el in ter valo de con fian za se m an tien e en tre


-,y -,. om o am b os lm ites, in ferior y su perior, son n egativos, p u ed e
r ech azar se con u n de segu rid ad la h iptesis n u la.
gu al con clu sin se
obtien e si se ob ser va la pr ob abilid ad b ilater al
tratn d ose de u n a h ip tesis
altern ativa bid ir eccion aldel valor em prico de t, es d ecir, de -,. l ser
in fer ior a ,, pu ede rech azarse la h iptesis d e u e las m ed ias r espectivas
d e h om br es y m u jer es sean igu ales en la p ob lacin .

7...Pru ebas
n o
param tricas
para
m u estras
in depen dien tes
a pru eba estadstica n o param trica m s in dicada para m u estras in depen dien tes es la de an n -h itn ey, tam bin con ocida com o la pru eba de las
su m a de ran gos de ilcoon . pera de m odo sim ilar a la ya epu esta del sign o
de los ran gosse agru pan los datos de las dos m u estras en u n solo gru po, se les
asign a el ran go correspon dien te al valor de cada caso y se in ten ta com probar si
la su m a de los ran gos de u n gru po es igu al o n o a la del otro gru po.
E n este caso la su m a esperad a de los ran gos del gr u po j se aju sta a la
sigu ien te epr esin

el valor z, con d istr ib u cin n or m al, es el resu ltado d e dividir la difer en cia en tre esta su m a de r an gos en con tr ada y la esper ad a p or la desviacin
tp ica aju stada.
ara ue tata produzca esta pru eba se debe utilizar la instruccin ran su m
con el m ism o form ato ue la instruccin ttest. e este m odo, si a los datos an teriores se les u iere aplicar una prueba no param trica, el m odo adecuado de
solicitarlo es m ediante la insercin del sigu iente com ando
ra n su m pvotop p, b y
seo

tras cu ya in ser cin el resu ltado ob ten id o sera el sigu ien te


ILUSTR ACI 7 .1. P r u e b a d e la su m a d e r a n o s
Two- s ampl e Wi l c oxon r ank- s um ( Mann- Whi t ney ) t es t
s ex o |
obs
r ank s um
expect ed
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - hombr e |
10302
1. 039e+08
1. 058e+08
muj er |
10228
1. 068e+08
1. 050e+08
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - c ombi ned |
20530
2. 108e+08
2. 108e+08
unadj ust ed v ar i anc e
adj us t ment f or t i es
adj us t ed var i anc e

1. 803e+11
- 5. 315e+09
---------1. 750e+11

Ho: pv ot opp( s ex o==hombr e) = pv ot opp( sex o==muj er )


z = - 4. 366
Pr ob > | z | =
0. 0000

om o p u ed e apreciarse au , la d iferen cia en la su m a d e ran gos es sign ificativa al pr oporcion ar u n valor n orm alizado su p er ior a . or tan to, se
p u ed e afirm ar u e la p au ta ord in al d e la var iable voto
al
PP
es d istin ta en tr e
h om b res y m u jer esdich o d e m od o m s sim plificado, las m ed ian as de estas
d os variables son distin tas.

7 .. Co m p a r a cio n e s d e k m u e st r a s in d e p e n d ie n t e s
as pr u eb as u e se h an visto h asta ah ora slo podan aplicar se a la com p aracin de dos en tid ad es. as u e se ab or dan a con tin u acin p er m iten
com p ar ar m s de d os objetos. E n u n p rim er m om en to, se estu diar n las
p ru ebas u e perm iten aver igu ar si son igu ales o n o m ed ias, p rop orcion es o
varian zas calcu lad as en d istin tas m u estras y, posteriorm en te en el p rim o
ap ar tado, se an alizar n las u e im p lican la com p ar acin de m s d e dos var iables. , com o en los an lisis pr eceden tes, tam b in cabe au la aplicacin

E E G

d e tcn icas par am tricas, cu an do se cu m plen u n a ser ie de su p u estos, o de


p ru ebas m s r obu stas u e n o n ecesitan estos r eu erim ien tos.

7..1.om paracion es
n o
param tricas
de

m u estras
ar a la com p ar acin de m s d e m u estras eiste u n a am pliacin de la
p ru eba d e an n -h itn ey, llam ada d e ru sal-allis, u e u tiliza la distrib u cin de c. E st b asad a, com o la tcn ica pr eceden te, en com par ar en cad a
gru p o la su m a d e r an gos.
n tes d e proceder a las p ru ebas u e com p ar an m s de dos gru p os, es
con ven ien te solicitar u n a tabla u e describ a n m er o d e casos, m edia y d esviacin tp ica d e cada gru p o. om o ejem plo, se va a tom ar la m ism a var iab le d ep en d ien te, es d ecir, la pr ob abilid ad d e voto u e cada en tr evistado se
atr ibu ye al ar tid o op u lar, pero, en lu gar de em plear com o var iable gr u pal
el seo, se u tilizar la edad r ecodificada en siete categor as. ecu rd ese u e
esta op eracin d e agru p am ien to d e valor es h a d e h acer se m ed ian te la sigu ien te in str u ccin
recod e eda d

.
, gen
ed adr

a solicitu d de los estad sticos para cad a gru po pu ede r ealizarse m ed ian te la sigu ien te m od alid ad de la or den tabu late
tabu la te ed adr, su m m arize
pvotop p

edian te ella se ob tien e m edia, d esviacin tpica y n m er o de casos tan to p ar a cada u n o d e los gru pos com o para el con ju n to de la m u estra
ILUSTR ACI 7 .1 7.

Ta b la d e co m p a r a ci n d e m e d ia s y d e svia cio n e s t p ica s

|
Summar y of pp
edadr |
Mean
St d. Dev.
Fr eq.
- - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - 18- 25 |
4. 2746458
3. 5555559
3317
26- 35 |
4. 396222
3. 6012627
4235
36- 45 |
4. 2245061
3. 6288486
3746
46- 55 |
4. 7932773
3. 6942614
2975
56- 65 |
5. 5415361
3. 7011868
2552
66- 75 |
5. 3428237
3. 7629557
2564
75+ |
5. 2223199
3. 84858
1138
- - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - Tot al |
4. 7092123
3. 6924366
20527

E l p rom edio u e da el con ju n to d e la m u estr a a la pr obabilid ad d e votar


al p artido en cu estin es d e ,. u ede observarse, ad em s, cm o los gr u pos
d e ed ad con m en os d e a os estn por debajo de este valor y los u e tien en
m s d e a os otorgan u n a pu n tu acin sen siblem en te m s alta, su per ior
a los pu n tos. e trata de ver ah or a si estas d ifer en cias son sign ificativas.
este fin se aplica la in stru ccin u e r ealiza la pr u eba de r u sal-allis
allis pvotop p, b y
eda dr

tese u e el ord en d e las variab les es el in verso del de la or den tabu la


te. om o en las otr as pr u eb as com p ar ativas de m u estras in d ep en d ien tes, la
variab le u e h a de ser com par ad a h a d e epr esar se en p rim er lu gar y en el
ltim o la var iable gr u pal.
ILUSTR ACI 7 .1 . P r u e b a d e r u sa l
a llis d e iu a ld a d d e m e d ia s
e n m u e st r a s in d e p e n d ie n t e s
Test : Equal i t y of popul at i ons ( Kr us k al - Wal l i s t es t )
edadr
18- 25
26- 35
36- 45
46- 55
56- 65
66- 75
75+
c hi - s quar ed =
pr obabi l i t y =

_Obs
3317
4235
3746
2975
2552
2564
1138

_RankSum
31742682. 00
41328124. 00
35568528. 00
30939640. 00
29588968. 00
28905476. 00
12615706. 00

365. 915 wi t h 6 d. f .
0. 0001

c hi - s quar ed wi t h t i es =
pr obabi l i t y =
0. 0001

377. 031 wi t h 6 d. f .

E n los r esu ltad os se ofrecen dos can tidad es de cla or igin al y la corr egid a p or la pr esen cia de em p ates en el ran go d e las p u n tu acion es. m bas
con fir m an u e p u ed e rech azarse con u n n ivel d e segu r id ad su p er ior al
la h iptesis n u la de u e el ran go m ed io en cada gru p o d e edad es sim ilar.
, lo u e es lo m ism o, pu ede asegu r arse u e eisten diferen cias sign ificativas p or edad en la p rob ab ilidad de voto al ar tid o op u lar. E ste, com o se h a
visto en la tab la de m ed ias, es pr ob ablem en te m s votado en tre las p erson as
m ayor es.

7..2.om paracion es
param tricas
de

m edias
e u n a p ob lacin d ividida en gr u pos con
m edias
, , ,, , se
,
etraen m u estras aleator ias con m edias , , , ,..., . a pr u eb a del

E E G

an lisis de varian za tr ata de ver ificar si con las m edias m aestr ales obten idas
p u ed e sosten erse la h ip tesis de igu aldad d e m ed ias en la p oblacin

.
os su p u estos p ar a r ealizar com p ar acion es param tr icas de m edias
son los sigu ien tes
. as m u estr as se h an seleccion ado aleator ia e in d epen dien tem en te de
las poblacion es.
. as distribu cion es en la pob lacin d e la variab le cu ya m edia se com par a son n orm ales en cad a u n o de los gru p os.
. as d esviacion es tpicas d e la var iable en cada u n a de las p oblacion es son igu ales en tre s.
a p rim er a con dicin se cu m p le siem pr e y cu an do se h ayan etrad o
m u estr as in depen dien tes y aleatorias d e los d atos. E s p resu m ib le u e al
aplicar u n cu estion ar io a p erson as seleccion adas al azar se cu m p la este su p u esto del an lisis de var ian za, siem pr e y cu an do los valores de la var iable
gru p al sean m u tu am en te eclu yen tes.
ar a el segu n do su pu esto, eisten d istin tas pr u eb as p ar a com p rob ar la
n orm alid ad de u n os d atos m aestrales. E n tata son u tilizables d iver sos pr oced im ien tos para com p robar si u n a d istr ibu cin es o n o n orm al. E n tre ellos
estn sil,
s
ran cia,
sm irn ov y stest.
E n tr e estos son m s recom en d ables en este con teto los d os pr im eros,
pu es son los n icos u e perm iten r ealizarse con la opcin bpara obten er
u n a pr u eba de n or m alidad de la var iable en cu estin para cada u n a d e las
m u estr as in depen dien tes etr adas.
om o u n ejem plo de an lisis de varian za, se con sidera com o variable depen dien te la probabilidad de voto al artido opu lar (pvotopp) por n iveles de
estu dio. n tes de ejecu tar el an lisis de varian za, se com bin an las variables es
cu ela
y estu dios, para aplicarles con ju n tam en te la pru eba de n orm alidad para
cada gru po de la m u estra m edian te la in stru ccin silprecedida por b
sort
repla ce estu diosif
escu elaescu ela
recod e estu d ios .
la bel defin e estu d ios
in estu dios
, ad d
b ysort estu d iossilp votop p

om o la variable estu dios posee, adem s de los n o


con testa, siete valores,
el an lisis procede a la realizacin de och o pru ebas. om o pu ede com probarse
las seis prim eras ofrecen diferen cias su stan tivas con respecto a la n orm alidad,

m ien tras u e los dos ltim os gru pos, los m en ores en tam a o, podran proven ir
de poblacion es en las u e la distribu cin de la variable fu era n orm al. in em bargo, a pesar de u e en los gru pos im portan tes n o se cu m pla el su pu esto de
n orm alidad, cu an do los tam a os gru pales son gran des, el reu isito n o es tan
su stan cial. irve m s bien para determ in ar u pru eba de h om ocedasticidad es
m s adecu ada aplicar, pu es el su pu esto de igu aldad de varian zas es m u ch o m s
im portan te u e el de la n orm alidad de las poblacion es.
ILUSTR ACI 7 .1. P r u e b a d e Sa p ir o
ild e n o r m a lid a d e n lo s d a t o s
_______________________________________________________________________________
- > es t udi os = Si n es t udi os
Shapi r o- Wi l k W t es t f or nor mal dat a
Var i abl e |
Obs
W
V
z
Pr ob>z
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - pvot opp |
1603
0. 98572
13. 849
6. 631 0. 00000
_______________________________________________________________________________
- > es t udi os = pr i mar i os
Shapi r o- Wi l k W t es t f or nor mal dat a
Var i abl e |
Obs
W
V
z
Pr ob>z
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - pvot opp |
9534
0. 98257
83. 289
11. 824 0. 00000
_______________________________________________________________________________
- > es t udi os = s ecundar i os
Shapi r o- Wi l k W t es t f or nor mal dat a
Var i abl e |
Obs
W
V
z
Pr ob>z
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - pvot opp |
3482
0. 98361
32. 118
8. 998 0. 00000
_______________________________________________________________________________
- > es t udi os = f or mac i n pr of es i onal
Shapi r o- Wi l k W t es t f or nor mal dat a
Var i abl e |
Obs
W
V
z
Pr ob>z
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - pvot opp |
2533
0. 98383
23. 761
8. 127 0. 00000
_______________________________________________________________________________
- > es t udi os = uni v er si t ar i os de gr ado medi o
Shapi r o- Wi l k W t es t f or nor mal dat a
Var i abl e |
Obs
W
V
z
Pr ob>z
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - pvot opp |
1795
0. 98323
18. 028
7. 327 0. 00000
_______________________________________________________________________________
- > es t udi os = uni v er si t ar i os de gr ado s uper i or
Shapi r o- Wi l k W t es t f or nor mal dat a
Var i abl e |
Obs
W
V
z
Pr ob>z
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - pvot opp |
1500
0. 98038
17. 906
7. 260 0. 00000
_______________________________________________________________________________
- > es t udi os = ot r os es t udi os no r egl ados
Shapi r o- Wi l k W t es t f or nor mal dat a
Var i abl e |
Obs
W
V
z
Pr ob>z
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - pvot opp |
50
0. 96225
1. 775
1. 224 0. 11045
_______________________________________________________________________________
- > es t udi os = n. c.
Shapi r o- Wi l k W t es t f or nor mal dat a
Var i abl e |
Obs
W
V
z
Pr ob>z
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - pvot opp |
36
0. 95404
1. 676
1. 080 0. 14009

E E G

E l tercer su pu esto u e h ay u e com pr obar es el d e la h om ocedasticidad


p ar a ello se p u ede u tilizar el test de even e o cu alu ier a d e su s varian tes,
u e se pu eden obten er a tr avs de la in str u ccin robvar.
rob var p votop p, by
estu d ios

edian te esta in str u ccin , r ecom en dab le siem p re u e se u ier a h acer


u n a com paracin d e m edias m ed ian te el an lisis d e var ian za, las p ru ebas
d e h om ocedasticid ad estn pr ecedidas por las m ed ias, d esviacion es tp icas
y n m ero d e casos d e cada u n o d e los gr u pos.
ILUSTR ACI 7 .. P r u e b a d e Le ve n e d e iu a ld a d d e va r ia n a s
|
Summar y of pp
es t udi os |
Mean
St d. Dev.
Fr eq.
- - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - Si n es t ud |
4. 6219588
3. 7790826
1603
Pr i mar i os |
4. 95794
3. 6834252
9534
Sec undar i |
4. 6550833
3. 650202
3482
For mac i n |
4. 1729175
3. 6172672
2533
Medi os |
4. 6250696
3. 6810303
1795
Super i or e |
4. 3446667
3. 7301225
1500
Ot r os |
5. 56
4. 0866133
50
N. c . |
3. 75
4. 0523362
36
- - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - Tot al |
4. 7089563
3. 6922759
20533
W0

= 3. 5717968

W50 = 2. 677433
W10 = 3. 5717968

df ( 7, 20525)
df ( 7, 20525)
df ( 7, 20525)

Pr > F = . 00076178
Pr > F = . 00905666
Pr > F = . 00076178

ra s el resu m en por gr u pos y tota l d e la var ia ble cu yas d ifer en cia s se


u ier e en con tra r, a pa r ecen en tr es ln ea s la s tr es pr u eba s in clu id a s en este
pr ocedim ien to. E n pr im er lu ga r ap a rece el test de even e (), en el u e
se efect a u n a n lisis d e va rian za con la s diferen cia s a b solu ta s de la s pu n tu a cion es d e ca da in d ividu o con resp ecto a su m ed ia gr u pa l. espu s a pa rece el , u e h ace lo m ism o per o efectu a n do la s diferen cia s con rela cin a la m edia n a gr u pa l, y el 1, u e lo rea liza con la m edia r ecorta da ,
ca lcu la da con el d e los ca sos cen tr ales, es d ecir, eclu yen d o a l
de los ca sos con p u n tu a cion es m en or es y al otro con p u n tu acion es
m a yores.
E n este caso, la con clu sin u e h ay u e tom ar es u e n o se d an las
con dicion es de h om ocedasticidad, por lo u e h ab ra u e tom ar con m u ch a
p recau cin el r esu ltado del an lisis d e var ian za. ar a u e tata h aga este
se pu eden em p lear las in str u ccion es on eay an ova. E n este apartado slo
se con tem p la la p rim er a, dejan d o la segu n da par a otro pr im o, p u es p osee
tam b in la posib ilidad d e com par ar m u estr as d ep en d ien tes.

ar a ob ten er u n an lisis de varian za con el pr ocedim ien to on ea


, b asta
con epr esar d etrs de la in str u ccin , en pr im er lu gar, la var iable cu an titativa y en segu n d o lu gar la gru p al. E n el ejem plo actu al, p rim er o h a d e apar ecer la var iable pvotopp y desp u s la variab le estu dios.
on eay pvotop p estu dios

E l resu ltado n o slo ep resa las su m as y m edias cu ad rticas de las tr es


fu en tes de var iacin
total, in ter n a y eter n a
, sin o u e tam bin in clu ye otr o
test de com p aracin d e varian zas, el de artlett.
ILUSTR ACI 7 .1.

An lisis d e va r ia n a p a r a m u e st r a s in d e p e n d ie n t e s

Anal y s i s of Var i anc e


Sour c e
SS
df
MS
F
Pr ob > F
-----------------------------------------------------------------------Bet ween gr oups
1622. 11558
7
231. 730797
17. 09
0. 0000
Wi t hi n gr oups
278288. 607 20525
13. 5585192
-----------------------------------------------------------------------Tot al
279910. 723 20532
13. 632901
Bar t l et t ' s t est f or equal v ar i ances :

c hi 2( 7) =

6. 6295

Pr ob>c hi 2 = 0. 468

a su m a cu adrtica total
otal
SS
o repr esen ta la su m a d e las
d esviacion es al cu adr ad o d e todos los valores con respecto a la m ed ia global
d e la m u estra.

.
E n la frm u la se su m an en cad a u n o de los gru p os, las n j diferen cias
cu adr ticas en tr e los valores (ij) y las m ed ias (
). o es esto otr a cosa u e el
n u m er ad or de la var ian zap or lo u e al d ividirla p or los grados de libertad
(d
) d e la m u estr a, se ob tien e la cu asivar ian za, con ocid a en este con teto
com o la m edia cu adr tica total
otal
S o
.

.
u r az cu adr ada eu ivale a la cu asid esviacin tp ica d e la variab le cu yas m edias se estn com paran d o en d istin tas su b m u estr as, en este caso, d e
la var iable u e m ide la p robab ilidad su b jetiva de voto al .

E E G

a su m a cu adrtica se descom p on e en dosla etern a


in ter gr u pal, bet
een o SE y la in tern a
in tragru pal, itin o S

. a pr im era d e estas
r ecoge las d esviacion es al cu adr ado d e cada u n a d e las m ed ias d e los gr u pos
con r especto a la m edia global, es decir, r efleja las d ifer en cias eisten tes
en tr e los d istin tos gr u pos.

.
E n ca m b io, la su m a cu ad r tica in ter n a rep r esen ta la s d esvia cion es eisten tes d e los va lores con r esp ecto a la m ed ia d e su gru p o, es d ecir, la var ia cin u e eiste en el in terior d e ca d a u n a d e la s su b m u estra s ob ten id as.

.
e las su m as cu adrticas se obtien en las m edias cu adrticas, dividien do las
prim eras por su s grados de libertad. E n el caso de la su m a cu adrtica etern a
(beteen ), los grados de libertad son igu ales al n m ero de gru pos m en os u n o
y en el de la su m a cu adrtica in tern a (itin ) al n m ero de casos del con ju n to
m en os el n m ero de gru pos.

.
om o la hiptesis nula u e se est com probando es la igualdad de m edias de
los distintos grupos, es obvio ue cu anto m ayor sea la sum a cuadrtica intergrupal, m enores sern las garantas de ue auella sea cierta. e sabe ue, en caso
de ue se cum plan los supuestos m encionados, el cociente de la m edia cu adrtica intergrupal entre la m edia cuadrtica intragrupal sigue la distribu cin .

.
E n el ejem plo an terior m en te epu esto, la da u n valor etr em ad am en te
gran d e
,
, cu ya p robab ilidad de ocu rr en cia, en el caso d e u e la h ip-

tesis n u la fu er a cier ta, ser a n fim a


n o su p er ior a ,
por ello, sera
p oco arr iesgad o el rech azo de esta, esto es, decir u e la valor acin electoral
a u n d eter m in ad o par tid o es d istin ta seg n los d ifer en tes n iveles d e estu dio
d e los votan tes. E n el grfico .est repr esen tad a la ter ica d istr ibu cin
d e la en el caso d e u e la h ip tesis n u la fu er a cierta. om o se pu ede
ap reciar, es n fim a la posibilid ad d e u e el valor sea su p er ior in clu so a ,

p,
.
ist r ib u ci n co n 7 y r a d o s d e lib e r t a d

.2

F(x,7,2525)
.4

.6

.8

R IC 7 .1.

.5

1.5

2.5

3.5

E n este ejem p lo se im pon e volver a l tem a d el su pu esto d e h om oceda sticida d, pu esto u e ofr ece ciertas con tr a ried ad es u e deben ser ten ida s
en cu en ta . on el a n lisis on ea
, ta ta ob tien e la p ru eba de a rtlett d e
igu a lda d de va ria n zas. E n el ejem plo de la ilu stra cin .n o pa r ece h a ber
in d icios de h eteroced a sticid ad , ya u e la pr oba bilida d d e la m edida es su p er ior a ,. E sto se con tra dice con el a n terior test d e even e, con el u e
se r ech a z la h ip tesis n u la de h om oced a sticid ad . u l de estos a rtilu gios, el d e a rtlett o el d e even e, es m s fia b leE n pr in cip io, el segu n d o,
p u es el pr im er o es m s sen sible a l su p u esto de u e la s su b pobla cion es ten ga n u n a distribu cin n orm a l, con d icin u e se com p rob con la pr u eb a d e
h ap ir o-ils u e n o era cier ta . or ta n to, a p esa r d e la p ru eba de a rtlett, el ejem p lo n o ofr ece gr a ra n ta s de h om oceda sticida d. o obsta n te,
com o la sign ifica cin d el va lor en la pr u eba de com p ar a cin de m edia s
es ta n n fim a , a p esa r de n o cu m plir se los su p u estos, segu ira pu din d ose
r ech a za r la h iptesis n u la con gra n tr an u ilid a d de n o eu ivoca r se.
edian te la opcin tabu late del program a on ease ob tien e u n a tabla
sim ilar a la u e p rod u cen otras in stru ccion es, com o tabu late, table o robvar,

E E G

con m edias, d esviacion es tpicas y frecu en cias por gru p o, pero, adem s, tam bin es posib le realizar pru eb as de com paracion es m ltiples con las opcion es sce

e,
bon
erron i o sida. E stas tres respon den con diferen tes criterios
a corregir el prob lem a u e su p on e realizar m u ch as pru eb as de sign ificacin
al m ism o tiem po. i de cada cien com paracion es, cin co salen sign ificativas
aleatoriam en te de cad a diez com p aracion es, m ed ia ten dra u e salir sign ificativa. ara evitar rech azar aleatoriam en te, diferen cias u e n o lo son , se
ap lican criterios m s estrictos u e la sign ificacin otorgada por la t
d e tu den t para com parar slo dos m u estras.
E n el ejem p lo actu al, u tilizan d o el criterio de ch eff, u e con siste en
d ividir el cu ad rad o d e la distrib u cin t de tu den t p or el n m ero de gru p os
m en os , se ob tien e u n a d istrib u cin con -grados d e libertad en el n u m erad or y n -grad os en el den om in ador. E stas operacion es se obten d ran con la
sigu ien te in stru ccin , cu yos resu ltados se presen tan en la ilu stracin .
on ea y pvotop p estu d ios, n oan ova sch effe
ILUSTR ACI 7 .. Co m p a r a ci n d e m e d ia s c o n co r r e cc io n e s d e Sce

Compar i s on of pp by es t udi os
( Sc hef f e)
Row Mean- |
Col Mean | Si n es t u
Pr i mar i o
Sec undar
F. P
Medi os
Super i or
Ot r os
- - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - Pr i mar i o |
. 335981
|
0. 121
|
Sec undar |
. 033124
- . 302857
|
1. 000
0. 016
|
F. P | - . 449041
- . 785023
- . 482166
|
0. 042
0. 000
0. 001
|
Medi os |
. 003111
- . 33287
- . 030014
. 452152
|
1. 000
0. 090
1. 000
0. 027
|
Super i or | - . 277292
- . 613273
- . 310417
. 171749
- . 280403
|
0. 733
0. 000
0. 384
0. 957
0. 692
|
Ot r os |
. 938041
. 60206
. 904917
1. 38708
. 93493
1. 21533
|
0. 871
0. 988
0. 887
0. 433
0. 872
0. 627
|
N. c | - . 871959
- 1. 20794
- . 905083
- . 422917
- . 87507
- . 594667
- 1. 81
|
0. 961
0. 796
0. 951
1. 000
0. 960
0. 996
0. 653

e esta m atriz d e com paracion es d on de aparecen en cad a celda d os cifrasla diferen cia de m ed ias
de la correspon d ien te al gru po d e fila m en os d e
la correspon d ien te al de la colu m n ay la sign ificacin corregida se dedu ce
u e a pesar de u e los u e n o con testan al n ivel de estu dios son los u e con
m en or probabilid ad dan su voto al
tod as las restas d e su fila son n egativasy u e los u e poseen otros estu d ios son los u e otorgan m ayor prob ab ilidad
tod as las restas d e su fila son positivas
, n in gu n a de las d os resu ltan
sign ificativas, poru e son categoras con u n a peu e a can tidad d e casos.

E n cam b io, la categor a .


, con u n a m edia de ,, ap ar ece com o el
gr u po con m en or p rob ab ilidad sign ificativa d e votar a favor del . lo
p resen ta asociacion es n o sign ificativas con el gru p o de estu d ios su p er iores
u e tam bin tien en u n a p rob ab ilid ad m edia p or deb ajo de la d el con ju n to d e la m u estra y con los ya m en cion ados gru p os m en or es d e otros
estu d ios y de casos u e n o con testan . , en el otr o etr em o, se en cu en tr a la
categor a rim arios, u e p resen ta m ed ias sign ificativam en te m ayores u e
con secu en tem en te la categor a ., p ero tam b in con la d e estu dios
secu n darios y con la de estu dios su p er ior es.
am bin pu eden efectu ar se com p ar acion es d e m u estr as in depen dien tes
con la in str u ccin an ova, pero el u so d e esta se ver con m s d etalle en el
sigu ien te apar tado, cu an do se vean los an lisis com p arativos de m u estr as
d ep en dien tes.

7 .. Co m p a r a cio n e s d e k m u e st r a s d e p e n d ie n t e s
lgo m s com plejo es el em p leo d e pr u eb as de m u estr as dep en d ien tes con
el pr ogram a tata. E n p rim er lu gar, n o se pu ede em p lear la m s sim ple in stru ccin on ea
, sin o u e h a d e u tilizarse la m s com p leja an ova. eso n o
es todo, por u e ad em s h an d e dispon er se los d atos en el for m ato alargado,
tal com o se eplic en la seccin ...
ILUSTR ACI 7.. st r u ct u r a a n c a d e la m a t r id e d a t o s

Gen er alm en te, el for m ato d e los fich er os de datos se aju sta al m odelo
an ch o, d e form a u e en las ln eas se en cu en tran los casos y en las colu m n as,
las variab les. ara m u estras d ep en d ien tes esto im plicara u e cada variable
ap ar ece en u n a colu m n a d istin ta. in em bar go, el tratam ien to d e la in stru ccin an ova reu iere u e la in for m acin est disp u esta en otro form ato, el
alargado. e n ecesita u e h aya u n a var iable n ica con tod o lo u e se d esea
com p ar ar
var dep , ideo
en el ejem ploy al m en os otr as dos variab lesu n a
u e sea la fu en te d e la com paracin
varr ep, partido
, o el n m er o de repeticin d e la m edida, y otra u e in diu e al su jeto de com p aracin
varid, id
.
E sto, u e par ece tan com p lejo, p u ed e en ten der se m ejor visu alm en te com p ar an do los m ism os d atos epr esad os a lo an ch o
ilu str acin .y a lo lar go

ilu str acin .

E E G

ILUSTR ACI 7.. st r u ct u r a a la r a d a d e la m a t r id e d a t o s

on el fich er o en form ato alar gad o, se pu ede ap licar la in stru ccin id n ea p ar a efectu ar u n an lisis de varian za d e m edidas r epetid as, u e p osee
esta frm u la gen eral
a n o va va rdep varid varrep , r e p e a t e d
varrep

on de, vard ep es la variab le dep en d ien te


la ideo
d e la ilu str acin .

varid , la iden tificadora de los in divid u os o casos (id),


y varr ep,
la u e in dica
d e u n m er o d e variab le se trata (partido).
ase tod o el pr oceso con los d atos d el cu estion ario electoral, su p on ien d o u e se ten gan u e com parar las m ed ias d e u bicacin en la escala id eolgica d e tres partidos en el pas vasco
, y E .
E n p r im er lu ga r, se d eb e p r oced er a l a r r eglo d el fich er o p a r a u e
sea p osib le el tr a ta m ien to. a es con ocid o u e ta ta tr a b a ja n or m a lm en te con a r ch ivo s a n cos,
esto u ier e d ecir u e tod a s la s va r ia b les se
en cu en tr a n en la d im en si n ver tica l d e la m a tr iz d e d a tos. er o , p a r a
u e se p u ed a r ea liza r este a n lisis, la s d istin ta s va r ia b les h a n d e esta r
d isp u esta s en d istin ta s fila s co m o si d e ca sos d ifer en tes se tr a ta r a . E sto
p u ed e so lu cio n a r se f cilm en te co n la in str u ccin resa pe
lon
,
p er o esta
n ecesita u e la s va r ia b les ten ga n n o m b r es sim ila r es u e se d istin ga n
n ica m en te p or n m er os co n secu tivos a l fin a l, p or ejem p lo , va r ia b le,
va r ia b le, va r ia b le. E n el ejem p lo a ctu a l, la s va r ia b les u e se u ier en com p a r a r se d en om in a n ideopp,
ideoea
y ideopn v. o r ello , h a n d e
ser tr a n sfo r m a d a s, p a r a d isp on er d e u n a ser ie or d in a l con secu tiva u e
p u ed a ser tr a ta d a con la in str u cci n u e con vier te el for m a to d e la m a tr iz. e a h u e h a ya u e gen er a r o r en om b r a r la s va r ia b les. i se tien e
esp a cio y m em or ia su ficien te, es p r efer ib le la p r im er a o p cin . or ello,
h a b r a u e cr ea r la s va r ia b les u e se u ier en com p a r a r co n la in str u ccin
en era te.

u se p an el, clea r
gen erate pa rtidoideopp
gen erate pa rtidoideopn v
gen erate pa rtidoideoea

a y u e ten er en cu en ta u e el p r ogr a m a a n ova d e m ed id a s r ep etid a s tien e cier ta s lim ita cion es d e c lcu lo. o p u ed e tr a b a ja r con m s d e
ca so s, p u es p or la s ca r a cter stica s d el p r ogr a m a estos son tr a ta d os
com o si fu er a n va lor es d istin tos d e u n a va r ia b le. or eso, es con ven ien te
elim in a r d el fich er o tod os a u ellos ca sos con va lor es p er d id os en la s
va r ia b les tr a ta d a s y, com o a n eso n o es su ficien te, d a d a la gr a n m u estr a d isp on ib le, h a b r u e con str u ir u n a su b m u estr a con la in str u ccin
sa m ple, en este ca so b a sta con h a cer u n a u e com p r en d a el d e
los su jeto s d isp on ib les. in a lm en te, ta m b in es con ven ien te r ed u cir el
ta m a o d el fich er o d e tr a b a jo p a r a u e el tr a n sfor m a d o n o con ten ga
va r ia b les in tiles y p a r a u e se a m in or e el esfu er zo d e con ver sin . E sta s
tr es op er a cion es d e seleccin h a n d e r ea liza r se m ed ia n te la s sigu ien tes
in str u ccion es
recode partid o-partid o.
d rop if partid o. p artid o. pa rtido.
sam ple
eep id pa rtido-p artido

bviam en te, con las dos pr im er as, al elim in ar los casos con valor es perd id os en estas variab les, se seleccion an los casos u e h an con testado a la
evalu acin d e la posicin id eolgica de los tres par tid os con sid er ad oscon
la ter cer a, se seleccion an la m itad de los casos y, fin alm en te au n u e p od ra h ab er sido tam bin u b icad a en pr im er lu gar, slo se m an tien en las
cu atr o var iables con las u e se obten d r la n u eva disposicin de los datos. n a vez r ealizad as estas oper acion es, pr ocede la tr an sform acin de la
m atriz d e d atos, m edian te la in str u ccin , u e en este ejem plo ad optar a la
sigu ien te for m a
resh ap e lon g pa rtido, i
id j
p ar

n a vez in trodu cid a esta in stru ccin , el fich ero se pr epara au tom ticam en te p ar a u e sea posib le realizar el an lisis de varian za con el dise o
d e m edid as repetidas. on secu en cia d el p roceso, en pan talla se m u estra lo
sigu ien te

E E G

ILUSTR ACI 7 .. P a r m e t r o s d e la t r a n s
o r m a ci n d e m a t r ic e s
( not e: j = 1 2 3)
Dat a

wi de

->

Number of obs.
Number of v ar i abl es
j v ar i abl e ( 3 v al ues)
x i j v ar i abl es:
par t i do1
par t i do2

l ong
670
4

->
->

par t i do3

2010
3
->

par

->

par t i do

e los d atos dispu estos en form ato an co


se pasa al for m ato lar
o. e
casos se p asa a ., esto es, se m u ltiplica p or tr es las ln eas d el fich er olas var iables p asan de a , es decir, de ten er la iden tificacin y tr es
variab les, ah or a se tien e la id en tificacin , las tr es var iables en u n a sola
partidoy otr a n u eva var iable n om in al
par con valor es del al , u e in d ican
d e u p artido se trata la m edicin .
n tes d e efectu ar el an lisis d e var ian za de m edid as r ep etid as con vien e
p on er etiu etas a la n u eva var iable par y solicitar u n a tabla con tabstat
de
los estad sticos b sicos p ar a recon ocer las evalu acion es u e se h an dad o a
los tres par tid os en cu estin
la bel defin e p artid os

E
la bel va lu es par p artid os
tabstat pa rtido, b y
p arstatistics
n m ean sd

e este m od o se obtien en los estadsticos cor r esp on d ien tes a las tr es


variab les. ad a u n a d e ellas con tien e el n total. E n ese sen tid o, el n de la fila
total es ficticio, p u esto u e est su m an do a cad a in d ivid u o tres veces p ara
obten er la m ed ia con ju n ta de las tr es variab les
ILUSTR ACI 7 .. Ta b la d e m e d ia s y d e s via cio n e s t p ica s d e m u e st r a s
d e p e n d ie n t e s
Summar y f or var i abl es : par t i do
by cat egor i es of : par
par |
mean
sd
N
- - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - PP |
7. 998507 1. 829422
670
PNV |
5. 291045 1. 899668
670
EA |
4. 425373
1. 53376
670
- - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - Tot al |
5. 904975 2. 327455
2010
----------------------------------------

or todo ello, con vien e cerrar el fichero de trabajo despus de estos anlisis, ya ue los
casos se m u ltiplican por tan tas veces com o m edidas repetidas se disponga.

ras estos p asos p revios con los d atos, h ay u e in clu ir la or den an ova
p ara obten er el an lisis
a n ova partid o id p ar, repeated
p ar

E l resu ltad o es sim ilar al de la in stru ccin on eadel an terior apartado


An lisis d e va r ia n a d e m u e st r a s d e p e n d ie n t e s

ILUSTR ACI 7.7.

Number of obs =
2010
Root MSE
= 1. 53364

R- s quar ed
=
Adj R- squar ed =

0. 7137
0. 5701

Sour c e |
Par t i al SS
df
MS
F
Pr ob > F
- - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - Model |
7844. 54378
671 11. 6908253
4. 97
0. 0000
|
id |
3073. 60249
669
4. 5943236
1. 95
0. 0000
par |
4770. 94129
2 2385. 47065
1014. 20
0. 0000
|
Res i dual |
3147. 05871 1338 2. 35206181
- - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - Tot al |
10991. 6025 2009 5. 47118093

Bet ween- s ubj ect s er r or t er m:


Level s :
Lowest b. s . e. v ar i abl e:

id
670
id

( 669 df )

Repeat ed var i abl e: par


Huynh- Fel dt eps i l on
=
Gr eenhous e- Gei s s er eps i l on =
Box' s c onser vat i ve eps i l on =

0. 8979
0. 8956
0. 5000

- - - - - - - - - - - - Pr ob > F - - - - - - - - - - - Sour c e |
df
F
Regul ar
H- F
G- G
Box
- - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - par |
2 1014. 20
0. 0000
0. 0000
0. 0000
0. 0000
Res i dual |
1338
- - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -

a tabla de var ian za est dividid a en seis colu m n as. a pr im er a in d ica


la fu en te de la variacin corr esp on dien te a cad a fila. a segu n da d a cu en ta
d e las su m as cu adr ticas. a tercera, de los gr ad os d e lib er tad. a cu ar ta es
el cocien te en tre la segu n da y la ter cer a, esto es, las m edias cu ad rticas. a
u in ta son los valor es . a seta, su s cor respon d ien tes p rob ab ilidad es.
as fu en tes d e variacin tien en eu ivalen cia con las com p ar acion es en
m u estras in depen dien tesla d el m odelo eu ivale a la eter n a (beteen )

la
r esidu al, a la in tern a (itin ),
y la total es, com o en el caso an ter ior, la su m a
d e todas las diferen cias al cu ad rado de los valor es d e las tr es variab les con
r especto a la m ed ia global d e todas.
a var iacin total, com o pu ede com pr obarse fcilm en te, es la su m a de
la u e ep lica el m odelo y de la r esidu al. su vez, la variacin del m odelo se

E E G

d escom pon e en dos factor esla u e es ep licada p or el h ech o d e u e estn


sien do evalu ados tres p ar tidos d iferen tes y la u e es eplicada por cu an to
u e h ay in d ividu os con evalu acion es d ifer en tes. om o h ay tan tos su jetos, la su m a cu adr tica es casi tan alta com o la de los par tid os, pero, u n a
vez h allada la m edia cu ad rtica, se ve u e las difer en cias eisten tes en tre
los p ar tidos son bastan te m ayores u e las eisten tes en tre in dividu os. E sto
es as p oru e eiste cier to con sen so social sob re la u bicacin en la escala
id eolgica d on d e estn situ ad os los partidos.
h ora bien , el p rin cip al com etid o para el u e se h a h ech o este an lisis es
el d e com parar las m edias u e los su jetos dan en la escala id eolgica a los
partidos. or ello, la fu en te de variacin m s im p ortan te es la de la variab le
par, pu es es la u e in stru m en ta las diferen cias en tre las tres origin ales. E l
estad stico cen tral para la com paracin de las m ed ias es la calcu lada con
la fu en te de variacin de la variab le par, en este caso, .,. in em bargo,
al tratarse de u n as m edidas u e carecen del su pu esto de in depen den cia, ya
u e estn em itidas por la m ism a person a, n ecesitan u n a correccin p ara u e
se aju sten a la terica distribu cin de la d e n edecor. E isten , en tre otras
m ed id as correctivas, d en om in adas
, tres u e u tiliza el p rogram a tata, la
de eldt, la d e Geisser y la de o. E n los tres casos se trata de u n n m ero
m en or o igu al a , u e redu ce el tam a o d e la , evitan d o la com isin de u n
error d e tipo
, esto es, d e rech azar la h iptesis n u la sien do cierta.
E n el ejem p lo actu al, la ob ten id a es .,y los factor es de corr eccin d e ,, ,y ,, r espectivam en te. E n cu alu ier caso, se pu ede con
tr an u ilidad r ech azar la h iptesis de u e la m edia en la escala ideolgica de
los tres par tid os vascos sea idn tica en la p oblacin .

7..1.
P ru ebas
n o
param tricas
de
com paracin

de
m u estras
depen dien tes
am b in el an lisis de varian za d e m u estras d epen dien tes r eu ier e u e se
cu m plan los r eu isitos d e n orm alid ad d e los datos poblacion ales y, sobr e
tod o, de h om oced asticidad . ero, para el su p u esto de u e estas asu n cion es
n o se cu m p lan , eisten otras p ru ebas estadsticas u e n o reu ieren con dicion es tan estrictas. E n el caso d e u e se d eseen com par ar m s de dos var iables de u n a m ism a m u estr a a d ifer en cia d el caso en el u e se tr ate de
cotejar u n a sola var iable en varias m u estr as n o se pu ede u tilizar la pr u eb a
d e ru sall-allis, sin o la de r iedm an .
E l pr ogr am a tata
n o in corp or a or igin alm en te n in g n p roced im ien to
capaz de obten er este estad sticosin em bar go, en tr e su s libr eras d isp on ib les y adu ir ibles a travs de
n ter n et, se en cu en tra u n pr ocedim ien to capaz
d e pr oporcion ar los clcu los n ecesar ios. e trata d el pr ogr am a sn p2. or
tan to, si n o se tien e a n in stalad o, es pr eciso escr ibir la sigu ien te in str u ccin , con ectado a
n tern et.

n et in stall sn p .p g

n a vez u e ya se h a in cor p or a d o este p r oced im ien to en el d isco


d u r o d el or d en a d or con el p r ogr a m a ta ta , la in str u ccin n ecesa r ia p a r a
p r od u cir el esta d stico d e r ied m a n y el coeficien te d e en d a ll es la sigu ien te

r ie d m a n lista
d evariab les
in ra n go
iep

E ste pr ogr am a adolece d e u n peu e o defecton o p u ed e tr ab ajar con


variab les u e con ten gan valor es p er didos. or tan to, an tes de escrib ir la in stru ccin h ay u e asegu r ar se de u e slo va a trabajar con los casos vlidos.
ay diversos m od os d e acom eter esta op er acin , pero u iz el m s cm odo
sea cr ean do u n a var iable ficiticia e in str u m en tal con las in stru ccin m ar,
u e da el valor a au ellos casos u e n o tien en n n g n caso p erd ido en la
lista d e variab les se aladas. E sto se logra para las variab les del ejem plo an ter ior
ideopp,
ideoea
y ideopn vcon las dos sigu ien tes ln eas, u e gen er an
la var iable ficticia seleccion a
u se p an el, clea r
m arseleccion a
m arou t seleccion a id eopp id eoea ideopn v

con tin u acin , ya p u ed e u tilizar se la in str u ccin


riedm an con el con dicion an te cor respon d ien te
friedm an ideopp id eoea id eop n v if seleccion a

E l resu ltado pr oporcion a tr es ln eas u e con tien en el estadstico d e


ried m an , su sign ificacin y el coeficien te de en d all.
ILUSTR ACI 7 .. P r u e b a d e r ie d m a n p a r a m u e st r a s d e p e n d ie n t e s
Fr i edman = 5. 4e+03
Kendal l =
0. 7490
p- val ue =
0. 0000

E l estadstico de r iedm an p osee u n a distrib u cin con el n m er o d e


gr u pos m en os u n o com o gr ados de lib ertad . om o en este caso el valor es

E E G

tan alto, la sign ificacin , in d icad a a travs d el p


valu e,
es bajsim a. or ello
p u ed e r ech azar se con toda tr an u ilid ad la h ip tesis n u la de u e el ran go
id eolgico u e los su jetos dan a los tr es p artidos sea idn tico. E l coeficien te
d e con cord an cia de en dall es u n a m edid a u e vara en tre y cu an to
m s cer ca est del , in d ica m ayores acu erd os en tr e person as en el ju icio
efectu ado a u n objeto, en este caso, a los p ar tid os.

7..
e r cicio s
. on los d atos d el b arm etr o de m arzo de
cis
, p ru eba la h ip tesis de u e m s del d e los ciu dadan os p refier en ir per son alm en te a
la ficin a de dm in istr acin cu an do n ecesitan in for m acin relacion ada
con la gestin d e tr m ites adm in istr ativos
.
. om p ru eba asim ism o
u e m s d el de la p oblacin espa ola h a accedid o a
n tern et en los
ltim os m eses.
. er ifica u e la m ayor a de los ciu dadan os u e h an h ech o gestion es adm in istr ativas h an u edad o satisfech os con la aten cin

.
. E sto podr a h acer se tan to con m edias com o con por cen tajes. r esta especial
aten cin a eclu ir a u ien es n o h an em itid o op in in por n o h ab er realizad o estos trm ites.
. E m p lean do cu alu ier bar m etro poltico d el

en ero-abr il-ju lio-octu br e


, aver igu a si h ay difer en cias estadsticam en te en la valor acin de los
lder es polticos. or ejem plo, u tilizan d o el d e ab ril de
cis
,
com para la evalu acin d e
os u is odr gu ez apater o con la de ayo
ara, la d e osa ez y la de arian o ajoy.
. E val a si h ay d iferen cias estad sticam en te sign ificativas en las m edias
de los ld er es m en cion ados en el ejercicio an terior o cu alu ier otro u e
seleccion es, seg n la valoracin la h agan h om br es o m u jer es, jven es

m en ores de a oso m ayores


m s d e e izu ierd a
-o derech a

-
. pr ovech a par a record ar la in stru ccin recode
vista en el u in to
cap tu lo. ealiza otra agr u pacin de los valor es de las d os ltim as var iables
edad e ideolo
apar a com p ar ar m s d e d os gr u pos d e edad e
id eologa al m ism o tiem p o.
. gru pa las categoras conservadora
dem crata cristian a
liberal, por u n lado,
y socialdem crata
socialista
com un ista, por el otro. ay diferen cias sign ificativas en la m u estra de abril de de la sociedad espa ola en tre ideologas clsicas de derech as e izuierdason los jven es m s de izu ierda
on las m u jeres m s proclives a las ideologas de derech as
ara facilitar
el ejercicio, cu en ta slo con la prim era opcin de respu esta de la
.del
barm etro de abril de , cis
.
. ru eba la h iptesis de u e todas las valoracion es de los lderes n acion alistas
u igcercs, u in tan a, ivero y ar osson igu ales.

8
Co n fe cci n y a n lisis d e t a b la s co n St a t a 1
Pr ob a b lem en te, el m tod o esta d stico m s a m p lia m en te u tiliza d o (a l m en os en sociologa ) sea la ta b la d e con tin gen cia . Un a ta b la qu e m u estr a
u n cr u ce en tr e d os o m s va r ia b les es u n a m a n er a f cil e in tu itiva d e
estu d ia r la r ela cin en tr e d os o m s va r ia b les. Per o esta fa cilid a d d e u so
e in ter p r eta cin , p ese a ser u n a d e la s p r in cip a les ven ta
a s d el a n lisis
d e ta b la s d e con tin gen cia , ta m b in su p on e en m u ca s oca sion es u n p r ob lem a . m en u d o el a n lisis esta d stico con ta b la s se r ea liza d e m a n er a
m en os cu id a d osa slid a qu e con otr os m tod os, sin p r esta r a ten cin
a p r ob lem a s d e sign ifica cin esta d stica o a in ter r ela cion es com p le
as
en tr e va r ia b les. in em b a r go, eisten er r a m ien ta s esta d stica s qu e p erm iten a cer u n a n lisis cu id a d oso d e ta b la s d e con tin gen cia , esta d stica m en te r igu r oso. n este ca p tu lo se a b or d a n en p r im er lu ga r la s ta b la s d e
con tin gen cia p r op ia m en te d ica ssegu id a m en te, se tr a ta n otr os tip os d e
ta b la s qu e p er m iten com p a r a r esta d sticos d istin tos d e los p or cen ta
es,
cu o tr a ta m ien to in fer en cia l se vio con m s p r ofu n d id a d en el ca p tu lo
a n ter ior, se fin a liza con la s ta b la s p r op ia s d e va r ia b les con va lor es qu e
n o son m u tu a m en te eclu en tes.
l a n lisis d e ta bla s d e con tin gen cia est in dica do p a ra el estu dio de
la r ela cin o a sociacin en tre var ia bles cu a lita tiva s (n om in a les u or din a les), a u n qu e el m odelo b sico es p a ra dos va r ia bles, se pu ede eten d er
f cilm en te a m s d e d os. n cu a lqu ier ca so, en el a n lisis d e ta b la s de
con tin gen cia se d eben esp ecifica r al m en os d os va ria b les en or den in difer en te, si b ien en m u ca s oca sion es en el ter ren o terico pu ede pen sa rse
qu e estas d os p u eden ten er u n esta tu s d ifer en teu n a va ria b le depen dien te
(cu o com porta m ien to se in ten ta eplicar ), u n a o m s va ria b les in d epen d ien tes (qu e se com p roba r si cor rela cion a n en qu m edid a con el
com por ta m ien to d e la var ia ble depen dien te). s, por ta n to, u n a tcn ica

Para am pliar con ocim ien tos de este tem a se recom ien da el libro bsico de n cez arrin () o los de uiz aa (). n in gls, en tre otros, son recom en dables
veritt (), n dersen () com o in troductorios
, entre los avan zados, gresti ()
aal ().

08_Confeccion y anlisis.indd 237

06/06/12 09:34

qu e sirve pa ra estu d ia r, en p rin cip io, la a socia cin en tr e va riab les


, por
eten sin , el efecto (a tr avs d e la d ep en d en cia en tre va lor es) d e u n a o
va r ia s va riab les sobr e otra .
lo la r go d e la p r im er a p a r te d e este ca p tu lo se u tiliza r u n m ism o
e
em p lo p a r a ilu str a r la s eplica cion es. on d a tos d e la en cu esta p ostelector a l d el
de , se ea m in a el efecto d e los in gr esos fa m ilia res sobr e el voto. a id ea d e p a r tida es qu e la situ a cin econ m ica d el
in divid u o p u ed e a fecta r a su s p r efer en cia s p oltica s. isten n u m erosos
estu d ios sociolgicos, ta n to en sp a a com o en otr os p a ses, qu e estu d ia n
ta l r ela cin en tr e situ a cin econ m ica voto . l ilo d e este e
em p lo, se
ver n la s in str u ccion es n ecesa r ia s p a r a a cer a n lisis d e ta b la s de con tin gen cia con ta ta
, a l m ism o tiem po, se ofr ecer n la s frm u la s la s
in terp r eta cion es d e los esta dsticos qu e se r equ ier en pa r a u n cor r ecto u so
de esta tcn ica .

8.1.

Ta b la s d e co n t in ge n cia d e d o s va r ia b le s

a s va r ia b les q u e se va n a em p lea r p a r a el a n lisis son el r ecu er d o


d e vo to en la s ltim a s eleccio n es los in gr eso s fa m ilia r es m en su a les
d ecla r a d os p o r el en tr evista d o en la en cu esta p ostelecto r a l d el
d e
. s m u co n ven ien te r ea liza r co m o p a so p r evio u n a ta b la d e fr ecu en cia s sim p le p a r a ca d a u n a d e la s va r ia b les p o r sep a r a d o. llo se
logr a d e d o s for m a sb ien r ep itien d o en d istin ta s ln ea s la in str u cci n
ta bu la te ta n ta s veces co m o va r ia b les se d eseen ta b u la r, b ien escr ib ien d o
la o r d en ta b1 a co n tin u a ci n esp ecifica n d o ta n ta s co m o va r ia b les se
d esee, p u esto q u e, si se o p ta p o r esta fo r m a , el p r o gr a m a en tien d e q u e
s lo se r equ ier en ta b la s u n id im en sion a les, p or m u ca s va r ia b les qu e en
ella se listen .
tabrvoto in gresos

stu dio
. u estra de .casos, representativa de la poblacin espa ola de
am bos seos, de m s a os, realizada m edian te entrevista person al en m arzo de .

ase, por e
em plo, on zlez ()tam bin Param io ().

n a n n o era el eu ro la u n idad de cam bio m on etario en spa a. as etiqu etas de


la variable ingresos estn epresadas en m illares de pesetas. Para obtener su correspon diente
aproim ado en eu ros, basta con m u ltiplicar por . s (m iles de pesetas) equ ivale a e
a .e.

08_Confeccion y anlisis.indd 238

06/06/12 09:34

ANLIS IS DE DATOS CON S TATA

ILUSTR ACI 8.1 .

ist r ib cio n e s n iva r ia d a s d e fr e ce n c ia s

- > t abul at i on of r v ot o
Rec uer do de |
v ot o |
r ecodi f i c ado |
Fr eq.
Per c ent
Cum.
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - PP |
1, 773
33. 57
33. 57
PSOE |
1, 054
19. 96
53. 53
IU |
226
4. 28
57. 81
Naci onal i st a |
350
6. 63
64. 44
Ot r os |
95
1. 80
66. 24
Bl anc o |
108
2. 05
68. 28
No v ot o |
890
16. 85
85. 14
NC |
785
14. 86
100. 00
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - Tot al |
5, 281
100. 00
- > t abul at i on of i ngr esos
I ngr esos |
f ami l i ar es |
mensual es |
ent r ev i s t ado |
Fr eq.
Per cent
Cum.
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - <150 |
1, 846
34. 94
34. 94
150- 300 |
1, 449
27. 43
62. 37
>300 |
452
8. 56
70. 93
Ns / Nc |
1, 536
29. 07
100. 00
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - Tot al |
5, 283
100. 00

om o se ap recia en la ilu stracin ., la pr im era var iable, rvoto, es u n a


variab le n om in al con .casos, u n , de los cu ales o sab en
o
con testan . In gresos, por su par te, es ord in al con tr es categor as u n porcen ta
e d e o sabe
o con testa a n m aor, de m s de u n . l pr im er
p rob lem a qu e se plan tea es qu acer con los o sabe
o con testa. o se
su elen in clu ir en el an lisis a m en os qu e se qu ieran estu d iar esp ecficam en te, pu esto qu e, au n qu e apor tan in for m acin , n o es d el tipo qu e in ter esa n orm alm en te en fu n cin de las ip tesis, lo qu e tam bin es el pr esen te caso. l
s
c a la pr egu n ta de in gr esos in d ica sim p lem en te qu e n o se qu ieren d eclarar los in gr esos, m ien tras qu e el s
c a la p regu n ta de voto p u ed e in d icar o b ien lo m ism o o falta de com peten cia (percib ida o r eal) para ablar
d e tem as polticos. o se in clu ir en con secu en cia el s
c en el an lisis,
au n qu e ap ar ecer en las pr im er as tab las par a ep lor ar qu tipo de sesgos
tien en los s
c con respecto a las var iables estu diad as (p or e
em p lo, si la
n o r esp u esta se da m s en u n os in gresos determ in ad os).
l com an d o d e tata para tablas d e con tin gen cia es tabu late. u sin tais gen eral es

s el m ism o com an do qu e para tablas de frecu en cias. i se escribe tabu late el n om bre
de u na variable, tata en ten der que se desea m ostrar su tabla de frecu en cias as lo ar. i
se epresa la in struccin tabu late segu ida por los n om bres de dos variables, tata m ostrar u na
tabla de con tin gen cia.

08_Confeccion y anlisis.indd 239

06/06/12 09:34

t a b la t e variable va ria ble


if epresin
in ran go
a
f
ie igt varp eso

, opcion es

r as la p alabr a tabu late, en variab lese a d e escr ib ir el n om br e d e


la variab le depen dien te (la qu e se trata de eplicar), qu e aparecer en las
filas d e la tablam ien tr as qu e en var iablea de epr esar se el n om br e de
la var iable in d ep en d ien te (la qu e se su pon e qu e eplica el com p ortam ien to
d e la an ter ior), qu e aparecer en las colu m n as. ptativam en te, la or den de
tab u lacin se pu ed e acom pa ar con la ep resin de la clu su la if, qu e p u ed e ser n u m rica o lgicael ran go tr as in , qu e se r efiere a u n con
u n to d e
casos con tigu os defin idos m ed ian te el caso in ferior el su perior sep ar ados
p or u n a barr a, se p erm ite la pon d er acin an altica, fr ecu en cial (fweigh t),
an altica (aweight) o discr ecion al (iweigh t), qu e a de ir acom p a ad a p or
la var iable p or la qu e se p on dera p reced ida por el sign o igu al. in alm en te,
tras u n a com a, pu eden in clu irse las opcion es qu e se irn eplican do en las
p rim as p gin as.
n el e
em plo actu al, la var iable dep en d ien te es rvoto la in depen dien te
in gresos, por lo qu e para gen erar u n a tabla d e con tin gen cia sen cilla slo a
qu e escribir
tabu la te rvoto in gresos

p ar a qu e ap arezca la sigu ien te tabla


ILUSTR ACI 8 .. is t r ib c i n b iva r ia d a d e fr e ce n cia s
Rec uer do de |
vot o | I ngr es os f ami l i ar es mens ual es ent r ev i s t ado
r ec odi f i cado |
<150
150- 300
>300
Ns / Nc |
Tot al
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - +- - - - - - - - - PP |
613
552
183
425 |
1, 773
PSOE |
477
293
79
205 |
1, 054
IU |
69
90
26
41 |
226
Nac i onal i s t a |
86
108
37
119 |
350
Ot r os |
16
30
23
26 |
95
Bl anc o |
31
30
16
31 |
108
No vot o |
286
230
61
313 |
890
NC |
268
114
27
376 |
785
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - +- - - - - - - - - Tot al |
1, 846
1, 447
452
1, 536 |
5, 281

el m ism o m odo que se perm ita la in struccin tab1 listavar, tam bin eiste tab2 listavar. sta ace cru zar todas las variables qu e se in clu an en la lista de variables. i se escribe
con la opcin firston ly, slo se cru za la prim era con todas las dem s.

08_Confeccion y anlisis.indd 240

06/06/12 09:34

ANLIS IS DE DATOS CON S TATA

p a r ece en la ilu str a cin .u n a ta b la co n la s fr ecu en cia s cr u za d a s


d e r ecu er d o d e voto e in gr esos fa m ilia r es. u n qu e esta es a p r o p ia m en te u n a ta b la d e con tin gen cia , lo s d a tos m ostr a d os r esu lta n d ifciles d e
in ter p r eta r. d em s d e con ocer la s fr ecu en cia s, es p r eciso con ta r co n
los p or cen ta
es p a r a estu d ia r a d ecu a d a m en te la r ela cin en tr e a m b a s
va r ia b les.
Pero cm o se calcu lan los p orcen ta
esatr es m an er as d e acerlo. i
se repr esen tan las frecu en cias d e u n a tab la d e con tin gen cia, del m odo en el
qu e ap arecen en el cu adr o .
CUAR 8.1 .

o t a c i n d e la s t a b la s d e co n t in ge n cia
a r ia b le in d e e n d ie n t e

a r ia b le
d e e n d ie n t e

c o ln a 1 c o ln a co ln a

To t a l

ila

f.

ila

f.

otal

f.

f.

f.

n f..

as tr es m od alidades de por cen ta


es se p u ed en calcu lar del sigu ien te
m od o
. Porcen taje de colu m n a: el p orcen ta
e qu e r ep resen ta la fr ecu en cia d e
u n a celda sob re el total de la colu m n a

(.)
Par a qu e los m u estr e tata se esp ecifica la op cin col tras la com a
tab u late rvoto in gresos, col

con lo qu e apar ecen los datos d e la ilu stracin ..

08_Confeccion y anlisis.indd 241

06/06/12 09:34

ILUSTR ACI 8.. Ta b la d e c o n t in ge n c ia c o n fr e c e n cia s


y o r ce n t a
e s ve r t ica le s
+- - - - - - - - - - - - - - - - - - - +
| Key
|
| -------------------|
|
f r equenc y
|
| c ol umn per c ent age |
+- - - - - - - - - - - - - - - - - - - +
Rec uer do de |
vot o | I ngr es os f ami l i ar es mensual es ent r ev i st ado
r ec odi f i cado |
<150
150- 300
>300
Ns / Nc |
Tot al
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - +- - - - - - - - - PP |
613
552
183
425 |
1, 773
|
33. 21
38. 15
40. 49
27. 67 |
33. 57
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - +- - - - - - - - - PSOE |
477
293
79
205 |
1, 054
|
25. 84
20. 25
17. 48
13. 35 |
19. 96
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - +- - - - - - - - - IU |
69
90
26
41 |
226
|
3. 74
6. 22
5. 75
2. 67 |
4. 28
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - +- - - - - - - - - Nac i onal i s t a |
86
108
37
119 |
350
|
4. 66
7. 46
8. 19
7. 75 |
6. 63
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - +- - - - - - - - - Ot r os |
16
30
23
26 |
95
|
0. 87
2. 07
5. 09
1. 69 |
1. 80
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - +- - - - - - - - - Bl anc o |
31
30
16
31 |
108
|
1. 68
2. 07
3. 54
2. 02 |
2. 05
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - +- - - - - - - - - No vot o |
286
230
61
313 |
890
|
15. 49
15. 89
13. 50
20. 38 |
16. 85
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - +- - - - - - - - - NC |
268
114
27
376 |
785
|
14. 52
7. 88
5. 97
24. 48 |
14. 86
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - +- - - - - - - - - Tot al |
1, 846
1, 447
452
1, 536 |
5, 281
|
100. 00
100. 00
100. 00
100. 00 |
100. 00

om o p u ed e ap reciarse, esta tabla epr esa n o slo la frecu en cia,


sin o tam b in el por cen ta
e d e casos qu e aen cad a casilla sobr e el
total de cad a categora de la variab le in gresos. s, el , de los
en trevistados qu e ten an in gr esos in fer ior es a .p tas. votar on
al PPel ,, al Pel ,, a
U, etc.
. Porcen taje de filas: el p orcen ta
e qu e rep resen ta la frecu en cia de cada
casilla sob re el total de la fila

(.)
n tata se obtien e m edian te la opcin row d e la in stru ccin tabu late. om o tam bin pu ede acerse con los porcen ta
es verticales,
si se d esea qu e n o aparezcan las frecu en cias absolu tas de las casillas,
es preciso a adir la op cin n ofreq, com o se p on e de m an ifiesto en el
sigu ien te e
em p lo.

08_Confeccion y anlisis.indd 242

06/06/12 09:34

ANLIS IS DE DATOS CON S TATA

tab u late rvoto in gresos, ro n ofreq

e este m od o, se obtien e u n a tab la m s com pacta con lectu ra


m s fcil d e los porcen ta
es orizon tales.
ILUSTR ACI 8 .. Ta b la d e c o n t in ge n c ia c o n o r ce n t a
e s o r io n t a le s
Recuer do de |
vot o | I ngr esos f ami l i ar es mens ual es ent r ev i s t ado
r ecodi f i cado |
<150
150- 300
>300
Ns / Nc |
Tot al
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - +- - - - - - - - - PP |
34. 57
31. 13
10. 32
23. 97 |
100. 00
PSOE |
45. 26
27. 80
7. 50
19. 45 |
100. 00
IU |
30. 53
39. 82
11. 50
18. 14 |
100. 00
Naci onal i s t a |
24. 57
30. 86
10. 57
34. 00 |
100. 00
Ot r os |
16. 84
31. 58
24. 21
27. 37 |
100. 00
Bl anc o |
28. 70
27. 78
14. 81
28. 70 |
100. 00
No vot o |
32. 13
25. 84
6. 85
35. 17 |
100. 00
NC |
34. 14
14. 52
3. 44
47. 90 |
100. 00
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - +- - - - - - - - - Tot al |
34. 96
27. 40
8. 56
29. 09 |
100. 00

n la ilu stracin .se lee qu e el , de los qu e votar on al PP


tien en in gr esos in fer iores a .p tas., el , tien en in gr esos
de .a ., etc.
. Porcen taje totalel por cen ta
e d e la fr ecu en cia d e cada casilla sobre
el total d e los casos de la tabla

(.)
u ob ten cin es an loga a las an teriores con la opcin cell. Por ello en el
e
em plo actu al la in str u ccin deber a ser
tab u late rvoto in gresos, cell n ofreq

p ara obten er el r esu ltad o d e la ilu stracin ..

08_Confeccion y anlisis.indd 243

06/06/12 09:34

ILUSTR ACI 8 .. Ta b la d e c o n t in ge n c ia c o n o r ce n t a
e s t o t a le s
Rec uer do de |
vot o | I ngr es os f ami l i ar es mens ual es ent r evi s t ado
r ec odi f i cado |
<150
150- 300
>300
Ns / Nc |
Tot al
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - +- - - - - - - - - PP |
11. 61
10. 45
3. 47
8. 05 |
33. 57
PSOE |
9. 03
5. 55
1. 50
3. 88 |
19. 96
IU |
1. 31
1. 70
0. 49
0. 78 |
4. 28
Nac i onal i s t a |
1. 63
2. 05
0. 70
2. 25 |
6. 63
Ot r os |
0. 30
0. 57
0. 44
0. 49 |
1. 80
Bl anc o |
0. 59
0. 57
0. 30
0. 59 |
2. 05
No vot o |
5. 42
4. 36
1. 16
5. 93 |
16. 85
NC |
5. 07
2. 16
0. 51
7. 12 |
14. 86
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - +- - - - - - - - - Tot al |
34. 96
27. 40
8. 56
29. 09 |
100. 00

a lectu ra en este caso es qu e el , d e tod os los en cu estad os son


votan tes d el PP con in gr esos in fer ior es a .ptas.
as tres for m as de calcu lar los p orcen ta
es epr esan los m ism os datos, pero cada u n a acen t a u n distin to asp ecto d el cru ce u n a m an era de
com par ar las distribu cion es. l por cen ta
e de colu m n as perm ite com p ar ar
el com p or tam ien to d e la var iable d epen dien te en las diferen tes categoras
d e la in d epen dien te. l de fila m u estr a la distribu cin d e frecu en cias de la
d ep en d ien te p ara las categor as d e la in depen dien te el p or cen ta
e sob re
el total perm ite estu d iar la distr ibu cin con
u n ta d e am bas var iables. l
p or cen ta
e m s u tilizado es el d e colu m n a, pu es p er m ite ver el efecto de la
variab le in d ep en dien te sobr e el com p or tam ien to de la depen dien te. i los
p or cen ta
es de colu m n a son m u distin tos en las d istin tas categor as d e la
variab le in dep en d ien te, ab r in d icios de asociacin estadstica en tr e las
variab les.
e este m odo, en este e
em p lo, se d etecta en la ilu stracin .cm o los
in gr esos par ecen ten er in flu en cia sob re el voto. os qu e dicen ten er m s in gresos votan m s al PP qu e los qu e tien en in gresos m edios b a
oslos qu e
tien en in gr esos in ferior es votan m s al Pqu e los de in gr esos m ed ios
altos, los qu e d eclaran in gr esos m ed ios votan m s a
U qu e los qu e tien en
in gr esos altos b a
os. on r esp ecto a los o sabe
o con testa, au m en tan
con form e ba
a el n ivel de in gr esos. s all de con statar este eco, n o in ter esa in clu irlos en el an lisis, p or lo qu e es con ven ien te gen er ar u n a n u eva
tab la qu e n o in clu a los o sabe
o con testa
tabu la te rvoto in gresos if rvoto
in gresos
, col n ofreq

a ep resin if qu ita los casos con o sabe


o con testa d e am b as var iables. or a se ve m s claram en te la r elacin en tre am b as var iab lesel voto al PP a los n acion alistas au m en ta ligeram en te con el n ivel d e
in gr esos, el voto al P la absten cin au m en tan seg n d ism in u en los

08_Confeccion y anlisis.indd 244

06/06/12 09:34

ANLIS IS DE DATOS CON S TATA

in gr esos, el voto a
U es algo m aor en los in gr esos m ed ios. Par ece, p or
tan to, qu e s eiste r elacin en tr e situ acin econ m ica voto.
ILUSTR ACI 8.. Ta b la d e fr e c e n cia s co n o r c e n t a
e s ve r t ic a le s
sin va lo r e s e r d id o s
Recuer do de |
I ngr esos f ami l i ar es mens ual es
v ot o |
ent r evi s t ado
r ecodi f i c ado |
<150
150- 300
>300 |
Tot al
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - +- - - - - - - - - PP |
38. 85
41. 41
43. 06 |
40. 41
PSOE |
30. 23
21. 98
18. 59 |
25. 45
IU |
4. 37
6. 75
6. 12 |
5. 55
Naci onal i st a |
5. 45
8. 10
8. 71 |
6. 92
Ot r os |
1. 01
2. 25
5. 41 |
2. 07
Bl anc o |
1. 96
2. 25
3. 76 |
2. 31
No v ot o |
18. 12
17. 25
14. 35 |
17. 30
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - +- - - - - - - - - Tot al |
100. 00
100. 00
100. 00 |
100. 00

dem s de com par ar los d istin tos por cen ta


es en tre s par a ver el efecto
d e la var iable in d ep en d ien te sob re la dep en d ien te, es in teresan te com parar
los p orcen ta
es de colu m n a de las categoras con el p orcen ta
e de colu m n a
total, qu e se llam a m argin al (el qu e apar ece en la ltim a colu m n a de la
d ereca). i n o u bier a r elacin algu n a en tr e las var iables, los por cen ta
es
d e colu m n a de las categor as d eberan ser igu ales o m u p arecidos a los
m ar gin ales de colu m n a. n este caso, p u ed e com pr obarse qu e n o es aslos
p orcen ta
es de las casillas se d istan cian sen sib lem en te de su s m ar gin ales.
a com p aracin en tre los p orcen ta
es de colu m n a los m argin ales sirve
com o u n a prim era aproim acin al con cep to de in depen den cia en tablas d e
con tin gen cia. u en a parte d e los estad sticos d e sign ificacin asociacin
estadstica se basan en la com p aracin en tre las frecu en cias observadas de las
casillas las frecu en cias eseradas en caso de in dep en d en cia, esto es, si n o
u biera relacin en tre las variables (la variab le dep en d ien te sera au n qu e
p arezca u n
u ego de palabras in depen dien te d e la variab le in d ep en dien te).
m o se con str u en estas frecu en cias eseradasPar a calcu lar cu l ser a la frecu en cia de cada casilla si n o u bier a r elacin en tre las variab les,
se m u ltiplica el n m er o de casos m ar gin al de cad a fila por el n m er o de
casos m ar gin al d e cad a colu m n a se divid e p or el n m ero de casos total de
la tabla. Utilizan do la n om en clatu r a de la tabla , la frecu en cia esp erada se
calcu la op er ativam en te d el sigu ien te m odo

(.)
n la ilu str acin ., la fr ecu en cia esper ad a de la pr im era casilla -
(ot PP e in gresos m en or es a .ptas.) sera

08_Confeccion y anlisis.indd 245

06/06/12 09:34

(.)
s decir, si n o u b iera r elacin en tr e voto e in gr esos, el n m er o d e person as qu e vot al PP con in gresos in feriores a .ptas. d ebera ser
,. om o el valor obser vad o es d istin to (), ain dicios de cier ta r elacin en tre las var iables. a d iferen cia en tre el valor ob ser vad o el esperado
se llam a residu o, qu e m an ifiesta d ep en d en cia en tr e p ares de valor es d e las
variab les resp ectivas, siem p re cu an do su valor d ifier a de . l r esidu o de
la casilla -sera-,-,, qu e in d ica qu e la frecu en cia d e la casilla es m en or en ,casos a la esperab le en caso d e in depen den cia.
a sigu ien te in str u ccin con str u e u n a tabla de con tin gen cia (ilu str acin .) con las fr ecu en cias obser vad as esper ad as
tabu la te rvoto in gresos if rvoto
in gresos
, epected
ILUSTR ACI 8 .. Ta b la d e c o n t in ge n c ia c o n fr e c e n cia s o b se r va d a s
y e s e r a d a s
+- - - - - - - - - - - - - - - - - - - - +
| Key
|
| --------------------|
|
f r equenc y
|
| ex pec t ed f r equenc y |
+- - - - - - - - - - - - - - - - - - - - +
|
I ngr esos f ami l i ar es mensual es
|
ent r ev i st ado
RECODE of p34 |
<150
150- 300
>300 |
Tot al
- - - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - +- - - - - - - - - PP |
613
552
183 |
1, 348
|
637. 6
538. 6
171. 7 |
1, 348. 0
- - - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - +- - - - - - - - - PSOE |
477
293
79 |
849
|
401. 6
339. 2
108. 2 |
849. 0
- - - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - +- - - - - - - - - IU |
69
90
26 |
185
|
87. 5
73. 9
23. 6 |
185. 0
- - - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - +- - - - - - - - - Naci onal i st as |
86
108
37 |
231
|
109. 3
92. 3
29. 4 |
231. 0
- - - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - +- - - - - - - - - Ot r os |
16
30
23 |
69
|
32. 6
27. 6
8. 8 |
69. 0
- - - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - +- - - - - - - - - Bl anc o |
31
30
16 |
77
|
36. 4
30. 8
9. 8 |
77. 0
- - - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - +- - - - - - - - - No vot |
286
230
61 |
577
|
272. 9
230. 6
73. 5 |
577. 0
- - - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - +- - - - - - - - - Tot al |
1, 578
1, 333
425 |
3, 336
|
1, 578. 0
1, 333. 0
425. 0 |
3, 336. 0

om o p u ed e ap reciarse, el segu n d o valor de cada casilla es el valor esp er ad o (el d e la p rim er a casilla es el m ism o qu e se a calcu lado m an u alm en te
m s arr iba). a d iferen cia en tr e la frecu en cia observada la esp er ada in dica, com o a se a se alad o, la relacin en tr e las var iables. s, el n m ero

08_Confeccion y anlisis.indd 246

06/06/12 09:34

ANLIS IS DE DATOS CON S TATA

d e n o votan tes de in gr esos ba


os es su per ior al esp er able si n o u b iera r elacin en tr e las variab les, el de in gr esos m edios es igu al al esper ad o el de
in gr esos altos, in fer ior al esp er ado, su gir ien do u n a r elacin lin eal en tre las
variab les (a m s in gr esos, m en or ab sten cin ).
l com ando tabu late de tata n o perm ite obtener los residuos. Para traba
ar
con ellos, a de instalarse un m dulo .ado de tata creado por ico().
a de instalarse con conein a
nternet, m ediante las siguientes instruccion es
n et from ttp

.stata.com
u sers
n
c
n et in stall tabci

e este m od o, se in stala el pr ogr am a tabchi, especialm en te d ise ad o


p ara tr ab a
ar con resid u os d e tab las de con tin gen cia.
on el u so d e opcion es, tabchi p er m ite an alizar los r esidu os. a op cin
raw m u estr a el r esidu o cr u do (r ij fr ecu en cia observada m en os fr ecu en cia
esp er ada)earson (r s ij) m u estra los resid u os de Pearson , a veces llam ad os
r esidu os estan dar izad os (r esidu o n eto divid id o p or la r az cu adr ada de la
frecu en cia esper ad a)con t m u estra la con tr ib u cin de cada casilla al c de la
tabla (ob ser vad a m en os esp er ada al cu adr ado divid id o por esp er ada, es decir, el r esidu o d e Pearson al cu adr ad o), adj m u estra los residu os a
u stad os
(r esidu os de Pearson divid id os p or su desviacin tpica).

(.)
ase aora u n a tabla con estas opcion es, a adin dole tam bin n oo n oe,
para elim in ar las frecu en cias observadas esperadas qu e a se an obten ido en
la ilu stracin .. a in stru ccin se com pon dra de las sigu ien tes opcion es
tab ci rvoto in gresos if rvoto
in gresos
, n oo n oe ra p earson ad
u st

n cad a casilla d e la ilu str acin .apar ecen tod os los estad sticos ped id os. l pr im ero es el r esidu o, qu e sim plem en te epr esa la d istan cia en tr e
el valor observado el esperado de la casilla. l segu n do es el r esidu o d e
Pear son , qu e n o tien e m u co in ters en este caso. , por ltim o, ap arece el

08_Confeccion y anlisis.indd 247

06/06/12 09:34

r esidu o a
u stado, qu e es el m s in ter esan te p ar a la in terp retacin . st estan d ar izado p ara poder estu d iar la sign ificacin estad stica de la frecu en cia
d e cad a casilla. l valor qu e tom a sigu e u n a d istr ibu cin n or m al con m edia
desviacin tpica (
,
), por lo qu e p u ede u tilizarse para com pr obar
en la tab la de pr ob abilid ades d e la n orm al si el valor d el resid u o es sign ificativo o se p u ed e d eber a err ores d e m u estr eo. n gen er al, si su pera ,
en tr m in os absolu tos (n egativo o positivo), p u ed e d ecir se qu e la d ifer en cia
en tr e el valor ob ser vad o el esp er ado en caso d e n o ab er relacin en tre las
variab les n o es d eb ido a err ores de m u estreo, con u n d e con fian za. n
este caso, las casillas de voto al PP n o son sign ificativas (n o llegan al valor
crtico de ,), p or lo qu e las d ifer en cias obser vad as en voto al PP p or in gresos p u ed en ser d eb id as a err or es de m u estreo n o deben ser tom ad as en
con sideracin . as difer en cias en voto al P, en cam b io, s qu e son sign ificativas, as com o las de
U n acion alistas p ara in gresos m edios b a
os.
ILUSTR ACI 8.8 . Ta b la d e c o n t in ge n c ia c o n r e sid o s b r t o s
e st a n d a r ia d o s y a
st a d o s
r aw r es i dual
Pear s on r es i dual
adj us t ed r es i dual
------------------------------------------------------------------------------Rec uer do de |
v ot o
|
I ngr es os f ami l i ar es mens ual es ent r ev i s t ado
r ec odi f i cado |
<150
150- 300
>300
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - PP |
- 24. 633
13. 366
11. 267
|
- 0. 976
0. 576
0. 860
|
- 1. 741
0. 963
1. 192
|
PSOE |
75. 405
- 46. 244
- 29. 161
|
3. 763
- 2. 511
- 2. 804
|
6. 003
- 3. 753
- 3. 476
|
IU |
- 18. 509
16. 078
2. 431
|
- 1. 979
1. 870
0. 501
|
- 2. 804
2. 483
0. 552
|
Nac i onal i s t a |
- 23. 268
15. 697
7. 571
|
- 2. 226
1. 634
1. 396
|
- 3. 178
2. 186
1. 549
|
Ot r os |
- 16. 638
2. 429
14. 210
|
- 2. 912
0. 463
4. 793
|
- 4. 054
0. 603
5. 184
|
Bl anc o |
- 5. 423
- 0. 768
6. 190
|
- 0. 899
- 0. 138
1. 976
|
- 1. 252
- 0. 181
2. 141
|
No vot o |
13. 067
- 0. 558
- 12. 509
|
0. 791
- 0. 037
- 1. 459
|
1. 198
- 0. 052
- 1. 717
------------------------------------------------------------------------------Pear s on c hi 2( 12) =
l i k el i hood- r at i o c hi 2( 12) =

08_Confeccion y anlisis.indd 248

86. 7344
81. 5902

Pr = 0. 000
Pr = 0. 000

06/06/12 09:34

ANLIS IS DE DATOS CON S TATA

l an lisis d e los r esidu os, por tan to, su gier e qu e el voto al P, a


U
a los partidos n acion alistas se vio afectado p or el n ivel de in gresos, m ien tr as
qu e el voto al PP, la absten cin el voto en blan co n o p resen taron pau tas
esp eciales seg n in gr esos d e m od o sign ificativo.
dem s del an lisis d e la sign ificacin de cad a casilla, p u ed e in teresar
com p robar si la relacin global en tre voto e in gr esos es sign ificativa. Par a
ello se u tiliza el estad stico c , qu e se calcu la a p artir d e los resid u os. u
frm u la es

(.)
l va lor d e c ser cu a n d o n o a a r ela cin a lgu n a en tr e la s d os
va r ia b les, a u m en ta r cu a n to m a or sea la r ela cin . o ob sta n te, n o se
su ele u tiliza r com o in d ica d or d e la fu er za d e la a socia cin , p or qu e n o
va r a en tr e (m s a d ela n te se estu d ia n esta d sticos qu e s lo a cen
son p or ello m s a d ecu a d os p a r a estu d ia r la fu er za d e la a socia cin ).
e m a or in ter s qu e el va lor d el c es su sign ifica cin . l va lor d e c d e
u n a ta b la tien e u n a d istr ib u cin d e p r ob a b ilid a d con ocid a en fu n cin
d e su s gr a d os d e lib er ta d , d e m od o qu e con ocien d o a m b os va lor es (c
gr a d os d e lib er ta d ) p u ed e com p r ob a r se la sign ifica cin esta d stica d e la
d ifer en cia glob a l en tr e fr ecu en cia s ob ser va d a s esp er a d a s en u n a ta b la
d e con tin gen cia , p or ta n to com p r ob a r si efectiva m en te eiste r ela cin
en tr e la s va r ia b les.
os gr a dos de lib erta d se ca lcu la n sigu ien d o la frm u la gl (n m ero
de fila s - )
(n m ero de colu m n as - ). n el e
em plo a ctu a lgl (-)
(-) . l va lor d e c , qu e a pa r ece deba
o d e la tab la gen er ad a con la
ord en ta bch i, es de ,. Un c de ,con gra d os d e lib er ta d tien e
u n a sign ifica cin esta dstica a ltsim a, con p rob ab ilida d d e qu e se d eb a a
err ores d e m u estr eo in fer ior a ,(este va lor a pa r ece en la p en ltim a
fila d e la ilu stra cin ., a la der eca del va lor de c ). e pu ed e, por ta n to,
d esca rtar la iptesis n u la d e qu e la s diferen cias ob serva da s se deba n a
err ores de m u estreo. a r ela cin en tr e voto e in gr esos es estad stica m en te
sign ificativa.
eba
o de la p ru eba d e c a pa rece la r azn de ver osim ilitu d (lielihood
ratio c ), qu e es u n a cor reccin d el c qu e se u sa pa ra m odelos log-lin ea les.
n m u estra s pequ e as difiere del valor de c, per o seg n a u m en ta el tam a o d e la m u estra a m b os valores tien den a con ver ger. u frm u la es la
sigu ien te

(.)

08_Confeccion y anlisis.indd 249

06/06/12 09:34

a p r u eb a d e c la d e r a z n d e ver osim ilitu d p er m iten a segu r a r


con u n a lto n ivel d e con fia n za qu e la r ela cin qu e se ob ser va en la s
ta b la s en tr e voto e in gr esos es esta d stica m en te sign ifica tiva . Pa r a qu e
ta ta ca lcu le a m b os esta d sticos, a b r qu e esp ecifica r en la in str u ccin
ta bu la te la s op cion es ch i2 lrch i2. Per o el qu e u n a r ela cin sea esta d stica m en te sign ifica tiva n o im p lica qu e sea im p or ta n te, sim p lem en te qu e
n o se d eb e a er r or es d e m u estr eo. Pa r a estu d ia r la fu er za d e la r ela cin
d eb e r ecu r r ir se a otr os esta d sticoslos d e a socia cin . Pa r a ello, p u ed e
ta m b in u tiliza r se la in str u ccin ta bu la te d e ta ta , qu e in cor p or a tr es
esta d sticos d e a socia cin la d e r a m er, el coeficien te g d e oo d m a n
r u sa ll, la t b d e en d a ll. Pa r a qu e ta ta m u estr e estos esta d sticos,
a n d e in tr od u cir se, r esp ectiva m en te, la s op cio n es (en m a scu la ),
ga m m a ta u b. a m b in p u ed en p ed ir se tod os (los d e sign ifica cin los
d e a socia cin ) m ed ia n te la op cin a ll tr a s la a b itu a l in str u ccin (ilu str a ci n .)
tabu la te rvoto in gresos if rvoto
in gresos
, n ofreq ci

Por otro lad o, al in clu ir la op cin n ofreq, n o se m u estra la tab la de con tin gen cia, slo aparecen los estad sticos epr esam en te solicitados, com o se
p u ed e com pr obar en la ilu str acin ..
ILUSTR ACI 8.. r e b a d e c y d e Cr a e r d e n a t a b la d e c o n t in ge n c ia
Pear s on c hi 2( 12) =
Cr amer ' s V =

86. 7344
0. 1140

Pr = 0. 000

a d e r am er es u n estadstico d e asociacin b asad o en el c, qu e est


especialm en te in d icad o para variab les n om in ales. ara en tr e , sien do
n in gu n a asociacin asociacin perfecta . u frm u la es

(.)
a d e r a m er lo qu e a ce es con ver tir el c en u n in d ica dor d e a socia cin d ivid in d olo p or el va lor m im o qu e p u ed e tom a r (el ta m a o
de la m u estr a m u ltip lica d o p or el m n im o n m er o d e fila s o colu m n a s
m en os ).

Un a asociacin perfecta sign ifica que todos los valores de la tabla se en cu en tran en u n a
diagonalcada valor en la variable in depen dien te se correspon de con u n valor nico en la in depen diente (el resto de las casillas ser ). n este caso, el valor de la variable in depen dien te
determ in a de m anera absolu ta el valor de la variable dependien te.

08_Confeccion y anlisis.indd 250

06/06/12 09:34

ANLIS IS DE DATOS CON S TATA

n este e
em p lo, tom a el valor ,, lo qu e cor r esp on d e a u n n ivel d e
asociacin b astan te b a
o. n la pr ctica, casi cu alqu ier estad stico de asociacin p ara d atos d e en cu esta se p u ed e con siderar b a
o si es m en or qu e
,m od er ado si est en tr e ,,, alto si es su per ior a ,. Por
tan to, seg n la de ram er, la asociacin en tr e n ivel de in gr esos voto es
b a
a, au n qu e sign ificativa.
an to g com o t b son estad sticos de asociacin par a var iables ord in ales.
o slo m iden la fu er za de la asociacin en tre dos var iables, sin o tam bin
su dir eccin . n este caso n o se p u ed en u sar p orqu e voto n o es u n a var iab le ord in al, sin o n om in al. Per o a qu e la asociacin en tr e voto e in gr esos
n o p ar ece ser dem asiad o im por tan te, sera con ven ien te relevan te pon er
com o segu n do e
em p lo la relacin en tre ideologa e in gresos. n este con teto , ideologa es u n a var iable or din al si slo se tom an los valores vlidos
(izqu ierd a-cen tr o-d er eca), por tan to servir de e
em p lo p ara eplicar g
t b . Para obten er la tabla, se in trod u ce la sigu ien te in str u ccin
tab u late ideologia in gresos if ideologia
in gresos
, col all

el p rogram a ofr ece tan to la tabla com o todos los estad sticos im plem en tad os.
ILUSTR ACI 8.1 . st a d st ico s d e la t a b la d e c o n t in ge n c ia
I deol og a |
I ngr es os f ami l i ar es mens ual es
ent r ev i st a |
ent r ev i st ado
do | Menos de
De 150. 00 Ms de 30 |
Tot al
- - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - +- - - - - - - - - I z qui er da |
525
514
178 |
1217
|
38. 29
39. 75
41. 40 |
39. 33
- - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - +- - - - - - - - - Cent r o |
607
574
194 |
1375
|
44. 27
44. 39
45. 12 |
44. 44
- - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - +- - - - - - - - - Der echa |
239
205
58 |
502
|
17. 43
15. 85
13. 49 |
16. 22
- - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - +- - - - - - - - - Tot al |
1371
1293
430 |
3094
|
100. 00
100. 00
100. 00 |
100. 00
Pear son c hi 2( 4)
l i k el i hood- r at i o c hi 2( 4)
Cr amer ' s V
gamma
Kendal l ' s t au- b

=
=
=
=
=

4.
4.
0.
- 0.
- 0.

2793
3678
0263
0462
0284

Pr = 0. 370
Pr = 0. 359
ASE = 0. 027
ASE = 0. 016

n los cuestion arios del


la ideologa su ele m edirse en u n a escala del (etrem a
izqu ierda) al (etrem a dereca) presentada a los in dividu oslos n m eros n o sign ifican sin o
un orden en el supu esto con tin uo izqu ierda
dereca. Para sim plificar en este captulo, se an
agrupado las respu estas -com o izqu ierda, -com o centro -com o dereca. bviam ente, si se pregu n tara por la ideologa con creta qu e se profesa (liberal, con servadora, socialista,
com u n ista, an arquista) ten dra carcter nom inal. e m odo discu tible, a veces tam bin se usa
esta valoracin ideolgica com o variable cu an titativa, calcu lan do m edias desviacion es tpicas.

08_Confeccion y anlisis.indd 251

06/06/12 09:34

a n to g com o t b va r a n en tr e . in d ica qu e n o eiste a socia cin , qu e eiste u n a a socia cin p er fecta p ositiva (cu a n d o a u m en ta el
va lor de u n a va r ia b le ta m b in lo a ce el d e la otr a ), , u n a a socia cin
per fecta n ega tiva (cu a n d o a u m en ta el va lor d e u n a d ism in u e el d e la
otr a ). s cu r ioso cm o en este ca so la a socia cin es m u d ifer en te a la
qu e a p a r eca en tr e in gr esos voto (los por cen ta
es p a r ece qu e in dica n qu e
a m s in gr esos, m s id eologa de izqu ier d a s). e tod os m od os, a qu e
fi
a r se en la p r u eb a d e c , qu e m u estr a qu e la a socia cin qu e a p a r ece en
la ta b la n o es sign ifica tiva . o ob sta n te, se ep lica r a con tin u a cin qu
in d ica cm o se ca lcu la g p a r a en ten d er lo m e
or. l sign o n ega tivo de g
ep r esa qu e la r ela cin es in ver sa cu a n d o se su b e en la esca la d e in gr esos, la id eologa tien d e m s a cia la izqu ier d a (va lor es a ltos en in gr esos
se cor r esp on d en con va lor es b a
os en id eologa , qu e son los d e izqu ier d a ).
e todos m od os, la r ela cin es b a
sim a (,en ga m m a )
, com o a se a
se a la d o, n o sign ifica tiva . l coeficien te t b m u estr a esen cia lm en te lo m ism o, con va lor es m s ba
os, p u es a ce u n a m ed icin m s con ser va d or a d e
la a socia cin , com o se p u ed e d ed u cir a con tin u a cin d e la com pa r a cin
de su s fr m u la s.
m bos coeficien tes ord in ales pr oced en del clcu lo de los pares posibles
d e valores. Par a en ten der esto, se va a su p on er u n a tab la de con tin gen cia
ordin al com o la esqu em atizad a en el cu ad ro .
CUAR 8 .. Cr o is d e t a b la d e co n t in ge n cia o r d in a l
a r ia b le in d e e n d ie n t e

a r ia b le
d e e n d ie n t e
y

od o ca so qu e est en la ca silla (a ) es in fer ior ta n to en la va r ia b le in d ep en d ien te (en la qu e va le ) com o en la d ep en d ien te (en la qu e va le )


a cu a lqu ier otr o ca so situ a d o en la s ca silla s (e), (f), () o (i). este tip o
d e p a r es (en los qu e la r ela cin en tr e a m b os es con cor d a n te en a m b a s
va r ia b les, m en or
o m a or en , ta m b in m en or
o m a or en y) se les
lla m a p a r es con corda n tes. Por el con tr a r io, u n ca so qu e est en la ca silla
(g) ten d r u n va lor in fer ior en la va r ia b le in d ep en d ien te p er o su p er ior en
la d ep en d ien te a cu a lqu ier ca so qu e est en la s ca silla s (b ), (c), (e) o (f).
ico con m s con cr ecin , u n in d ivid u o en (g) p osee u n en la va r ia b le
d ep en d ien te, m ien tr a s qu e la s p er son a s situ a d a s en (b ) (c) tien en en la
va r ia b le d ep en d ien te () va lor es in fer ior es, p u es en esta son igu a les a ,
en el ca so d e (e) (f) ta m b in son in fer ior es en d ica va r ia b le, p u es

08_Confeccion y anlisis.indd 252

06/06/12 09:34

ANLIS IS DE DATOS CON S TATA

tien en p or el con tr a r io, en la va r ia b le in d ep en d ien te (g) va le (b ),


(c), (e) (f) m s d e . od o p a r d e ca sos d e este tip o se lla m a p a r discorda n te.
Pu es b ien , g lo qu e a ce es con ta r, en fu n ci n d el n m er o d e ca sos
d e ca d a ca silla , el n m er o tota l d e p a r es d e ca so s co n cor d a n tes d isco r d a n tes p a r a m ed ir la r ela cin en tr e a m b a s va r ia b les d el sigu ien te
m od o

(.)
sien d o P c los p a res con cor d a n tes, qu e se ob tien en su m a n d o tod os
los pr od u ctos d e la s fr ecu en cia s d e ca d a ca silla p or la su m a d e tod a s la s
fr ecu en cia s d e ca silla s qu e se en cu en tr en a l m ism o tiem p o d eb a
o a la
d er eca . igu ien d o el cu a dr o ., a qu e su m a r a (efi), b (fi), d (i)
ei. Por otr o la d o, P d son los p a r es d iscor d a n tes, qu e se ca lcu la n su m a n d o tod os los p r od u ctos d e la s fr ecu en cia s d e ca da ca silla p or la su m a d e
tod a s la s frecu en cia s d e ca silla s qu e se en cu en tr en a l m ism o tiem p o a r r ib a a la der eca . s decir, en este ca so a qu e su m a r g(b cef), (cf),
d (b c) ec.
l den om in a d or (P c P d) es el n m er o tota l de p ar es de casos en
los qu e p u ed e eistir relacin or din al en tre la s va ria b les el n u m er ad or
(P c P d) es el n m ero de pa res en los qu e eiste r ela cin p ositiva m en os el
n m ero de p ar es en los qu e eiste relacin n ega tiva . Por ta n to, el sign o de
g in dica el tip o d e pa r es qu e pr edom in a en la ta b la , su va lor ep resa qu
por cen ta
e r ep resen ta este pr edom in io en el tota l d e pa r es estricta m en te
ord in a les. n este ca so, pred om in a n liger a m en te los pa r es de va lor es con
u n a rela cin n ega tiva (en los qu e la va ria b le in gresos tom a u n valor a lto
e ideologa u n o ba
o, vicever sa), p or lo qu e el n u m er ad or es n ega tivo,
por ta n to ta m b in lo es g. Por otr a p ar te, el va lor de g es m u b a
o por qu e
el n m er o de pa res con cor da n tes d iscor da n tes es casi igu al, p or lo qu e
el n u m era d or es ca si al con tr a rr esta rse u n os a otros. n efecto, si en
u n a ta b la n o u bier a relacin algu n a en tre va ria bles, el n m ero d e pa r es
con cor da n tes sera igu a l qu e el n m er o de pa res d iscor da n tes, p or lo qu e
a l r esta rse el resu lta do sera . Pa ra m a or cla rid a d, a con tin u acin se d a n
tr es e
em plos d istin tos de rela cion es en ta bla ord in a l qu e m u estr a n resu lta d os m u difer en tes

strictam en te ablan do, el n m ero total de pares que se pu eden form ar en u n a tabla
de n casos es n (n -)
, cifra esta siem pre m aor, salvo en casos ecepcionales, que la su m a
de pares concordan tes discordan tes. sta ltim a, pares estrictam en te ordinales, slo tien e
en cu en ta las pare
as de casos qu e n o tien en u n valor idn tico en tre s en u na u otra variable.

08_Confeccion y anlisis.indd 253

06/06/12 09:34

ILUSTR ACI 8 .11 .

Gamma

Nc N d
Nc Nd

16 16
16 16

Gamma

Nc Nd
Nc Nd

16 0 16
1
16 0 16

Gamma

Nc Nd
Nc Nd

0 16
0 16

Ta b la s a r a d is t in t o s va lo r e s d e g

0
0
32

16
16

t b se con str u e igu al qu e g, slo qu e en el d en om in ad or in corp ora u n a


corr eccin p ar a los par es em patados en u n a variable (P y) en otr a (P ). u
fr m u la es

(.)
u va lo r es siem p r e m en o r qu e el d e g a l in cor p or a r m s p a r es en
el d en o m in a d o r. o s q u e in co r p or a so n los p a r es em p a ta d o s en (P ),
qu e so n in d ivid u o s q u e, ten ien d o d istin to va lo r en la va r ia b le d ep en d ien te, sin em b a r go tien en el m ism o en la in d ep en d ien tem ien tr a s qu e
los em p a ta d o s en y (P y) so n lo s qu e p o seen va lo r es d esigu a les en la in d ep en d ien te p er o igu a les en la d ep en d ien te. s d ecir, ta n to u n o s com o
otr o s p o d r a n a b er sid o co n gr u en tes o in con gr u en tes, p er o se qu ed a r o n en m ita d d el ca m in o p o r q u e en u n a va r ia b le p r esen ta n va lor es
id n ticos .

ico con otras palabras, son pares em patados en un a variable aquellos qu e tien en un
m ism o valor en esa variable u n valor superior o in ferior en la otra. Por e
em plo, volvien do al
cu adro ., el par form ado por u n caso que estu viera en la casilla (a) otro que estu viera en
la casilla (d) sera u n par em patado en la variable in depen dien te (). sea, qu e am bos casos
valen en , pero (a) es in ferior en y qu e (d).

08_Confeccion y anlisis.indd 254

06/06/12 09:34

ANLIS IS DE DATOS CON S TATA

8 .. s d e d o s va r ia b le s
n m u ca s oca sion es, los r esu lta d os d e u n a ta b la d e con tin gen cia d e d os
va r ia b les est n m ed ia d os p or el efecto d e u n a ter cer a va r ia b le, o d e va r ia s
m s, d esd ib u
n d ose o m ostr n d ose a s d e for m a in cor r ecta la r ela cin
en tr e la s va r ia b les d e in ter s. n estos ca sos se d eb e tr a ta r d e en con tr a r
esta s ter cer a s va r ia b les e in clu ir la s en la s ta b la s, con tr ola n d o a s su efecto. n este ca so, se a b la r d e ta b la s m u ltiva r ia b les d e con tin gen cia . n
el e
em p lo a n ter ior se a visto qu e el efecto d e los in gr esos fa m ilia r es sob r e el voto es d b il, a u n qu e eiste. a d o qu e la va r ia b le d e in gr esos est
r efer id a a l con
u n to d e los ob ten id os en u n oga r, d os p er son a s con u n
m ism o n ivel d e in gr esos fa m ilia r es p u ed en va r ia r en su situ a cin econ m ica seg n su ed a d , p u esto qu e los in gr esos n o se d istr ib u en d e m a n er a
a b solu ta m en te equ ita tiva d en tr o d e la s fa m ilia s. a m b in d os p er son a s
con u n m ism o n ivel d e in gr esos p er o d istin ta ed a d p u ed en ten er d istin ta
a ctitu d p oltica p or qu e el ciclo d e vid a p u ed e d eter m in a r la p er cep cin
d e r esp on sa b ilid a d , p or e
em p lo. n cu a lqu ier ca so, el p osib le efecto d e
la ed a d sob r e la r ela cin en tr e cla se voto es u n a ip tesis qu e se d eb er a con tr a sta r a cien d o a n lisis d e ta b la s m u ltiva r ia b les d e con tin gen cia
con ta ta .
a m a n er a d e a cer lo es u tiliza n d o la p r ein str u ccin bysort segu id a
p or la (s) va r ia b le(s) d e con tr ol, d os p u n tos la or d en esp ecfica d e la
ta b la . om o a se vio en ca p tu lo a n ter ior, bysort p er m ite e
ecu ta r u n a
m ism a or d en p a r a d ifer en tes ca tegor a s d e u n a o m s va r ia b les esp ecifica d a s a l tiem p o qu e or d en a los d a tos p a r a p od er lo r ea liza r. om o p u ed e
a p r ecia r se en el e
em p lo m s a d ela n te, el com a n d o en s qu e se em p lea
p a r a gen er a r la ta b la es ta bu la te, el m ism o qu e se em p lea p a r a ta b la s
d e d os va r ia b les, p er o p r eced id o p or bysort, el n om b r e d e la va r ia b le d e
con tr ol los d os p u n tos. ta ta m u estr a a s u n a ta b la d e con tin gen cia d e
voto p or in gr esos sep a r a d a a ra ca da u n a de la s ca tegora s de eda d. Por
ta n to, com o la ed a d a sid o r ecod ifica d a p or sim p lifica r el e
em p lo en
d os ca tegor a s, ta ta m u estr a slo d os ta b la s, con su s cor r esp on d ien tes
esta d sticos.
recode ed ad (

) (

), in to(ed adr)
label variable edad r
d ad
bsort edadrtabu late rvoto in gresos if rvoto
ingresos
, col n ofreq all

08_Confeccion y anlisis.indd 255

06/06/12 09:34

ILUSTR ACI 8 .1 . Ta b la d e co n t in ge n cia t r id ie n sio n a l


---------------------------------------------------------------------------------- > edadr = 18/ 49
|
I ngr esos f ami l i ar es mens ual es
Recuer do de |
ent r evi s t ado
v ot o |
<150
150- 300
>300 |
Tot al
- - - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - +- - - - - - - - - PP |
29. 49
37. 32
39. 05 |
34. 92
PSOE |
29. 34
21. 34
19. 37 |
23. 76
IU |
6. 44
7. 73
6. 67 |
7. 12
Nac i onal i s t as |
4. 79
7. 84
8. 25 |
6. 86
Ot r os |
1. 95
2. 68
6. 35 |
3. 02
Bl anc o |
2. 99
2. 89
3. 17 |
2. 97
No v ot |
25. 00
20. 21
17. 14 |
21. 35
- - - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - +- - - - - - - - - Tot al |
100. 00
100. 00
100. 00 |
100. 00
Pear son c hi 2( 12) =
Cr amr ' s V =

51. 8490
0. 1152

Pr = 0. 000

---------------------------------------------------------------------------------- > edadr = 50/ 98


|
I ngr esos f ami l i ar es mens ual es
Recuer do de |
ent r evi s t ado
v ot o |
<150
150- 300
>300 |
Tot al
- - - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - +- - - - - - - - - PP |
45. 71
52. 34
54. 55 |
48. 16
PSOE |
30. 88
23. 69
16. 36 |
27. 84
IU |
2. 86
4. 13
4. 55 |
3. 33
Nac i onal i s t as |
5. 93
8. 82
10. 00 |
7. 01
Ot r os |
0. 33
1. 10
2. 73 |
0. 72
Bl anc o |
1. 21
0. 55
5. 45 |
1. 37
No v ot |
13. 08
9. 37
6. 36 |
11. 57
- - - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - +- - - - - - - - - Tot al |
100. 00
100. 00
100. 00 |
100. 00
Pear son c hi 2( 12) =
Cr amr ' s V =

50. 2101
0. 1347

Pr = 0. 000

e qu m od o se in ter pr etan estas tab las m u ltivar iablesPara in ter pr etar este tipo d e tab las, se deb e com par ar cad a u n a de las tablas m u ltivar iab les con la tab la bivar iable origin al (en n u estr o caso, con la ilu str acin .),
las tablas m u ltivar iables en tre s. n esta com par acin se pu eden pr odu cir
las sigu ien tes cu atro situ acion es d ifer en tes
a)

08_Confeccion y anlisis.indd 256

a rela cin observa da en tre va ria ble in deen dien te y deen dien te se
debilita o desa a rece a l in trodu cir la va ria ble de con trol: en este ca so,
toda o pa r te de la rela cin en tr e la var ia ble in dep en d ien te dep en d ien te se deba a l efecto ocu lto de la va r ia ble de con trol, por lo qu e
a l in tr odu cir esta , la rela cin desa pa r ece. l e
em p lo cl sico es el
d e la rela cin en tre el n m ero de cig e a s la ta sa d e n a ta lida d .
i se cr u za ta sa de n a talid ad p or n m er o d e cig e a s en el m u n icipio, es pr oba ble qu e la r ela cin sea sign ifica tiva la n a ta lida d
es m a or en los m u n icipios en los qu e a m s cig e a s. u ier e
esto d ecir qu e la ca u sa d e la m a or n a ta lida d son las cig e as

06/06/12 09:34

ANLIS IS DE DATOS CON S TATA

vid en tem en te, n oesta r ela cin es espu r ia , se d eb e a l efecto de


u n a ter cer a var ia ble, ta m a o d el b ita t (cu a n to m s pequ e o es
el bita t, m a or es el n m er o de i
os). i se con trola p or tam a o
de b ita t, se com p ru eba qu e toda la rela cin en tre n m er o d e
cig e a s ta sa de n a ta lida d d esap ar ece (en m u n icipios d el m ism o
ta m a o, n o eiste rela cin algu n a en tre n m er o d e cig e a s n m ero m edio d e i
os).
b ) a relacin en tre las variables se m an tien e m s o m en os igu al en cada
categora de la variable de con trol: en tal caso la variab le d e con trol
n o afecta a la relacin . Por e
em plo, en n u estro caso, si las tablas
en los tres gr u pos de edad fu er an pr cticam en te igu ales, el efecto de
los in gr esos sob re el voto ser a in d ep en d ien te de la edad, p or lo qu e
n o ser a n ecesar io in clu ir la edad com o var iable d e con tr ol.
c) a relacin en las variables se in crem en ta al con trolar or u n a tercera
variable: esto im plicara qu e s qu e eiste u n a relacin sign ificativa
en tr e la var iable in depen dien te la depen dien te, qu e se m u estr a d eb ilitada si n o se con sidera la var iable de con tr ol. sto es lo qu e par ece qu e su cede en el e
em plo pr opu esto. a r elacin en tre in gr esos
voto es m s clar a den tro de cad a gru p o de edad qu e en todas las
edades con siderad as con
u n tam en te (com prese la ilu str acin .
con la ilu stracin .). Par a u n a m ism a ed ad, con form e au m en tan
los in gr esos, au m en ta el voto al PP dism in u e el voto al P. as
d os tablas con tr olad as p or edad son sign ificativas por c , las d e
r am er son su per iores a las qu e aparecieron en la ilu stracin .
p ar a la relacin sin con trol en tre in gresos voto.
d ) a relacin en tre variable in deen dien te y deen dien te cam bia de form a al
in clu ir la variable de con trol: en este caso, se tratara de u n a in teraccin
de la variable in depen dien te la variable de con trol. n el e
em plo en
cu estin parece qu e eiste u n a ligera in teraccin en tre in gresos edad,
porqu e la relacin en tre in gresos voto es m en or para los m s
ven es
qu e para los m aores (vase ilu stracin .)los in gresos fam iliares
afectan m s al voto seg n au m en ta la edad del en trevistado. Para an alizar este tipo de in teraccion es en tablas m u ltivariables es acon se
able
recu rrir a tcn icas m s avan zadas, com o el an lisis log-lin eal.
Para in clu ir m s de u n a var iable d e con tr ol, slo aqu e a adirla en la p rein str u ccin bysort. Por e
em plo, si se qu isiera con tr olar
por seo edad en este e
em plo, las in str u ccion es deberan ser las
sigu ien tes
b sort seo ed adrtabu la te rvoto in gresos if rvoto
in gresos
, col all

on lo que tata m ostrara cu atro tablasin gresos por edad para


om bres m en ores de a os, para om bres con m s de , para m u -

08_Confeccion y anlisis.indd 257

06/06/12 09:34

eres
ven es para m u
eres m aores. l anlisis de estas tablas sera
igu al al que se a con siderado para el caso de u na sola variable de con trol, slo qu e ligeram en te m s com plicado.

8.. t r a s t a b la s e se cia le s
dem s de las in stru ccion es su m m ari
e tabu late, a partir de la versin ,
tata in clu e otras tres qu e perm iten represen tar en tablas u n a serie de estadsticos. i la prim era de las m en cion adas pu ede m ostrar los estadsticos propios
de u n a n ica variable cu an titativa la segu n da pon e en relacin las frecu en cias (absolu tas, relativas con dicion ales) de dos o m s variables cu alitativas,
las in stru ccion es qu e se m u estran en el sigu ien te apartado tien en por com etido cru zar in form acin de variables cu an titativas con variables cu alitativas. Un
e
em plo sim ple de ellos con sistira en m ostrar las distin tas m edias de ideologa
seg n la edad, el seo o am bas caractersticas de las person as en trevistadas.
a pr im era d e ellas n o es r ealidad u n a n u eva in str u ccin , sin o la m ism a
ord en tabu late aplicad a con la opcin su m m ari
e(variab le). i se opta p or
in clu ir esta ltim a, en lu gar de frecu en cias (ad em s d e p osibles p orcen ta
es
residu os) d e las variab les d e la tab la, ap arecen los pr in cipales estadsticos
d e la variab le cu an titativa epr esad a en tr e p ar n tesis.
l u so m s sim ple de esta opcin con siste en pon er u n a variable cu alitativa tras la in stru ccin u n a cu an titativa en la opcin del su m ario. i se d esean
ver las diferen tes atribu cion es ideolgicas qu e atribu en al PP los en cu estados
de distin tas edades, abra qu e redactar la in stru ccin del sigu ien te m odo
tabu la te ed adr, su m m arize(id eopp )

n realidad, m s qu e u n a n u eva in stru ccin , se tr ata d e la ord en an alizada en el apar tado an terior con u n a opcin qu e p er m ite r ep resen tar en las
casillas, los estadsticos de la variab le ep resada, en este caso, la id eologa
qu e los en trevistados atr ibu en al PP.
ILUSTR ACI 8 .1 . Ta b la d e e st a d st ico s se g n va lo r e s d e n a va r ia b le
| Summar y of At r i buci n de i deol og a
|
al PP
Edad |
Mean
St d. Dev.
Fr eq.
- - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - 18/ 49 |
7. 4254574
1. 5351508
2569
50/ 98 |
7. 4261548
1. 5507619
1537
- - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - Tot al |
7. 4257185
1. 5408244
4106

am b in pu eden obten erse estadsticos en fu n cin d e d os var iables, e


in clu so tres o m s si se em plea par a ello la p rein stru ccin bysort.

08_Confeccion y anlisis.indd 258

06/06/12 09:34

ANLIS IS DE DATOS CON S TATA

b sort seotab u late ed ad r in gresos, su m m arize(ideop p)


ILUSTR ACI 8.1 . Ta b la d e e st a d st ico s se g n va lo r e s d e d o s va r ia b le s
- > s ex o = Hombr e
Means , St andar d Dev i at i ons and Fr equenc i es
of At r i buc i n de i deol og a al PP
|
I ngr es os f ami l i ar es mens ual es
|
ent r ev i s t ado
Edad |
<150
150- 300
>300
Ns / Nc |
Tot al
- - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - +- - - - - - - - - 18/ 49 |
7. 38 7. 3193277 7. 2989691 7. 4155496 | 7. 3566642
| 1. 7239994 1. 5406507 1. 3858272
1. 439263 | 1. 5345397
|
300
476
194
373 |
1343
- - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - +- - - - - - - - - 50/ 98 |
7. 408046 7. 4285714 7. 1911765 7. 2402235 | 7. 3571429
| 1. 6441824 1. 4448856
1. 458453 1. 4352512 | 1. 5338973
|
348
203
68
179 |
798
- - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - +- - - - - - - - - Tot al | 7. 3950617 7. 3519882 7. 2709924 7. 3586957 | 7. 3568426
| 1. 6803548 1. 5124239 1. 4030065 1. 4390069 | 1. 5339419
|
648
679
262
552 |
2141
---------------------------------------------------------------------------------- > s ex o = Muj er
Means , St andar d Dev i at i ons and Fr equenc i es
of At r i buc i n de i deol og a al PP
|
I ngr es os f ami l i ar es mens ual es
|
ent r ev i s t ado
Edad |
<150
150- 300
>300
Ns / Nc |
Tot al
- - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - +- - - - - - - - - 18/ 49 | 7. 5892256 7. 4656319 7. 5074627 7. 4680233 | 7. 5008157
| 1. 5551631 1. 6098428 1. 4548145 1. 4404084 | 1. 5329042
|
297
451
134
344 |
1226
- - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - +- - - - - - - - - 50/ 98 | 7. 4089636 7. 4129032 7. 7111111 7. 7032967 | 7. 5006766
| 1. 6165327 1. 5699578 1. 3249738 1. 5050156 | 1. 5663941
|
357
155
45
182 |
739
- - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - +- - - - - - - - - Tot al | 7. 4908257 7. 4521452 7. 5586592 7. 5494297 | 7. 5007634
| 1. 5902868 1. 5986111 1. 4224012 1. 4659402 | 1. 5451865
|
654
606
179
526 |
1965

i p arece dem asiada in for m acin qu e aparezcan tan tos estad sticos, es
p osible om itir algu n os de ellos con las sigu ien tes opcion es, cu o n om br e ep lica p or s solo qu e es lo qu e se de
a d e r epr esen tar, n om ean sn ostan dard
n oobsn ofreq .
a segu n da in stru ccin , tabstat, se p u ed e con siderar en cam bio u n a am p liacin de la in str u ccin su m m ari
e. esto es as en u n doble aspecto. Por
u n lado, p orqu e in clu e la p osibilidad d e m ostrar m s estadsticos d e lo

bservacion es coin cide con el n m ero de casos, las frecuen cias son los casos u na vez
efectu ada la pon deracin, si la ubiere.

08_Confeccion y anlisis.indd 259

06/06/12 09:34

qu e es capaz la or den m s sen cilla. , por el otr o lad o, p orqu e es capaz d e


cru zar los estadsticos seg n las valores d e u n a segu n d a var iable cu alitativa
sin n ecesidad d e u tilizar la pr ein str u ccin by, n i de ord en ar el ficero p or
los valor es d e la m en cion ad a var iable.
Par a ello, la or den m en cion ada a de ir acom p a ad a por d os opcion es.
a opcin statistics(estad stico) se epr esa p ara in dicar otros estad sticos
d istin tos de la m edia, qu e se ob tien e por om isin . en tr o d e esta, las posib ilidad es son m ean (p ar a la m edia), m edian (par a la m edian a), n (para
la frecu en cia de casos), su m (para la su m a de los valor es de la variab le), q
(par a los cu ar tiles), m a(p ar a el valor m im o), m in (par a el valor m n im o), ran ge (para el ran go), iqr (p ara el ran go in tercu artlico), sd (la desviacin tp ica), varian ce (la var ian za), cv (el coeficien te de variacin ), sem ean
(el er ror tpico d e la m ed ia), sewn ess (el coeficien te d e sim etr a), u rtosis
(el coeficien te d e ap u n tam ien to).
l sigu ien te e
em p lo m u estra par a u n tro de var iables (la valor acin
id eolgica de tr es par tid os) los sigu ien tes estad sticosn m ero d e casos,
m edia, cu artiles, desviacin tpica, ran go in ter cu ar tlico, sim etr a apu n tam ien to. Para ello aqu e escribir la sigu ien te in str u ccin
tabstat ideopp ideopsoe ideoiu, s(n m ean q iqr sd seness urtosis) col(variable)

el resu ltado ap arece en la sigu ien te ilu stracin


ILUSTR ACI 8.1. Ta b la d e e st a d st ic o s d e d ive r sa s va r ia b le s
s t at s |
i deopp i deopsoe
i deoi u
- - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - N |
4106
4007
3913
mean |
7. 425718 4. 284253 2. 453872
p25 |
6
3
2
p50 |
7
4
2
p75 |
8
5
3
i qr |
2
2
1
sd |
1. 540824 1. 445571 1. 206442
s kewnes s | - . 1242612 . 5195444 1. 083963
k ur t osi s |
3. 065596
4. 59968 5. 997489
----------------------------------------

e observa qu e ta n to las m ed id as d e ten den cia cen tr al com o las d e


loca liza cin va n en sen tido decrecien telas m s a lta s cor resp on d en a l PP,
pu es repr esen ta n las p osicion es situ ad a s m s a la d er eca . n con cr eto, la
m edia d e la id eologa a tr ib u ida a l PP (en u n a esca la d el a l ) est situ a da en el ,la del P est u bica da en el ,, la de
U, en el ,. e
igu al m odo, en los cu a r tiles se pr odu ce u n a distan cia de tr es p u n tos en tr e
los dos pr im er os p ar tidos, de u n o o dos pu n tos en tr e los dos pa rtidos
qu e se sit a n a la izqu ier da del esp ectr o. Por otr o la do, la s desvia cion es d e
la s atrib u cion es son ligera m en te m s altas en la calificacin ideolgica d el

08_Confeccion y anlisis.indd 260

06/06/12 09:34

ANLIS IS DE DATOS CON S TATA

PP qu e en la de los p a rtidos de izqu ierd a. in a lm en te, la sim etr a m u estra


r esu lta dos m u lgicoses n ega tiva pa ra el PP, por qu e a m u cos su
etos
qu e da n alta p u n tu a cin pocos qu e la da n ba
a (a sim etra p ar a d
icam en te en este ca so a la izqu ier da ). od o lo con tr ar io de lo qu e ocu rr e en
la eva lu acin d e
U, d on d e a m u cos qu e da n ba
a pu n tu a cin (pu n tu a cin d e izqu ier da s) p ocos qu e d a n pu n tu acion es a lta s (en este ca so la
sim etra es positiva, a la d ereca ). a be d estaca r ta m b in cm o la evalu acin de la ideologa d el PP sigu e p r ctica m en te u n a d istr ib u cin n or m a l
(sim etr a cerca n a a a pu n tam ien to pr im o a ), m ien tr as qu e el P

, sob re tod o,
U poseen u n a con cen tr acin d e va lor a cion es en tor n o a la
m edia (distr ibu cin lep toc r tica ).
a in stru ccin tabstat p er m ite adem s de m ostrar al m ism o tiem p o
las estadsticas de d iver sas var iables cr u zar estos datos por los valores d e
u n a var iable n om in al o gru p al. l m ism o e
em plo an ter ior, con slo tres estad sticos, se ofr ece p ar a cad a u n o de los d os gru p os de ed ad para el total,
si se a ade la opcin by(var iable).

tab sta t id eop p ideopsoe id eoiu , statistics(n m ean sd s) col(statistics) b (eda dr)

tr a opcin qu e se em p lea de m od o distin to en la an ter ior in stru ccin


es col. n esta ocasin se a u tilizado con la m od alid ad statistics p ar a qu e
ap ar ezcan los estadsticos en los en cabezam ien tos d e las colu m n as, en lu gar
d e las var iables, com o se especific col(variable) en el e
em plo an ter ior.
e este m od o, en la p rim er colu m n a p or e
em p lo apar ece el n m er o d e
casos corr espon dien tes a las tres variab les, en p rim er lu gar para los
ven es, en segu n do lu gar para los m aor es fin alm en te para el con
u n to de la
m u estra.
ILUSTR ACI 8.1 . Ta b la s d e e st a d st ico s se g n va lo r e s d e n a va r ia b le
Summar y f or v ar i abl es: i deopp i deops oe i deoi u
by c at egor i es of : edadr ( Edad)
edadr |
N
mean
s d s k ewness k ur t os i s
- - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - 18- 49 |
2569 7. 425457 1. 535151 - . 1338611 3. 066827
|
2520 4. 413492 1. 461038 . 5639496 4. 469687
|
2484 2. 526973 1. 204635 . 9846718 5. 507637
- - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - >=50 |
1537 7. 426155 1. 550762 - . 1086945 3. 062845
|
1487 4. 065232 1. 392315 . 4177254 4. 831858
|
1429 2. 326802 1. 199435 1. 285705 7. 093494
- - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - Tot al |
4106 7. 425718 1. 540824 - . 1242612 3. 065596
|
4007 4. 284253 1. 445571 . 5195444
4. 59968
|
3913 2. 453872 1. 206442 1. 083963 5. 997489
---------------------------------------------------------

08_Confeccion y anlisis.indd 261

06/06/12 09:34

om par an d o las m ed ias p u ed e ver se qu e en el caso del PP la ed ad ap en as in flu e los otr os d os p artidos son valorados u n as d cim as m s a la
d er eca p or los
ven es qu e por los m aores. n la disp ersin d e las difer en cias en la valor acin ideolgica d e los par tid os se ve clar am en te qu e al
igu al qu e en las m edias, per o n o de for m a tan eagerada am aor es
d iferen cias en tr e p artidos qu e en tr e edad es.
in alm en te, est la in str u ccin table, qu e per m ite u n a con stru ccin verstil de tablas m u ltidim en sion ales, con la n ica lim itacin de n o ser capaz
d e gen er ar p or cen ta
es con d icion ales, es decir, p or cen ta
es ver ticales u orizon tales.
a versatib ilid ad d e esta in stru ccin resid e en el n m ero d e dim en sion es qu e p u eden ser con
u gadas en u n a m ism a tab la. n prim er lu gar, com o
en el caso de tabu latesu m m ary(var iable) o el de tabstat var iable pu ed en
u tilizar se las casillas par a repr esen tar los estad sticos d e u n a variab le cu an titativa. n segu n do lu gar, tras la in str u ccin p u ed en ep licitarse asta tr es
variab lesla pr im er a ser repr esen tad a en las filas, la segu n da en las colu m n as, la tercer a aqu r eside la d ifer en cia fu n d am en tal de esta in stru ccin
fren te al r esto an idar los valor es d e la segu n d a. u ier e ello d ecir qu e, si
en la tercera dim en sin se epon e la edad recodificad a en la segu n da los
in gr esos, se r ep resen tarn en pr im er lu gar todos los in gresos cor resp on d ien tes a los
ven es, a con tin u acin todos los cor r esp on d ien tes a los m aor es.
, p or si m s d im en sion es se pu d ieran n ecesitar, la in stru ccin table p er m ite
in trod u cir asta cu atr o variab les m s en la opcin by(listavar) para an idar
a la var iable deen dien tes ep u esta en las filas d e la tab la. dem s, com o en
tan tas otr as rd en es, tam b in p u ed e em plearse la p rein stru ccin bysort, qu e
p u ed e a adir cu an tas dim en sion es sean n ecesarias en la p resen tacin de
frecu en cias o estadsticos.
u n qu e pocas veces se n ecesiten tan tas dim en sion es, el e
em plo sigu ien te m u estr a d n d e son epu estas cada u n a d e las variab les en la tab la resu ltan te.
recod e cca a .. else, in to(com u n id ad )
la bel defin e m ad rid
ad rid
esto
la bel va l com u n id ad m ad rid
b sort com u n id adtab le rvoto in gresos edad r if in gresos , b(seo)

cellidt()

e este m odo, la p rim er a la cu arta d im en sin se repr esen tan en las


filas an id ad as en tre sla segu n d a la ter cer a variab les, en las colu m n as,
tam b in an id ad as en tre ellas, la qu in ta posib les su bsigu ien tes con form an distin tas tablas, com o se m an ifiesta en la ilu stracin .. dvirtase,
asim ism o, qu e se a in d icad o u n tam a o d e colu m n a de oco p osicion es
p ar a qu e cu p ieran todas las colu m n as en la m ism a ln ea.

08_Confeccion y anlisis.indd 262

06/06/12 09:34

ANLIS IS DE DATOS CON S TATA

ILUSTR ACI 8.1 . Ta b la d e co n t in ge n cia co n la o r d e n ta ble


- > comuni dad = Madr i d
-------------------------------------------------------------------------sex o and
|
Edad and I ngr es os f ami l i ar es mens ual es ent r evi s t ado
Rec uer do de | - - - - - - - - - - - 18/ 49 - - - - - - - - - - - - - - - - - - - - 50/ 98 - - - - - - - - - vot o
|
<150
150- 300
>300
<150
150- 300
>300
- - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - Hombr e
|
PP |
9
29
24
11
18
12
PSOE |
11
18
11
12
8
4
IU |
2
13
6
5
5
1
Ot r os |
1
1
2
Bl anco |
1
4
2
1
No v ot |
5
14
6
4
3
No cont es t a |
1
1
2
8
2
1
- - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - Muj er
|
PP |
5
30
15
25
16
9
PSOE |
10
26
9
18
6
3
IU |
6
6
4
5
Ot r os |
1
1
Bl anco |
2
1
2
1
2
No v ot |
10
15
8
8
1
No cont es t a |
2
1
12
1
----------------------------------------------------------------------------------------------------------------------------------------------------- > comuni dad = Res t o
---------------------------------------------------------------------------sex o and
|
Edad and I ngr es os f ami l i ar es mens ual es ent r ev i st ado
Rec uer do de
| - - - - - - - - - - - 18/ 49 - - - - - - - - - - - - - - - - - - - - 50/ 98 - - - - - - - - - vot o
|
<150
150- 300
>300
<150
150- 300
>300
- - - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - Hombr e
|
PP |
68
158
39
177
86
24
PSOE |
82
77
24
101
37
6
IU |
21
31
6
9
9
3
Nac i onal i st as |
16
46
16
20
19
7
Ot r os |
6
12
16
1
2
1
Bl anc o |
11
11
3
4
2
1
No vot |
87
71
29
29
15
4
No c ont es t a |
29
34
13
63
20
4
- - - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - Muj er
|
PP |
115
145
45
203
70
15
PSOE |
93
86
17
150
35
5
IU |
14
25
5
7
1
1
Nac i onal i st as |
16
30
10
34
13
4
Ot r os |
5
12
2
2
2
2
Bl anc o |
6
12
3
6
2
No vot |
65
96
11
78
16
2
No c ont es t a |
53
35
6
102
19
----------------------------------------------------------------------------

dem s de frecu en cias, tam b in pu eden m ostr arse m edian te la ord en


table p rcticam en te los m ism os estad sticos qu e la in stru ccin tabstat. lo
se ecep t an el r an go, la varian za, el err or tpico de la m ed ia, la asim etr a
la cu r tosis. Per o en este caso, en lu gar de ap arecer en la opcin statistics, a
d e figu rar en la opcin con ten tsal lad o d el n om b re literal del estadstico
en in gls a d e apar ecer la var iable cu an titativa de la qu e se desea qu e se
ob ten ga el cor respon d ien te clcu lo. n el sigu ien te e
em plo, se qu ieren las
m ed ias d e la atr ibu cin ideolgica del PP d el P, par a cad a u n a d e las
ed ad es r ecu erd os d e voto. d em s, se especifica u n for m ato con la op cin
form at para qu e las m ed ias n o salgan con u n a lar ga lista d e decim ales
se a aden otras d os opcion es (col row) a fin de qu e tam b in m u estr e las
m ed ias in depen dien tem en te d e la ed ad en la ltim a colu m n a e in dep en d ien tem en te del voto en la ltim a fila.

08_Confeccion y anlisis.indd 263

06/06/12 09:34

table rvoto edad r, con ten t(m ean ideopp m ean ideopsoe) form at(.f) col ro

ILUSTR ACI 8 .1 8.

Ta b la d e e st a d st ico s co n la in s t r cc i n ta b le

---------------------------------Rec uer do de |
Rec odi f i c aci on de
v ot o
|
edad
r ec odi f i cado | 18- 49
>=50 Tot al
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - PP |
6. 9
7. 1
7. 0
|
4. 2
3. 9
4. 0
|
PSOE |
7. 8
8. 0
7. 9
|
4. 0
3. 8
3. 9
|
IU |
7. 9
8. 2
8. 0
|
5. 2
5. 0
5. 1
|
Nac i onal i s t a |
7. 7
7. 8
7. 7
|
4. 7
4. 3
4. 6
|
Ot r os |
7. 8
7. 8
7. 8
|
5. 0
4. 9
5. 0
|
Bl anc o |
7. 6
7. 7
7. 6
|
4. 7
5. 0
4. 8
|
No vot o |
7. 6
7. 3
7. 5
|
4. 8
4. 5
4. 7
|
NC |
7. 3
7. 3
7. 3
|
4. 4
4. 4
4. 4
|
Tot al |
7. 4
7. 4
7. 4
|
4. 4
4. 1
4. 3
----------------------------------

n r esu m en , la in str u ccin ta bu la te es la m s a p r op ia d a p a r a la ob ten cin d e fr ecu en cia s p or cen ta


es, a u n qu e even tu a lm en te sir va ta m b in p a r a r ep r esen ta r en u n a o d os d im en sion es esta d stica s b sica s
d e u n a va r ia b le cu a n tita tiva a l a a d ir le la op cin su m m a ri
e. a or d en
ta bsta t es m u a p r op ia d a p a r a la ob ten cin d e m u d istin tos tip os d e
esta d sticos u n iva r ia d os (er r or tp ico, a sim etr a cu r tosis, en tr e otr os),
p er o est lim ita d a p or p er m itir u n a sola d im en sin d e cr u ce, a u n qu e d e
m ltip les va r ia b les cu a n tita tiva s. in a lm en te, la in str u ccin ta ble ofr ece
m u ltid im en sion a lid a d , sin n ecesid a d d e or d en a r el ficer o, n i e
ecu ta r
la p r ein str u ccin bysort, sob r esa le en la p osib ilid a d es d e for m a to
, aunqu e n o es ca p a z d e ofr ecer p or cen ta
es ver tica les n i or izon ta les, p er m ite
r ep r esen ta r u n elen co a m p lio d e esta d sticos d e u n a o va r ia s va r ia b les
cu a n tita tiva s.

08_Confeccion y anlisis.indd 264

06/06/12 09:34

ANLIS IS DE DATOS CON S TATA

8 .. La s t a b la s d e r e se st a lt ile
s frecu en te, sob re tod o en cu estion ar ios, ten er qu e an alizar pr egu n tas a las
qu e con vien e o a las qu e sim plem en te es posib le dar m s d e u n a resp u esta.
on los an lisis e in stru ccion es tratad os asta el m om en to estas pr egu n tas
tien en qu e ser tr atadas su bd ividin d olas en cada u n a de su s op cion es d e
r espu esta. Por e
em plo, sea la p regu n ta a del estu d io postelector al d e las
eleccion es d e .
ILUSTR ACI 8.1 . r e gn t a d e r e se st a lt ile
o ci n c d igo b in a r io

n ella se in ter r oga p or los p a r tid os d e los qu e se a visto p u b licid a d


d u r a n te la ca m p a a elector a l. n el cu estion a r io d esta ca qu e tod os los
p a r tid os p osib les est n cod ifica d os con el m ism o d gito, el , ocu p a n d o
ca d a u n o d e ellos u n a colu m n a . i se a tien d e a l ficer o en ta ta (p a n el.
d ta ), p u ed e ob ser va r se qu e la s va r ia b les se d en om in a n p a -p a .
on lo a sta a or a a p r en d id o, slo p od r a escr ib ir se u n a in str u ccin
com o
tab p a -p a

provecan do qu e est codificada con valores -, se podra utilizar la igu aldad en tre
u n a proporcin la m edia de u na variable dicotm ica para em plear la instru ccin

t abs t at p21a01- p21a04, s ( mean n) , c ol ( s t at i st i t i c s )

dem s, si se sustitu e el por el , los resu ltados seran porcen ta


es.

08_Confeccion y anlisis.indd 265

06/06/12 09:34

on ella, saldr an catorce tab las d icotm icas, d e las qu e se ofrece u n a


m u estr a d e las tres pr im er as
ILUSTR ACI 8 .. Ta b la cio n e s d e t e s d e lt ir r e se st a
- > t abul at i on of p21a01
iu |
Fr eq.
Per c ent
Cum.
- - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - 0 |
1, 323
43. 16
43. 16
1 |
1, 742
56. 84
100. 00
- - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - Tot al |
3, 065
100. 00
- > t abul at i on of p21a02
pp |
Fr eq.
Per c ent
Cum.
- - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - 0 |
479
15. 63
15. 63
1 |
2, 586
84. 37
100. 00
- - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - Tot al |
3, 065
100. 00
- > t abul at i on of p21a03
psoe |
Fr eq.
Per c ent
Cum.
- - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - 0 |
564
18. 40
18. 40
1 |
2, 501
81. 60
100. 00
- - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - Tot al |
3, 065
100. 00

Puede com probarse qu e la presen tacin de los resultados es larga innecesariam en te. Para solventarlo, se a de recu rrir a un a rutin a o m dulo especial creado para tata, que a de descargarse de
nternet de las pginas de su revista .
n et from ttp

.stata -
ou rn al.com
softare
s
-
n et in stall st

Para variables dicotm icas, com o es el caso de las que se acaban de sealar
para el e
em plo, la instruccin para obtener una tabla no puede ser m s sencilla
m rtab pa-p a , title(
ecu erdo pu blicid ad
) n on am es

in em bargo, la salida, m ostr ada en la ilu stracin .r equ iere u n com en tar io m s eten d ido. n p rim er lu gar, con vien e fi
ar se en el fin al, d on d e

u nque se pu blique en tata


ou rn al, este procedim ien to (m rtab) n o tien e garan ta de
tata orp., pues n o a sido desarrollado por esta em presa. e presen ta eplica en
an n
().

08_Confeccion y anlisis.indd 266

06/06/12 09:34

ANLIS IS DE DATOS CON S TATA

se m u estr an los casos vlidos e in vlidos. n este caso a.de estos


ltim os, por qu e esta p regu n ta est filtr ada por la an ter ior. odos aqu ellos
qu e di
eron n o aber visto p u blicid ad en la televisin o n o con testar on a la
p regu n ta pap arecen com o casos in vlidos en esta tab la.
ILUSTR ACI 8.1. Ta b la lt ir r e s e s t a d e a r t id o s
d e lo s e s e r e c e r d a b licid a d
Recuer do de |
Per c ent of
Per cent
publ i c i dad |
Fr equenc y
r es pons es
of c as es
- - - - - - - - - - - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - iu |
1742
19. 79
56. 84
pp |
2586
29. 38
84. 37
ps oe |
2501
28. 42
81. 60
ea |
87
0. 99
2. 84
pnv |
200
2. 27
6. 53
ci u |
436
4. 95
14. 23
er c |
191
2. 17
6. 23
i c- v |
104
1. 18
3. 39
bng |
99
1. 12
3. 23
pa |
159
1. 81
5. 19
cc |
86
0. 98
2. 81
c ha |
50
0. 57
1. 63
ot r os par t i dos |
307
3. 49
10. 02
ns / nc |
253
2. 87
8. 25
- - - - - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - Tot al |
8801
100. 00
287. 15
Val i d cas es :
Mi ss i ng c as es :

3065
2192

Per o lo m s im portan te de esta tab la son los d os por cen ta


es, qu e cor resp on den a d os bases d istin tas qu e aqu e sab er d istin gu ir en la in terp retacin d e la r esp u esta m ltip le. Por u n lado, est el qu e em plea com o b ase
p ara su clcu lo el n m ero de casos (n ). a ltim a colu m n a de la tabla d e
la ilu stracin .r espon de al cocien te en tre la frecu en cia dico n m er o
(.casos qu e an r espon dido a la p regu n ta). Por tan to, la lectu ra de dico p orcen ta
e a d e ser la sigu ien ten tr e qu ien es an visto p u blicidad de
p artidos en la d u ran te la ltim a cam pa a elector al, el la aribu al
PP, u n al P, m ien tras qu e slo u n lo izo a
U.
Por otr o lado, p ar a el clcu lo de por cen ta
es, p u ed e u tilizar se otra base
d istin tael n m ero d e resp u estas (r), equ ivalen te en este e
em plo con cr eto
al n m ero total de par tid os vistos por el con
u n to de los en tr evistados. n
la ilu str acin ., este valor cor resp on d e a la su m a de las frecu en cias, es
d ecir, .. sta can tidad , a m en u d o difcil d e in ter pretar, tien e su im p ortan cia p or qu e es el d en om in ad or d e la colu m n a de porcen ta
es d e r esp u esabra qu e prestar aten cin al n s
n c, qu e est su m ado en realidad n o es n in g n
partido poltico, tam bin a la categora otros partidos, qu e pu eden ser un o o varios. o
correcto en la m aor parte de los casos sera om itir de esta tabla tam bin la n o respu esta, especialm en te si in teresa u tilizar com o base de porcenta
es el n m ero de respu esta.

08_Confeccion y anlisis.indd 267

06/06/12 09:34

tas, qu e con ciertas p recau cion es pod ra in ter pr etarse com o el porcen ta
e
d e r ecu erd os de u n partido sobr e la totalid ad de p ar tidos recor dad os. el
con
u n to de r ecu er dos, casi u n son de p u blicid ad d el Partid o Pop u lar,
u n d el Par tido ocialista u n d e
zqu ierd a Un ida.
l pr ob lem a qu e p resen ta la tabla an terior es qu e su b ase (los n o filtr ad os en la pr egu n ta an terior ) es u n a p ar te n o r epresen tativa de la m u estr a
son slo aqu ellos qu e vieron pu b licidad. Por tan to, debera m od ificar se a fin
d e qu e la base sea el con
u n to d e los casos en cu estados. Par a ello aqu e
acer dos op eracion es
todos los qu e n o su pier on o n o con testaron a la p regu n ta p(la
qu e ace el papel de filtro) otor gar el valor en la var iable m ltip le
qu e r ecoge el valor n s
n c (p a, en este caso).
b) rear u n a n u eva var iable (p a, por e
em plo) qu e r eco
a a aqu ellos su
etos qu e di
eron n o en la pr egu n ta filtro, es decir, en la
pr egu n ta p, esto es, a todos aqu ellos qu e d i
eron n o aber visto
pu blicid ad de partidos p olticos en la televisin .
a)

m p lean do los recu r sos abor dados en el captu lo , am bas cosas p u ed en


r ealizar se d el sigu ien te m odo
repla ce paif p
gen era te pa
repla ce paif p
la bel va ria ble pa
o a visto

r as este pr oceso, se pu ede volver a solicitar la tab la, a ad ien do la n u eva


variab le creada (pa), qu e r ep resen ta a todos aqu ellos qu e n o an visto
p u b licidad d e p ar tid os polticos du r an te la cam p a a electoral.
con tin u acin , se rep ite la in stru ccin , per o in clu en d o tam b in la
n u eva var iable cr ead a
m rtab pa-p a p a, title(
ecu erdo d e p u blicid ad
)

a ven ta
a d el n u evo resu lta do est en qu e el porcen ta
e de los ca sos
est ca lcu lad o sobre el con
u n to d e la m u estra , en lu ga r de slo sob re los
qu e r ecord a ron a ber visto p u blicid ad . e este m odo, p u ed e estim a rse qu e
ap en a s el de los ciu d ad a n os m a or es d e a os vier on p u blicida d en
la ca m pa a de la s eleccion es gen era les d e de a lgu n o de los dos pa r tidos m a orita rios d el sistem a poltico espa ol. ste p orcen ta
e es ta n ba
o
com o con secu en cia d e qu e m s del de los en tr evista dos se a la ron
n o a ber visto n in g n esp acio d e p ropa ga n da electora l de alg n pa rtido o
coa licin .

08_Confeccion y anlisis.indd 268

06/06/12 09:34

ANLIS IS DE DATOS CON S TATA

ILUSTR ACI 8 .. Ta b la lt ir r e se st a co n la in clsi n


d e la c a t e go r a n in gn o
|
Per c ent of
Per c ent
Rec uer do publ . |
Fr equenc y
r es pons es
of c as es
- - - - - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - iu |
1742
15. 81
32. 97
pp |
2586
23. 47
48. 95
ps oe |
2501
22. 70
47. 34
ea |
87
0. 79
1. 65
pnv |
200
1. 82
3. 79
ci u |
436
3. 96
8. 25
er c |
191
1. 73
3. 62
i c- v |
104
0. 94
1. 97
bng |
99
0. 90
1. 87
pa |
159
1. 44
3. 01
cc |
86
0. 78
1. 63
c ha |
50
0. 45
0. 95
ot r os par t i dos |
307
2. 79
5. 81
ns / nc |
279
2. 53
5. 28
No ha v i s t o |
2192
19. 89
41. 49
- - - - - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - Tot al |
11019
100. 00
208. 57
Val i d c as es :
Mi s s i ng c as es :

5283
0

ste es el tr atam ien to qu e a ce el p rogra m a m rtab de la s va riab les


m ltip les d icotm ica s. a
, n o ob sta n te, otr os tipos d e va ria bles m ltip les
en los cu estion a r ios qu e n ecesita n u n tra ta m ien to liger a m en te d iferen te.
e tr ata d e las var ia bles m ltiples cu a s op cion es d e respu esta n o est n
codificad a s dicotm ica m en te, sin o con u n va lor distin to pa ra ca da ca tegora . a ven ta
a de este pr oceder es qu e se n ecesita n m en os va riab les
distin tas p or pr egu n ta, p u es b a sta con em plear ta n ta s com o el m im o
n m ero d e r espu esta s distin ta s p u ed e d a r el en tr evista do. l ca so a n ter ior
n o es p roceden te, a qu e a su
etos qu e pu eden con testa r d icien d o qu e
a n visto p u b licida d de toda s ca d a u n a d e las opcion es p oltica s, com o
su ced i rea lm en te en seis oca sion es en el estu dio qu e se com en ta . in em ba r go, en m u ca s ocasion es el pr opio r ed a ctor d el cu estion ar io lim ita el
n m ero de con testa cion es qu e u n a person a p u ed e da r a u n a p regu n ta d e
r esp u esta m ltiple. s, por e
em plo, el ca so de la p regu n ta p del estu d io
postelectora l d e , cu o teto litera l es el sigu ien tePod ra decirm e
en tr e qu dos pa r tid os u op cion es du d Ud.
. b via m en te, p od ran r eserva rse trein ta colu m n a s pa r a d istin tos p a rtidos u op cion es cod ifica dos
bin ar ia m en te. Per o es m u co m s cm od o em p lea r d os va r ia bles, ca da
u n a de ella s con la p osibilid a d de gr ab a r en for m a to fi
o d os colu m n a s,
con lo qu e se disp on dr a de opcion es distin tas. a ilu str a cin .
m u estr a con clar id ad u n e
em p lo alter n ativo d e cod ifica cin a l m ostra d o
en la ilu str acin ..

08_Confeccion y anlisis.indd 269

06/06/12 09:34

ILUSTR ACI 8 .. r e gn t a d e r e se st a lt ile


o ci n lt ic d igo

a in str u ccin p ar a elabor ar tab las de d istr ibu cion es de r esp u esta con
este tipo d e codificacin es la m ism a qu e la qu e se acaba d e escribir. o
n ico d istin to es la opcin , a qu e aqu e in d icar qu e los cd igos son
m ltiples, en lu gar d e b in arios con la op cin oly. n esta m odalidad es
con ven ien te esp ecificar otra op cin qu e r estrin
a los cd igos qu e se van a
r econ tarse tr ata de reson se(listavalores), don de la lista deb e in d icar los
valor es qu e se d esean r epr esen tar. Par a ob ten er al u n son o las fr ecu en cias
d e las dos respu estas de la pr egu n ta de la ilu stracin ., abr a qu e esp ecificar los cd igos com p ren did os en tr e .
m rtab papa , p olrespon se(
) title(
pcion es en du da
) n on a m es

l r esu ltad o de esta in stru ccin da u n tota l de ca sos, qu e son qu ien es d i


er on du d ar en la em isin del voto en la s ltim a s eleccion es. l tota l
de la fr ecu en cia n o tien e sen tid o algu n o, pu es m ezcla p ar tidos, a bsten cin
n o con testa cion es. Por tan to, los n icos n m er os in terp reta bles de la
ta bla son la s fr ecu en cias su s cor respon d ien tes porcen ta
es d e los casos.
a b ase de estos ltim os son qu ien es du d ar on . n con secu en cia , pod ra
decirse, d e a cu erd o con la ilu str acin ., qu e el de los qu e du d a ron
lo icieron in clu en d o a l P, el a l PP el a
U. dem s, pa r a
ca si u n d e los qu e du d ar on , la a bsten cin fu e u n a d e la s op cion es
posib les.

08_Confeccion y anlisis.indd 270

06/06/12 09:34

ANLIS IS DE DATOS CON S TATA

ILUSTR ACI 8 .. Ta b la d e fr e ce n cia s a r a va r ia b le lt ile


c o n lt ic d igo s
Opc i ones en |
Per c ent of
Per c ent
duda |
Fr equenc y
r es ponses
of c as es
- - - - - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - iu |
87
8. 54
16. 17
pp |
243
23. 85
45. 17
psoe |
276
27. 09
51. 30
ea |
5
0. 49
0. 93
pnv |
8
0. 79
1. 49
ci u |
31
3. 04
5. 76
er c |
11
1. 08
2. 04
bng |
9
0. 88
1. 67
pa |
7
0. 69
1. 30
cc |
6
0. 59
1. 12
i c- v |
15
1. 47
2. 79
cha |
6
0. 59
1. 12
ot r os par t i dos |
37
3. 63
6. 88
v ot ar en bl anc o |
49
4. 81
9. 11
abs t ener s e |
159
15. 60
29. 55
n. c . |
70
6. 87
13. 01
- - - - - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - Tot al |
1019
100. 00
189. 41
Val i d c ases :
Mi ss i ng cas es:

538
4745

n este tipo de var iables es m u til u tilizar u n a opcin de esta in stru ccin llam ada in clu de, qu e in corp ora tam b in tod os los casos qu e n o an
d ado n in gu n a r esp u esta.
m rtab papa, polrespon se(
) title(
pciones en du da
) n on am es

in clu d e

l efecto d e esta op cin (va se la ilu str a ci n .) es el d e in corp o r a r en la b a se d el p o r cen ta


e tod o s los ca sos qu e n o ten ga n u n va lor
co m p r en d id o en tr e lo s va lo r es d a d os (en tr e el el , en este e
em p lo ).
Po r ta n to, en lu ga r d e ca so s v lid os, se o b tien en .(el co n
u n to
d e la m u estr a ) . o n secu en tem en te, ca m b ia el p o r cen ta
e so b r e ca sos
se m a n tien e el d e r esp u esta s. e to d os m o d o s, esta ta b la p r esen ta u n
p equ e o d efecto en el c lcu lo d el to ta l d el p o r cen ta
e d e lo s ca sos ( ltim a fila d e la ltim a colu m n a ), p u esto q u e u tiliza co m o n u m er a d or la
su m a d e la s fr ecu en cia s, en lu ga r d el r ecu en to d e ca so s con a l m en os
u n a r esp u esta d a d a . l n m er o .es el n m er o to ta l d e r esp u esta s.
l tota l d el p or cen ta
e d e los ca sos se ca lcu la d ivid ien d o esta cifr a (d e
o n ecesariam ente tiene qu e ser el con
u n to de la m u estra. i un caso tiene valor perdido en todas las variables in dividu ales, n o es contabilizado para la base. n este e
em plo, los
casos filtrados por la pregun ta an terior se encu en tran en la base de datos con , por lo qu e
cu m plen la con dicin para ser recon tados.

08_Confeccion y anlisis.indd 271

06/06/12 09:34

m o d o eq u ivoca d o , p o r qu e d eb er a n d ivid ir se los q u e r esp o n d en n o la s


r esp u esta s) p o r el n m er o d e ca sos to ta l. P or ta n to, este p or cen ta
e no
tien e n in gu n a in ter p r eta cin v lid a , com o es d e r eco n ocer q u e ta m p o co
la tien e en la ilu str a cin ., d on d e es m s evid en te p o r so b r ep a sa r el
.
ILUSTR ACI 8 .. Ta b la d e fr e c e n cia s a r a va r ia b le lt ile
co n lt ic d igo s e in clu d e
Opc i ones en |
Per c ent of
Per c ent
duda |
Fr equenc y
r es ponses
of cas es
- - - - - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - iu |
87
8. 54
1. 65
pp |
243
23. 85
4. 60
ps oe |
276
27. 09
5. 22
ea |
5
0. 49
0. 09
pnv |
8
0. 79
0. 15
ci u |
31
3. 04
0. 59
er c |
11
1. 08
0. 21
bng |
9
0. 88
0. 17
pa |
7
0. 69
0. 13
cc |
6
0. 59
0. 11
i c- v |
15
1. 47
0. 28
c ha |
6
0. 59
0. 11
ot r os par t i dos |
37
3. 63
0. 70
v ot ar en bl anc o |
49
4. 81
0. 93
abs t ener s e |
159
15. 60
3. 01
n. c . |
70
6. 87
1. 33
- - - - - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - Tot al |
1019
100. 00
19. 29
Val i d c ases :
Mi s s i ng cas es :

5283
0

1 ru ces con variables m ltiles


d em s d e o b ten er ta b la s d e p r egu n ta s d e r esp u esta s m ltip les, la
in str u cci n m rta b, a l igu a l q u e su co r r esp o n d ien te o r igen ta bu la te,
es ca p a z d e p r o d u cir ta b la s d e d o b le en tr a d a , siem p r e cu a n d o la
segu n d a va r ia b le, u b ica d a en la s co lu m n a s, n o sea m ltip le. a estr u ctu r a gen er a l d e esta in str u ccin p a r a ta b la s d e d ob le en tr a d a es la sigu ien te

i se qu isier a sa b er qu p or cen ta
e ep r esa du d a , a b r a qu e con ver tir a los qu e
n o d u d a n (cod ifica d os a qu com o ) en u n n u evo va lor (, p or e
em p lo) ta b u la r lo
com o u n a ca tegor a m s. l p or cen ta
e com p lem en ta r io d e esta ca tegor a ser a el cor r espon d ien te a la s p er son a s qu e d u d a n . n este e
em p lo a b r a .qu e n o d u d a n , esto
es, u n . n con secu en cia , los qu e d u d a n son u n . s en con cr eto, d e .
en tr evista dos.

08_Confeccion y anlisis.indd 272

06/06/12 09:34

ANLIS IS DE DATOS CON S TATA

r t a b listava rm u l, b y(variable)
c o ln r o c e ll n o fr e c ilr cit e s t
lr c i

n esta or d en a qu e n o ta r qu e la va r ia b le sen cilla d e la s co lu m n a s a p a r ece en tr e la s o p cio n es, a n teced id a p o r by()p u ed en ob ten erse tip o s d e p or cen ta
es sim ila r es a los d e la ta b la n or m a l, a s co m o
su p r im ir la s fr ecu en cia s. a m b in se p u ed e ca lcu la r u n c co n
u n to
d e Pea r so n u o tr o b a sa d o en la r a z n d e ver osim ilitu d , o p u ed e op ta r se
p o r m ltip les p r u eb a s p o r fila s , en cu o ca so d eb er a m o s o p ta r p o r
m test o esta segu id a d e m lrch i2, a fin d e ca lcu la r la s p or el segu n d o
m to d o.
Pa r a p r o b a r la ip tesis d e q u e n o a d ifer en cia s en el r ecu er d o
d e p u b licid a d d e los p a r tid os p o ltico s d u r a n t e la ca m p a a elector a l
en tr e o m b r es m u
er es, a b r a q u e solicita r u n a ta b la d e p or cen ta
es
q u e in clu er a la s p r u eb a s m ltip les el test co n
u n to d e la c d e P ea rson
m rta b pa-p a pa , b(seo) n ofreq col cim test title(
ec
)

n on am es

a ta b la o b ten id a m u estr a qu e lo s om b r es se a n ep u esto o r ecu er d a n m s lo s m en sa


es p u b licita r ios d e ca si tod o s los p a r tid o s. sp ecia lm en te, son r ese a b les la s d ifer en cia s en los tr es p a r tid os d e m a o r
co b er tu r a ter r ito r ia l, p u es so n m u p r im a s a d iez p u n tos p or cen tu a les. n con so n a n cia , u n d e la s m u
er es n o r ecu er d a n a b er visto
cu a s electo r a les, fr en te a u n d e lo s o m b r es qu e n o vier on este
tip o d e p u b licid a d .

Para el clcu lo de este estadstico, el program a epan de las filas a tantas com o com bin aciones em pricas eisten de m u ltirrespu estas. Un e
em plo sencillo aclarar esto ltim o.
m agin em os slo dos partidos optados. a tabla aparen tem ente tiene slo dos filas, pero pu eden
epan dirse a cuatron o elige nin gu no, slo elige el prim ero, slo elige el segun do o elige los
dos. n general, el n m ero de filas epan didas es i. in em bargo, es preciso ten er en cu en ta
que aqu e elim in ar aqu ellas com bin acion es sin n in gun a frecu en cia, a fin de obten er los verdaderos grados de libertad de la tabla.

i se opta por m ltiples pru ebas, se pu ede elegir u n a


u ste de la significacin por el
m todo de onferron i, olm o ida, pon ien do su s n om bres en m in scu las en tre parntesis
despu s de la opcin m test.

08_Confeccion y anlisis.indd 273

06/06/12 09:34

ILUSTR ACI 8 .. Cr ce d e r e c e r d o d e b lic id a d o r se o


c o n r e b a s lt ile s
Recuer do de |
s exo
publ i c i dad |
Hombr e
Muj er |
Tot al
- - - - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - +- - - - - - - - - - iu |
38. 75
27. 71 |
32. 97
pp |
53. 20
45. 08 |
48. 95
psoe |
52. 52
42. 62 |
47. 34
ea |
1. 83
1. 48 |
1. 65
pnv |
4. 33
3. 29 |
3. 79
ci u |
9. 65
6. 98 |
8. 25
er c |
4. 25
3. 04 |
3. 62
i c- v |
2. 42
1. 56 |
1. 97
bng |
2. 30
1. 48 |
1. 87
pa |
3. 85
2. 24 |
3. 01
cc |
1. 98
1. 30 |
1. 63
cha |
1. 27
0. 65 |
0. 95
ot r os par t i dos |
7. 07
4. 67 |
5. 81
ns / nc |
4. 57
5. 93 |
5. 28
No ha v i st o |
37. 55
45. 08 |
41. 49
- - - - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - +- - - - - - - - - - Tot al |
225. 53
193. 13 |
208. 57

chi 2/ p*
72.
34.
51.
0.
3.
12.
5.
5.
4.
11.
3.
5.
13.
4.
30.

575/
740/
829/
956/
874/
353/
525/
120/
809/
668/
833/
389/
859/
931/
741/

0.
0.
0.
0.
0.
0.
0.
0.
0.
0.
0.
0.
0.
0.
0.

000
000
000
328
049
000
019
024
028
001
050
020
000
026
000

* Pear s on c hi 2( 1) / Unadj us t ed p- v al ues


Val i d c ases :
Mi s s i ng cas es :
Over al l

5283
0

Tes t ( s ) of Si gni f i c anc e:


Pear s on c hi 2( 164) = 238. 7807

Pr = 0. 000

a n ica pru eb a en la qu e n o se aprecian d iferen cias sign ificativas (vase


ltim a colu m n a de la ilu stracin .) es en la d e u so lartasu n a. n con
u n to, au n a asociacin sign ificativa en tre recu erdo de pu b licidad gn ero
los om bres recu erd an aberla visto m s qu e las m u
eres.

8..
e r cicio s
. r u za el u so d e
n ter n et en los d oce ltim os m eses (cisP.) por
seo, ed ad (r ecod ificada en tr es in ter valos) estu dios. u var iable
par ece ten er m aor in flu en cia(e recom ien d a p on er valor es p er didos
a los qu e n o con testan a la p regu n ta sob re
n ter n et a los estu d ios).
. alcu la los r esidu os a
u stad os d e la tabla
n ter n et por estu d ios. n
qu casillas se en cu en tr an los r esidu os sign ificativosu im plica qu e
u n os sean positivos otros n egativos
. ealiza u n cr u ce d e u so d e
n ter n et por ed ad estu d ios, con tr olan do
por seo. s d ifer en te la in flu en cia de la ed ad de los estu dios seg n
se sea om br e o m u
er
. m p lean do aora el b arm etr o de abr il d e (cis), o cu alqu ier
otr o de en er o, abr il,
u lio u octu b re, az u n a tab la con los estad sticos
pr in cip ales (n , m ed ia desviacin tp ica) d e la valor acin de los pr in -

08_Confeccion y anlisis.indd 274

06/06/12 09:34

ANLIS IS DE DATOS CON S TATA

cip ales lderes p olticos (P.). om p ar a estos resu ltados por id eologa
agru p ada en tr es categor as (izqu ier da, cen tro dereca).
. n el bar m etro de m ao de (cis) se ace u n a pr egu n ta de
r espu esta m ltiple (P.a) sob re las p er son as con las qu e con vive el en trevistado. ealiza u n a tabla en la qu e est recogida tam b in la categora n adie. r zala p or la edad recodificad a en cu atro in tervalos
etrae con clu sion es sobr e la r elacin en tre am b as var iables.
. on el m ism o estu d io, ob tn u n a tab la de d istr ib u cin de frecu en cias
con los pr in cipales pr oblem as del pas (P.). r zala por ideologa com en ta la in flu en cia d e la ideologa en la p er cep cin tem tica de los prob lem as del pas.

08_Confeccion y anlisis.indd 275

06/06/12 09:34

08_Confeccion y anlisis.indd 276

06/06/12 09:34

9
La r e gr e si n 1
Un aspecto d e pr im ord ial aten cin en el an lisis d e las var iables cu an titativas es el estu dio de la asociacin en tre ellas, par a averigu ar si los valores
d e u n as deter m in adas variables var an con la m ism a pau ta qu e los de otr as.
Un a per spectiva ya vista en el captu lo r elacion ad o con las com paracion es es estu d iar, por ejem p lo, si la tasa de in flacin es m ayor o m en or en
Fran cia qu e en sp a aotr a per spectiva qu e pu ede ad op tar se es la de ver si
varan con ju n tam en te, esto es, si en los m om en tos en qu e en Fran cia es alta,
tam bin lo es en spa a, m ien tras qu e cu an do el ascen so d e los p recios se
en cu en tra en cotas b ajas en Fr an cia, tam bin lo ace d e ese m odo en spa ao si, p or el con trar io, n o eiste relacin algu n a en tre los datos de cad a
u n o de estos p ases, y la evolu cin de la in flacin en u n o de estos p ases es
in depen dien te de la del otr o. on ien do otro ejem plo, p odra in d agarse en
u n con ju n to de p ases si, p or trm in o m edio, la esp er an a d e vid a de los
om b res es distin ta -m ayor o m en or qu e la d e las m u jer es, en este caso
estar am os an te u n a com paracin . in em b ar go, si se d esea averigu ar si
aqu ellos p ases en los qu e viven m s tiem po los om br es son los m ism os en
los qu e tam b in las m u jeres tien en u n a esp er an
a de vid a m ayor, en ton ces
se est an te el estu d io d e la asociacin en tre las var iables. atu ralm en te,
p u ed e darse el caso en el qu e la r elacin o asociacin sea de distin to sign o,
p u es p od ra ocu rr ir qu e los casos qu e en u n a variab le tien en valor es m s
altos, lo tien en m s b ajos en la otr a variab le. or ejem p lo, es clar o qu e en
los pases con alta ren ta per cpita, la m ortalid ad in fan til es pequ e a, p u es
los pases qu e tien en m ejor es n iveles de in gr esos su elen ten er m ejores con d icion es san itarias p ar a su s recin n acid os, por lo qu e la tasa de u n a m u erte
p ostn atal es m en or.

ara los prim os dos captulos y, en parte, tam bin para los dos sigu ien tes se recom iendan los m an uales de econom etra. n tre los m s conocidos se en cu en tran ovales

, e a

, u jarati

, ooldridge

, reen

, addala

am bin eisten
libros de econ om etra basados en tata. n tre ellos, se encu en tran am eron
y au m

. sim ism o, en focados desde el an lisis m u ltivarian te con abu ndan tes ejem plos, pueden
citarse, entre otros m u cos, air
y ea

9.1.

Nu b e d e p u n t o s, co va r ia n za y co r r e la ci n

l m todo m s in tu itivo para el estu dio de la covariacin en tre dos variables


cu an titativas es el grfico de dispersin o n u be de pu n tos, qu e con siste en u n
eje de coorden adas en el qu e se represen ta la variable x, in depen dien te o tam bin den om in ada predictora, en el eje de abscisas, y se u bica la otra variable
y, depen dien te o resu ltado (ou tcom e), en el eje de orden adas. n el espacio
in terior del grfico se dibu ja u n pu n to por cada caso a u n a distan cia orion tal
proporcion al al valor de la variable x y a u n a distan cia vertical proporcion al al
valor de la variable yo, dico de otro m odo, se trata de dibu jar tan tos pu n tos
com o casos ten ga la distribu cin sobre cada u n a de las dos dim en sion es del
grfico, cu yas proyeccion es equ ivalgan a los valores qu e cada caso tien e en las
dos variables en cu estin . om o ya se eplic en el captu lo dedicado a los grficos, la n u be de pu n tos
o diagram a de dispersin en tre dos variables pu ede
obtenerse m ediante la instruccin scatter seguida de las dos variables que se quieren represen tar. s, con la sigu ien te in stru ccin
scatter tm i p n bpp a, n am e
, repla ce

ta ta r ep r esen ta la n u b e de p u n tos de la s d os va r ia b les se a la d a s,


en este ca so la ta sa de m or ta lid a d in fa n til y el p r od u cto n a cion a l b r u to
per c p ita , con sid er a d a s com o dep en d ien te e in d ep en d ien te, r esp ectiva m en te.
Nu b e d e p u n t o s

Tasa de mortalidad infantil /1000 1998


50
100
150

200

GR F I 9 .1.

10000

20000
30000
PNB por unidad de compra

40000

n este gr fico est n r ep r esen ta d a s d os va r ia b les p a r a los p a ses


d el m u n d o d e los qu e se p oseen a m b os d a tosen el eje or i
on ta l est
ep u esto el p r od u cto n a cion a l b r u to p er c p ita en u n id a d es d e p od er d e
com p r a y en el ver tica l, la ta sa d e m or ta lid a d in fa n til. l r a n go d e la p r im er a se etien d e d esd e los d la r es p er c p ita d e ier r a eon a a sta
los .d e sta d os Un id os, el d e la segu n d a , d esd e los d e on g
on g a sta los cor r esp on d ien tes ta m b in a ier r a eon a . om o
er a lgica m en te d e esp er a r, se p u ed e a p r ecia r qu e los ca sos qu e tien en
m en or es va lor es d e r en ta p oseen ta m b in a lta s ta sa s d e m or ta lid a d .
a r a en ten d er m ejor la r ela cin en tr e la s d os va r ia b les es til d ib u ja r
en el gr fico d os ln ea s d e r efer en cia qu e sea n la s m ed ia s d e la s va r ia b les
r ep r esen ta d a s. sto se logr a ca lcu la n d o en p r im er lu ga r u n a con sta n te
d en om in a d a m acro en la ter m in ologa d e ta ta m ed ia n te la or d en
globa l, p a r a ca d a u n a d e la s m ed ia s, a la s qu e se les d en om in a r con el
n om b r e qu e se d esee. n este ca so se a p r efer id o a cer lo con el m ism o
n om b r e d e la va r ia b le segu id o d e u n a x. con tin u a cin , la con sta n te o
m a cr o se in ser ta en la in str u ccin scatter cu id a n d o d e qu e est p r eced id a
d el sign o .
su m m arie tm i
glob al tm ir
m ea n
su m m arie p n bp pa
glob al p n b pp ar
m ean
sca tter tm i p n bp pa , lin e
p n b pp aylin e
tm in am e
, rep lace

l traar las dos ln eas d e r eferen cia qu e r ep resen tan las m edias d e cada
u n a d e las variab les, resu lta qu e la m ayor a d e los p ases se en cu en tr an o
b ien p or en cim a en m or talidad in fan til, pero por d ebajo en p rod u cto n acion al bru to p er cp ita, o bien por d eb ajo en m or talidad y p or en cim a d e la
m ed ia en ren ta. in em b ar go, au n qu e en m en or n m er o en con ju n to, tam b in ay otro gru po de p ases qu e p oseen b aja m ortalid ad y b ajo p rod u cto
n acion al bru to y slo u n caso qu e se en cu en tra con valor es por en cim a en
las dos var iables con sid er adas.

n los grficos de este captulo y sigu ien tes se an especificado opcion es qu e n o an


sido eplicadas por raon es de espacio en el correspon dien te captu lo de grficos. or la den om in acin de estas opcion es y por su con teto, el lector in teligen te dedu cir in m ediatam en te
su u so. or ejem plo, xline sign ifica dibu jar un a ln ea en el eje x, e ytitle se u sa para pon er u n
ttu lo en el eje y.

Tasa de mortalidad infantil /1000 1998


50
100
150

200

GR F I 9 .. Nu b e d e p u n t o s co n la s e d ia s r e p r e se n t a d a s

Sudfrica

10000

20000
30000
PNB por unidad de compra

40000

Un con cepto clave para la com pren sin de la asociacin en tre dos variables
de tipo cuan titativo es el de covarian a. om o es fcil dedu cir, procede del con cepto de varian a, es decir, del prom edio de las distan cias cu adradas de los valores con respecto a la m edia. n el caso de trabajar con dos variables, en lu gar
de un a, se pu eden calcu lar sen das distan cias con respecto a la m edia, u n a para
e
. a covarian
cada u n a de las variables
xi x
yi y
a es u n prom edio del
produ cto en tre estas dos distancias, y su frm ula adopta la sigu ien te epresin

.
a covariana pu ede adoptar cu alqu ier valor positivo o n egativo. i se divide el grfico en cu atro sectores por las m edias aritm ticas de cada u na de las
variables, es fcil advertir que los produ ctos de las diferen cias en los casos qu e
estn en el cu adran te superior de la dereca
slo u dfrica en este casoan
com o
son positivos. am bin los prode ser positivos, pu es tanto
xi x
yi y
du ctos de las diferen cias de los casos qu e se encuentran en el cu adran te inferior
iqu ierdo
por ejem plo, eorgiason su periores a porqu e am bas diferen cias
en x e y son n egativas. n cam bio, los pun tos o casos qu e se u biquen en los
cu adrantes superior i
quierdo e in ferior dereco gen eran produ ctos n egativos,
pu es u n a de las diferen cias es positiva y la otra n egativa. n este caso, com o la
m ayor parte de los pun tos se encuen tran en cu adran tes con produ ctos n egativos
y, sobre todo, las distan cias de estos a las m edias son bastan te m ayores, el su m atorio, y en con secu en cia la covarian
a, arroja u n valor por debajo de .

ar a ob ten er la covar ian a con el p rogram a tata a d e u tiliarse u n a


op cin d el pr ogr am a qu e ace el clcu lo de la m atr id e corr elacion es. e
este m od o, par a la obten cin d e la covarian a en tre las var iables pm i y
pn bppa, ab r qu e escr ib ir la sigu ien te in stru ccin
correlate tm i pn bp pa , covaria n ce

l r esu ltad o n o slo otor ga la covar ian


a en tr e las d os var iables. am b in p resen ta en la diagon al de la m atrilas varian as d e las dos variab les,
p u esto qu e la covar ian a de u n a var iable con sigo m ism a es igu al a su var ian a.
ILR IN 9 .1.

a t r iz d e va r ia n za s
c o va r ia n za s

( obs =125)
|
t mi
pnbppa
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - t mi |
1493. 36
pnbppa |
- 194352 6. 2e+07

a var ian
a de las tasas de m ortalid ad su p era el m illar y la del p rod u cto
n acion al bru to su per a las d ecen as de m illn . on tan gran d es porqu e estn r eferen ciad as en u n id ades cu adr ticas. a covarian a con u n valor d e
-.sale n egativa, com o se dedu jo d e los raon am ien tos ep u estos m s
ar rib a. esu lta evid en te qu e la in terp retacin de estas can tidades d epen de
d e las u n idades de m edid a qu e em p leem os en cada variable. or ello, es
con ven ien te, par a p od er reali
ar com par acion es, tr an sform ar las variab les
en u n idades tp icas, esto es, con ver tir las en otr as, lin ealm en te depen dien tes,
en fu n cin de u n a fr m u la qu e logra qu e se con viertan en var iables con
m ed ia y desviacin tpica igu al a .

.
i se r ealia esta op eracin tan to sob re la var iable x com o sobr e la var iable y, m edian te la in stru ccin egen y la fu n cin std()

ara reali
ar operacion es repetitivas sobre variables, es til la utili
acin del bu cle for.
u nque ya est descatalogado y su stitu ido en tata por in stru ccion es m s com plejas y com pletas, n o deja de ser til y sen cillo su u so. ras la in struccin se escribe u n a lista de variables
segu idas de dos pu ntos. con tinu acin se escribe otra orden en la qu e la letra m ayscu la
ser reem pla
ada por los n om bres de las variables. n el ejem plo del cu erpo del teto, la
aparece dos veces en la in struccin egen.
n clu so en un a de ellas se escribe precedida de u n a
z, lo qu e perm ite crear n uevas variables con el nom bre de las an tigu as an tecedidas por dica
letra m in scula.

gen era te valid otm i. p n bp pa .


for var tm i p n b pp aegen std
if valid o
scatter
tm i
pnbppa, line
yline
label
-
ylabel
-
nam e
, replace

al aber ap licad o u n a tran sfor m acin lin eal sob re las dos variab les
estu d iadas, el gr fico qu e repr esen ta su relacin qu ed a in alterado en com p ar acin con el an ter ior y ofrece en con secu en cia el sigu ien te asp ecto

Standardized values of (tmi)


0
1
2

GR F I 9 .. Nu b e d e p u n t o s d e la s va r ia b le s e st a n d a r iza d a s

1
2
Standardized values of (pnbppa)

er o, au n qu e el grfico sea sim ilar, las covar ian as son distin tas. on la
m ism a in stru ccin an tes u sada, aplicada a las variab les tr an sform ad as
correla te
tm i
p n bp pa, cova rian ce

la m atride covarian as pr esen tar a el sigu ien te r esu ltad o


ILR IN 9.. a t r iz d e co r r e la cio n e s
( obs =125)
|
zt mi
zpnbppa
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - zt mi |
1
zpnbppa | - . 640543
1

om o p u ede apr eciar se, es la m ism a qu e si se p idier a la m atr ide corr elacion es d e las var iables or igin ales. sto es as p orqu e, m atem ticam en te,
el coeficien te de cor relacin en tr e d os var iables es igu al a la covar ian
a de
estas variab les tipificad as o, ep u esto dir ectam en te en u n a fr m u la, el coeficien te de correlacin se epr esa com o la covar ian a divid id a por las desviacion es tp icas d e am b as variab les

.
a m atrian ter ior p odr a aberse ob ten ido d e m odo m u co m s sim ple
con la in stru ccin correlate aplicada a las var iables or igin ales
correlate tm i pn bp pa

sta in stru ccin a de ofrecer n ecesar iam en te el m ism o resu ltado qu e el


d e las covarian as d e las var iables tipificadas
ILR IN 9 .. a t r iz d e va r ia n za s
co va r ia n za s d e va r ia b le s
e st a n d a r iza d a s
( obs =125)
|
t mi
pnbppa
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - t mi |
1
pnbppa | - . 640543
1

or tan to, desde este pu n to de vista, p u ed e en ten der se el coeficien te d e


corr elacin com o la covarian a d e dos var iables tipificadas, de m od o tal qu e
vara en tre , en el caso de qu e am b as var iables sean igu ales, y -, en el caso
d e qu e ten gan los m ism os valores tip ificados, p er o de distin to sign o.

9 .. R e gr e si n sip le
eali
ar u n a r egr esin sim p le con siste en bu scar u n a ln ea qu e pase lo m s
cerca posible de los pu n tos qu e r eflejan la distribu cin con ju n ta d e dos var iables. l m od elo m s sim p le de ln ea qu e pu ede en con trar se es u n a r ecta.
on n ocion es b sicas de lgebr a, se sabe qu e u n a ln ea r ecta p u ed e rep resen tar se m atem ticam en te a travs d e u n a ecu acin .

n esta ecu acin slo resu lta d e m om en to con ocid o xi, qu e repr esen ta
los valores d e la variable predictor, en este caso, el pr odu cto n acion al b ru to
p er cpita.
yi son los valores tericos
por eso, el acen to cir cu n flejoqu e d eb er a ten er el resu ltado o variab le depen dien te
por eso, y
, si esta sigu iera
fielm en te el m od elo de la r ecta. b 0 es la con stan te d e la regresin , o pu n to
d on d e la recta corta el eje de ab scisas
el vertical
. b 1 es otr a con stan te, qu e
r efleja la in clin acin d e la r ecta
su tan gen teo, dico de otro m odo, el cam b io qu e se p rod u ce en la var iable depen dien te cu an do en la in depen dien te
se pr od u ce el au m en to de u n a u n id ad.

GR F I 9 .. R e p r e se n t a ci n a t e t ica y ge o t r ica d e u n a r e ct a

b0

b1xi

1 2xi

y
x

b1

b0
0

n este grfico se represen ta el m odelo lin eal, en el qu e la variable x est


epu esta en el eje orion tal, la y en el vertical y en el espacio en tre ellas se a
dibu jado u n a recta, represen tada en la ecu acin
yixi, qu e n ace en el pu n to
del eje de orden adas (b 0), con u n a pen dien te igu al a (b 1), es decir, qu e la
variable y in crem en ta esta can tidad por cada in crem en to de u n a u n idad en x,
en este caso, cu an do el valor de x crece u n pu n to, la variable y su be dos.
tr o ejem plo de obten cin d e esta r elacin lin eal de d os var iables se
ofr ece a con tin u acin u tilian do el pr ogr am a tata. e va a adoptar com o
variab le p redictor a la var iable tip ificad a del pr od u cto n acion al p er cpita
(zpn bppa) y a partir d e ella se va a gen erar u n a n u eva var iable, la
yi, d esign ada en el pr ogr am a com o tztm i
la t p ar a aclarar qu e se trata d e valor es
tericos y la z para in dicar qu e se tr ata d e valor es tipificad osasu m ien d o
qu e b o sea igu al a y b 1 igu al al coeficien te d e corr elacin
-,

gen era te ttm i-.


p n bp pa

Un a vecr ead a la n u eva var iable, se con str u ye el gr fico a adien do u n a


ser ie d e opcion es a la ord en scatter par a obten er la ln ea d el m odelo d e la
r egr esin
sca tter ttm i tm i
p n b pp a if valido, con n ect
l im sym bol
i

lin e
ylin e
sort

p n bp pan am e
, repla ce

e este m odo se obtien e el sigu ien te grfico, d on d e, ad em s de los p u n tos qu e rep resen tan a los p ases, aparece u n a recta qu e r ep resen ta el m od elo. om o clar am en te se ve, ay u n a d iscrepan cia en tr e la r ealid ad
los p u n tosy el m odelo
la recta
. ad a u n a d e las d iscrepan cias, corr esp on dien te a
u n caso, r ecibe el n om br e de residu o, qu e se ob tien e m edian te la su straccin
d e los valores tericos a los reales

GR F I 9.. N u b e d e p u n t o s y r e ct a e st ia d a d e va r ia b le s e st a n d a r iza d a s

1
Standardized values of (pnbppa)

tztmi

Standardized values of (tmi)

ara qu e la ln ea solicitada en con n ect


lse presen te sin discontin uidades, es preciso qu e los datos estn ordenados por la variable in depen diente. edian te la opcin grfica
sort
variablepu ede reali
arse esta operacin slo tem poralm en te para producir el grfico.
om o es tan larga la in stru ccin grfica, se a dividido en distintas ln eas m edian te

. ste
procedim ien to es vlido en tata slo si la orden est locali
ada en u n program a. o fu n cion a
si se in trodu ce desde la ventana interactiva de in struccion es. ara que lo aga, an de om itirse
las tres barras.

dem s d e la s r ecta s or togon a les a los ejes qu e r ep r esen ta n la s r espec


tiva s m ed ia s d e x e y, tod a s la s r ecta s qu e p a sa n p or el p u n to
x, ytien en
u n a cu r iosa p r op ied a d , qu e es la d e qu e la su m a d e la s dista n cia s d e los
pu n tos a esta s recta s tr a
a da s, es d ecir, el su m a tor io d e los r esidu os, es
igu a l a . sto es evid en te en el ca so d e la s r ecta s or togon a les cor resp on dien tes a la s m ed ia s d e ca d a u n a d e la s va r ia b lesen el ca so d e la r ecta
ver tica l
m ed ia d e x
, la s d ista n cia s d e los p u n tos a la r ecta se pu ed en

ep r esa r con la d ifer en cia en tr e


x i x
y u n a de la s pr opied a d es d e la
m ed ia es qu e el su m a tor io d e esta s difer en cia s es igu a l a . or otr o la d o,
la a plica cin d e esta p r op ieda d a la r ecta or i
on ta l
m edia d e yta m b in
es evid en te, p u es la s dista n cia s d e los pu n tos a ella vien en in d ica d a s p or

la ep resin
yi y
, qu e p or eten sin tien e ta m bin la s m ism a s p r op ieda des qu e x.
n la r egr esin basada en el criter io d e m n im os cu adrados se preten d e
n o slo qu e la su m a de r esidu os sea igu al a , ya qu e esta p rop iedad la cu m
p len in fin itas rectas, esto es, todas las qu e p asan por el pu n to
x, y
, sin o, sob re tod o, en con tr ar la r ecta en la qu e sea m n im a la su m a d e las d istan cias
al cu ad rad o de su s pu n tos con respecto a los p u n tos em p r icos, esto es, en la
qu e la su m a d e los resid u os elevados al cu adr ad o sea la m en or posible.

.
a in stru ccin del program a que perm ite obtener los parm etros b o y b 1
correspondien tes a la recta obten ida con el criterio de m n im os cu adrados
ordin arios es regress. u sin tais m s sim ple se com pon e de la orden seguida
por la variable depen dien te
resultadoy la independien te
predictora
, en este
orden
r e gr e ss vard ep varin dep

om o pr im er ejem plo se va a reali


ar la r egr esin d e las dos variab les
tipificad as corr esp on dien tes a tasa d e m ortalidad in fan til y pr od u cto n acion al b ru to p er cp ita
regress tm i pn bp pa

l resu ltado de esta in stru ccin es el sigu ien te

ILR IN 9.. R e gr e si n d e la s va r ia b le s e st a n d a r iza d a s

el con ju n to d el r esu lta d o se a n r esa lta d o la s d os ca n tid a d es qu e


r esp ectiva m en te r ep r esen ta n los coeficien tes d e la r egr esin . l p r im er o,
el cor r esp on d ien te a la ln ea d e la va r ia b le p r ed ictor a (zpn bppa), es la
p en d ien te d e la r ecta d ib u ja d a en el gr fico .. om o p u ed e a p r ecia r se,
es id n tica a l coeficien te d e cor r ela cin , p or el eco d e a b er em p lea d o la s va r ia b les tip ifica d a s. im p lica qu e u n ca m b io en u n a d esvia cin
tp ica d el p r od u cto n a cion a l b r u to d e u n p a s se tr a d u ce en u n a d ism in u cin d e seis d cim a s d e la d esvia cin tp ica en la ta sa d e m or ta lid a d .
n la m ism a colu m n a , p er o en la ln ea sigu ien te, se en cu en tr a el va lor
cor r esp on d ien te a la con sta n te o b 0. ste es p r ctica m en te igu a l a slo
p r ob lem a s d e p r ecisin a cen qu e el va lor n o sea ea cta m en te n u lo, sin o
con n u eve cifr a s d ecim a les. l eco d e qu e la con sta n te sea es p or
esta r a m b a s va r ia b les tip ifica d a s, es d ecir, p or qu e a m b a s tien en m ed ia
n u la y la r ecta d e r egr esin b a sa d a en los m n im os cu a d r a d os a d e p a sa r
n ecesa r ia m en te p or ese p u n to. u a n d o u n a va r ia b le in d ep en d ien te tip ifica d a a d op ta el va lor , la d ep en d ien te, ta m b in tip ifica d a , a d e ten er el
va lor n u lo.
u pasara si se iciera la r egr esin con las variab les origin alesase ap lican do la in stru ccin con los n om b res qu e estas d os var iables ten an
or igin alm en te en el ficero, esto es, tm i y pn bppa.
regress tm i pn b pp a

partir d e lo cu al la regresin resu ltan te es la sigu ien te

ILR IN 9.. R e gr e si n d e la s va r ia b le s o r igin a le s

n este caso, los coeficien tes sa len com p letam en te distin tosel cor respon dien te a la va r ia ble dep en d ien te pa sa a ser d e -,, pu esto qu e seg n la n u eva r ecta en con tra da ca d a d la r qu e u n pa s a u m en ta en su
pr od u cto n a cion a l b ru to im p lica u n a r edu ccin en m illon sim a s en su
ta sa d e m or ta lida d in fa n til. el va lor ,d e la con sta n te sign ifica qu e
en el im p osible caso de qu e u n pa s tu vier a u n a pr odu ccin n u la , igu a l a
dla res per c pita , la ta sa de m or ta lida d in fa n til pr ed ica p or la r ecta
ser a del .
m o se podr an ob ten er con tata los valor es pr ed icos p or este m od eloay dos frm u las. n tr e las in str u ccion es con ocidas, la m s con ven ien te es gen erate, tal com o se io an ter iorm en te con las dos variab les tip ificad as, au n qu e en este caso aya qu e em plear los dos coeficien tes, p u esto
qu e la con stan te (b 0) n o es igu al a
gen era te ttm ib.-.
p n bp pa

er o ay u n a in str u ccin m s d ir ecta en la qu e n o ay qu e tr an scr ibir


n in g n n m ero, n i con stan te, con tal de r ealiarla tr as la in str u ccin regress
corr esp on dien te. e trata d e la ord en predict segu ida del n om br e de la variab le p redica qu e se crear con los p ar m etros de la regresin y los valor es
d ispon ib les de la variable in depen d ien te
p r e d ict varn u eva

n r ea lid a d , u n ca m b io en la va r ia b le in d epen d ien te p r ovoca u n a d ism in u cin en


m ilsim a s de la s va r ia b le d ep en d ien te, p er o com o esta est ep r esa d a en la m a tr id e
da tos en ta n tos p or m il, la s tr es m ilsim a s se con vier ten en m illon sim a s.

am bin ay otra solucin in directa. e trata de utili


ar las estim acion es qu e se qu edan
gu ardadas despu s de cu alquier anlisis estadstico. os coeficien tes de las regresion es en tata se con servan con este form ato b
n om bre
. e este m odo, podra predecirse la ttm i con la
siguiente epresinb

cons

b
pn bppa

pnbppa.

partir d e este m om en to ya se p u ed e trabajar con esta n u eva var iable


en cu alqu ier in stru ccin , com o pu ede ser scatter
p red ict ttm i
sca tter ttm i tm i p n bp pa if va lid o, con n ect
l im sym b ol
i

lin e
pn b pp aylin e
tm isort
p n bp pan am e
, rep lace

qu e gen era el grfico sigu ien te

50

50

100

150

GR F I 9.. Nu b e d e p u n t o s y r e ct a e st ia d a d e va r ia b le s o r igin a le s

10000
20000
PNB por unidad de compra
Fitted values

30000

Tasa de mortalidad infantil /1000 1998

u ed e apr eciar se qu e el gr fico .y el efectu ad o con los valores tp icos


d e am b as variab les
grfico .son id n ticos salvo en las escalas, pu esto
qu e cu an do se tipifica u n a var iable su s r elacion es lin eales con otras var iab les qu edan in alter adas, pu es esta tr an sform acin slo pr odu ce u n cam bio
p rop or cion al en su s valor es.

9 .. o n d a d d e l a
u st e d e la r e gr e s i n
e acab a de ob ten er la recta
el m odelo lin ealqu e m ejor se aju sta a los
valor es em p r icos d e la d istrib u cin d e d os variab les. er o el m ejor n o n ecesar iam en te qu iere decir qu e sea bu en o. ar a m ed ir la bon d ad d el m odelo se
u tilian dos m ed idasu n a ab solu ta y otr a r elativa.
a m edida ab solu ta p ara evalu ar u n a r egr esin es el er ror tp ico d e la
r egr esin o desviacin tpica de los resid u ales. n el fon d o es u n p rom ed io

cu ad rtico d e los resid u os de la r egr esin , es d ecir, la r acu adr ada de la


m edia ar itm tica de los cu adr ad os d e d icos valor es

.
n la r egr esin d e la tasa de m ortalid ad con el p rodu cto n acion al br u to
p er cpita, el valor obten id o (Root ,) es ,. sto qu ier e d ecir qu e,
u tili
an do la segu n da d e las variables, p u ede pr ed ecir se la pr im era con u n
err or por tr m in o m edio del , , epr esad o en tan tos p or m il, por cu an to las u n id ad es de la var iable d ep en d ien te estn m edid as d e esta form a.
tam b in pu ede con sid er arse com o u n a m ed id a de la d esviacin d e las
p rediccion es, d e m odo qu e podr a pen sar se qu e u n a gr an m ayora de los
valor es observados d e la var iable d ep en d ien te estaran com pr en d idos en el
r an go s e en tor n o a los valores pr ed icos. n el ejem plo actu al el ran go
apr oim ad o estara cifr ado en , u n a cifr a n ada desde ab le, com o se
apr ecia al p en sar sob re ello.
s evid en te qu e esta m ed id a de aju ste estar m u y d eter m in ada por las
u n id ad es qu e se em pleen en la var iable d epen dien te y, en con secu en cia, si,
en lu gar de aber m edido la tasa de m or talidad en tan tos p or m il, se u bier a eco en tan tos p or cien , el valor d e e ab ra cam b iado. or eso, y par a
p od er com par ar las regresion es efectu adas en tre variab les m u y d iferen tes,
es m u y til el em pleo d e m edidas relativas d e aju ste. Un a d e las p ropied ades
qu e estas an de ten er es u n con ocim ien to pr eciso d e su s lm ites, con el fin
d e saber el gr ad o de aju ste qu e tien e la r ecta allada.
a m edida de aju ste relativo m s em plea da en la r egr esin es el R o
coeficien te de determ in acin . n rea lida d, n o es m s qu e el coeficien te
de cor relacin a l cu a dr ad o, pero se p u ede in terp reta r m ejor sa bien d o qu e
es el cocien te en tr e dos su m a s cu a dr tica sla cor respon dien te a la r egr esin y la cor r esp on d ien te a la va r ia ble d ep en d ien te.

n m n im os cuadrados ordinarios, se divide por n m en os el n m ero de parm etros de


la regresin () para obtener el estim ador in sesgado de s e.

tata calcu la e com o si los datos procedieran de u n a m u estra. or ello, en lu gar de dividir por n , lo ace por los grados de libertad
n-
, de a qu e, cu an do se ten ga un bajo n m ero
de casos, pu eda aber u n a divergencia im portan te en el resu ltado en tre esta frm u la y la qu e
u tili
a el program a estadstico.

a su m a cu adrtica total se defin e com o la su m a de las distan cias al


cu adr ad o d e los n valor es de la variab le d epen dien te con r especto a la m edia
ar itm tica

.
n cam bio, la su m a cu adrtica de la regresin es la su m a de las d istan cias al cu ad rado de los n valores p redicos p or la regresin con r esp ecto a
la m edia aritm tica

.
a r esta de am bas su m as cu ad rticas es la ya con ocid a com o su m a d e
los resid u os al cu ad rado, o su m a cu adrtica residu al
.
, su m a d e la difer en cia al cu ad rado en tr e valor es reales y p redicos, qu e por el criterio
d e m n im os cu adr ad os or din ar ios a de ser la m en or p osible con los d atos
d isp on ibles.

.
or tan to, en tr e ellas se estab lece la sigu ien te igu aldad

.
u esto qu e la s su m a s cu a d r tica s slo p u ed en ser p ositiva s, el va lor
d e la d e la r egr esin a d e ten er com o lm ite su p er ior el va lor d e la
tota l, en el su p u esto d e qu e tod os los va lor es em p r icos se en con tr a r a n sob r e la ln ea r ecta d el m od elo. a d a esta situ a cin , el va lor d e R
ser a igu a l a . n ca m b io, si la d e la r egr esin fu er a igu a l a , esto
es, tod os los va lor es p r ed icos p or la r ecta fu er a n igu a l a la m ed ia d e la
va r ia b le d ep en d ien te, en este ca so R ser a igu a l a . m b os, y , son
los lm ites en tr e los qu e se m u eve este coeficien te d en om in a d o d e d eterm in a cin .

GR F I 9.. Gr
ico d e la d e sco p o sici n d e la va r ia n za e n la r e gr e si n

(y y ) (y y )
i

y
i

(y y)
y

y
i

y
i

tr o m od o d e con ceb ir esta particin d e la var ian


a total de la var iable
d ep en d ien te es de m od o grfico. n el grfico .se an repr esen tad o m ed ian te d os ln eas ver ticales dos d istan cias d esde u n valor em pr ico asta la
r ecta ori
on tal de las m edias. a d e la der eca aparece com p leta, en tan to
qu e la de la iqu ierd a qu eda divid id a en dos fr agm en tosel qu e va d esd e el
p u n to em p r ico asta la recta d e la regresin y el qu e va d esd e esta asta la
r ecta orion tal de las m edias.
n el ejem plo del an ter ior a pa r ta do
ilu str acin .
, la su m a cu a d ra da d e la va ria b le d ep en d ien te a scien d e a .y se descom pon e en la
debid a a la regresin
odel .y en la qu e n o se pu ede eplicar la
regresin , esto es, la resid u al
Residu al .
. or tan to, el R tien e
el valor de ,, qu e pu ede ser in terp reta do d icien do qu e el d e la varia cin de la va r ia ble r esu lta d o es eplica do por su regresin lin ea l con su
pr ed ictor. s con creta m en te, en este m odelo, el de la va r ia cin total
de la m orta lid a d in fa n til se p u ed e eplica r con el p rodu cto n a cion a l br u to
per c pita.
ste R d ep en d e del n m ero de var iables in trod u cid as en la regresin .
or ello, se em plea u n aju ste, al qu e se r econ oce com o R a, tan to m ayor
cu an toam en or sea el R origin al, y bm ayor sea el n m ero d e var iables
en r elacin con el n m ero de casos. ar a su clcu lo, al coeficien te de deter m in acin or igin al ay qu e r estar le el p rodu cto d el com p lem en to del R

-R y del cocien te en tre el n m er o de parm etr os () m en os


esto es, el n m er o de variab les, p or con sid er ar la con stan te com o u n p arm etr oy el
n m er o d e casos m en os el d e p ar m etros

.
n el ejem p lo con tem p lado
-R es igu al a ,y el cocien te variab les
casos
. l p rod u cto de am bos es tan bajo qu e el R origin al apen as se
r edu ce m ilsim as.

9 .. In
e r e n cia s e n la r e gr e si n sip le
e la ilu str acin .tan slo se a ep licad o la in ter pr etacin d e los p ar m etros b 0, b 1 , las su m as cu adr ticas y el coeficien te d e deter m in acin , p u es
el r esto tien e relacin con in fer en cias estad sticas cu ya d ificu ltad im p lica
qu e se le d ed iqu e especficam en te este apar tado. dem s, asta el m om en to
los estad sticos con tem plados se an calcu lado en y p ar a la m u estra ob ten id a. in em b argo, es com n en estadstica etrapolar los datos ob ten idos en
la m u estr a a la p oblacin d e la qu e pr oced en . n regresin p asa lo m ism o,
los clcu los qu e se ob tien en pr oceden gen eralm en te de u n a m u estra y p ar a
traslad arlos a la p oblacin ay qu e ten er en cu en ta las leyes d e la in fer en cia
estad stica.
n te tod o, es p reciso con ver tir la ecu acin m u estral de la r egr esin a su
ep resin pob lacion al

.
n el captu lo relacion ad o con las com p aracion es se in tr odu jo el con cepto d e pr u eba estad stica y cm o se pr ocede par a en u n ciar iptesis estad sticas n u las y alter n ativas. de la m ism a form a qu e pu eden realiarse
p ru ebas d e sign ificacin con m ed ias, pr opor cion es, m ed ian as, varian as,
tam bin pu eden efectu arse con los par m etros de la r egr esin , en cu yo caso
se an d e form u lar del sigu ien te m od o

stad sticam en te, se sabe qu e, siem p re y cu an do se cu m plan u n a serie


d e su pu estos qu e se ver n d eten idam en te en el p rim o captu lo, la d istr ib u cin m u estr al del estadstico b 0 es t-tu den t con (n -gr ados de libertad,
m edia b y d esviacin tp ica

.
or su p arte, en relacin con el com p ortam ien to d el estadstico b 0, tam b in con los m ism os su pu estos, su d istr ibu cin m u estr al es t-tu d en t con
(n -gr ad os d e lib er tad , m ed ia b, pero con esta otr a d esviacin tp ica

.
or a bien , m s im por tan te en este con teto qu e las frm u las es la in ter pr etacin y u so d e estos er ror es tpicos. ar a ep licarlo, es con ven ien te
volver al resu ltado an terior d e la regresin d e la tasa de m or talidad in fan til
con el pr od u cto b ru to n acion al per cpita
ILR IN 9.. R e gr e si n sip le
Sour c e |
SS
df
MS
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - Model |
75976. 9095
1 75976. 9095
Res i dual |
109199. 139
123 887. 797874
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - Tot al |
185176. 048
124 1493. 35523

Number of obs
F( 1,
123)
Pr ob > F
R- s quar ed
Adj R- s quar ed
Root MSE

=
=
=
=
=
=

125
85. 58
0. 0000
0. 4103
0. 4055
29. 796

-----------------------------------------------------------------------------t mi |
Coef .
St d. Er r .
t
P>| t |
[ 95% Conf . I nt er val ]
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - pnbppa |
- . 0031526
. 0003408
- 9. 25
0. 000
- . 0038272
- . 002478
_cons |
65. 15607
3. 604551
18. 08
0. 000
58. 02108
72. 29106
------------------------------------------------------------------------------

l err or tpico se u tili


a p ar a la p ru eba d e iptesis. i el coeficien te b 0
o el b 1 son divid idos p or su err or tpico, se obtien e su valor tp ico en la distr ib u cin m u estr al (t), del qu e sabien d o qu e adopta la for m a d e d istrib u cin
d e la t d e tu d en t pu ede obten erse su pr obabilidad
p
t

. esd e el pu n to d e
vista pr ctico, en tan to se cu m p lan los su pu estos eplicad os m s adelan te,
si la p rob ab ilidad es m en or del o d el , seg n sea el n ivel de sign ificacin ad optad o, se p u ed e r eca
ar la iptesis n u la sob re el coeficien te.

tr o m od o de plan tear lo m ism o es a travs de los in tervalos de con fian a, qu e se obtien en con las sigu ien tes operacion es

.
sien d o t c el valor cr tico de d os colas de la distrib u cin t de tu d en t
con el n ivel de con fian
a igu al a c y n -gr ados de libertad .
n el ejem plo de la ilu str acin p reced en te los valores de los in tervalos se
ob ten dr an con las sigu ien tes operacion es

.
om o en am b os casos los dos lm ites d el in tervalo tien en el m ism o sign o

p ositivo p ar a b 0 y n egativo p ara b 1 ), la ip tesis n u la pu ede ser r ecaad a


con u n de n ivel d e con fian a
el com plem en tar io d el ,, com o n ivel
d e sign ificacin
. lo cu an do u n lm ite es n egativo y el otr o p ositivo, n o es
p osible r eca
ar la ip tesis n u la, ya qu e el valor se en con trar a den tr o
d el in ter valo con estas ltim as car acter sticas en u n ciadas.
Un a alter n ativa al test de tu den t para los coeficien tes de la regresin es
la pr u eb a de ald, qu e p er m ite com pr obar m s de u n coeficien te al m ism o
tiem po. a iptesis n u la se con vertir a d e este m odo en esta fr m u la

.
n la regresin sim ple la pr u eb a de ald n o es m u y im por tan te, ya qu e
slo eisten d os coeficien tes
la con stan te y el corr esp on dien te al pred ictor
,
cu ya com paracin n o tien e sen tid o p or ser de tan diferen te in terp retacin .
tata perm ite el em pleo del test de ald a travs de la in stru ccin test, en la
qu e deben especificarse las variables cu yas iptesis qu ieren com probarse, ju n to con el valor, en el caso de qu e se qu ieran com probar valores distin tos de .
en se dos ejem plos de esta in stru ccin . n p rim er lu gar, si se qu ier e
acer la ip tesis de qu e tan to la con stan te com o el coeficien te son n u los.
n cu yo caso
test con s p n bp pa

p resen ta el sigu ien te r esu ltad o


ILR IN 9.. r u e b a d e ip t e sis so b r e lo s p a r e t r o s d e la r e gr e si n
( 1)
( 2)

_c ons = 0
pnbppa = 0
F(

2,
123) =
Pr ob > F =

171. 17
0. 0000

on de es obvio qu e se p u ede r ecaar la iptesis n u la d e qu e am b os


coeficien tes son igu ales a .
sta m ism a in str u ccin p erm ite pr u eb as en las qu e la igu ald ad sea in icialm en te d istin ta d e . s, si se qu ier e p rob ar la ip tesis d e qu e el coeficien te corr espon dien te al pr od u cto n acion al b ru to per cpita es igu al a
-,, se escr ib ira la sigu ien te in stru ccin
test pn b pp a .

n cu yo caso, el resu ltado sera el sigu ien te


ILR IN 9.. r u e b a d e ip t e sis e sp e c
ica d e u n p a r e t r o
d e la r e gr e si n
( 1)

pnbppa = - . 003
F(

1,
123) =
Pr ob > F =

0. 20
0. 6551

bvio es en esta ocasin qu e n o pu ede r eca


ar se la iptesis pr op u esta, p u esto qu e la pr obabilidad d el estadstico es dem asiado alta com o para
arr iesgar se a acer lo.
tr o estadstico de sign ificacin en la r egr esin es el cocien te . ste se
obtien e d ividien d o la m ed ia cu ad rtica de la regresin y la r esidu al, ob ten id as a su veal d ivid ir p or su s cor respon d ien tes gr ados d e lib ertad las su m as
cu ad rticas ya eplicadas an ter iorm en te. n el caso de la var iacin de la
r egr esin (odel), su s gr ados de liber tad son igu al al n m ero de p ar m etr os m en os , y en el caso d e la residu al, los gr ados de libertad se ob tien en
r estan d o al n m er o de casos el n m er o d e p arm etr os. s, las fr m u las

l caso m s com n podra ser la iptesis de qu e el coeficiente de regresin es igu al a


la un idad, qu e equ ivaldra a decir qu e la variable in depen diente tien e u n efecto directo sobre
la dependien te de igu al m agn itu d. or ejem plo, cada a o de estu dios del padre o la m adre
im plica un a o de estu dio en su ija o ijo.

com p letas d e las m edias cu ad rticas qu edar an com o sigu e. n el caso de la


d el m od elo ad optar a la sigu ien te ep resin

.
n el d e la residu al respon d er a a esta otr a

.
con el cocien te de am bas m edias cu adrticas se obtien e el estadstico F

.
e sab e qu e este n u evo estadstico tien e u n a distr ibu cin de n ed ecor
con (-1) y (n -) gr ad os d e lib er tad , a par tir de la cu al pu ede calcu larse la
p rob ab ilidad d e qu e se d este valor o u n o m ayor.
a ip tesis n u la con la qu e se trabaja en este caso es la d e qu e el par m etro es igu al a . s sim ilar a la qu e se form u laba an ter iorm en te con la
d istr ib u cin de tu den t. e eco, en la regresin sim p le se d a la sigu ien te
r elacin en tr e am b os estad sticos d e sign ificacin

.
n con secu en cia lgica, siem pr e qu e sea sign ificativo el coeficien te b 1,
tam bin lo ser la r egr esin en la qu e est in clu ido.

9 .. R e gr e si n lt ip le
dem s de la con stan te y u n a var iable in depen dien te, en la regresin pu ed en in trod u cir se otr as variab les con u n a d oble fin alidadla d e m ejor ar la
p rediccin d e la variab le d ep en d ien te y la d e con tr olar la in flu en cia qu e
sob re ella tien en el r esto d e las var iables in clu id as en la regresin .

os valores tericos o esperad os del m od elo r esp on den en este caso a la


sigu ien te ecu acin

.
sien d o el n m ero d e var iables in depen d ien tes.
ar a obten er u n a r egr esin m ltip le con el pr ogr am a tata b asta con
a adir a con tin u acin de la pr im era variab le in dep en d ien te tan tas com o
se d eseen in tr odu cir, con la lim itacin d e qu e n o pu eden in clu irse m s del
n m ero de casos d e qu e se dispon ga.
or tan to, a la regresin an ter ior p od ra a adr sele u n a n u eva variab le y,
d e este m od o, la r egr esin aju sta el p lan o qu e pasa lo m s cer ca posib le de
los p u n tos qu e se alan en u n plan o tr id im en sion al, d os de cu yas dim en sion es son las var iables in d ep en d ien tes y la tercera es la var iable d ep en d ien te.
n este caso, adem s del p rod u cto in ter ior br u to, se in tr od u ce en la r egr esin el por cen taje de este qu e es d eb id o al sector agr cola, con la su posicin
d e qu e los pases en los qu e tien e m s peso el pr im er sector poseen u n a tasa
d e m or talidad in fan til su p er ior.
regress tm i pn bp pa piba g

l for m ato d e la salida es idn tico al de la r egr esin sim ple. o n ico
qu e lo diferen cia es la adicin de u n a ln ea corr esp on dien te a u n a var iable
con el valor de su coeficien te, er ror tpico, sign ificacin e in tervalos d e con fian a.
ILR IN 9.9 .

R e gr e si n lt ip le

Sour c e |
SS
df
MS
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - Model |
102524. 348
2
51262. 174
Res i dual |
82651. 70
122 677. 472951
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - Tot al |
185176. 048
124 1493. 35523

Number of obs
F( 2,
122)
Pr ob > F
R- s quar ed
Adj R- s quar ed
Root MSE

=
=
=
=
=
=

125
75. 67
0. 0000
0. 5537
0. 5463
26. 028

-----------------------------------------------------------------------------t mi |
Coef .
St d. Er r .
t
P>| t |
[ 95% Conf . I nt er val ]
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - pnbppa |
- . 0015201
. 0003958
- 3. 84
0. 000
- . 0023036
- . 0007366
pi bag |
1. 323406
. 2114112
6. 26
0. 000
. 9048969
1. 741916
_cons |
29. 5263
6. 504691
4. 54
0. 000
16. 64962
42. 40299
------------------------------------------------------------------------------

s d e ad ver tir, sin em b ar go, qu e, a pesar d e qu e el for m ato es el m ism o,


m u cos datos an cam biad o. ar a com p ren der m ejor la r egr esin m ltiple,

es con ven ien te fijarse en estos cam bios, p er o p reviam en te es p reciso r eparar
en lo qu e perm an ece in alterado.
u ed e ver se tam bin cm o lo n ico qu e n o cam b ia, ad em s del n m er o
d e casos , es la su m a y m ed ia cu adr ticas de la var iacin total. so es as
p or u n a r a
n m u y sen cilla, la variab le resu ltado n o cam bia y, por tan to, la
su m a de las d esviacion es d e los valor es de esta var iable con r esp ecto a su
m ed ia es con stan te cu alqu ier a qu e sea el n m ero de variab les in depen d ien tes qu e se in trodu can en el m odelo .
n cam bio, son difer en tes la s su m a s cu a dr tica s d e la r egr esin y la
r esidu a l. s obvio qu e cu a n ta s m s var ia bles in corpor em os a u n a r egr esin , el a ju ste ser ta n to m a yor, y slo en el ca so de in trod u cir u n a var ia b le n a d a r eleva n te pa ra la depen dien te, el valor d e la su m a cu a dr tica d e
la regresin sera igu a l al a n terior sin la n u eva va r ia ble in tr od u cida . la
in versa , la su m a de r esidu os a l cu ad ra do se ir acien do ca da vem s p equ e a a m edid a qu e se va ya n in trodu cien do m s va ria b les in dep en d ien tes
r eleva n tes.
os gr ados d e libertad sigu en la ten d en cia op u esta. or cada var iable
in trod u cida en la regresin , los grados d e lib er tad d e su su m a cu adr tica
au m en tan en u n a u n id ad , m ien tr as qu e los d e la resid u al dism in u ir n en u n
p u n to por p arm etr o calcu lab le.
l ca m b ia r tan to la s su m a s cu a dr ticas d e la r egr esin y de los resid u os com o su s r espectivos gra d os de libertad , es obvio qu e tam bin a n
d e ca m b ia r la s m edia s cu a dr tica s y los esta dsticos y R , qu e de ellos
se der iva n p or c lcu lo, com o es ob vio a l ea m in a r la s fr m u las
.y

.
. stos d os ltim os son m ayor es a m ed ida qu e el m odelo in cor pora
m s var ia bles.
ecu rd ese qu e R es el coeficien te d e deter m in acin y epr esa el porcen taje d e la var ian
a d e la variab le d epen dien te qu e es eplicado p or el
con ju n to d e in d ep en dien tes, m ien tr as qu e es u n estadstico d e sign ificacin qu e es cap ad e com p rob ar sim u ltn eam en te la ip tesis d e qu e tod os
los coeficien tes de la r egr esin sean igu al a , es d ecir, pr u eba la certidu m b re de qu e sea cier ta la sigu ien te r elacin

n la m ayor parte de las ocasion es tam bin cam bia el n m ero de casos. n gen eral,
siem pre que las n u evas variables in corporadas posean casos perdidos en tre sujetos con valores
vlidos en las variables de m odelos m s sim ples, el n m ero de casos ser inferior en tan tos
enteros com o casos perdidos con esas caractersticas aya.

odra ocu rrir, sin em bargo, qu e el n m ero de casos en la regresin descendiera al incluir m s variables in depen dientes que con tribu yeran a dism in uir el tam a o m u estral. n estos
casos descendera necesariam en te la su m a cu adrtica total.

n el ejem plo pr esen te, el R es igu al a ,. om p arado con el d e la


r egr esin sim ple, qu e er a igu al a ,, se a pr odu cido u n in cr em en to de
p u n tos en la eplicacin de la var iable d ep en dien te al in tr odu cir la segu n da
in d ep en d ien te. recisam en te la r acu ad rada d e esta d ifer en cia es lo qu e se
d en om in a coeficien te p arte de cor relacin . or otr o lado, se pu ede recaar
con tr an qu ilid ad la ip tesis d e qu e todos los coeficien tes d e las var iables
in d ep en d ien tes son n u los, es decir, igu al a , p u esto qu e el valor de la F es
m u y alto
,y, por tan to, es m u y im pr obable.
n cam bio, los par m etros o coeficien tes y su s corr espon dien tes er ror es
tpicos cam bian su valor, n o siem p re en la m ism a d ireccin , a m edid a qu e
se in trodu cen n u evas variab les en la r egr esin . n algu n os casos, el coeficien te se ace m ayor y, en otros, se ace m en or. odo d ep en d e de la especial
p au ta d e r elacin qu e ten ga el con ju n to d e las variab les pr edictor as.
n el caso del ejem plo pr esen te, a de record ar se qu e la ecu acin lin eal
d el m odelo sim ple d e r egr esin es

.
s decir, la m ortalid ad in fan til es in icialm en te de , en u n su p u esto p as cu yo p rod u cto in terior per cpita fu er a n u lo, y p or cada dlar qu e
au m en ta el
, esa cifr a dism in u ye en m ilsim as.
in em bargo, al in trodu cir la var iable porcen taje d el p rod u cto in terior
b ru to atr ibu id o a la agricu ltu r a, la ecu acin cam b ia a la sigu ien te

.
n este caso, u n pas sin
n i pr od u cto agr ar io ten dr a u n a m ortalid ad
in fan til p rom ed io del , , y por cada d lar d e au m en to en el p rod u cto
in ter ior b ru to bajara la tasa de m or talidad m ilsim as y, en con dicion es
igu ales d e ren ta, p or cada p u n to qu e su b iera el por cen taje del pr od u cto agr cola, la tasa de m or talidad in fan til su b ir a u n , .
os asp ectos son su ficien tem en te im por tan tes a la or a de in terp retar
estos coeficien tes
. o p rim er o es qu e el valor d el coeficien te depen de d e las u n id ad es
en las qu e estn m edid as pr in cipalm en te las variab les p red ictoras,
pero tam bin de la variab le resu ltado, au n qu e esta sea m en os tr ascen d en te, por qu e es n ica, en tan to qu e los coeficien tes d e cad a variab le in d ep en d ien te se refier en a u n id ad es d istin tas en tr e s.
ara solucionar este problem a se puede recurrir a la estan dari
acin de los coeficientes, operacin qu e puede plantearse de dos form as,
que dan lugar al m ism o resultado. a prim era es m s com pleja de rea-

li
ar, pero refleja bastante m ejor el planteam ien to del procedim ientose
trata de convertir todas las variables de la regresin en valores tpicos,
esto es, m edia y desviacin tpica . i se reali
a la regresin con las
variables tipificadas, los coeficientes resu ltan tes seran los coeficientes
estandari
ados, que podran interpretarse com o el cam bio en unidades
de desviacin tpica de la variable depen diente, que im plica el cam bio en una un idad de desviacin tpica de la variable in depen diente en
cuestin, m anten ien do constan te el resto de las variables. a segu nda
es m s inm ediata en su clculo y con siste en m u ltiplicar el coeficien te
original por la desviacin tpica de la variable dependiente y dividirlo
por el de la independiente. e les denom in a coeficien tes beta, aunque
no deban con fun dirse con los parm etros b de la poblacin que se estim an a partir de los estadsticos b de la m uestra.

.
n tata, en la regresin m ltip le, com o en la sim p le, p u ed en ob ten erse estos coeficien tes estan dariad os, en lu gar d e los origin ales,
sim plem en te a adien do la op cin beta. dem s, com o ya se an ob ten ido los datos gen erales del m od elo de varian a, pu ed e a ad irse otra
op cin p ara qu e n o m u estre el an lisis de varian a de la regresin n i
el coeficien te de determ in acin . e trata d e la op cin n oead.
regress tm i p n bp pa p ibag, beta n oead

l r esu ltad o pr esen ta directam en te los coeficien tes estan d ar iados


ILR IN 9 .1. o e
icie n t e s e st a n d a r iza d o s d e la r e gr e si n lt ip le
-----------------------------------------------------------------------------t mi |
Coef .
St d. Er r .
t
P>| t |
Bet a
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - pnbppa |
- . 0015201
. 0003958
- 3. 84
0. 000
- . 3088509
pi bag |
1. 323406
. 2114112
6. 26
0. 000
. 5033717
_c ons |
29. 5263
6. 504691
4. 54
0. 000
.
------------------------------------------------------------------------------

stos coeficien tes estan dari


ados, que tienen que variar entre -y
, son tiles siem pre y cu ando se cu m plan los supuestos de regresin, especialm en te los de om ocedasticidad, au sencia de m ulticolinealidad y correcta especificacin com o un m edio adicional al valor t de
ju
gar la im portancia de la asociacin directa de cada predictor sobre
el resultado. bviam ente, valores prim os a reflejan u na variacin

conjun ta pequ ea de las variables, en tanto que, cuan to m ayor valor


absoluto
prescindiendo del signoposea, tanto m ayor cam bio conjunto entre ellas ser presum ible, m an teniendo constante las dem s .
. l segu n do aspecto qu e a d e ser ten ido en cu en ta en la in terpretacin de estos coeficien tes es qu e se sobreen tien de qu e se m an tien e
con stan te el resto de las variab les in trodu cid as en la ecu acin . n
con creto, con el ejem plo actu al, en el caso de qu e u n con ju n to de p ases tu vieran el m ism o p rod u cto n acion al bru to per cpita, por cad a
p u n to qu e su b a el porcen taje del qu e le corresp on de a la agricu ltu ra, la m ortalidad in fan til, m ed id a en tan tos por m il, es ,p u n tos
su p erior. , d ico de otro m od o, en tre d os n acion es con el m ism o
p rodu cto n acion al bru to p er cp ita y u n a d e ellas d iep u n tos por
en cim a en p orcen taje agrcola, esta ltim a ten dra tericam en te u n a
tasa d e m ortalid ad en tan tos por m il p u n tos su perior. or esta
ran su stan cial, son distin tos de los d e la regresin sim ple y, n o slo
eso, sin o qu e si se in trodu jera u n a tercera variable, com o se va a ver
a con tin u acin , tam b in cam biaran porqu e esta tam b in se su pon e
qu e se d eja con stan te para el clcu lo del n u evo coeficien te ob ten ido.
regress tm i pn bp pa piba g lin tfn o, n oead
ILR IN 9.1 1.

R e gr e si n sin ca b e ce r a

-----------------------------------------------------------------------------t mi |
Coef .
St d. Er r .
t
P>| t |
[ 95% Conf . I nt er val ]
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - pnbppa |
. 0020745
. 000961
2. 16
0. 033
. 0001719
. 0039772
pi bag |
1. 142371
. 2033324
5. 62
0. 000
. 7397867
1. 544955
l i nt f no |
- . 1533458
. 0376802
- 4. 07
0. 000
- . 22795
- . 0787416
_cons |
34. 82963
6. 23195
5. 59
0. 000
22. 4908
47. 16846
------------------------------------------------------------------------------

om o p u ed e ap r eciar se, se a in tr od u cid o u n a ter cer a va r iab le


in dep en d ien te
lin tfn o, las ln eas telefn icas p or m il ab itan tesy el
coeficien te cor r esp on d ien te al p or cen taje a gr cola d el
a d escen d ido a d os d cim as, asta ,, y el d el p r od u cto n acion al br u to
(pn bppa) se a con ver tid o en p ositivo
en igu alda d d el sector agr a
ico esto, ay qu ien es em plean esta m edida para com parar los efectos cau sales directos en tre las variables presen tes en u n m odelo. o obstan te, son in m en sa m ayora y les asiste
m s la ran a qu ien es piensan que n o se pu ede in ferir qu e la variable ten ga u n efecto cau sal
m ayor qu e la , a partir de la con statacin de que u n cam bio de un a desviacin en tenga
u n efecto en x u n idades de desviacin tpica de la variable depen dien te, m ien tras qu e el efecto
proporcion ado por la sea de xa, es decir, tam bin m ayor. Un bu en ejem plo de ello es el
prim o ejem plo de regresin . era u n a barbaridad decir qu e el n m ero de ln eas telefn icas
son la cau sa m ayor de descen so en la tasa de m ortalidad in fan til.

r io y del n m er o d e telfon os, el efecto d el p r od u cto n acion a l b r u to


n o va en la dir eccin esp er ad a
. s evid en te qu e el m ejor m od o d e
acer com p a ra cion es es m ed ia n te los coeficien tes b eta, qu e se ob tien en a l ep r esar ju n to a la r egr esin la op cin corr esp on d ien te

regress tm i pn b pp a p ib ag lin tfn o, n oead beta


ILR IN 9 .1 . o e
icie n t e s e st a n d a r iza d o s s in ca b e ce r a
-----------------------------------------------------------------------------t mi |
Coef .
St d. Er r .
t
P>| t |
Bet a
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - pnbppa |
. 0020745
. 000961
2. 16
0. 033
. 4221748
pi bag |
1. 142371
. 2033324
5. 62
0. 000
. 4353203
l i nt f no |
- . 1533458
. 0376802
- 4. 07
0. 000
- . 8143264
_c ons |
34. 82963
6. 23195
5. 59
0. 000
.
------------------------------------------------------------------------------

e pu ede ap reciar cm o con todas las pr ecau cion es qu e ab ra


qu e adop tar la variab le con b eta m s alta es la ltim a in tr odu cida, en cierta m edida p orqu e est reflejan d o la eten sin del n ivel
tecn olgico en cada pas, n o por qu e los telfon os sean la cau sa del
descen so de la m or talidad in fan til. on esta in ter pretacin y todas
las cau telas n ecesarias, se p od ra afir m ar qu e, m an ten ien do con stan tes el porcen taje d e pr odu ccin agr ar ia y el n m ero d e ln eas
telefn icas por abitan te, a m ayor ren ta per cp ita cor resp on d e p arad jicam en te m ayor m ortalid ad in fan til.
igu ien do con los coeficien tes, ay qu e term in ar dicien do qu e, al
igu al qu e en la regresin sim ple, de cada coeficien te pu ede calcu larse
su error tpico con frm u las sim ilares a las epresadas en
.y

.
. l cocien te en tre cada coeficien te y su error tpico posee en
m u estras aleatorias u n a distribu cin de t de tu den t con n --grados
de libertad. u an do el n m ero de casos m en os el de parm etros es
su perior a , en ton ces la distribu cin pu ede con siderarse n orm al, y
si el valor absolu to del m en cion ado cocien te es su perior a ,, podra
con siderarse sign ificativo con u n riesgo de error estadstico de tipo
,
in ferior al . n este ejem plo se ve qu e todos los coeficien tes son
sign ificativam en te distin tos de , lo cu al n o sign ifica n ecesariam en te
qu e la relacin sea fu erte. n el caso de m u estras gran des, relacion es
m u y dbiles pu eden m ostrar coeficien tes sign ificativos.

obre todo, la precau cin m s im portan te de todas es la alta correlacin entre estos
tres predictores, especialm en te, entre el produ cto nacion al bru to per cpita y el n m ero de
ln eas telefn icas, que es m ayor de ,. ase el problem a de la m u lticolin ealidad en el prim o captu lo.

9.. R e gr e si n co n va r ia b le s
ict icia s
u n qu e los m ecan ism os m a tem ticos de la regresin sea n p ropios d e va ria b les cu a n titativa s, ta m b in se p er m ite la in tr odu ccin de va riab les cu a lita tiva s, siem pr e y cu a n do se tom en p reca u cion es. or ejem plo, ten ien do
u n a var ia ble en la ba se de da tos com o el con tin en te, qu e in clu ye cin co
va lores a rb itr a ria m en te codificad os desd e a l
u ropa a sta el
cea n a
, n in g n sen tid o ten d ra in tr odu cir la com o va ria b le in dep en d ien te. n
ca m b io, si tom a m os u n o de los valor es d e esta va r ia ble y se tr a n sform a
en u n a n u eva va ria b le dicotm ica con va lor es y , los coeficien tes d e la
regresin y esta m ism a a d op ta n u n sign ifica do in ter pretab le, pu esto qu e
la u n ida d repr esen ta la ca ra cterstica qu e repr esen te al va lor. Un ejem plo
pu ede a cla ra r lo qu e se aca ba d e d ecir. i se seleccion a el va lor frica ,
cod ifica do com o , den tr o d e la va riab le con ti, se tr an sfor m a en , y el
con ju n to de p ases qu e n o est n situ a dos en el con tin en te a fr ica n o se les
otorga el va lor de , el coeficien te p rop io d e la n u eva va r ia ble a frica sign ifica r la d iferen cia m edia de valores en la var ia ble d ep en d ien te, la ta sa
de m orta lid ad in fa n til en este ca so, en tre los p ases a fr ica n os y el r esto,
m a n ten ien d o con sta n te los va lores d el resto d e la s va r ia bles in clu ida s en
la regresin .
ar a r ealiar la regresin con este tip o de var iables, la solu cin m s
eviden te es la de crear la n u eva var iable y, u n a vequ e ya est creada, se
in trodu ce en la r egr esin
gen era te africa
con tiif con ti.
regress tm i pn bp pa africa

r as la ejecu cin de estas dos in str u ccion es, la regresin r esu ltan te es la
sigu ien te
ILR IN 9 .1. R e gr e si n lt ip le co n va r ia b le
ict ic ia
Sour c e |
SS
df
MS
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - Model |
129825. 14
2 64912. 5701
Res i dual |
55350. 9078
122 453. 695966
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - Tot al |
185176. 048
124 1493. 35523

Number of obs
F( 2,
122)
Pr ob > F
R- s quar ed
Adj R- s quar ed
Root MSE

=
=
=
=
=
=

125
143. 08
0. 0000
0. 7011
0. 6962
21. 3

-----------------------------------------------------------------------------t mi |
Coef .
St d. Er r .
t
P>| t |
[ 95% Conf . I nt er val ]
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - pnbppa |
- . 0018975
. 0002695
- 7. 04
0. 000
- . 002431
- . 001364
af r i c a |
50. 70149
4. 653904
10. 89
0. 000
41. 48862
59. 91436
_cons |
41. 61537
3. 362865
12. 37
0. 000
34. 95824
48. 2725
------------------------------------------------------------------------------

l coeficien te corr esp on dien te a la var iable africa, qu e tien e el valor ,,


in dica qu e, en trm in o m edio y con trolan d o por la variab le d el p rod u cto n acion al b ru to per cpita, los pases afr ican os tien en u n a tasa d e m ortalid ad
in fan til ,pu n tos
en tan tos por m ilp or en cim a d e los pases u bicados
en otr os con tin en tes.
u n qu e sea n a lgo com p leja s la s in str u ccion es, es d e esp ecia l in ter s
ver el r esu lta d o gr fico d e esta op er a cin , p or cu a n to fa cilita la cor r ecta
in ter p r eta cin d e lo qu e su ced e cu a n d o se in tr od u ce u n a va r ia b le ficticia
en u n a r egr esin . o p r im er o qu e a y qu e a cer es gen er a r d os p r ed iccion es d istin ta su n a p a r a los p a ses a fr ica n os (ptm i1) y otr a p a r a los n o
a fr ica n os (ptm i0). a r a u n a r ep r esen ta cin d ifer en cia d a , ta m b in con vien e d esd ob la r la va r ia b le or igin a l en los d el con tin en te n egr o (tm ia ), p or
u n la d o, y en los a b ita n tes d e otr os con tin en tes (tm ir). sta s cu a tr o va r ia b les p u ed en r ep r esen ta r se sob r e el p r od u cto n a cion a l b r u to p er c p ita ,
d os d e ella s
la s p r ed iccion esen for m a to d e ln ea y la s otr a s d os
la s
va r ia b les r ea lesen for m a to d e p u n tos
p a ses a fr ica n oso cu a d r a d os

r esto d e los p a ses


.
p red ict ptm iif
africa
label var p tm i
ju ste resto
p red ict ptm iif a frica
label var p tm i
ju ste african o
gen erate tm ia tm i if a frica
label var tm ia
m i african a
gen erate tm irtm i if
africa
label var tm ir
m i resto
sca tter ptm iptm itm ia tm ir pn b pp a if e
sam p le ptm i,

con n ect
l l . .lp attern
solid dassym b ol
i i o s

ytitle

asa d e m ortalid ad in fa n til por m il

sort
pn b pp an am e
, replace

n el gr fico p u ed e ver se claram en te qu e la in trod u ccin d e u n a var iab le d icotm ica gen er a d os pr ediccion es paralelas. n la ln ea con tin u a se
en cu en tra la d e los pases african os, m ien tras qu e la discon tin u a se refier e
al r esto d e los con tin en tes. sta ltim a n ace en el eje d e ord en adas en la
con stan te d e la r egr esin
,
, qu e es el valor esp er ado d e la tasa d e m ortalid ad in fan til de u n p as n o afr ican o. n cam b io, la ln ea african a arr an ca
,pu n tos m s arr iba
este es el coeficien te de la variab le ficticia africa
,
esto es, en tor n o a los .

Tasa de mortalidad infantil por mil


50
100
150
200

GR F I 9 .. R e p r e se n t a c i n gr
ica d e u n a r e gr e si n co n va r ia b le
d ico t ic a

5000

10000
15000
PNB por unidad de compra
Ajuste africano
Tmi africana

20000

Ajuste resto
Tmi resto

m bas rectas son paralelas y su in clin acin r efleja el efecto d el pr odu cto
n acion al en la m ortalid ad. e tr ata de rectas d escen den tes
coeficien te n egativo-en la m ed ida en qu e esta var iable tien e u n a in flu en cia p ositiva
en el d escen so de la m ortalid ad in fan til. or cad a m il dlar es, baja pr cticam en te dos p u n tos la tasa. ste m odelo asu m e qu e el efecto del pr odu cto
n acion al b ru to es igu al en fr ica qu e en el resto de los con tin en teslo qu e
p u ed e ser du doso. s ad elan te se ver cm o reali
ar u n a r egr esin qu e n o
asu m a qu e am bas rectas sean par alelas.
l aber tran sfor m ado slo u n o de los cin co valores origin ales de la
variab le n om in al se pier de in for m acin . o se sabe cu l es el efecto de los
otr os con tin en tes. a solu cin est en crear tan tas variables com o valores
-dispon ga la var iable. n este caso, pu esto qu e ay cin co con tin en tes, se
d eb er an crear para disp on er de toda la in for m acin cu atro variab les y d ejar
u n o de los valores com o r eferen cia. u ede ser cu alqu iera, p ero par a ob ten er
u n a r egresin con sim ilar in form acin , se va a d ejar com o categor a b ase el
valor frica d e la variab le con tin en te, codificad o com o el valor . u n qu e
lu ego se m u estre u n a in str u ccin esp ecfica para ello, p u ed e recor dar se lo
visto en el cap tu lo de tran sfor m acion es y cr ear se m edian te u n a in stru ccin
r ecu rsiva en u n a sola in stru ccin . or ejem p lo, d e este m odo

e presen ta u n nu evo y m s com plejo uso del for, qu e im plica dos parm etros qu e cam bian de m odo paraleloun o n u m rico (n u m ) y otro tetual, qu e represen ta tetos em pleados
para gen erar n uevas variables (an y). m bas listas estn separadas por y term in an con los dos
pun tos. a prim era se llam a en la in stru ccin con , la segu n da con .

for num any europa asia am erica oceania generate


contiif conti.

con tin u acin ya p u ed e for m u larse la regresin con las cu atro n u evas
variab les creadas, desde eu ropa asta ocean ia
regress tm i pn b pp a eu ropa-ocea n ia

a regresin ap ar ecer con la var iable in depen dien te cu an titativa m s


las cu atr o var iables ficticias qu e se acaban de gen erar
ILR IN 9 .1. R e gr e si n lt ip le co n va r ia b le s
ict icia s
Sour c e |
SS
df
MS
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - Model |
132516. 756
5 26503. 3511
Resi dual |
52659. 2923
119 442. 515061
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - Tot al |
185176. 048
124 1493. 35523

Number of obs
F( 5,
119)
Pr ob > F
R- s quar ed
Adj R- squar ed
Root MSE

=
=
=
=
=
=

125
59. 89
0. 0000
0. 7156
0. 7037
21. 036

-----------------------------------------------------------------------------t mi |
Coef .
St d. Er r .
t
P>| t |
[ 95% Conf . I nt er v al ]
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - pnbppa |
- . 0016082
. 0002996
- 5. 37
0. 000
- . 0022015
- . 0010149
eur opa |
- 59. 75014
6. 163719
- 9. 69
0. 000
- 71. 95492
- 47. 54536
asi a |
- 45. 83031
5. 304399
- 8. 64
0. 000
- 56. 33355
- 35. 32707
amer i c a |
- 52. 55179
5. 895357
- 8. 91
0. 000
- 64. 22519
- 40. 8784
oceani a |
- 46. 6498
13. 13383
- 3. 55
0. 001
- 72. 65608
- 20. 64351
_c ons |
91. 77734
3. 550267
25. 85
0. 000
84. 74745
98. 80722
------------------------------------------------------------------------------

om o, en este ca so, la ca tegor a ba se es el con tin en te a fr ica n o, tod os


los coeficien tes per ten ecien tes a l r esto de los con tin en tes son n ega tivos,
p or qu e en tod os ellos la ta sa d e m or ta lida d in fan til es m en or, d esd e sia ,
pu n tos in fer ior, a sta u r op a , p u n tos por d eb a jo de la tasa por m il
a fr ica n a . d em s, es d e n ota r qu e la in flu en cia d el p rodu cto n a cion al p er
c pita a pen as a ca m bia d o y sigu e con u n coeficien te sign ifica tiva m en te
d istin to d e .
l grfico, qu e p ara sim p lificarse n o d ifer en cia los valor es em p ricos d e
los distin tos con tin en tes, m u estra cin co aju stes de ln eas distin tas, adem s
d e la in icial n u be d e pu n tos. a con tin u a repr esen ta al con tin en te b ase,
fr ica en este caso, qu e tien e u n p ron stico d e partida
la or den ada en el
or igen d e las ab scisasde . a ln ea m s cer can a es la d e sia
-,
,
segu ida m u y de cerca por la d e cean a
-,
. s d istan ciado se en cu en tra el con tin en te am er ican o, y el qu e p resen ta los pr on sticos d e la tasas d e
m or talidad in fan til m en or es es u r opa.

p red ict p tm i
toay
scatter tm i p n bpp a, legen d
lab el

asa de m ortalidad in fan til

lfit ptm i pn b pp a if africa, lp attern


solid legen d
la bel

frica

lfit ptm i pn b pp a if am erica , legen d


label

m rica

lfit ptm i pn b pp a if asia , legen d


la bel

sia

lfit ptm i pn b pp a if eu rop a, legen d


lab el

u rop a

lfit ptm i pn b pp a if ocean ia, legen d


lab el

cea n a

if
e
sam ple
tm i ptm i

, ytitle

asa de m ortalida d in fan til


n am e
, repla ce

ar a elabor ar el gr fico, en lu gar de con stru ir u n a p rediccin p ar a cad a


con tin en te con la ord en predict, tal com o se p lan te en el gr fico ., se realia a travs de la m ism a in stru ccin gr fica con el su btipo lfit. a equ ivalen cia es p osible por qu e los aju stes se reali
an con ptm i. i se u b iera eco
con tm i, las p en dien tes de las rectas n o ab ran sido id n ticas .
R e p r e s e n t a ci n gr
ica d e u n a r e gr e si n co n s d e u n a
va r ia b le d ico t ic a

Tasa de mortalidad infantil


20
40
60
80

100

GR F I 9.9.

10000
20000
PNB por unidad de compra
Tasa de mortalidad infantil (1988)
mrica
uropa

30000
frica
sia
ceana

tese, adem s, que la in stru ccin toay con tiene seis grficos distin tos qu e se represen tan en las m ism as coordenadas cada u n o con su s propias opciones. ero, adem s, term ina
con dos ln eas de cdigos qu e afectan al con ju nto del grfico. a prim era es u n a seleccin de
casos qu e slo evita represen tar los pases qu e n o estn en la regresin
e(sam ple)
, as com o
los qu e no tienen un a tasa de m ortalidad etrem adam en te alta
tm i100
, n i u n pron stico n egativo de este in dicador
ptm i0
la segu nda son las opcion es qu e repercuten de m odo gen eral
en el grfico com pu esto. lgu nas de ellas, com o legen d e ytitle, pueden colocarse in distin tam en te en cada grfico o en el con ju n to.

olvien do a la regresin , a de ad ver tir se qu e el con tin en te african o, en


el ltim o ejem p lo, est r epresen tado en la con stan te, y qu e los coeficien tes
d el resto de los con tin en tes sign ifican d ifer en cias con r especto al p rim er o.
om o pu ede apr eciar se, todos p resen tan u n coeficien te sign ificativo. si
d eseram os sab er si ay difer en cias en tre u r op a y siaen tr e este ltim o y el con tin en te am erican oada m s sen cillo, em plear am os la in str u ccin test con el sigu ien te form ato
test eu ropaa sia
test asia am erica

om o pu ede dedu cir se d e los r esu ltad os, la r espu esta a la p rim er a p regu n ta es p ositiva y a la segu n d a es n egativa.
ILR IN 9.1. r u e b a s d e ip t e sis so b r e igu a ld a d
d e p a r e t r o s e n la r e gr e si n
( 1)

eur opa - as i a = 0
F(

( 1)

1,
119) =
Pr ob > F =

5. 68
0. 0187

as i a - amer i c a = 0
F(

1,
119) =
Pr ob > F =

1. 29
0. 2589

tr o m od o m s directo y m u co m s cm odo de pr oceder a la creacin d e va riab les ficticia s es m ed ia n te el u so de fa ctor es en ta ta. esde
su ver sin u n dcim a cu a lqu ier var ia ble discr eta es su scep tible d e ser em p lea da en la m ayor pa rte de la s in str u ccion es com o u n con ju n to d e va ria b les dicotm icas o ficticia s. u a lqu ier va ria b le qu e slo con ten ga va lor es
en teros p u ed e ser r efer en cia d a con el pr efijo i segu ido d e u n pu n to, en
cu yo ca so se crea n

-va ria bles d e la va riab le ca tegrica . s, si se desea


p roced er de este m od o con la va ria b le con ti, deb e escr ib irse i.con ti.
Un ejem plo d e este u so ser a el sigu ien te
regress tm i pn b pp a i.con ti

qu e dara lu gar al sigu ien te resu ltado, sim ilar al qu e se acaba d e ep on er

n version es an teriores tam bin era posible u sar factores, aun que para ello era n ecesario em plear la prein stru ccin xi. s detalles de esta posibilidad pu eden en con trarse en elp xi.
am bin en la versin sigue eistien do esta posibilidad, com o pu ede com probarse en tata

e-
.

ILR IN 9.1. R e gr e si n lt ip le co n va r ia b le s
ict icia s a u t o t ic a s

a c t o r e s
Sour c e |
SS
df
MS
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - Model |
132516. 756
5 26503. 3511
Res i dual |
52659. 2923
119 442. 515061
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - Tot al |
185176. 048
124 1493. 35523

Number of obs
F( 5,
119)
Pr ob > F
R- s quar ed
Adj R- s quar ed
Root MSE

=
=
=
=
=
=

125
59. 89
0. 0000
0. 7156
0. 7037
21. 036

-----------------------------------------------------------------------------t mi |
Coef .
St d. Er r .
t
P>| t |
[ 95% Conf . I nt er val ]
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - pnbppa |
- . 0016082
. 0002996
- 5. 37
0. 000
- . 0022015
- . 0010149
|
c ont i |
2 |
13. 91983
5. 838961
2. 38
0. 019
2. 358107
25. 48156
3 |
59. 75014
6. 163719
9. 69
0. 000
47. 54536
71. 95492
4 |
7. 198347
6. 102943
1. 18
0. 241
- 4. 886089
19. 28278
5 |
13. 10034
12. 66966
1. 03
0. 303
- 11. 98684
38. 18753
|
_cons |
32. 0272
5. 476525
5. 85
0. 000
21. 18313
42. 87126
------------------------------------------------------------------------------

s d e n otar qu e la r egr esin n o es eactam en te igu al qu e la an terior. o


cam bia el an lisis de var ian
a, n i el R , n i la r ad el er ror m edio cu ad rtico. am poco cam bian los coeficien tes, n i las sign ificacion es d e la variable
cu an titativa. n cam bio, aparece la variab le con ti segu ida de cu atr o valor es, qu e se refier en , r esp ectivam en te, a sia

, frica

, m rica
y
cean a

. o apar ece el
u r opa
, pu es, p or om isin , este recu rso d eja
com o categor a base el pr im er valor d e la variab le categr ica y, en este caso,
corr esp on de a este con tin en te. or tan to, aor a los coeficien tes n o m ar can
la difer en cia de u n con tin en te con respecto a fr ica, tal com o se io en el
caso an ter ior, sin o con r esp ecto a u rop a y, au n qu e esta r egr esin eplica
lo m ism o qu e la an ter ior, en tr e las variab les ficticias de los con tin en tes slo
apar ecen com o sign ificativas las corr espon dien tes a fr ica y a sia, porqu e
el r esto de los con tin en tes n o tien en tasas de m or talidad in fan til su stan cialm en te difer en tes d e las de u rop a, qu e es la con sid er ada en este caso base.
ay u n a m an era fcil de cam b iar la categor a base. s epr esan d o en tr e
la i y el pu n to u n a b segu id a d el valor qu e se d esea tom ar com o tal.
regress tm i pn bp pa ib .con ti

e este m odo, la categor a b ase de la variab le con ti ser a la tercera en


lu gar d e la p rim er a. or con sigu ien te, en el caso de qu e se p idier a la r egr e
dem s, se pu ede optar por especificar el prim ero con ib(first), el ltim o con ib(last)
o el en sim o valor ib(n ) de la variable de valores en teros en cu estin . sim ism o, m edian te el
prefijo ib(fre), tata se en carga de seleccion ar com o base la categora m s frecu en te.

sin con la m ism a in str u ccin qu e an ter iorm en te, el r esu ltad o sera com o
el ep u esto en el pr im er ejem plo
ilu str acin .
. o n ico qu e cam biar a
ser a el n om br e d e las variab les n d ices o ficticias.

9 .. R e gr e sio n e s co n in t e r a cci n
ay d os m an er as de en ten d er las in teraccion es. or u n lad o, si la r elacin
en tr e dos var iables dep en d e de los valor es de u n a tercer a, estam os an te u n a
clara situ acin de in teraccin . igu ien d o con el ejem plo an ter ior sim p lificad o al con tin en te african o fr en te al r esto, abr a in ter accin en tre la tasa d e
m or talidad in fan til, el pr odu cto n acion al br u to per cpita y el con tin en te, si
la relacin en tr e las dos p rim er as var iables fu er a distin ta seg n si el p as se
en cu en tra en fr ica o fu era de ella.
am bin se dice qu e ay in teraccin cu an do dos variables tien en u n a in flu en cia con ju n ta en u n a tercera. con ju n ta n o sign ifica qu e am bas pu edan
in flu ir por su lado, sin o qu e in ciden slo o adicion alm en te en el resu ltado si se
da u n a com bin acin especfica de valores en los predictores. e podra pon er
u n ejem plo sim ple dicien do qu e agu a y lu in teract an en el crecim ien to de las
plan tas. or m u ca agu a con qu e se riegu e u n vegetal por s solo, o por m u ca
lu qu e se le proporcion e sin qu e se le a ada agu a, este ser vivo n o sobrevivir
adecu adam en te. e n ecesita la accin con ju n ta de am bos agen tes.
l m odo de trabajar con in teraccion es en u n a regresin es m edian te la
m u ltiplicacin de las variables in depen dien tes. l porqu es as se ve m an ifiestam en te en variables dicotm icas, n dices o ficticias. om an do el ejem plo
an terior y recodifican do las variables lu z y agu a a presen cia y au sen cia , al m u ltiplicar am bas, slo da el valor u n idad en el caso de qu e am bas sean igu al a
R 9.1.

u a d r o d e la in t e r a cci n e n t r e d o s va r ia b le s

gu a

Lu z

In t e r a cc i n

ive

os son las propiedad es qu e p u ed en d escu b rirse en la cu adro .. n p rim er lu gar, qu e la in teraccin se obtien e m u ltip lican d o los valores d e las variab les origin ales y, en segu n do lu gar, qu e el valor qu e m ejor predice el prod u cto

si vive o n o la plan taes la in teraccin y n o las variab les origin ales.


l qu e aya in teraccin n o im plica n ecesariam en te, com o era el caso an terior, qu e las variables n o ten gan in flu en cia por separado. esta ltim a con tribu cin especfica de las variables se le den om in a efecto prin cipal. con tin u acin pon em os u n ejem plo de esto con las regresion es del apartado an terior.

om o se podr observar num rica y grficam ente, el contin ente y el producto


nacion al bruto per cpita interact an en su asociacin con la tasa de m ortalidad
infantil. a regresin con in teracciones debera prepararse del siguiente m odo
gen era te pn bp pa africa pn b pp a
a frica
regress tm i pn bp pa africa pn b pp aafrica

l resultado de esta regresin son cuatro coeficientes distin tosde abajo


arriba, el m s sim ple sera la con stante, que estara referida a la supuesta tasa
de m ortalidad infantil de un pas no africano con un producto nacion al bruto
de cero dlares. l sigu ien te sera el correspondiente a frica, que sign ifica
qu e en u n pas african o de nu lo producto nacion al bruto, tendra una tasa de
m ortalidad infantil pu ntos superior a la del resto de con tinen tes. tro coeficiente, el de la variable pnbppa, indica la pendiente de la recta pn b-tasa de m ortalidad para los pases fuera de frica
africa
. Finalm ente, la n ovedad del
an lisis es que el coeficiente pnbppaafrica es la diferencia de la influencia de
la renta en la m ortalidad en tre no africanos y african os. ico de otro m odo,
si por cada dlar qu e aum enta el producto nacional bruto per cpita fuera de
frica, dism inuye la tasa de m ortalidad in fan til en dos m ilsim as
-,
,
en frica por cada dlar adicion al producido por cada abitante, baja la tasa de
m ortalidad in fan til un a centsim a
-,
-,

. ay, en con secuencia,


un efecto diferente del in dicador econm ico en el indicador san itario segn se
est en frica o fu era de ella. n la prim era tiene m ayores efectos positivos, es
decir, el increm en to del produ cto reduce m s la m ortalidad.
ILR IN 9 .1 . R e gr e si n c o n in t e r a cc i n d e u n a va r ia b le cu a n t it a t iva
con u n a
ict ic ia
Sour c e |
SS
df
MS
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - Model |
139646. 774
3 46548. 9246
Res i dual |
45529. 2742
121 376. 274994
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - Tot al |
185176. 048
124 1493. 35523

Number of obs
F( 3,
121)
Pr ob > F
R- s quar ed
Adj R- s quar ed
Root MSE

=
=
=
=
=
=

125
123. 71
0. 0000
0. 7541
0. 7480
19. 398

-----------------------------------------------------------------------------t mi |
Coef .
St d. Er r .
t
P>| t |
[ 95% Conf . I nt er val ]
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - pnbppa |
- . 0017201
. 0002479
- 6. 94
0. 000
- . 0022108
- . 0012294
af r i c a |
68. 87338
5. 53297
12. 45
0. 000
57. 9194
79. 82735
pnbppaXaf r ~a |
- . 0090408
. 0017696
- 5. 11
0. 000
- . 0125441
- . 0055375
_cons |
39. 975
3. 07931
12. 98
0. 000
33. 87869
46. 0713
------------------------------------------------------------------------------

Un a m ejor com pren sin de este an lisis se con sigu e represen tan do grficam en te el m odelo. ara con segu ir el grfico ., abra qu e acer dos prediccion es por separadou n a para el con tin en te african o y otra para el resto.
sim ism o, para represen tar los pu n tos de los con tin en tes con distin ta form a, se
an vu elto a u tiliar las variables em pricas de la tasa de m ortalidad in fan til di-

feren ciadau n a con los valores african os (tm ia) y otra con el resto de los valores (tm ir). as in stru ccion es para gen erar este grfico, in m ediatam en te despu s
de aber solicitado la regresin con el efecto in teractivo in clu ido, an sido
p red ict ptm iif
africa
label var p tm i
ju ste resto
p red ict ptm iif a frica
label var p tm i
ju ste african o
sca tter ptm iptm itm ia tm ir pn b pp a if e
sam p le ptm i,

con n ect
l l . .
lp attern
solid da ssym b ol
i i o s

ytitle

asa de m ortalida d in fan til por m il


sort
pn bppan am e
, replace

Tasa de mortalidad infantil por mil


50
100
150
200

GR F I 9 .1 . R e p r e se n t a c i n gr
ica d e u n a r e gr e si n co n in t e r a cci n

5000

10000
15000
PNB por unidad de compra
Ajuste africano
Tmi africana

20000

25000

Ajuste resto
Tmi resto

i se tien en d os variab les cu an titativas, para in tr odu cir la in ter accin en


la ecu acin d e r egr esin , es n ecesario crear la n u eva var iable m ed ian te su
p rod u cto. s, por ejem plo, si se qu ier e estu diar el efecto d e la in teraccin
d el prod u cto n acion al b ru to y la p ropor cin n o agr cola de este, b astara
escribir la sigu ien te in stru ccin p ar a cr ear la n u eva variab le qu e repr esen te
a la in teraccin en tre am bas var iables.
gen erate pn b pibn agpn b pp a

-p ib ag

sta in stru ccin gen era la variab le qu e rep resen ta la in teraccin se alad a. om o p u ed e ap reciarse, se a obten ido el porcen taje d el
n o agrario,
restan d o de el porcen taje corresp on dien te a la produ ccin agrcola. Un a
vequ e se obtien e la n u eva variab le, pu ede ser in trodu cid a en la regresin .

regress tm i pn bp pa piba g pn b pibn a g

, a con tin u acin , se gen er a la ecu acin con los dos efectos pr in cipales

las variab les origin alesm s el efecto in teractivo de am bos.


ILR IN 9.1. R e gr e s in co n in t e r a c ci n d e d os va r ia b le s cu a n t it a t iva s
Sour c e |
SS
df
MS
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - Model |
133472. 561
3 44490. 8537
Res i dual |
51703. 4868
121 427. 301544
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - Tot al |
185176. 048
124 1493. 35523

Number of obs
F( 3,
121)
Pr ob > F
R- s quar ed
Adj R- s quar ed
Root MSE

=
=
=
=
=
=

125
104. 12
0. 0000
0. 7208
0. 7139
20. 671

-----------------------------------------------------------------------------t mi |
Coef .
St d. Er r .
t
P>| t |
[ 95% Conf . I nt er val ]
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - pnbppa |
- . 0565354
. 0064721
- 8. 74
0. 000
- . 0693487
- . 0437222
pi bag |
1. 683842
. 1731587
9. 72
0. 000
1. 341029
2. 026655
pnbXpi bnag |
. 0005579
. 0000656
8. 51
0. 000
. 0004281
. 0006877
_cons |
47. 45577
5. 578999
8. 51
0. 000
36. 41067
58. 50087
------------------------------------------------------------------------------

os tres coeficien tes, adem s del correspondien te a la con stan te, son significativos. a m ortalidad in fan til desciende con el au m en to del produ cto nacion al
bruto per cpita, asciende a m edida qu e el porcentaje del
sea m s agrario,
pero tam bin au m en ta a m edida qu e se produ ce u n a conju ncin de au m en to de
ren tas y de produ ccin n o agraria. in em bargo, esta ecu acin posee un problem a im portan te qu e se ver cu ando se aborden los diagnsticos de la regresin .
am b in , com o es ob vio, a p artir del prim er ejem p lo d ad o se pu eden con str u ir in ter accion es con variab les categricas, siem pr e y cu an d o se con viertan en variab les ficticias.
n clu so, p u ed e acerse u so d e las p rop iedades d e
los factor es. e este m odo, si dos variab les con valores en ter os se separ an
con el sign o , tata las con sider ar ficticias y con stru ir au tom ticam en te
las in teraccion es. d icion alm en te, si se separan con dos sign os , n o slo
in clu ir au tom ticam en te en la regresin las in teraccion es, sin o tam b in los
tr m in os pr in cipales. am b in pu eden in clu ir se in teraccion es
y tr m in os
p rin cip alesau tom ticam en te con variab les cu an titativas, siem pr e y cu an do
se pr ecedan con c y u n pu n to. isten las sigu ien tes m odalidades
vcategoricavcategor icao vcategor icavcategor ica
vcategoricac.vcu an titativa o vcategor icac.vcu an titativa
c.vcu an titativac.vcu an titativa o c.vcu an titativac.vcu an titativa

o es n ecesario preceder las variables con valores en teros con la i y el pu nto. partir
de la versin , se em plean estos n uevos sign ospara in dicar in teraccin en tre variables
categricas y para especificar n o slo las in teraccion es, sin o tam bin los efectos prin cipales.

ar a com p ren der su s efectos, n o estara d e m s ver algu n os ejem plos d e


cada u n a d e estas m odalidad es. n p rim er lu gar, se ver la in teraccin de
d os var iables categr icas
regress tm i pn b pp a con tiocde

l con tin en te (con ti) tien e cin co valor es, por tan to se gen er an cu atr o
variab les ficticiasla variable ocde slo tien e dos cod ificad os com o y . a
in teraccin deb er a in cor por ar, por tan to, cu atr o m odalidades

ILR IN 9 .1 9.

R e gr e si n lt ip le co n in t e r a ccio n e s a u t o t ica s

fectivam en te, se gen eran cu atro coeficien tes r elacion ad os con el con tin en te, d esde asta , qu e equ ivalen a sia, frica, m r ica y cean a,
p u es u rop a, al estar cod ificad a con el valor m s bajo, qu ed a com o categor a base. e ellas, d estacan sia y sobr e todo fr ica, qu e tien en coeficien tes
sign ificativos y positivos, en la m ed ida en qu e en am b os con tin en tes la tasa

n teriorm ente, era m s com plejo, pu es aba que u tili


ar y con la prein struccin xii se
dispon e de u na versin an terior, con s ltese la ayu da de xi.

d e m or talidad in fan til es su perior a la qu e se d a en u r opa. con tin u acin


apar ece la categora de la var iable ocde, pu esto qu e el valor m s pequ e o
es el , qu e in d ica la n o per ten en cia a esta or gan i
acin . l sign ificativo
coeficien te vien e a se alar qu e, con tr olan d o por la r en ta per cpita, los pa
ses d e la en u rop a
con sid erado aqu el con tin en te base
tien en
m ayor m ortalid ad in fan til qu e los qu e n o perten ecen a ella. am bin apar ecen las in ter accion es en tre el con tin en te y la cu atro en la m ed ida en
qu e respon den a la fr m u la

-
. n tre ellas, se d escarta p or qu e n o
ay pas afr ican o qu e p erten e
ca a esta organ iacin com er cial.
i se desea in tr odu cir en la ecu acin de regresin u n a in teraccin en tr e
u n a var iable categr ica y u n a cu an titativa, basta con separ ar las con d oble
alm oad illa y pr eceder la segu n d a con la letr a c segu id a de pu n to.
regress tm i con tic.pn b pp a

a regr esin in clu ye tan to los efectos pr in cipales com o los in ter acctivos,
com o pu ede ap reciarse a con tin u acin
ILR IN 9 .. R e gr e si n lt ip le co n in t e r a cci n e n t r e va r ia b le
cu a n t it a t iva y c u a lit a t iva
Sour c e |
SS
df
MS
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - Model |
145869. 64
9 16207. 7378
Resi dual |
39306. 4077
115
341. 79485
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - Tot al |
185176. 048
124 1493. 35523

Number of obs
F( 9,
115)
Pr ob > F
R- squar ed
Adj R- squar ed
Root MSE

=
=
=
=
=
=

125
47. 42
0. 0000
0. 7877
0. 7711
18. 488

-----------------------------------------------------------------------------t mi |
Coef .
St d. Er r .
t
P>| t |
[ 95% Conf . I nt er val ]
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - c ont i |
2 |
30. 91629
7. 637111
4. 05
0. 000
15. 78864
46. 04393
3 |
90. 16486
7. 682314
11. 74
0. 000
74. 94767
105. 382
4 |
19. 00068
8. 447558
2. 25
0. 026
2. 26769
35. 73366
5 |
43. 94498
21. 30635
2. 06
0. 041
1. 741206
86. 14875
|
pnbppa |
- . 0006379
. 0003968
- 1. 61
0. 111
- . 0014238
. 000148
|
c ont i #|
c . pnbppa |
2 |
- . 0016523
. 0006366
- 2. 60
0. 011
- . 0029133
- . 0003914
3 |
- . 010123
. 0017164
- 5. 90
0. 000
- . 0135229
- . 0067232
4 |
- . 0007495
. 000697
- 1. 08
0. 284
- . 0021302
. 0006312
5 |
- . 0022423
. 0013203
- 1. 70
0. 092
- . 0048576
. 000373
|
_cons |
18. 68352
6. 310526
2. 96
0. 004
6. 183581
31. 18346
------------------------------------------------------------------------------

n gen eral, el coeficien te de u n efecto prin cipal de u n a variable debe interpretarse ten ien do en cuenta que slo m ide el efecto de ella, cu ando la otra variable con la qu e est interactu ando posee el valor de .

e todos los coeficien tes r elacion ados con la in ter accin , el m s sign ificativo es el corr esp on dien te a frica
con tic.p n bp pa
, qu e in dica qu e el
au m en to de la r en ta per cpita en este con tin en te tien e m s efectos positivos
r edu ctoressob re la m ortalid ad in fan til qu e en el eu ropeo, com o ya se
vio en u n ejem p lo an terior.
i la ep r esin d e la in ter a cci n se u b ier a r ea lia d o con u n a sola
a lm oa d illa

, en lu ga r d e d o s

, la r egr esin n o a b r a in clu id o los


efecto s p r in cip a les d e la va r ia b le ca tegr ica . e este m o d o, si la o r d en
se u b ier a escr ito d e este m od o
regress tm i con tip n b pp a

la regresin resu ltan te ab ra sid o esta otr a


ILR IN 9.1 .

R e gr e si n lt ip le co n in t e r a c cio n e s sin e
e ct o s
p r in cip a le s

Sour c e |
SS
df
MS
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - Model |
81451. 8192
5 16290. 3638
Res i dual |
103724. 229
119 871. 632175
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - Tot al |
185176. 048
124 1493. 35523

Number of obs
F( 5,
119)
Pr ob > F
R- squar ed
Adj R- squar ed
Root MSE

=
=
=
=
=
=

125
18. 69
0. 0000
0. 4399
0. 4163
29. 523

-----------------------------------------------------------------------------t mi |
Coef .
St d. Er r .
t
P>| t |
[ 95% Conf . I nt er val ]
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - c ont i #|
c . pnbppa |
1 |
- . 0029641
. 0003833
- 7. 73
0. 000
- . 0037231
- . 0022052
2 |
- . 0031422
. 0006845
- 4. 59
0. 000
- . 0044975
- . 0017868
3 |
. 0020754
. 0021563
0. 96
0. 338
- . 0021943
. 006345
4 |
- . 0031168
. 0007029
- 4. 43
0. 000
- . 0045086
- . 001725
5 |
- . 0028194
. 0010749
- 2. 62
0. 010
- . 0049478
- . 0006911
|
_c ons |
61. 4754
3. 926884
15. 66
0. 000
53. 69978
69. 25102
------------------------------------------------------------------------------

om o p u ed e fcilm en te apr eciar se n o apar ecen los efectos pr in cipales


d e n in gu n a de las dos var iables, lo qu e con d u ce a qu e el coeficien te in ter activo cor resp on d ien te a fr ica sea positivo, ya qu e la tasa d e m ortalid ad
in fan til es m u y alta en este con tin en te y al n o ap arecer este eco en los
efectos pr in cipales, lo in corp ora en la in ter accin . eg n este m od elo, tod os
los con tin en tes com par tir an la con stan te
lo qu e es m s qu e du d osoy el
efecto de la r en ta sob re la tasa de m ortalid ad ser a el in d icado por el coeficien te. tese qu e cada con tin en te, in clu id a la b ase
u ropa
, tien e el su yo
p rop io.

9.. t r a s r e la cio n e s
u n cio n a le s d e la r e gr e si n
edian te m n im os cu adrados ordin arios n o slo pu eden aju starse ln eas rectas
plan os o iperplan os cu an do se tien e m s de u n a variable in depen dien te
para pron osticar los valores de la variable depen dien te en fu n cin de la
s
in depen dien te
s
. am bin es posible aju star cu rvas qu e en determ in ados casos se aproim an m s a los valores em pricos qu e se in ten tan pron osticar. l
procedim ien to en tata pasa por la tran sform acin adecu ada de las variables
y la posterior in trodu ccin de las n u evas variables en la regresin .
ecu rdese qu e las relacion es fu n cion ales n o lin eales m s frecu en tes son
aas regresion es cu adr tica y c b ica.
ba regr esin in ver sa.
cas regresion es con var iables logar tm icas.
on el ejem p lo de la regresin d e la m ortalidad in fan til sobr e el pr od u cto n acion al br u to p er cp ita, se ver cm o se op er a p ar a ob ten er las y
r ep resen tarlas.
Regresin cu adrticaara pr odu cir la, ay qu e obten er pr im ero el cu ad rado de la variab le in d ep en d ien te p ar a d esp u s in trod u cir lo ju n to con la
variab le origin al. or ello el p rim er paso con siste en gen er ar los valores
cu ad rticos m edian te la in str u ccin gen erate.
gen era te pn bpn b pp a

, u n a vequ e se d ispon e de la n u eva variab le, esta se in tr odu ce en la


ecu acin de regresin ju n to con la origin al.
regress tm i pn bp pa pn b

e esta for m a, sale u n a ecu acin con tr es coeficien tes, la con stan te, el
d e la variab le y el d e esta al cu ad rad o .

tro m odo de obten er el m ism o resu ltado con adicion ales ven tajas es aciendo u so de
las posibilidades de in corporar trm in os de in teraccin, ya que elevar al cuadrado es com o
m u ltiplicar u na variable por s m ism a

regress tm i c.pn b pp ac.p n bp p a

e esta m an era, pu eden calcu larse con propiedad los efectos m argin ales de pn bppa (elp
m argin s
.

ILR IN 9 .. R e gr e si n cu a d r t ica
Sour c e |
SS
df
MS
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - Model |
115248. 64
2 57624. 3202
Resi dual |
69927. 4075
122 573. 175471
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - Tot al |
185176. 048
124 1493. 35523

Number of obs
F( 2,
122)
Pr ob > F
R- s quar ed
Adj R- squar ed
Root MSE

=
=
=
=
=
=

125
100. 54
0. 0000
0. 6224
0. 6162
23. 941

-----------------------------------------------------------------------------t mi |
Coef .
St d. Er r .
t
P>| t |
[ 95% Conf . I nt er v al ]
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - pnbppa |
- . 0118483
. 0010856
- 10. 91
0. 000
- . 0139974
- . 0096992
pnb_2 |
3. 46e- 07
4. 18e- 08
8. 28
0. 000
2. 63e- 07
4. 29e- 07
_c ons |
88. 35696
4. 030461
21. 92
0. 000
80. 37826
96. 33566
------------------------------------------------------------------------------

od a fu n cin cu adrtica se caracter i


a p or ten er u n p u n to de in flein ,
esto es, los valores pr on osticados cam bian d e or ien tacin a p ar tir de u n
valor deter m in ado d e x. l ten er el coeficien te cu adr tico positivo im plica
qu e la cu r va obten ida em piea descen d ien do y ter m in a ascen d ien d o, com o
es aqu el caso. , com o el coeficien te de la var iable or igin al tien e sign o con trar io al cu adrtico, el pu n to de in flein se en cu en tra en u n valor positivo
d e x .
, si se qu isier a obten er u n a r ep resen tacin grfica, abra qu e escr ib ir
las sigu ien tes in str u ccion es. a p rim er a gen er a el valor p redico con la n u eva r egr esin , la segu n d a ord en a los casos por la var iable in d epen dien te y
la tercera gen era pr opiam en te el grfico.
p red ict ttm iif e
sam ple
.
label variable ttm i
rediccin cu ad rtica
sort p n bp pa
scatter ttm itm i pnbppa if e
sam ple
, con nect
lsym bol
i onam e
, replace

om o p u ed e a p reciar se a tra vs d el gr fico, el m od elo cu a d r tico p red ice qu e la ta sa d e m or ta lida d in fan til b aja a m edid a qu e a u m en ta la r en ta
p er c pita en los p ases pob res, pero, a p ar tir d e d eter m in a do n ivel de
r en ta, la relacin se in vier te y la p rod u ccin in cide n ega tiva m en te en este
in d icad or.

ecu rdese qu e el valor del pu n to de in flein en la fu n cin parablica es b


c, sien do
b el coeficien te de la variable origin al y c el de la cu adrtica.

a ra
n por la qu e est acom paada por un if es para qu e slo prediga en caso de que
los valores de la depen dien te sean vlidos. i no se ace eplcita esa condicin, tam bin aparecera prediccin para u n posible valor etrem o de x, qu e n o poseyera valor en la dependien te.
ste es el caso en este ejem plo, porqu e de u em bu rgo, con u na alta ren ta per cpita, n o se
dispon e del dato de la tasa de m ortalidad in fan til.

R e p r e se n t a ci n gr
ic a d e la r e gr e si n c u a d r t ica

50

100

150

200

GR F I 9 .11 .

10000
20000
PNB por unidad de compra
Prediccin cuadrtica

30000

Tasa de mortalidad infantil /1000 1998

Regresin c bicaara obten er u n a regresin c bica ay qu e a adir a


la cu adr tica u n a n u eva var iable, la or igin al elevada al cu bo. e este m odo,
siem p re y cu an do ya se dispon ga de la var iable al cu adr ado, se p u ed en con segu ir los coeficien tes de la regresin c bica en dos p asos
gen era te pn bpn b pp a
regress tm i pn bp pa pn b
pn b

u e d ar lu gar a u n a r egr esin con con stan te y tr es coeficien tes, qu e


m od u larn dos p u n tos d e in flein

e m odo an logo a la regresin cuadrtica, puede acerse u n a regresin c bica con


in teraccion es sin necesidad de con struir nu evas variables. sto se logra m encion ando la variable tres veces precedidas por c., in dican do su carcter cu antitativo, y separadas por doble
alm oadilla

regress tm i c.pn b pp ac.p n bp p ac.p n b p pa

ILR IN 9 .. R e gr e si n c b ica
Sour c e |
SS
df
MS
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - Model |
131330. 579
3 43776. 8596
Resi dual |
53845. 4692
121 445. 003877
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - Tot al |
185176. 048
124 1493. 35523

Number of obs
F( 3,
121)
Pr ob > F
R- s quar ed
Adj R- squar ed
Root MSE

=
=
=
=
=
=

125
98. 37
0. 0000
0. 7092
0. 7020
21. 095

-----------------------------------------------------------------------------t mi |
Coef .
St d. Er r .
t
P>| t |
[ 95% Conf . I nt er v al ]
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - pnbppa |
- . 021411
. 0018562
- 11. 53
0. 000
- . 0250858
- . 0177362
pnb_2 |
1. 33e- 06
1. 68e- 07
7. 93
0. 000
9. 98e- 07
1. 66e- 06
pnb_3 |
- 2. 50e- 11
4. 16e- 12
- 6. 01
0. 000
- 3. 32e- 11
- 1. 68e- 11
_c ons |
104. 6266
4. 465046
23. 43
0. 000
95. 7869
113. 4664
------------------------------------------------------------------------------

ras lo cu al se p u ed en gen er ar los valores tericos d e la var iable depen d ien te a fin de ob ten er la r ep resen tacin d el aju ste c bico
p red ict ttm iif e
sam ple
label variable ttm i
rediccin c bica
scatter ttm itm i pnbppa if e
sam ple
, connect
lsym bol
i onam e
, replace

l grfico resu ltan te de las an terior es in stru ccion es es el sigu ien te

50

100

150

200

GR F I 9 .1. R e p r e se n t a ci n gr
ic a d e la r e gr e si n c b ic a

10000
20000
PNB por unidad de compra
Prediccin cbica

30000

Tasa de mortalidad infantil /1000 1998

Regresin in ersaara con segu ir u n a r egr esin de este tip o, es su ficien te con vertir pr eviam en te la var iable in d ep en d ien te en su in ver sa con la in stru ccin gen erate e in trodu cir la com o n ico pr ed ictor d e la ecu acin .

gen era te in vpn b


p n b pp a
regress tm i in vpn b

l form ato d el resu ltado es idn tico al de u n a r egr esin sim ple.
ILR IN 9.. R e gr e s i n in ve r sa
Sour c e |
SS
df
MS
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - Model |
139222. 172
1 139222. 172
Res i dual |
45953. 8759
123 373. 608747
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - Tot al |
185176. 048
124 1493. 35523

Number of obs
F( 1,
123)
Pr ob > F
R- s quar ed
Adj R- s quar ed
Root MSE

=
=
=
=
=
=

125
372. 64
0. 0000
0. 7518
0. 7498
19. 329

-----------------------------------------------------------------------------t mi |
Coef .
St d. Er r .
t
P>| t |
[ 95% Conf . I nt er val ]
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - i nvpnb |
67857. 04
3515. 193
19. 30
0. 000
60898. 93
74815. 14
_cons |
11. 53628
2. 365531
4. 88
0. 000
6. 853862
16. 21871
------------------------------------------------------------------------------

om o pu ede ap reciarse con este sim ple m odelo se llega a ep licar el


de la var ian a d e la variab le dep en d ien te (R-su ared).
on los m ism os pr in cipios con los qu e se a eco en las regresion es
cu ad rtica y c bica, en la in versa tam b in pu ed en r epr esen tar se los p u n tos
em pricos y la ln ea d el m odelo.
p red ict ttm in v if e
sa m p le
la bel va ria ble ttm in v
rediccin in versa
scatter ttm inv tm i pnbppa if e
sam ple
, connect
l .
sym bol
i onam e
, replace

l resu ltado ser u n n u evo grfico con u n a cu r va en form a d e

50

100

150

200

GR F I 9 .1. R e p r e se n t a ci n gr
ic a d e la r e gr e si n in ve r sa

10000
20000
PNB por unidad de compra
Prediccin inversa

30000

Tasa de mortalidad infantil /1000 1998

u edan fin alm en te por eplicar las r egr esion es log-lin eales qu e, a su
ve
, p u eden ad op tar tres m odalidad es
Regresion es log-logon aqu ellas en las qu e tan to la var iable depen dien te
com o la in depen dien te son tr an sform ad as en su cor respon d ien te logar itm o.
u coeficien te, en lu gar de in dicar cu n tas u n idad es cam bia la var iable d ep en dien te por cad a u n idad qu e cam bia la in d epen dien te, in dica la tasa de
cam b io qu e su fr e la p rim er a por u n cam b io r elativo en la segu n d a. e pu ede
ep resar d e los d os m odos sigu ien tes

.
a pr im era fr m u la es tal cu al se p repar an los d atos para qu e p u ed a
r ealiarse la regresin com o si fu era lin eal. n la segu n d a, el valor d e la
variab le dep en d ien te se epr esa en fu n cin d e elevar el valor de la variab le
in depen dien te a u n a determ in ad a poten cia (b 1) y m u ltiplicar el r esu ltad o
p or u n a con stan te, ep(b 0).
a pr ep ar acin de esta r egr esin logar tm ica im p lica la gen eracin d e
d os n u evas variab les, qu e sean logaritm os n ep er ian os de las origin ales, y a
con tin u acin la realiacin de la r egr esin com o si fu ese lin eal
gen erate lpn bp pa ln
pn bp pa
gen erate ltm iln
tm i
regress l
tm i l
p n bp pa

l pr od u cto d e estas tres in str u ccion es es tam bin com o el d e la regresin sim ple
ILR IN 9.. R e gr e si n lo ga r t ica
lo g
lo g
Sour c e |
SS
df
MS
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - Model |
128. 217683
1 128. 217683
Resi dual |
24. 1159321
123 . 196064489
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - Tot al |
152. 333615
124 1. 22849689

Number of obs
F( 1,
123)
Pr ob > F
R- s quar ed
Adj R- squar ed
Root MSE

=
=
=
=
=
=

125
653. 96
0. 0000
0. 8417
0. 8404
. 44279

-----------------------------------------------------------------------------l _t mi |
Coef .
St d. Er r .
t
P>| t |
[ 95% Conf . I nt er v al ]
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - l _pnbppa |
- . 8884191
. 0347411
- 25. 57
0. 000
- . 9571869
- . 8196512
_c ons |
10. 58703
. 2899
36. 52
0. 000
10. 01319
11. 16087
------------------------------------------------------------------------------

osterior m en te, p ara obten er los valor es tericos de y, abr a qu e realiar la sigu ien te op er acin yep
,
x,,x ,. llo im plica

qu e el m od elo p red ice qu e la du p licacin d el pr odu cto n acion al br u to per


cpita en u n deter m in ado p as, por ejem plo, pasar de .per cpita a
.o de .a ., im p licar a u n a cada del en la tasa br u ta
d e m or talidad in fan til. ar a ob ten er esta ltim a can tidad ay qu e elevar

el dob lea ,
el coeficien te b 1). am bin , d e m odo m s d irecto,
p u ed e in ter pr etar se el coeficien te afir m an do qu e u n a su bid a d el en el
p redictor, im p lica u n a b ajada del , en el r esu ltad o.
ar a con segu ir con tata los valores ter icos de la var iable depen dien te,
p rim er o se obtien en los valor es de la variab le logartm ica y poster iorm en te
se con vier ten a su ep resin or igin al. s n ecesario, pu es, proceder en d os
p asos

p red ict ttm igg if e


sa m p le
gen era te ttm ggep
ttm igg
la bel va ria ble ttm gg
red iccin log-log

r as d ispon er de los valor es tericos de la var iable d ep en dien te, se p u ed e dem an d ar el grfico del m od o ab itu al
scatter ttm gg tm i pnbppa if e
sam ple
, connect
l .sym bol
i onam e
, replace

om o p u ed e apr eciar se, la ln ea del m od elo se aproim a b astan te a los


p u n tos em p ricos. Un R d e ,n os avala la bon dad d e p redecir el logar itm o de la tasa d e m ortalidad in fan til a p artir del logar itm o del p rod u cto
n acion al br u to per cpita.

ste proceder n o genera la m edia con dicion al en la m trica origin al. ara solven tarlo,
icard oldstein a gen erado u n procedim ien to llam ado predlog. st locali
ado en la red.
ara su b squ eda e in stalacin, escriba n et searcpredlog. Una vein corporado, pu ede obten erse ayu da de su u so y resultados, m edian te elp predlog.

50

100

150

200

GR F I 9 .1. R e p r e se n t a ci n gr
ic a d e la r e gr e si n lo ga r t ic a

10000
20000
PNB por unidad de compra
Prediccin loglog

30000

Tasa de mortalidad infantil /1000 1998

Regresin log-lin n este caso, slo se tr an sform a la variable d ep en d ien te. or tan to, los coeficien tes de la r egresin in d ican el cam b io relativo qu e
su fre esta, cu an d o la in depen d ien te vara en u n a u n idad. a epr esin m atem tica qu e respon de a este m od elo es la sigu ien te

.
ar a pod er obten er este m odelo y su rep resen tacin m ed ian te las in stru ccion es tata, estas d eberan ten er la secu en cia sigu ien te

gen erate ltm iln


tm i
regress l
tm i pn bp pa
p red ict ttm ign if e
sa m p le
gen erate ttm gn ep
ttm ign
label variable ttm gn
red iccin log-lin
scatter ttm gn tm i pnbppa if e
sam ple
, connect
l .sym bol
i onam e
, replace

a ecu acin r esu ltan te, em plean d o com o resu ltad o la tasa de m or talidad
in fan til
en realidad, su logaritm oy com o p redictor el pr od u cto n acion al
b ru to p er cpita, ofrece u n coeficien te de -,, lo qu e su pon e qu e
p ara b ajar u n esta tasa en este pas, se n ecesita au m en tar en .la
r en ta p er cp ita de su s ciu dadan os
-ep
-,

,
.

ILR IN 9 .. R e gr e si n e p o n e n cia l
lo g
lin
Sour c e |
SS
df
MS
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - Model |
109. 28253
1
109. 28253
Res i dual |
43. 0510845
123 . 350008817
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - Tot al |
152. 333615
124 1. 22849689

Number of obs
F( 1,
123)
Pr ob > F
R- s quar ed
Adj R- s quar ed
Root MSE

=
=
=
=
=
=

125
312. 23
0. 0000
0. 7174
0. 7151
. 59162

-----------------------------------------------------------------------------l _t mi |
Coef .
St d. Er r .
t
P>| t |
[ 95% Conf . I nt er val ]
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - pnbppa |
- . 0001196
6. 77e- 06
- 17. 67
0. 000
- . 000133
- . 0001062
_cons |
4. 094556
. 0715704
57. 21
0. 000
3. 952887
4. 236225
------------------------------------------------------------------------------

l gr fico resu ltan te con u n R de ,es decir, algo m en os aju ste qu e


el an ter ior m odelo, esp ecialm en te en los valor es b ajos de la var iable in dep en d ien te es el sigu ien te

50

100

150

200

GR F I 9 .1. R e p r e se n t a ci n gr
ic a d e la r e gr e si n e p o n e n cia l

10000
20000
PNB por unidad de compra
Prediccin loglin

30000

Tasa de mortalidad infantil /1000 1998

Regresin lin -logFin alm en te, qu ed a el m odelo d on de la variab le d ep en d ien te n o se tr an sform a en su logar itm o, p ero s lo ace la in d epen dien te.
a ecu acin m atride este m odelo es

.
or ello, slo es n ecesar ia la tradu ccin logartm ica d e la var iable in d ep en d ien te, y la secu en cia de in str u ccion es par a r ep resen tar u n a relacin
en tr e variab les de este tipo sera la sigu ien te

gen erate lpn bp pa ln


pn bp pa
regress tm i lpn bp pa
p red ict ttm in g if e
sa m p le
label variable ttm in g
rediccin lin -log
scatter ttm ing tm i pnbppa if e
sam ple
, connect
lsym bol
i onam e
, replace

l coeficien te de la regresin sign ifica cu n to su be o b aja la var iable


r esu ltad o por cad a p u n to logar tm ico qu e su ba el pr ed ictor. Un a form a
p rctica d e in terp retar lo es m u ltip licn dolo por ,, qu e es el logaritm o
n eper ian o de . l valor de este pr odu cto im plica el cam bio en la var iable
d epen dien te cu an do se du plica el pr ed ictor. e este m od o, de acu erd o con
la ilu str acin ., por cad a d u plicacin de pr odu cto n acion al br u to p er cp ita, la tasa d e m or talidad in fan til se r edu ce en ,pu n tos
por diem il
,
cifra obten id a m ed ian te el pr od u cto -,ln

.
ILR IN 9.. o e
icie n t e s d e la r e gr e si n d e l o d e lo lin
lo g
Sour c e |
SS
df
MS
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - Model |
133783. 834
1 133783. 834
Resi dual |
51392. 2139
123 417. 822877
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - Tot al |
185176. 048
124 1493. 35523

Number of obs
F( 1,
123)
Pr ob > F
R- s quar ed
Adj R- squar ed
Root MSE

=
=
=
=
=
=

125
320. 19
0. 0000
0. 7225
0. 7202
20. 441

-----------------------------------------------------------------------------t mi |
Coef .
St d. Er r .
t
P>| t |
[ 95% Conf . I nt er v al ]
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - l _pnbppa |
- 28. 69761
1. 603762
- 17. 89
0. 000
- 31. 87216
- 25. 52306
_c ons |
279. 9285
13. 38273
20. 92
0. 000
253. 4382
306. 4188
------------------------------------------------------------------------------

l aju ste m ed id o a travs d el R de este m odelo es de ,y, en este caso


d on de se relacion a la tasa de m ortalid ad in fan til con el pr odu cto n acion al
b ru to p er cp ita, el gr fico repr esen ta b astan te peor qu e el m odelo log-log
el con ju n to de d atos em p ricos, esp ecialm en te en los valor es altos d e la in d ep en dien te

50

100

150

200

GR F I 9 .1 . R e p r e se n t a c i n gr
ica d e la r e gr e si n lin
lo g

10000
20000
PNB por unidad de compra
Prediccin linlog

9.9.

30000

Tasa de mortalidad infantil /1000 1998

e r cicio s

. on la b a se d e d a tos m u n d ia l d e
m u n d o
, elige com o va r ia b le d ep en d ien te la esp er a n a d e vid a a l n a cer y com o in d ep en d ien tes la r en ta p er c p ita
en u n id a d es d e p od er d e com p r a y el
con tin en te. ep r od u ce la s r egr esion es r ea lia d a s en este ca p tu lo y
en cu en tr a u n m od elo sa tisfa ctor io.
. on la m ism a b ase d e d a tos, seleccion a u n a n u eva va r ia b le d ep en d ien te y seleccion a las va r ia b les in d ep en d ien tes m s a d ecu a d a s p a r a
la d efin icin d e u n b u en m od elo.
n tr od u ce tam b in , si te p a r ece con ven ien te, a lgu n a otr a va r ia b le n om in a l
factor
, com o, p or ejem p lo, la
p er ten en cia o n o al .
. on los d a tos em p lea d os en este ca p tu lo
m u n d o
, r ealia u n a tab la qu e cr u ce el con tin en te con la p er ten en cia a la p on ien d o en
la s ca sillas la m ed ia d e la ta sa d e m or ta lid a d in fan til. con tin u acin ,
a u n a r egr esin d e la ta sa sob r e a m b os factor es y su in ter accin .

n ter p r eta los coeficien tes en fu n cin d e la p r im er a tab la elab or ad a .

n tr od u ce com o cova r ia n a el p r od u cto n a cion a l p er cp ita y ob ser va


el cam b io qu e ep er im en ta n los coeficien tes d e los fa ctor es.
. on el cu estion ar io d el b ar m etr o d e a b r il d e
cis
, seleccion a la s cu atr o va r ia b les qu e r ep r esen tan la p r ob ab ilid ad su b jetiva d e
votar el en tr evistad o a los cu a tr o p ar tid os con can d id atu r as en tod o
el ter r itor io d el stad o y al m en os u n r ep r esen ta n te en el a r lam en to
esp a ol
, ,
U y Uy
. eleccion a d el cu estion ar io las var iab les qu e ter ica m en te se con sid er en m s im p or ta n tes p a r a ep lica r el

com p or tam ien to elector a l. om p a r a , fin a lm en te, los r esu ltad os d e las
cu a tr o ecu a cion es.
. or a , em p lean d o el b a r m etr o d e m ar o
cis
, tom a la p r im er a
p a r te d e la .com o va r ia b le r esp u esta . u sca ep lica cion es a la va r ia cin en la d isp osicin d el tiem p o lib r e d e la s p er son a s en el r esto
d el cu estion a r io. l m en os, in tr od u ce el seo com o fa ctor y la ed ad
com o p r ed ictor cu an tita tivo.

10
Dia gn st ico
d e
la
r e gr e si n
1 0.1.Su p u e st o s
de
la
r e gr e si n
lin e a l
E l m odelo poblacion al d el qu e se p arte para el corr ecto fu n cion am ien to de
la estim acin de los parm etr os de la r egr esin por el pr ocedim ien to de
m n im os cu ad rados r esp on de a la sigu ien te ecu acin :
(10.1)
Seg n ellaeiste en la p oblacin u n a r elacin lin eal en tr e u n con
u n to
k de ariab les in depen dien tes (xi) qu e dan lu gar d e m od o estocstico o in
d eterm in ad o a la ariab le d ep en d ien te (yi). or elloap arece en la ecu acin
la ar iable aleatoria
de la qu e se su pon e en el m odelo qu e se d istr ibu e
i
n or m alm en te con u n a m edia de 0.
ero en esta ecu acin d el m odelo n o estn d eclarados epresam en te u n a
serie d e prerrequ isitos p ara qu e los estim adores de los parm etros b ob ten i
dos p or el criterio de m n im os cu ad rados ten gan la p rop iedad de ser los m e

ores estim adores lin eales in sesgados (E


) del teorem a d e au ss
aro
.
asn dose en u
arati orter (00)au n qu e cam bian do el orden la
term in ologa u tiliada por estos au toreslos criterios qu e debe satisfacer el m o
delo de la regresin por el m todo de m n im os cu adrados son los sigu ien tes:
1. os alores de las ariab les in depen d ien tes an de ser fi
os.
. E l n m er o de ob ser
acion es deb e ser m aor qu e el n m er o d e
ar ia
b les in dep en d ien tes.
(10.)
. ebe aber su ficien te ariab ilidad en los alor es d e las
ar iables in
d ep en d ien tes.
(10.)

E S E
S

. E l trm in o d e per tu rb acin est n orm alm en te d istrib u ido.

(10.)
. ar a cada con
u n to d e casos con u n a xi d ad ael alor m edio de la
pertu rb acin (
i ) es cer o.

(10.)
. E n el caso de qu e las xi sean estocsticasn o eiste corr elacin en tre
estas los trm in os d e p ertu r bacin .

(10.)
. ar a cada con
u n to de casos con u n a xi d adala ar ian
a de
i es
con stan te u om oced stica.

(10.)

. o a r ela cin ea cta (n o a m u ltico lin ea lid a d ) en lo s r egr e


so r es.

(10.)
. o eiste au tocor relacin en tr e las p er tu r bacion es.

(10.)
10.
11.

E l m odelo d e r egr esin es lin eal en su s par m etros.


E l m odelo d e la regresin est corr ectam en te especificado.

os tr es pr im er os requ isitos son fciles d e com p rob ar sin n ecesid a d d e


op era cion es com p le
a s de n a tu r a le
a estad stica . E l pr im ero im plica qu e
la s
a ria b les in d epen dien tes n o son a lea tor ia scom o pu ede ser el ca so de
qu e sea n in tr od u cida s eper im en ta lm en te p or el in
estigad or. Sin em ba r
goen cien cia s socia lescom o es m u im pr oba ble qu e p u ed a n ten er esa
con d icin los r egr esor esn o es n ecesa rio qu e se cu m pla en ta n to en cu an
to el cr iter io seto est sa tisfeco. E l segu n do es d e fcil com pr ob a cin


S
S E S S

pu esto qu e ta n to n com o k son con ocid os. or cu estion es de determ in a


cin de los p ar m etr osestos son im posib les de estim a r siem pr e qu e k>n
p er oa u n en el ca so de qu e n >k, eisten a u tor es qu e recom ien da n pa r a
e
ita r la pr esen cia de altos err ores de estim acin u n a pr op orcin de
e
ces su p er ior el n m ero de casos sob re el de pa r m etros (fifi et a l. 00).
in a lm en teel ter cero pu ede com pr ob a rse m ed ia n te la ob ten cin d e la
d es
ia cin tp ica d e la s
a ria b les in d ep en d ien tes. m e
orsi cab econ el
coeficien te d e
ar ia cin qu e es el cocien te en tre a qu ella la m edia a ritm
tica de la
ar ia ble. el m ism o m odo qu e el su pu esto an ter iorin cide pr in
cipa lm en te en la cu a n ta de los er r or es tpicos de los p ar m etros. u a n do
la
ar ia bilida d de x es ba
a a u tom tica m en te el d en om in a d or del clcu lo
d e estos esta dsticos tien de a 0
p or ta n toel r esu ltad o d el cocien te se
ele
a r a sta can tida d es ecesi
a m en te a lta s. b
io es qu e la solu cin a
los p rob lem a s su scita dos en el segu n d o ter cer su pu esto es el in cr em en to
d e la m u estra 1 .
os su pu estos cu artoqu in to setotod os ellos r elacion ad os con el tr
m in o de la pertu rb acin p u ed en ealu ar se con d istin tas in str u ccion es p re
sen tes en Stata. a p rim era fu n dam en tal d e ellas es la gen eracin d espu s
d e r ealiar u n a r egr esin de u n a n u ea
ar iablequ e epr ese los r esid u os
d e la r egr esin qu e son los m e
or es in dicador es m u estrales d el tr m in o d e
p er tu r bacin en la pob lacin . ap ar a ellos tres m od alid ades qu e pu ed en
seleccion arse en fu n cin d e la op cin qu e se a ada al com an d o predict. E s
tas tres opcion es son :
a)

os resid u os sim ples m edidos en las m ism as u n id ades qu e la


ar ia
b le depen dien te (,residu als):

(10.10)
b)

os r esid u os tipificad oses d ecirtr an sform ad os para qu e ten gan


m edia de 0 d esiacin tp ica igu al a 1 (,rstan dard):

(10.11)

1
n problem a bastan te com n en la regresin m ltiple es el del descen so del n m ero de
casos de la m u estra origin al al in trodu cir m u cas
ariables con u n alto n m ero de casos per
didos.
n clusoau nque no lo seanse pu ede dar u n a com bin acin de au sen cia de inform acin
entre ellas (com o en el caso de pregun tas filtradas)qu e aga ba
ar su stan cialm en te el n m ero
de casos con los qu e se opera. E n estas ocasion eses conen ien te prescin dir de las predictores
que causen u n con siderable descen so de la m u estrano slo por los problem as de au m ento del
error tpicosino sobre todo por los de seleccin sesgada de in diidu os m u estrales.

c)

E S E
S

os resid u os stu d en ti
ad ossi se diid e por la d esiacin tpica d e los
resid u ales resu ltan te de elim in ar el caso en cu estin (s e(i)) (,rstu den t):

(10.1)
E stas tr es ariab les pu eden obten erse al solicitar el com an do predict
tr as la e
ecu cin de u n a r egr esin con la cor resp on d ien te opcin
obia
m en teel n om b re qu e se le qu ier a d ar a la n u ea
ar iable:
p r e d ict
n u eaar

r e sid u a l
p r e d ict
n u eaarr st a n d a r d
p r e d ict
n u eaarr st u d e n t

n e
em p lo de aplicacin d e in stru ccion es se p u ede aplicar a u n a de las
r egr esion es obten id as en el cap tu lo an ter ior :
regress
p red ict
p red ict
p red ict

tm i pn bp pa
tm irresidu al
tm irtrstan da rd
tm irsrstu d en t

par tir d e ase d isp on e en la base de d atos abier ta d e tr es n u e


as
ariab les con las qu e se pu ede op er ar com o si u b ieran sido in tr od u cidas al
crear el ficer o. e este m odosi se escr ibe la sigu ien te in stru ccin
su m m a rie tm i

se obtien en los estadsticos b sicos d e las tres n u eas


ar iables:

E n Stata pu eden em plearse los sm bolos para con stru ir listas de


ariables. E l pri
m ero sign ifica reem pla
o de un a caden a de caracteres segu idosm ien tras qu e el segu ndo slo
reem pla
a u n carcter al tiem po. l escribir
elue tm i, pu esto que eclu e la posicin
en blan com ientras que la in clu e. Si slo se ubiera puesto
slo se in clu ira tm ir, si se
u biera escrito tm i??, la lista abra sido tm irt tm irs.

S
S E S S

ILUSTR ACIN
1 0.1 .E st a d st ico s
de
lo s
r e sid u o s
Var i abl e |
Obs
Mean
St d. Dev .
Mi n
Max
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - t mi r |
125
7. 63e- 08
29. 67555 - 41. 25054
105. 1491
t mi r t |
125
. 0020788
1. 00298
- 1. 39146
3. 553735
t mi r s |
125
. 0051997
1. 012505
- 1. 39683
3. 736263

om o pu ede apr eciar sela m ed ia de los resid u os es pr cticam en te igu al


a 0 la des
iacin tpica d e los tipificad os es igu al a 1. ero tam bin se
ob ser a cm o los alor es m n im os d e los resid u os tipificados stu d en tia
d os son en alores absolu tos bastan te m en ores qu e los m im oslo qu e es
in dicatio de u n a n otable asim etra en la distr ibu cin .
ara er si esa m edia de 0 es con stan te a lo lar go de los distin tos alor es
d e x (su pu esto qu in to)en cu o caso tam bin se cu m p lir a la n o corr elacin
en tr e
to)se pu ede proceder a la con str u ccin del gr fico
i x i (su p u esto se
qu e cr u a los resid u os con los alores pr edicos de la ar iable depen dien te.
E ste p u ed e obten erse d e m odo fcil con escr ibir tras u n a regresin el co
m an d o rvfplotqu e r ep resen ta la n u b e d e p u n tos de los resid u os versu s los
alor es a
u stados de la r egr esin :
rfp lot

com o con secu en cia de esta in stru ccin aparecer el sigu ien te grfico:

50

Residuals

50

100

R IC
1 0.1.Nu e
de
p u n t o s
d e
lo s
r e sid u o s

40

20

20
Fitted values

40

60

E n este e
em p lo es obio qu e el
alor m ed io d e los r esidu os cam b ia con
los alor es a
u stad osqu e en este casocom o slo se dispon e de u n a aria

E S E
S

b le in depen dien tecoin ciden lin ealm en te con los


alores de esta. Se n ota
cm o en los alor es m s b a
os de la ariab le in dep en d ien telos resid u os
an
d escen dien do a m edid a qu e aqu ella au m en taper o a p ar tir d e deter m in ado
alor (ap roim adam en te los 0 a os d e
alor a
u stado)la m edia del
alor
esperad o d e los resid u os a acin dose cada em aor.
tr o r equ isito qu e pu ede
er ificarse de m od o fcil con Stata es la su
p u esta n or m alidad en la distrib u cin de los r esidu os (su p u esto cu ar to). ara
ello ad ier sas posib ilidad es. a p rim era m s sim ple es a tras del
eam en estad stico d e los coeficien tes d e sim etra cu r tosis. Se d ispon e de
u n com an doqu e n o slo los calcu lasin o qu e tam b in reali
a u n a pr u e
b a estadstica sobr e ellos par a er si son sign ificatiam en te distin tos de la
ip tesis n orm al. a or den sktest per m ite realiar estas op er acion es con tal
d e epr esar las ar iables cu a n orm alid ad se d esea
er ificar:
stest tm ir tm irs tm irt

E sta p ru eba estadstica esen r ealid ad u n a com p robacin de qu e sim e


tr a cu rtosis son igu ales qu e los qu e la d istr ibu cin n orm al pr esen ta.
ILUSTR ACIN
1 0..Asie t r a

cu r t o sis
d e
lo s
r e sid u o s
Sk ewness / Kur t os i s t est s f or Nor mal i t y
- - - - - - - j oi nt - - - - - Var i abl e |
Pr ( Sk ewness )
Pr ( Kur t osi s ) adj c hi 2( 2)
Pr ob>c hi 2
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - t mi r |
0. 001
0. 476
9. 34
0. 0094
t mi r s |
0. 001
0. 486
9. 30
0. 0096
t mi r t |
0. 001
0. 261
10. 78
0. 0046

E n este casolos r esidu ostan to n orm ales com o estan dar i


ad os o stu
d en ti
ad ospr esen tan u n a distribu cin asim tricap or lo qu e n o p u ed e afir
m ar se qu e su d istr ibu cin sea n or m al.
am b in pu ed en u tiliarse p ara com p robar la d istr ibu cin de la n or m al
las pr u eb as de Sap iro
ilSap ir o
ran ciacu as rden es resp ecti
as
son swilk sfran cia segu idas de la lista de ariab les cu a n or m alidad se d e
sea com p robar. e este m odocon las dos sigu ien tes in str u ccion es:
siltm ir
tm irt
sfran cia tm ir
tm irt

se obtien en las m ism as con clu sion es qu e con las pr u eb as d e sim etr a
cu rtosispu es en cada
ar iable p u ed e r ecaarse con u n n iel de sign ifica
cin in ferior al 0
0la iptesis n u la d e qu e la distribu cin es n orm al.

S
S E S S

ILUSTR ACIN
10 ..r u e a s
d e
n o r a lid a d
de
lo s
r e sid u o s
Shapi r o- Wi l k W t es t f or nor mal dat a
Var i abl e |
Obs
W
V
z
Pr ob>z
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - t mi r |
125
0. 94111
5. 866
3. 972 0. 00004
t mi r s |
125
0. 94104
5. 873
3. 975 0. 00004
t mi r t |
125
0. 93902
6. 074
4. 051 0. 00003

Shapi r o- Fr anci a W' t es t f or nor mal dat a


Var i abl e |
Obs
W'
V'
z
Pr ob>z
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - t mi r |
125
0. 94245
6. 248
3. 636 0. 00014
t mi r s |
125
0. 94239
6. 255
3. 638 0. 00014
t mi r t |
125
0. 93985
6. 531
3. 719 0. 00010

in alm en ted e u n m odo grficotam b in pu ede com p robarse cu n d is


tin ta es d e la n orm al la distrib u cin d e los resid u os m ed ian te la au da de
grficos. este resp ecto p odran u tiliarse tan to u n grfico de probabilid ades
(pn orm ) com o d e cu an tiles (qn orm ), o el d e su perposicin de las dos d istrib u
cion es m ed ian te la in stru ccin kden sitysegu ida de la opcin n orm al:
d en sittm irtn orm al

qu e dar lu gar al sigu ien te grfico d e fr ecu en cias d e u n a otra dis


tribu cin .
R IC
10 ..Co p r o a c i n
gr
ica
de
la
n o r a lid a d
de
lo s
r e sid u o s

.1

Density
.2

.3

.4

Kernel density estimate

Standardized residuals
Kernel density estimate
Normal density
kernel = epanechniko
andidth = 0.343

tr o de los diagn sticos qu e an d e efectu ar se a tod a regresin es el d e


la om ocedasticidad (su p u esto sptim o). Se en tien de por esta p rop iedad el

E S E
S

eco de qu e las ar ian as resid u ales sean las m ism as in dep en d ien tem en te
d e los
alores de las ariab les in depen dien tes
p or eten sin d e los alor es
p redicos de la d ep en d ien te. or ellola for m u lacin ep resada en (10.)
p u ed e r eform u larse m edian te la sigu ien te epr esin :

(10.1)
E l m edio grfico id n eo p ar a ob serar la p resen cia d e eter ocedasti
cidad es el qu e cru a r esidu os con los alor es pr edicos d e la ariab le de
p en d ien tequ e se obtien e m ed ian te la in stru ccin rvfplotcom o se a isto
an terior m en te a se a e
em plificad o en el grfico 10.1.
Stata disp on en o ob stan tede u n a pr u eb a qu e da cu en ta n u m r icam en te
d e la eisten cia de la eter ocedasticidad. Se tr ata del test d e oo
eisberg
(1)qu e se obtien e esp ecifican d o la in str u ccin hettest tr as la e
ecu cin
d e u n a r egr esin . s pu estras la regresin d e la tasa d e m ortalid ad in fan til
sobr e el pr od u cto n acion al b ru to p er cpitaal escrib ir la sigu ien te ln ea:
ettest

se ob tien e el sigu ien te r esu ltad o:


ILUSTR ACIN
1 0..r u e a
de
e t e r o c e d a st ic id a d
de
Co o

e ise r g
Br eus ch- Pagan / Cook- Wei s ber g t est f or het er os kedast i ci t y
Ho: Cons t ant var i anc e
Var i abl es : f i t t ed v al ues of t mi
c hi 2( 1)
Pr ob > c hi 2

=
=

12. 23
0. 0005

om o a ll m ism o se epr esa el


alor d e la ip tesis n u la es el de
a
ria n
a con sta n te. om o en este caso el con u n gra do de liber ta d tien e u n

a lor su per ior a 1con u n a p roba b ilida d in ferior a l a de reca


a rse
la iptesis d e om oced asticida d . or ta n tose est a n te u n d ato a dicion a l
qu e n os a ce descon fia r de la estim acin de m n im os cu a dr a dos or din a
rios.
a a u sen cia d e m u lticolin ealid a d es otro de los cr iter ios (su pu esto oc
ta
o)ap licab le slo en ca sos d e regresin m ltiple. or m u lticolin ea lida d
se en tien de la cor rela cin en tre la s
a riab les in dep en d ien tes. E l criter io
m s u tili
a do p a ra d etecta r la es el de la tolera n cia (com p lem en ta r io del
coeficien te de determ in a cin m ltip le de u n a
a riab le in d ep en d ien te con
el r esto) o su in
er socon ocid o com o fa ctor d e in fla cin de la
a ria n
a
(VI).


S
S E S S

(10.1)
ed ian te el pr ogr am a Stata se p u ed en obten er estos n d ices d e m u lti
colin ealid ad al in tr od u cir la in str u ccin vif desp u s d e u n a in stru ccin . e
este m odosi se in tr odu cen estas dos in stru ccion es:
regress tm i pn b pp a lin tfn o pibag
if

se obten d r com o resu ltado d e la segu n da el sigu ien te listado de a


r iables in depen dien tes:
ILUSTR ACIN
1 0..n d ice
d e
u lt ic o lin e a lid a d
en
la
r e gr e si n
lt ip le
Var i abl e |
VI F
1/ VI F
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - l i nt f no |
12. 37
0. 080856
pnbppa |
11. 81
0. 084651
pi bag |
1. 85
0. 539234
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - Mean VI F |
8. 68

E n esta ta b la se d etecta a lta colin ea lid a d so b r e tod o en tr e la s a r ia


b les pn ppa lin tfn o. om o r egla su ger id a se r ecom ien d a qu e el fa cto r
n o su p er e el a lor d e 10lo qu e equ ia le a l 0
10 d e su in er so od ico
d e o tr o m od o cu a n d o u n a a r ia b le d e la ecu a ci n tien e u n co eficien te
d e cor r ela ci n m ltip le co n el r esto d e la s a r ia b les su p er ior a 0
los
p r o b lem a s d e eficien cia d e lo s estim a d or es ser n m u elea d o s. on
a lgo m s d e r igu r osid a d n o d eb er a a cep ta r se la in clu sin d e a r ia
b les con VIsu p er io r es a equ ia len tes a co eficien tes d e cor r ela cin
d e 0
0.
e m odo gr ficoau n qu e im p ar cial por slo recoger r elacion es bia
r iadasse p u ed e recu r rir a la m atr ide n u be de p u n tos en tre las
ar iables
in depen dien tes p ar a
er si en tre algu n a de ellas se pr od u ce algu n a e
iden te
fu er te relacin lin eal.
grap m atrip n b pp a lin tfn o piba galf n a m e()

e este m odose gen era el sigu ien te r esu ltad oen el qu e claram en te se
e la p ecu liar r elacin lin eal en tre el p rodu cto n acion al b ru to p er cp ita el
n m er o d e ln eas telefn icas p or cada m il ab itan tes.

E S E
S

R IC
1 0..a t r i
d e
n u e s
d e
p un tos

PNB por
unidad
de
compra

00

Lineas
telefonicas
(x 1000
hbs) 1998

00
00
0
0
0

PIB en
agricultura

0
0
0

0000

0000
0

00

00

00

tro requ isitoesp ecialm en te rele


an te crticoen las regresion es con
series tem poraleses el d e la in dep en d en cia de los resid u os (su p u esto n oe
n o). E l par de estad sticos m s u tili
ados p ara detectarla es el d e u rb in
atson el d e reu sc
odfre
qu e d eb eran ser istos con m aor profu n
did ad en u n tem a relacion ado con este tipo m od elos qu e em p lean datos ob
ten idos regu larm en te en d istin tos p eriod os de tiem poqu e n o es el caso de
este captu lo.
s im por tan cia en este con teto tien en los requ isitos dcim o u n d ci
m oqu e se refier en a qu e en la poblacin se d efecti
am en te u n a r elacin
lin eal a qu e la
ar iable dep en d ien te dep en d a efectiam en te de los p red ic
tor es qu e se an esp ecificado en la ecu acin . Si en la p oblacin de la qu e
se etraen las m u estr as n o se da u n a r elacin lin eal o si se eclu e algu n a
ariab le fu n dam en tal en la ecu acin de regresin los estim adores ob ten id os
m edian te la m u estra estarn sesgadossalo en el im p rob ab le caso d e qu e la
om itida ten ga corr elacin n u la con el r esto d e las
ar iables d el m odelo.

n dicios de m odelos n o lin eales o de in correctas especificacion es (su pu es


tos dcim o u n dcim o) se dedu cen a tras de ba
os coeficien tes de determ i
n acin altos errores tpicos de los parm etrosalta au tocorrelacin o distri
bu cion es n o n orm ales de residu os. dem s de elloStata cu en ta con u n test
(el de am se1ovtest) qu e perm ite erificar los errores de especificacin .
E isten dos m odalidades: en la prim era se a aden los trm in os cu adradosc
bicos a la cu arta de los alores predicospara
er si estos son sign ificatios
en la segu n daqu e se obtien e m edian te la opcin rhslo qu e se a aden son las
poten cias de las ariables in depen dien tessiem pre cu an do n o sean ficticias.
om o otras in str u ccion es d e d iagn sticoesta a de esp ecificar se d es
p u s de la r egr esin cor respon d ien te. n e
em p lo n os m u estra cm o con
u n liger o cam bio d e las ariab les se p u ed en corr egir estos pr ob lem as de

S
S E S S

esp ecificacin . E n pr im er lu garse reali


an los diagn sticos de la tasa d e
m or talidad in fan til regresada con el p rodu cto n acion al br u to per cpita:
regress tm i pn b pp a
o
test

E l resu ltado m u estr a u n a difer en cia sign ificatia d e con sider acin .
ILUSTR ACIN
1 0..r u e a
d e
R a se
so r e
o isi n
d e
a r ia le s
en
la
r e gr e si n
r e gu la r
Rams ey RESET t es t us i ng power s of
Ho:
model has no omi t t ed
F( 3, 120) =
Pr ob > F =

t he f i t t ed v al ues of t mi
var i abl es
56. 11
0. 0000

Sin em b ar goal tr an sform ar las ariab les en su s logar itm oses pr eciso
r ealiar de n u e
o la p ru eba.
for
a r tm i p n bp pa:gen era te l
ln ()
regress l
tm i l
p n bp pa
o
test

E n este casocon los d atos ob ten id ospu ede n o ser recaada la ip te


sis n u la de qu e el m od elo n o a om itido
ar iables im por tan tes.
ILUSTR ACIN
1 0..r u e a
d e
R a se
so r e
o isi n
d e
a r ia le s
en
la
r e gr e si n
lo ga r t ic a
Rams ey RESET t es t us i ng power s of
Ho:
model has no omi t t ed
F( 3, 120) =
Pr ob > F =

t he f i t t ed v al ues of l _t mi
var i abl es
1. 84
0. 1444

os grficos tam b in p u ed en ser tiles en la deteccin d e lin ealidad en


la relacin en tre las ariab les relacion ad as. dem s del gr fico
isto an te
r ior m en te qu e en se a las r elacion es bi
ar iadas en tr e las ariablesp u ed en
ser u sados los grficos de regr esin p arcial o gr ficos d e ariab le a adida.
Se trata d el cru ce en trepor u n ladolos r esidu os de la ariab le depen d ien te
d el r esu ltad o de su regresin con el r esto de las
ar iables in depen dien tes

p or el otr o ladolos resid u os d e la


ar iable in d ep en d ien te ob ten idos tr as
con sid er arla depen dien te d el resto d e las in d ep en d ien tes. a pen dien te d e
este grfico n o es otr a cosa qu e el coeficien te p ar cial d e la r egr esin .

E S E
S

a instruccin es fcil de e
ecutar. asta con escribir avplots. Si as se especi
ficase gen erar un grfico por cada
ariable independiente. aso de que se quie
ra slo el grfico de una
ariablela instruccin a de eplicitarse en singu lar
(avplot), seguida de la
ariable in dependiente que se desee representar. aunqu e
se qu ieran todos los grficoses preferible para m e
or detalle obtenerlos in di
i
dualm ente. tro aspecto que a de ten erse en cuen ta es que esta instruccin
com o la de los grficos an teriorespuede utili
arsiem pre que le sea pertin ente
las opciones propias de la instruccin
raph. e este m odoentre otros aspectos
se podran obtener grficos con las etiqu etas de los casos presentes en la nube
de pu ntos. sen la regresin del logaritm o de la tasa de m ortalidad infantil en
funcin del logaritm o del producto n acional bruto per cpita de las lneas tele
fnicas por m il abitan tesse pueden gen erar los grficos de este m odo:
regress ltm i l
p n b pp a lin tfn o
aplot lpn b pp am label(pa is)
aplot lin tfn om lab el (p ais)

par tir de lo qu e se gen er aran u n a r egr esin (log


log) d os grficosel
segu n d o d e los cu ales ad op tar a el asp ecto d el grfico 10..
ILUSTR ACIN
10 ..R e gr e si n

lo g
lo g

de
la
t a sa
de
o r t a lid a d
in
a n t il
so r e
p r o d u ct o
n a cio n a l
per
c p it a

n e r o
de
ln e a s
t e le
n ica s
Sour c e |
SS
df
MS
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - Model |
133. 661425
2 66. 8307126
Res i dual |
18. 4490767
121 . 152471708
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - Tot al |
152. 110502
123 1. 23667075

Number of obs
F( 2,
121)
Pr ob > F
R- s quar ed
Adj R- s quar ed
Root MSE

=
=
=
=
=
=

124
438. 32
0. 0000
0. 8787
0. 8767
. 39048

-----------------------------------------------------------------------------l _t mi |
Coef .
St d. Er r .
t
P>| t |
[ 95% Conf . I nt er v al ]
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - l _pnbppa |
- . 5244678
. 0674209
- 7. 78
0. 000
- . 6579452
- . 3909904
l i nt f no |
- . 0022806
. 0003767
- 6. 05
0. 000
- . 0030264
- . 0015348
_cons |
7. 98921
. 4993729
16. 00
0. 000
7. 000569
8. 97785
------------------------------------------------------------------------------

En el e
e de orden adas se represen tan los residu os de la ariable depen dien
te obten idos con su regresin sobre el logaritm o del produ cto n acion al per c
pita en el e
e de abscisas se represen tan los residu os de las ln eas telefn icas
obten idos en su regresin sobre el logaritm o del produ cto n acion al per cpita
esto esel resto de las ariables in depen dien tes. Es preciso n otar qu e la in cli
n acin de la ln ea represen tada es el coeficien te parcial de regresin m ltiple
an otado tam bin en la parte in ferior del grfico
u n to con su error tpico. o
qu e aqu e com probarpara erificar el su pu esto de lin ealidades qu e n o aa
u n a pau ta cu riln ea o plan a de distribu cin de los casos.

S
S E S S

R IC
1 0..r
ico
de
r e sid u o s
d e p e n d ie n t e s
so r e
lo s
in d e p e n d ie n t e s
(a vp lo t)

Surafrica
Botsuana Namibia

Guinea

Mexico

eltmi

Brasil
Argentina
Peru

Argelia
Tailandia
Tunez

esoto
Zimbabue
Dominicana
ep
Egipto

ndia
Marruecos

uruia

aos
Paistan

Estados Unidos

Mauritania
Costa deCambo
Mar
il a
Papua Nueva Guinea
olivia
Uganda

ran
Ghana
Centroafricana (Rep)
Mozambique
Colombia
Camerun
Filipinas
rugua angladesh
ogo
Belgica

umania
Corea del
Sur
aiti ibano

ndonesia
Bur
ina aso
enezuela China
Nepal

ur
menistan
enegal
Portugal
Niger eino nido
Panama

usia
Paraguay
MaliZambia
Jordania
Canada Dinamarca
rlanda Austria
Chad
Malaui
Angola
Kazajistan
Congo
Holanda

ungria
Australia
Alemania
Benin
Francia
Sierra
SuizaLeona
Ecuador
onduras
Kenia

talia
Noruega
Letonia Singapur
Madagascar
Mongolia
Nicaragua iria
Burundi
Eslovauia
Etiopia
Japon
Chile
Grecia
Albania
Polonia
Costa
ica
Eritrea
Espana
Nueva Zelanda
Jamaica

emen

ep
NigeriaFinlandia
ielorrusiaMacedonia

ulgaria
ietnam
Estonia
Eslovenia
Kirguizistan
Malaisia
Georgia
epublica Checa
Lituania
ong ong
China Tanzania
Croacia
Sri an
a
zbeistan
Guatemala

Suecia

Ucrania
Molda
ia
Azerbai
an

Tayikistan

elint
no

coe
22se
2t

Se an
isto las erram ientas de las que dispone Stata para detectar el in
cu m plim iento de los supuestos de la regresin . ara acabar este apartado n o
estara de m s reali
ar un com pendio sim plificado de ellas
iendo su s efectos
el m odo de detectarlas. a m aor parte de ellas inciden en la ba
a eficiencia de
los estim adoreses decirm ultiplican la posibilidad de que obtengam os una es
tim acin ale
ada del
alor correcto. os in cum plim ientos qu e gen eran slo pro
blem as de eficiencia son la eterocedasticidad la autocorrelacin . a prim era
se detecta m ediante el grfico de residuos sobre los
alores predicos (rvfplot)
de m odo m s preciso con el test de oo
eisberg (hettest). a segunda con el
estadstico de urbin
atsonaun que en principio no debera preocupar siem
pre que n o se tengan datos de series tem porales. a m ulticolinealidad tam bin
gen era problem as de ineficiencia e incluso pu ede llegar a acer qu e sean in
calculables los parm etros de la regresin en el caso de qu e sea perfecta. Su
m odo de deteccin es a tra
s de la toleran cia o del factor de inflacin de la

arian
a obtenido m edian te la orden vif. Si las perturbaciones no son norm a
leslos estim adoresadem s de ineficientesn o estarn distribuidos norm al
m entepor lo que no sern
lidas las pru ebas de significacin . dem ssi las
m edias de las perturbaciones no son 0los parm etros sern segadosespecial
m ente peligrososi la esperan
a de las perturbaciones es adem s inconstante
porqu e afectara no slo a la constantesino tam bin a los coeficien tes de las

ariables. inalm enteel problem a principal es que la m atride las


ariables
independientes sea estocstica adem s correlacionen las
ariables regresoras
con los trm inos de perturbacin. E n dico casolas estim aciones poseern
im portantes segos no sern n i eficientes ni con sistentes. Estos problem as son
detectables principalm ente a tra
s de grficos de residu os con las
ariables
independientes con la pru eba de am se(ovtest)

E S E
S

10 ..An lisis
d e
lo s
ca so s
en
la
r e gr e s i n
dem s de erificar qu e se cu m p len los su pu estos de la regresin es til
eam in ar el com p or tam ien to d e los casospor cu an to estos p u ed en sesgar
el com portam ien to d e los estim ador es de los par m etros. atres tipos de
m edida qu e d eb en eam in arse p ara er si eisten casos qu e p u eden estar
p er tu r ban do u n a r egr esin . E n pr im er lu garlos a con ocid os r esidu osde
los qu e aor a se estu diar n o su com por tam ien to con
u n tosin o el p articu
lar de cad a caso. E n segu n do lu garestn las m edid as qu e pon der an la car
ga d e las
ariables in dep en d ien tesd e m odo qu e ten gan p u n tu acion es m s
altas m ien tr as
alores m s etrem os ten gan en estas. fin alm en teestn
aqu ellas pu n tu acion es qu e r efle
an de u n o u otr o m odo su con tr ib u cin a
los coeficien tesa los
alores pr edicos o al er ror estim ado de la regresin .
as p rim er as d e estas p u n tu acion es son los resid u os. s com o an terior
m en te eam os su s pr om ed ios su s distrib u cion esaor a r esu lta m s pro
p io el eam en d e los alor es etr em os. ara ellose disp on e en Stata tan to
d e err am ien tas n u m r icas com o gr ficas.
E n tr e las p rim er as est la in str u ccin listqu e en con
u n cin con la in s
tr u ccin sort la esp ecificacin ifp u ed e dar cu en ta d e m od o ord en ad o slo
d e los casos qu e ten gan alor es etr em os.
sdespu s de la regresin de la tasa logartm ica de m ortalidad in fan til
con el logaritm o del produ cto n acion al per cpita las ln eas telefn icastras
la a efectu ada gen eracin de los distin tos residu osse pu eden localiar aqu e
llos casos con alores etraordin ariossi as se con sideran aqu ellos cu o
alor
est 1
desiacion es tpicas por en cim a o por deba
o de la m edia aritm tica:
for an r rs rt a n resid u a l rstan dar rstu den t: p red ict ltm i
gen era te ltm ira abs(ltm ir)
gsort
ltm ira
list pa is ltm ir ltm irs ltm irt if (a bs(ltm irs)1.abs(ltm irt)1.) e(sam ple)

edian te estas in stru ccion esse crea u n a ariab le con los alores absolu
tos de los resid u os para pod erlos ord en ar d escen den tem en te por su tam a o.
fin alm en tese seleccion an los p ases qu e an en trad o en la regresin con
alores absolu tos tpicos o stu d en tiad os su p eriores al pu n to crtico de 1

corresp on dien te al n iel d el (p or elloen con dicion es d e n orm alidad de


b eran ap arecer ap roim adam en te en el listad o cin co de cad a cien casos).
E l resu ltado en la r egr esin com en tada es el sigu ien te:

l reali
ar u na regresinStata registra u na serie de resu ltados estim acion es con u n
n om bre especfico. na de las m s tiles es la fu ncin e(sam ple), qu e perm ite seleccionar los
casos qu e an en trado en la ltim a regresin al especificarla dentro de u na clu su la if de u na
in stru ccin posterior.

S
S E S S

ILUSTR ACIN
1 0..List a d o
de
r e sid u o s

1.
2.
3.
4.
5.
6.
7.
8.

+- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - +
|
pai s
l t mi r
l t mi r s
l t mi r t |
| ----------------------------------------------------|
|
Tayi k i s t an
- 1. 156497
- 2. 999984
- 3. 105277 |
|
Sr i Lank a
- . 9439814
- 2. 442333
- 2. 494482 |
|
Sur af r i c a
. 9388283
2. 458475
2. 511833 |
|
Az er bai y an
- . 8882979
- 2. 286082
- 2. 327433 |
| Es t ados Uni dos
. 8813
2. 323113
2. 366879 |
| ----------------------------------------------------|
|
Nami bi a
. 8771846
2. 284423
2. 325668 |
|
Bot suana
. 851571
2. 22672
2. 264379 |
|
Tur qui a
. 8011727
2. 061442
2. 089934 |
+- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - +

om o p u ed e apr eciar seu n os son p ositioslo qu e in dica qu e son p ases


con u n a tasa de m ortalid ad in fan til su per ior in clu so a la esperada con su
p rod u cto n acion al b ru to per cpita n m er o d e ln eas telefn icasotr os son
n egatiosen el caso d e qu e las
ar iables in d epen dien tes pr ed igan tasas de
m or talidad in fan til m s ba
as de las r eales.
n m odo gr fico fcil de d etectar los alores r esidu ales etr aor din ar ios
es m ed ian te los gr ficos d e ca
am ed ian te los qu e se con sid er an an m alos
los r esidu os ale
ados del pr om ed io em ed ia el ran go in ter cu ar tlico se
d en om in an etr em ossi se d es
an del pr om ed io tr es eces dica can tidad.
ed ian te Stata pu ede solicitarse al m ism o tiem po la repr esen tacin d e
los resid u os tpicos stu d en tiad os.
label ar ltm irs
esid u a les estan d ari
ad os
label ar ltm irt
esid u ales stu d en tiad os
grap b oltm irs ltm irt

R IC
10 ..r
ic o
d e
ca
as
d e
lo s
r e sid u o s
t p ico s

st u d e n t ia d o s

Residuales estandarizados

Residuales studentizados

E S E
S

om o pu ede fcilm en te apreciarseen el gr fico slo con sidera caso


d esiado el d e aiistn . os dem s estn den tro d e los lm ites m ar cad os
p or las eten sion es del r an go in ter cu artlico.
n a de las m edidas para in d icar el peso de u n caso en la r egr esin es la
car ga d el casoen ten d ien do por ello u n a m edid a de la distan cia en tre cad a
p u n to ob ser ad o el cen tr o de todos ellos en el con
u n to d e ariab les .
E sta m edid a p rocede de la m atrip roeccin ()qu e es la qu e con ier
te los alor es r eales de en
alores p redicosde acu er do con la sigu ien te
epr esin :

(10.1)
a m atri
se obtien e a partir d e la m atri
d e alor es d iferen ciales
d e xes d ecir(xi x)a la qu e se le agr ega com o pr im era colu m n a el ector
d e u n osqu e r epr esen ta la con stan tede acu erd o con la sigu ien te epr esin
m atr icial:

(10.1)
a m atri
es u n a m atride ord en n n . os elem en tos d e la diagon al
d e
son las llam ad as car gas (levera
e), qu e tom an u n alor com pr en d ido
en tr e 1
n en la circu n stan cia de qu e u n caso ten ga los
alores de todas las
ar iables igu al a su s r esp ecti
as m edias1cu an do u n in d iidu o posee
alor es totalm en te etr em os en todas las ar iables.
edian te Stata estas cargas p u ed en calcu larse m ed ian te la opcin leve
ra
e o hat de la in stru ccin predict segu id a d el n om br e d e la n u ea ariab le
con la qu e sern recon ocid as.
p red ict carga leerage

on esta in str u ccin se a ade u n a n u ea ariab le al arcio d e datos


llam ad a car
acu os
alores etr em os p u ed en ser listad os. E n este caso
p ar a listar los diecasos con m aores cargasp u ed e pr ocederse d el sigu ien
te m odo:
gsort ca rga
list pa is l
p n bp pa lin tfn o ca rga in 1
10

E p on ien d o en la lista la ariab le qu e id en tifica el caso (pais), las aria


b les in dep en d ien tes el n dice de car ga.

S
S E S S

ILUSTR ACIN
1 0.1 0.List a d o
d e l
n d ic e
d e
ca r ga

1.
2.
3.
4.
5.
6.
7.
8.
9.
10.

+- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - +
|
pai s
l _pnbppa
l i nt f no
c ar ga |
| ------------------------------------------------|
|
Suec i a
9. 943861
674
. 0735858 |
|
Si er r a Leona
6. 025866
4
. 0697807 |
|
Sui z a
10. 22143
675
. 0632281 |
|
Di namar c a
10. 09741
660
. 0619916 |
|
Nor uega
10. 18573
660
. 0592642 |
| ------------------------------------------------|
|
Tanzani a
6. 169611
4
. 0586668 |
| Es t ados Uni dos
10. 32876
661
. 0561181 |
|
Canada
10. 07428
634
. 0540864 |
|
Bur undi
6. 315358
3
. 0484039 |
|
Mal aui
6. 364751
3
. 0453132 |
+- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - +

om o pu ede apreciarse an sobresalid o dos tipos m u d istin tos de pases:


p or u n ladoSu eciaSu iain am arcaoru egaE stados n id os an ad
tien en alores altos tan to en com o en telfon os
por el otroSierra eo
n aan an iau ru n di alai los tien en ba
os en am bas ariables.
dem s d el listad oes til u n a r epr esen tacin grfica d e estos alor es
cr u
ados con los r esidu os. E sta op cin se obtien e in m ed iatam en te con la
or den lvrplot

R IC
1 0..r
ico
de
ca r ga s
so r e
r e s id u o s
n o r a lia d o s
a l
cu a d r a d o

Suecia

Sierra Leona

Suiza

Dinamarca

Noruega
Tanzania
Estados Unidos
Canada

Malaui
Etiopia Holanda
Mexico
Angola

Surafrica
Botsuana

rancia
Alemania
Yemen
(Rep)
Zambia
Hong Kong (China)
Reino Unido
Singapur
Finlandia
Mali Argentina
Grecia
iger
igeria
Argelia
Madaga

ailandiacar

une
Au
tralia

apon
Belgica
Mozambique
Austria
Chad
Brasil
Filipinas
Nueva
Zelanda
Italia
Paraguay
Benin
Congo
ina Faso
Peru
IrlandaBur

amibia

ayi
istan

enia
uatemala

spana
ritreadel
Corea
ur

ominicana

Chile
ep
Iran
Bulgaria
enezuela
Portugal
slovenia
Malaisia
Centroa
ricana
ep Albania
ganda
Zimbabue
aza
istan
Nepal
Marruecos
gipto
epublica Checa
Papua
Nueva
uinea
CamboyaCroacia

enegal
Indonesia

ogo
slovaquia Polonia
esoto
China

aiti

umania
Camerun
Bangladesh

ungria
uinea
Mauritania
Uruguay
aos Rica
Ghana
Jordania
India
Mongolia
Estonia
Costa
de Marfil
Costa
Colombia
Pakistan
Nicaragua
Rusia
Panama
Honduras
ietnam

etonia
Moldaia

urkmenistan
ituania
Georgia
U
bekistan
oliia
Ecuador
Ucrania

irgui
istan
ielorrusia
iria
uruia
Jamaica
Macedonia
ibano

ri an
a

erbaiyan

Carga

Burundi

Residuos normali
ados al cuadrado

E n este gr ficose
e qu econ la ecepcin d e E stados n idosel r esto
d e los pases qu e tien en alta car ga (por en cim a de alai) p oseen ba
os r e
sidu alespor lo qu e n o an de p reocu p ar en la r egr esin por m u co qu e su s
cargas en las
ar iables in d epen dien tes sean con sider ab les. ar a ob ten erlo
se a in tr od u cido la sigu ien te in str u ccin :

E S E
S

lrplotm la bel(pais) title(a rga) title(


esidu os n orm aliados al cu ad rado
)

n a m edida de la con tr ib u cin qu e u n caso tien e en u n coeficien te de


r egr esin es dfetaqu e repr esen ta el cam bio en d es
iacion es tpicas qu e
su fr e el coeficien te de u n a d eterm in ad a ariab le al in clu ir u n n u e
o caso
(elsle10). Su frm u la espu esla resta de los dos coeficien tes (con
sin la u n id ad a adida) d iid ido por el er ror tpico de esta ltim aqu e se ob
tien e al d iid ir el er ror tpico de la r egr esin sin el caso en cu estin (s e(i)) p or
la racu ad rada d e la su m a cu adr tica de los residu os d e u n a r egr esin en
la qu e la ariab le dep en d ien te es aqu ella (k) de la qu e se calcu la el coeficien
telos pr ed ictores son el resto de las ariab les in depen d ien tes ( SCResk ):

(10.1)
E n con secu en ciasu alor pu ede ser tan to positio (si el caso con tr ibu e
a au m en tar el coeficien te) com o n egati
o (si in flu e acia la ba
a) pu ede
ser p reocu p an te en el caso de qu e el alor absolu to sea su per ior a 1p u es
m od ificara el alor d el coeficien te de regresin en m s de u n er ror tp ico.
Sin em bargoelse(10) su giere qu e se com p are con 2 / n .:
E l m odo de obten er estas m edid as es especifican do la in stru ccin dfeta
d esp u s d e u n a regresin . E n el caso d e qu e n o se m en cion e n in gu n a a
r iablecalcu lar para cad a caso las d e tod as las
ar iables. con tin u acin
se m u estra la lista com pleta d e in stru ccion es par a qu e qu eden listad os los
casos qu e su p eren el cocien te m en cion ado en el an terior prr afo.
regress ltm i l
p n b pp a lin tfn o
d fb eta
list pa is
d fbif (
d fb eta
1
sqrt(e())
d fbeta

sqrt(e())) e(sam ple)

E s d e n ota r q u e esta s n u ea s m ed id a s so n d en om in a d a s com o


dfeta. am bin d eb e aclararse qu e el n m er o de casos de u n a regresin
qu eda registrado en el pr ogr am a en la con stan te e()s pu esel resu ltado
de la ltim a in stru ccin m u estra todos los casos en los qu e cu alqu ier alor
de dfeta es m aor qu e 2 / n :

En
ersiones anteriores de Stata se den om in aban con el nom bre de la
ariable in depen
dien te precedida por las letras m a sculas .

S
S E S S

ILUSTR ACIN
1 0.1 1.List a d o
d e
la s
d fb eta s

4.
7.
11.
16.
28.
46.
60.
65.

+- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - +
|
pai s
_df bet a_1
_df bet a_2 |
| ----------------------------------------|
|
Di namar c a
- . 1117166
. 2098867 |
| Es t ados Uni dos
- . 1412062
. 3598529 |
|
Sur af r i c a
. 4786185
- . 4590031 |
|
Bot suana
. 4019008
- . 4104398 |
|
Nami bi a
. 3554343
- . 3683658 |
| ----------------------------------------|
|
Tayi k i s t an
. 3639386
- . 2352885 |
|
Sr i Lank a
- . 2223299
. 2737852 |
|
Mal ai s i a
- . 2122332
. 1815071 |
+- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - +

om o p u ed e ap reciarseen am bas ar iables (pn ppa lin tfn o) el caso


qu e m s p er tu r ba los coeficien tes con diferen cia sob re el resto es el d e Su r
frica. E s r ecom en dab le realiar u n a r egr esin sin la p resen cia d e este caso
solicitan d o u n a regresin con el r esto d e los pases:
regress l
tm i l
p n bp pa lin tfn o if p ais

Su ra frica

con el sigu ien te resu ltado:


ILUSTR ACIN
1 0.1.R e gr e si n
co n
o isi n
d e
un
ca s o
in
lu e n t e
Sour ce |
SS
df
MS
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - Model |
134. 109956
2 67. 0549779
Res i dual |
17. 5275229
120 . 146062691
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - Tot al |
151. 637479
122 1. 24293015

Number of obs
F( 2,
120)
Pr ob > F
R- s quar ed
Adj R- s quar ed
Root MSE

=
=
=
=
=
=

123
459. 08
0. 0000
0. 8844
0. 8825
. 38218

-----------------------------------------------------------------------------l _t mi |
Coef .
St d. Er r .
t
P>| t |
[ 95% Conf . I nt er v al ]
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - l _pnbppa |
- . 5560512
. 0671759
- 8. 28
0. 000
- . 6890548
- . 4230475
l i nt f no |
- . 0021114
. 0003748
- 5. 63
0. 000
- . 0028535
- . 0013693
_c ons |
8. 212053
. 4967513
16. 53
0. 000
7. 22852
9. 195586
------------------------------------------------------------------------------

Si se com p ar a esta r egr esin d e 1p ases con la de 1se n ota u n a


a
r iacin pequ e a. Sin em bargoal eclu ir los siete p ases con m aor in flu en
cia en los coeficien tesla regresin gan a en ep licacin los coeficien tes
salen b astan te m s d iferen tes qu e en el caso an terior.
regress l
tm i l
pn bppa lin tfn o if
dfbeta
1
sqrt(e())
dfbeta

sqrt(e())

E S E
S

en cu o ca so se ob tien e u n a r egr esin con 11el r esu lta d o si


gu ien te:
ILUSTR ACIN
10 .1.R e gr e si n
co n
o is i n
de
a r io s
ca so s
in
lu e n t e s
Sour c e |
SS
df
MS
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - Model |
134. 109956
2 67. 0549779
Res i dual |
17. 5275229
120 . 146062691
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - Tot al |
151. 637479
122 1. 24293015

Number of obs
F( 2,
120)
Pr ob > F
R- squar ed
Adj R- s quar ed
Root MSE

=
=
=
=
=
=

123
459. 08
0. 0000
0. 8844
0. 8825
. 38218

-----------------------------------------------------------------------------l _t mi |
Coef .
St d. Er r .
t
P>| t |
[ 95% Conf . I nt er val ]
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - l _pnbppa |
- . 5560512
. 0671759
- 8. 28
0. 000
- . 6890548
- . 4230475
l i nt f no |
- . 0021114
. 0003748
- 5. 63
0. 000
- . 0028535
- . 0013693
_cons |
8. 212053
. 4967513
16. 53
0. 000
7. 22852
9. 195586
------------------------------------------------------------------------------

E isten tr es m edid as qu e son an logas a dfetap er oa d ifer en cia d e


estaob tien en u n n ico resu ltad o par a la r egr esin en lu gar de u n o para
cada
ar iable in depen dien te. ratan p or tan tod e m ed ir la in flu en cia d e
u n caso sobr e el m odelo en con
u n to. Son la fits las distan cias d e oo
(i) d e elsc(i). odas ellas son u n a tr an sform acin de los r esidu ales
stu d en tiados (t i) o tipificad os (
i ) por el peso qu e tien en en cada caso los
alor es de la ariab le in d ep en d ien tees d ecirp or su car ga (h i)
sen el caso de la m ed ida fitsesta se calcu la m ed ian te la sigu ien te
ep resin :

(10.1)
E n tan to qu e par a obten er la d istan cia d e elscse tr an sform a el r esi
d u o stu d en tiado con esta otra epr esin :

(10.1)
in alm en tela distan cia d e ooes cu adr tica se obtien e a p ar tir d e
los r esidu os tipificad os.

(10.0)


S
S E S S

on Stata se obtien en d e m odo sim ilar a las otr as m edidas aplicables a


los casoses decirm edian te la in stru ccin predict. E n las resp ecti
as op cio
n es son dfits, cooked welsch. od as pu eden obten erse m edian te u n a sola
ln ea en el caso d e qu e se u tilice el bu cle m edian te la ord en forp ero con
an ter ioridad se u ele a in clu ir la regresin p ar a qu e qu eden in clu id os todos
los pases.
regress l
tm i l
p n bp pa lin tfn o
for an d fits coosd elsc: predict l
tm i

ras ser obten idasse pu ede solicitar el listad o d e aqu ellos casos con
alor es p or en cim a d e los recom en d ad os:
list p ais ltm iif (ab s(ltm idfits)sqrt((e(d fm )1)
e())

l
tm i
coosd e()

abs(l
tm i
elsc)
sqrt(e(d fm )1)) e(sam ple)

E n este casose em plea e() p ara ep resar el n m ero de casos


lidos en
la ltim a regresin e(dfm )para in dicar el n m ero de parm etros d e la
regresin es decirel n m ero de
ariables in d ep en d ien tes (grad os d e libertad
de la su m a cu ad rtica d e la regresin ) m s u n a u n id ad se u tilia e(sam ple)
para listar slo los p ases con datos
lidos en la ltim a regresin estim ada
eitan d o qu e aparecan en las ln eas aqu ellos con
alores om itidos.
ILUSTR ACIN
10 .1 .List a d o
de
o t r a s
d ist a n cia s

7.
11.
16.
28.
46.
60.

+- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - +
|
pai s
l _t mi _d~s
l _t mi _~d
l _t mi _w~h |
| ---------------------------------------------------|
| Es t ados Uni dos
. 5771238
. 106956
6. 588138 |
|
Sur af r i ca
. 5361364
. 0917866
6. 079978 |
|
Bot s uana
. 4668481
. 0702527
5. 286491 |
|
Nami bi a
. 4294298
. 059309
4. 843116 |
|
Tay i ki s t an
- . 5004939
. 0779316
- 5. 622381 |
| ---------------------------------------------------|
|
Sr i Lanka
- . 3583613
. 0410365
- 4. 015223 |
+- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - +

E n este listado aparecen las tres distan cias m en cion adas en los seis casos
cu as distan cias estn por en cim a (o por d eb a
o) de los lm ites recom en d a
bles. Sin son elim in ados d e la regresin es eid en te qu e se produ cir u n a
m e
ora d el a
u steob ten ien do u n a a
u stada por en cim a tam b in d e 0
1.
regress l
tm i l
pnbppa lintfno if (abs(l
tm i
dfits)
sqrt((e(df
m )1)
e())

l
tm i
coosd
e()

abs(l
tm i
elsc)
sqrt(e(d fm )1))

E S E
S

ar a ter m in arotr a de las m edid as d e la in flu en cia qu e u n caso pu ede


p ropor cion ar en u n a regresin obten ible a tr a
s de la in stru ccin predict
es covratio. ide el cam b io qu e su pon e la elim in acin de u n caso en la
m atr ide ar ian as
co
ar ian
as d e los estim ad or es. on cep tu alm en te es el
cocien te en tre los d eter m in an tes de am b as m atricespero su
alor pu ede
calcu lar se tam bin m edian te la sigu ien te epr esin :

(10.1)
E n el ca so d e qu e u n d eter m in a d o ca so n o ten ga in flu en cia a lgu n a
sob r e la s a r ia n a s co
a r ia n
a s d e los estim a d or esel
a lor d e este
esta d stico es 1.
u icio d e elsle
u elsc(10)el a lor a b
solu to d e esta m ed id a m en os u n a u n id a d a d e ser m en or d e k
n . e
otr o m od o ten d r a qu e ea m in a r se cu id a d osa m en te la ob ser
a cin qu e
n o ten ga esta s ca r a cter stica s. a r a r ea lia r esta ep lor a cin con Sta ta
tr a s la e
ecu cin d e la r egr esin a d e gen er a r se la m ed id a or d en a rsi
se d esea los ca sos p or su a lor lu ego lista r o r ep r esen ta r los ca sos qu e
n o cu m p len este cr iter io.
p red ict ltm i
co
coratio
sort ltm ico
list pa is l
tm i
coif a bs(l
tm i
co

1)(e(d f
m )1)
e() e(sam p le)

E n este e
em p lo son n u e
e los casos qu e con tien en u n a r an d e co
a
r ian
as su perior a lo d eseado odico d e otr o m odoqu e con su elim in acin
acen
ar iar su stan cialm en te los err ores tp icos d e los estim adores las
co
ar ian
as en tre ellos. E stos son :
ILUSTR ACIN
1 0.1.List a d o
d e
la
r a n
de
co a r ia n a s

1.
2.
3.
4.
120.
121.
122.
123.
124.

+- - - - - - - - - - - - - - - - - - - - - - - - - +
|
pai s
l _t mi _~v |
| -------------------------|
|
Tay i k i s t an
. 8341598 |
|
Sr i Lanka
. 8991215 |
|
Az er bai y an
. 9068658 |
|
Sur af r i ca
. 9191754 |
|
Bur undi
1. 075498 |
| -------------------------|
|
Sui za
1. 077698 |
|
Nor uega
1. 078582 |
| Si er r a Leona
1. 083683 |
|
Suec i a
1. 102308 |
+- - - - - - - - - - - - - - - - - - - - - - - - - +


S
S E S S

1 0..R e gr e s io n e s
e sp e cia le s
esp u s de estu diar los pr oblem as qu e p u ed en plan tear se en u n a r egr esin
a con tin u acin se dan u n a ser ie de tcn icas d e regresin qu e p u ed en solu
cion arloso al m en os diagn osticar los con m s pr ecisin . E s obio qu e lo
qu e se a a estu diar a con tin u acin n o es el n ico rem edio a los pr ob lem as
d eriados d e u n n o cu m plim ien to de los su pu estos d e la regr esin o d e la
p resen cia d e casos an m alos en el an lisis. lgu n os d e elloscom o la tr an s
form acin de las escalas de las
ar iables o la elim in acin d e casos an m alos
a an sido ab ord ad os en las pgin as p reced en tes. con tin u acin lo qu e se
er son otros m odos d e r ealiar la r egr esin qu e se con sider an r egr esion es
r obu stas en la m edid a en qu e su s estim acion es son m s resisten tes a la pr e
sen cia de in cu m plim ien tos en los requ isitos d el m od elo.

rrores tpicos rou stos


a p rim er a tcn ica qu e se pr esen ta en esta segu n d a p arte d el segu n do cap
tu lo ded icad o a las r egr esion es es el clcu lo de err or es tpicos r ob u stos.
E sta tcn ica est esp ecia lm en te in dica d a pa ra cu a n do los d atos n o
cu m plen la a su n cin de qu e los trm in os d e er ror sea n in d epen dien tes de
los pr edictor es estn om ogn ea m en te distribu id os (om oceda sticida d).
om o se a se a lad o a n ter ior m en teen esa s con d icion es los estim ad o
r es son in eficien tescu a n do n o sesga dos. E n dica s con dicion es a d
ersa s
d eb e a su m irse qu e n o se est n r ea li
an d o pr ed iccion es d e la p ob lacin

er da d er a sin o qu e se in ten ta gen er ali


a r los resu lta dos a u n con
u n to d e
m u estr a s rea li
a d as en con d icion es sem e
a n tes a la s de a qu ella con la qu e
se tra b a
a.
Stata a im plem en tad o u n m od o fcil de calcu lar los err or es tpicos b a
o
este su p u esto m en os r estricti
o de las regresion essigu ien d o los tr ab a
os
d e u b er (1) ite (1)ba
o el prin cipio d e la m im a er osim ili
tu d. asta con a adir a la in str u ccin d e la r egr esin la opcin rou st. e
este m odosale u n a regresin con estim acion es id n ticas d e los par m etros
p er o con er ror es tp icos m aoresqu e con du cirn a ser m s eigen tes a la
or a d e r ecaar su s r espectias iptesis n u las.
regress l
tm i l
p n bp pa lin tfn orobu st

Si se com p ara la ilu stracin 10.con la obten id a m edian te la an ter ior


in stru ccin (ilu stracin 10.1)se n otan dos diferen cias p rin cipales: la p ri
m er a es qu e en esta n o ap ar ece la tab la d e su m a de cu adr ad osper o m s
im por tan te a n es qu e los er r or es tpicos son m aores qu e los calcu lad os
con el m tod o d e m n im os cu adrad os or din ar ios. Sin em bargolas estim a

E S E
S

cion es d e los coeficien tes son eactam en te igu ales. E n cu alqu ier casocon
asociacion es tan m an ifiestassigu en salien do los tr es coeficien tescon stan te
in clu idasign ificatios.
ILUSTR ACIN
10 .1.R e gr e si n
co n
e r r o r e s
t p ic o s
r o u st o s
Li near r egr ess i on

Number of obs
F( 2,
121)
Pr ob > F
R- s quar ed
Root MSE

=
=
=
=
=

124
601. 43
0. 0000
0. 8787
. 39048

-----------------------------------------------------------------------------|
Robus t
l _t mi |
Coef .
St d. Er r .
t
P>| t |
[ 95% Conf . I nt er val ]
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - l _pnbppa |
- . 5244678
. 0704985
- 7. 44
0. 000
- . 6640382
- . 3848974
l i nt f no |
- . 0022806
. 000407
- 5. 60
0. 000
- . 0030865
- . 0014748
_cons |
7. 98921
. 5093761
15. 68
0. 000
6. 980765
8. 997654
------------------------------------------------------------------------------

e
resion es pon deradas
dem s d el m todo d e m n im os cu ad rad os ord in ariosu n a r egresin pu ede
r ealiar se p on d eran do los datos con u n a determ in ada can tid ad d e tal form a
qu e en la d eter m in acin de la recta in flu an m s u n os casos qu e otros.
E l caso m s clar o r ad ical para p on derar u n a regresin es cu an do se
u tili
a u n a ariab le ficticiapu esto qu e esta fu n cion a com o u n filtr o de en
tr ada d el caso. e este m odotodas las obseracion es qu e ten gan el
alor 1
en la
ar iable d e p on deracin en tr an en la ecu acin en tan to qu e aqu ellas
qu e ten gan el
alor 0 o el alor p er did o n o figu r arn en la r egr esin . E l
m od o m s sim ple de pon d er acin qu e disp on e Stata es m edian te la esp ecifi
cacin gen er al de los p esoses d ecirescr ib ien do en la in stru ccin re
ress el
m od ificador
wei
ht ariab le
. E sta op er acin es equ ialen te a la escritu r a
d e u n con d icion al.
or e
em plosi se d esea acer u n a regresin slo con p ases eu ropeos
su pon ien d o qu e se a cr ead o u n a ariable ficticia den om in ada u ropa con
el
alor 1 par a los p ases de este con tin en tela escritu ra d e estas dos in stru c
cion es d ara resu ltados com pletam en te igu ales:
regress e
n tm i if E u ropa 1
regress e
n tm i
eigtE u ropa

E l r esu ltad o de estas dos ltim as in str u ccion es slo se d ifer en cia en la
aderten cia sob re el tipo de p on deracin qu e se est reali
an d ocom o se
m u estr a a con tin u acin :

S
S E S S

ILUSTR ACIN
1 0.1.R e gr e s i n
co n
p o n d e r a c i n
a n a lt ica
( anal y t i c wei ght s as sumed)
( s um of wgt i s
3. 5000e+01)
Sour c e |
SS
df
MS
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - Model |
275. 704472
1 275. 704472
Resi dual |
282. 466957
33 8. 55960475
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - Tot al |
558. 171429
34 16. 4168067

Number of obs
F( 1,
33)
Pr ob > F
R- s quar ed
Adj R- squar ed
Root MSE

=
=
=
=
=
=

35
32. 21
0. 0000
0. 4939
0. 4786
2. 9257

-----------------------------------------------------------------------------ev n |
Coef .
St d. Er r .
t
P>| t |
[ 95% Conf . I nt er v al ]
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - t mi |
- . 290591
. 051202
- 5. 68
0. 000
- . 3947623
- . 1864197
_c ons |
76. 97623
. 7506194
102. 55
0. 000
75. 44909
78. 50338
------------------------------------------------------------------------------

E fecti
am en tesi n o se esp ecifica el tip o d e pon d er acin qu e se d esea
el pr ogr am a qu e calcu la la r egr esin pon derad a asu m e u n tratam ien to an a
ltico d e los pesos. u iere ello decir qu e (salo p ara datos sin in form acin

casos p er did oso p on deracion es igu ales a 0) los pesos slo se tien en en
cu en ta p ara el clcu lo de los estim ador es en el n m er o d e obser
acion es
ap ar ece el n m ero de casos efectios qu e an o la su m a de las pon d e
r acion escom o as su cedera en el caso de qu e las pon d er acion es fu eran
frecu en ciales (fwei
ht)
E sta d ifer en cia a s com o la com p r en sin d e lo qu e se a ce a l p on
d er a r los ca sos d e u n a r egr esin p u ed e er se cla r a m en te si se p on e u n
e
em p lo con p ocos ca sos. Su p n ga se qu e se d isp on e d e los tr es sigu ien tes
ca sos: (1
) (
) (
)sien d or esp ecti
a m en teel p r im er a lor el d e
el segu n d o el d e . a r a qu e qu ed e m s cla r ose p r esen ta u n lista d o d e
los tr es ca sos con tod a s la s
a r ia b les n ecesa r ia s p a r a el tr a ta m ien to d el
e
em p lo:
ILUSTR ACIN
10 .1.E
e p lo
ia gin a r io
para
e r
c a so s
d e
r e gr e s io n e s
p ond eradas

1.
2.
3.

c as o
A
B
C

X
1
2
2

Y
5
4
6

pes o2
1
2
1

pes o3
1
1
2

n a p rim er a regresin con estos d atos arr o


ara u n a r ecta totalm en te
or ion talqu e p asar a en tre los p u n tos segu n do ter cero.
regress

E S E
S

ILUSTR ACIN
10 .1.R e gr e si n
sin
p ond erar
Sour c e |
SS
df
MS
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - Model |
0. 00
1
0. 00
Res i dual |
2. 00
1
2. 00
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - Tot al |
2. 00
2
1. 00

Number of obs
F( 1,
1)
Pr ob > F
R- s quar ed
Adj R- s quar ed
Root MSE

=
=
= 1.
= 0.
= - 1.
= 1.

3
0. 00
0000
0000
0000
4142

-----------------------------------------------------------------------------Y |
Coef .
St d. Er r .
t
P>| t |
[ 95% Conf . I nt er val ]
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - X |
0
1. 732051
0. 00
1. 000
- 22. 00779
22. 00779
_cons |
5
3
1. 67
0. 344
- 33. 11861
43. 11861
------------------------------------------------------------------------------

Sin em bargoal pon d er ar u n o d e los d os ltim os casos dn dole u n alor


su per ior a la u n id adse ob ten dr a u n a recta m s or ien tada al p u n to qu e
r ep resen ta. ssi se pon d er a m s al segu n do pu n to (peso), el alor d el
coeficien te de la r egr esin ser n egatiop u esto qu e la recta se le ap roi
m ar al estar colocad o en p or d eb a
o de la m ed iala ln ea descen d er.
E n cam b iosi se pon der a m s al ter cer o (peso), el coeficien te ser p ositio
en la m edida qu e se le d a m s im p or tan cia al caso cu o alor d e est p or
en cim a d e la m ed ia.
e este m odola regresin p on deran do el dob le el segu n do casosera
la sigu ien te:
regress
eigtp eso
n oead
p red ict

ILUSTR ACIN
1 0.0.R e gr e si n
p ond erada

p e so
( anal yt i c wei ght s ass umed)
( s um of wgt i s
4. 0000e+00)
-----------------------------------------------------------------------------Y |
Coef .
St d. Er r .
t
P>| t |
[ 95% Conf . I nt er val ]
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - X |
- . 3333333
1. 885618
- 0. 18
0. 889
- 24. 29238
23. 62572
_cons |
5. 333333
3. 399346
1. 57
0. 361
- 37. 85946
48. 52612
------------------------------------------------------------------------------

la efectu ada d n d ole el d oble alor al ter cer caso sera esta otr a si
gu ien te:
regress
eigtp eso
n oead
p red ict


S
S E S S

ILUSTR ACIN
1 0.1 .R e gr e s i n
pon derada

p e so
( anal y t i c wei ght s as sumed)
( s um of wgt i s
4. 0000e+00)
-----------------------------------------------------------------------------Y |
Coef .
St d. Er r .
t
P>| t |
[ 95% Conf . I nt er v al ]
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - X |
. 3333333
1. 885618
0. 18
0. 889
- 23. 62572
24. 29238
_c ons |
4. 666667
3. 399346
1. 37
0. 401
- 38. 52612
47. 85946
------------------------------------------------------------------------------

E l grfico con las tres regresion es ten dra este aspecto:


R IC
1 0..R e p r e se n t a ci n
d e
la s
t r e s
r e gr e sio n e s
d e
d ist in t o s
p e so s

ar a in tu ir el sen tido geom trico de la p on deracin es con en ien te


er
en el gr fico el sen cillo e
em plo pr opu esto: la recta in clin ad a su perior tien e
situ ado el alor p redico de la d ereca (m ar cad o con u n tr in gu lo) el dob le
d e cerca al caso (qu e se a pon derad o el dob le) qu e al caso . E n cam b io
la recta con in clin acin n egatia tien e su etrem o der eco (con sm b olo
cu adr ad o) el dob le de cer ca d el caso porqu e este a sid o pon derad o con
u n alor su p erior en dos eces al caso .
om o a se sab eeisten cu atro p osibilidades de p on d eracin en Sta
ta: pon d er acin d e fr ecu en cias (fwei
ht), pob lacion al (pwei
ht), an altica
(awei
h t) esp ecfica (iwei
h t)or om isin Stata r ealia la p on d eracin
an alticaqu e es la m s apr opiad a par a r egr esion es esp eciales. a otra im
p ortan te es la d e frecu en cias. a p rin cip al diferen cia en tr e am bas es qu e
m ien tras en la p rim er a el n m ero d e casos se m an tien e con stan teen la
segu n da se r ecalcu la el n m er o d e casos d e la r egr esin su m an d o los pesos
d el con
u n to de datos.
ar a
er lo con m s clarid ades til la com par acin d e d os r egr esion es
igu alescon la sola d iferen cia del tipo de pon d er acin :

E S E
S

regress
aeigtp eso
ILUSTR ACIN
1 0..R e gr e si n
con
p o n d e r a ci n
a n a lt ic a
( sum of wgt i s

4. 0000e+00)

Sour c e |
SS
df
MS
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - Model |
. 0625
1
. 0625
Res i dual |
2. 00
1
2. 00
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - Tot al |
2. 0625
2
1. 03125

Number of obs
F( 1,
1)
Pr ob > F
R- s quar ed
Adj R- s quar ed
Root MSE

=
=
= 0.
= 0.
= - 0.
= 1.

3
0. 03
8886
0303
9394
4142

-----------------------------------------------------------------------------Y |
Coef .
St d. Er r .
t
P>| t |
[ 95% Conf . I nt er val ]
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - X |
- . 3333333
1. 885618
- 0. 18
0. 889
- 24. 29238
23. 62572
_cons |
5. 333333
3. 399346
1. 57
0. 361
- 37. 85946
48. 52612
------------------------------------------------------------------------------

E n esta r egr esin a u n qu e ad


ier te qu e la su m a d e pesos es igu a l a
cu a tr o (a d os casos con u n a p on dera cin igu a l a la u n ida d u n o con el
doble de peso)en el n m er o d e ob ser
acion es ap a recen tr estodos los
estad sticos qu e depen den de ello (ta n to los er rores tp icos las m edia s
cu a dr tica s com o ta m bin las su m a s cu a dr tica s
en con secu en ciael
a
u sta d oen este ca so con u n
a lor ir rea l por la escased e ca sos) se
en
afecta d os.
E n cam b ioal r ealiar u n a pon d er acin de frecu en cias
fwei
h t
el r e
su ltado es este otr o:
ILUSTR ACIN
1 0..R e gr e si n
con
p o n d e r a ci n
d e

r e cu e n c ia s
Sour c e |
SS
df
MS
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - Model |
. 083333333
1 . 083333333
Res i dual |
2. 66666667
2 1. 33333333
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - Tot al |
2. 75
3 . 916666667

Number of obs
F( 1,
2)
Pr ob > F
R- s quar ed
Adj R- s quar ed
Root MSE

=
=
= 0.
= 0.
= - 0.
= 1.

4
0. 06
8259
0303
4545
1547

-----------------------------------------------------------------------------Y |
Coef .
St d. Er r .
t
P>| t |
[ 95% Conf . I nt er val ]
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - X |
- . 3333333
1. 333333
- 0. 25
0. 826
- 6. 070204
5. 403537
_cons |
5. 333333
2. 403701
2. 22
0. 157
- 5. 008957
15. 67562
------------------------------------------------------------------------------

om o pu ede apr eciarseslo coin cid en el los coeficien tes d e la r e


gresin . es tan b a
o el coeficien te d e d eter m in acin qu e al a
u star lo da u n
r esu ltado n egatio.


S
S E S S

e
resin de m n im os cu adrados
en erali
ados
(pon derados)
n a de las aplicacion es de la pon deracin an altica de las obser
aciones es eli
m in ar el error producido por la presen cia de eterocedasticidad en los datos.
ecu rdese qu e por este trm in o se en tienden
arianas desigu ales en el trm i
n o de pertu rbacin segn el alor de la(s)
ariable(s) indepen diente(s) qu e la
con secu encia estriba en que el error tpico de los estim adores calculado por el
m todo de m nim os cu adrados ordin arios es sesgado. El rem edio de la etero
cedasticidad consiste en pon derar los casos de la regresin por w i 1
s ipero
com o lo que realm ente se pon deran son los residu os cuadrticosse con sigu en
obten er los estim adores de la regresin tran sform an do su s ariables (su cons
tante) por wi en con secu en ciaen este caso por 1
s i. Es decirse a de con ce
bir u na regresin con todos los trm in os de la ecu acin di
ididos por s ilo qu e
con du ce a que el trm ino de error se tran sform ar en con stan te:

(10.)
El resu ltado de esta tran sform acin es qu e el n u e
o trm in o de error
si
i
ten dr arian a con stan tepu esto qu e al di
idir cada pertu rbacin por su des
iacin tpicasiem pre adoptar el alor con stan te de la u n idad.
e este m odoel clcu lo de los coeficien tes de regresin difiere al in tro
d u cir las p on deracion escon
irtin dose en la sigu ien te frm u la:

(10.)
en el clcu lo d e la ar ian
a d el estim ad or tam b in in ter
ien en lgica
m en te las p on deracion es:

(10.)

E S E
S

lgebr aica lgicam en teen el caso de qu e todas las pon d er acion es (w i)


sean igu alesestas frm u las son equ ipar ab les con las qu e se u tilian en el
caso d e la estim acin p or m n im os cu adr ados ordin ar ios.
Stata pr op orcion a al m en os dos m od os de reali
ar regresion es pon der a
d as m ed ian te la
ar ian
a. a m s com n es m ed ian te la in stru ccin re
ress,
a la qu e se le especifica com o peso la in ersa de la arian a.
ecu r rien do al e
em plo an terior d e tr es casos su pon ien do qu e la a
r iable peso r efle
a la desiacin tp ica de las p ertu r bacion es pesosu a
r ian a
ILUSTR ACIN
1 0..a t r i
d e
e
e p lo
para
r e gr e si n
d e
n io s
cu a d r a d o s
p ond erados
1.
2.
3.

Y
5
4
6

X
1
2
2

pes o

pes o2

1
1. 414214
1

1
2
1

el m od o de form u lar u n a regresin m ed ian te m n im os cu ad rad os


p on d er ados sera del sigu ien te m od o:
regress
aeigt1
p eso

el resu ltado ser el qu e pr esen ta cu alqu ier r egr esin p on derada:


ILUSTR ACIN
10 ..R e gr e si n
d e
n io s
cu a d r a d o s
p ond erad os
( sum of wgt i s

2. 5000e+00)

Sour c e |
SS
df
MS
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - Model |
. 08
1
. 08
Res i dual |
1. 60
1
1. 60
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - Tot al |
1. 68
2
. 84

Number of obs
F( 1,
1)
Pr ob > F
R- s quar ed
Adj R- s quar ed
Root MSE

=
=
= 0.
= 0.
= - 0.
= 1.

3
0. 05
8600
0476
9048
2649

-----------------------------------------------------------------------------Y |
Coef .
St d. Er r .
t
P>| t |
[ 95% Conf . I nt er val ]
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - X |
. 3333333
1. 490712
0. 22
0. 860
- 18. 60796
19. 27463
_cons |
4. 666667
2. 494438
1. 87
0. 313
- 27. 02818
36. 36151
------------------------------------------------------------------------------

er o Stata con tien e tam bin u n pr ogr am a especial (vwls) qu e calcu la


el err or tpico ba
o otr as asu n cion es. Varian ce
wei
hted least squ ares reali
a
este tipo d e regresion es con dos m od alid ades: u n a en la qu e el in estigador
le p rop or cion a la
ar ian
a de cad a caso otra en la qu e el m ism o pr oce
d im ien to lo calcu lasiem p re cu an d o los
alores d e las
ar iables in dep en


S
S E S S

d ien tes ten gan u n a deter m in ada agru p acin qu e p erm ita calcu lar la ar ian
a de los tr m in os de pertu rb acin .
E l pr im er caso es til cu an do se est an te u n eperim en to se p ien sa
qu e las
ar iacion es d e la p er tu r bacin son solam en te d eb idas a er rores d e
m ed ida. ar a ob ten er la regresin ba
o estos su pu estosse deb e especificar
la op cin sd(variale)con el n om br e de la
ar iable qu e reco
a la des
iacin
tpica d e los m en cion ados err ores. scon tin u an do con el e
em plo an terior
al escr ibir
ls sd (peso)

se obtien e la sigu ien te regresin :


ILUSTR ACIN
1 0..R e gr e si n
d e
n io s
cu a d r a d o s
p o n d e r a d o s
p or
la
a r ia n a
Var i ance- wei ght ed l eas t - s quar es r egr ess i on
Number of obs
=
3
Goodness - of - f i t chi 2( 1)
=
1. 33
Model c hi 2( 1)
=
0. 07
Pr ob > c hi 2
= 0. 2482
Pr ob > c hi 2
= 0. 7963
-----------------------------------------------------------------------------Y |
Coef .
St d. Er r .
z
P>| z|
[ 95% Conf . I nt er v al ]
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - X |
. 3333333
1. 290994
0. 26
0. 796
- 2. 196969
2. 863636
_c ons |
4. 666667
2. 160247
2. 16
0. 031
. 4326606
8. 900673
------------------------------------------------------------------------------

tese qu eau n qu e los coeficien tes sean igu aleslos er ror es tpicos son
d ifer en tesal calcu larse ba
o otr os su pu estosen este caso el del con oci
m ien to certer o d e los estim adores del er ror d e la ar iable . sim ism oen
lu gar del estadstico se u tilia el estad stico con u n a distr ibu cin d e
n
k
1 grados d e lib er tad. E n este casocom o la pr ob abilid ad de este estad s
tico (el d e la iqu ier da) es su p er ior a 0
0pu ede con sid er arse u n a r egr esin
n o sign ificatia.
E l otr o m od o de fu n cion am ien to del pr ogram a vwls es cu an d o se tien en
alor es agru p ad os d e xien cu o caso b asta con qu e se especifiqu en la
a
r iable d ep en d ien te las in depen dien tesom itien d o la opcin sd. Si eisten
su ficien tes alores para cada x ien ton ces el progr am a calcu la la arian a
d e su s r espectios tr m in os de p er tu r bacin pon d er a la r egresin con su
in
ersa.

1 0..R e gr e s i n
r o u st a
n a d e las p osibilid ades de p on d erar u n a r egr esin es a tras d e pr oce
d im ien tos iter atios qu e agan qu e aqu ellos casos con r esidu os pequ e os

E S E
S

ten gan alta in ciden cia en el clcu lo d e los coeficien tesen tan to qu e los
casos con resid u os gr an des ten gan u n p eso m u p equ e osi son in clu so
m u gr an d esn o ten gan n in gu n a rep er cu sin en la estim acin de los p ar
m etr os. E ste p rocedim ien to es esp ecialm en te til cu an d o los tr m in os de
p er tu r bacin n o tien en u n a distrib u cin n or m al acen qu e el clcu lo d e
los coeficien tes sea sesgad o.
E l p rogram a Stata in clu e u n pr ocedim ien to p ara acer este tip o de r e
gresion es sim ilar al qu e pr opu siera u oin g i (1).
E n pr im er lu garse r ealia u n a r egr esin por m n im os cu adr ad os. Se
calcu la el alor d e la de oose elim in an (o se da u n a pon der acin
igu al a 0) a aqu ellos casos en qu e este estad stico ar ro
e un
alor su perior
a la u n id ad .
on estos pesosse reali
a u n a n u ea regresin de la qu e se calcu lan los
r esidu ales (ei) estos son tran sfor m ados (u i) del sigu ien te m od o:
Se calcu la qu e es la m edian a d e la diferen cia en tr m in os absolu tos
en tr e cad a r esidu o su m ed ian aesto esal tom ar las r estas en tr m in os
absolu tosien e a ser u n a m edida de la dispersin d e los residu os:
(10.)
oster iorm en te se calcu la u id iidien d o el r esidu o (r i) p or
0
con
el pr opsito de qu e sean m s ad elan te in frapon d er ados aqu ellos casos cu o
r esidu al absolu to eced a d os eces la m ed ida .

(10.)
estos resid u os reescalados se les ap lica la fu n cin de u berqu e con
siste en d ar pon der acin 1 a todos aqu ellos casos con
u iin fer ior a u n a
d eter m in ada con stan te c (qu e p ara este pr oced im ien to Stata fi
a en 1
)
u n a p on deracin in ferior a esta can tid adsi esta can tid ad absolu ta est
p or en cim a de la con stan te. a n otacin m atem tica d e esta operacin es
la sigu ien te:

(10.)
1
di
idido por el an terior 0
da u n
alor de . or elloeste procedim ien to lo
qu e ace es pon derar por deba
o de 1 a todos aqu ellos casos cuos residu os estn ale
ados de
la m edian a dos
eces su
alor.


S
S E S S

Si estas p on d eracion es (w i) se d istan cian d e las an ter iores (en la pr im e


r a ocasin d e la u n id adp u esto qu e es el pu n to d e p artida) u n a can tidad
n fim aden om in ada con ergen cia estab lecid a por om isin en 0
01en
ton ces se detien e el pr oceso par a pasar al sigu ien te tipo d e pon deracin
el d e iwei
ht. eroen el caso d e qu e la m aor de las diferen cias en tr e las
p on deracion es n o sea tan pequ e ase
u el
e a r ealiar otr a r egr esin con
los p esos d e la ltim aqu e d ar lu gar a n u e
as p on d eracion esqu e d e n u eo
son com par ad as asta la con
er gen cia.
u an d o se a lca n
a d ica con ergen ciase pr ocede a u n p rocedim ien
to sim ila rp er o en lu ga r d e u tili
a r la fu n cin de u b erse em plea la d e
ea ton u e(1)den om in a da iwei
ht. ed ia n te esta al re
s qu e
en la fu n cin a n terior los casos ecesia m en te ale
a d os de la m edia n a
d e los resid u a les son pon der ad os con 0 a m edida qu e se ap roim a a este
p rom edioa lca n an el
a lor de 1. a epr esin qu e calcu la estos p esos es
la sigu ien te:

(10.)
E n esta n u ea p on d eracin Stata u tili
a com o con stan te p or om isin el
alor
qu e ace qu e tod os aqu ellos casos cu os resid u ales se ale
en del
p rom ed io siete eces la desiacin m ed ian a ten gan u n a pon deracin igu al
a 0. or a b ien en este segu n d o p asode su cesias iteracion esel u su ario
p u ed e cam biar el
alor de la con stan tem edian te la op cin tu n e(), en la qu e
se debe ep resar cu n tas eces ale
ad o de la m ed ian a se desea qu e la pon de
r acin sea n u la. E ste alorfi
ado por om isin en sietese recom ien da qu e
est com pr en d ido en tr e 1.
a or den qu e e
ecu ta esta regresin r obu sta es rresegu ida d e
ar iables
d epen dien te e in d epen dien tes por este ord en . sla in str u ccin
u se m u n d o
for
a r tm i p n bp pa: gen erate l
ln ()
rreg ltm i l
p n bp pa lin tfn o

d a lu gar al sigu ien te resu ltado:

E n este casoel siete procede de diidir


en tre el 0
u tiliado para calcu lar u i.

E S E
S

ILUSTR ACIN
1 0..R e gr e s i n
r o u st a
Huber
Huber
Huber
Bi wei ght
Bi wei ght
Bi wei ght

i
i
i
i
i
i

t
t
t
t
t
t

er at
er at
er at
er at
er at
er at

i
i
i
i
i
i

on
on
on
on
on
on

1:
2:
3:
4:
5:
6:

maxi
maxi
maxi
maxi
maxi
maxi

mum
mum
mum
mum
mum
mum

di
di
di
di
di
di

f
f
f
f
f
f

f
f
f
f
f
f

er ence
er ence
er ence
er ence
er ence
er ence

i
i
i
i
i
i

n
n
n
n
n
n

wei
wei
wei
wei
wei
wei

ght
ght
ght
ght
ght
ght

s
s
s
s
s
s

=
=
=
=
=
=

Robus t r egr ess i on est i mat es

.
.
.
.
.
.

58401938
07575524
01236351
19114446
01413694
00148212

Number of obs =
F( 2,
121) =
Pr ob > F
=

124
462. 99
0. 0000

-----------------------------------------------------------------------------l _t mi |
Coef .
St d. Er r .
t
P>| t |
[ 95% Conf . I nt er val ]
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - l _pnbppa |
- . 5751774
. 0667243
- 8. 62
0. 000
- . 7072758
- . 443079
l i nt f no |
- . 002082
. 0003728
- 5. 58
0. 000
- . 0028201
- . 0013439
_cons |
8. 382187
. 4942138
16. 96
0. 000
7. 40376
9. 360613
------------------------------------------------------------------------------

om o pu ede apreciarsean tes de la ep resin de los estim adores ap arece


el istorial d e la obten cin de la regresin robu sta. E n la p rim era iteracin d e
u ber la m im a discrepan cia en pesos era de 0
p or eso sigu e realian d o
otra pon deracin tras ellael alor de la d iferen cia m im a cae a 0
0. E n la
sigu ien te a 0
01
com o la prim a estara p or d eb a
o de esta can tidadpasa
a realiar las iteracion es con el p roced im ien to iwei
h t. E n el tercero de ello
la d iferen cia m im a es tan pequ e a qu e d e
a de bu scar n u eos pesos.
E l pr ogr am a rretien e u n a opcin qu e p er m ite p lasm ar el grfico qu e
com par a las d os ltim as pon d er acion es reali
ad as. Se trata de la op cin

raph. l in clu ir la en la in str u ccin del m odo u su al


rreg ltm i lpn b pp a lin tfn ograp

apar ece el sigu ien te gr fico:

.2

.4

New weight
.6

.8

R IC
10 ..r
ic o
d e
co p a r a ci n
d e
la s
p o n d e r a c io n e s
de
la
r e gr e s i n
r o u st a

.2

.4

.6
Old weight

.8

S
S E S S

E n este grfico todos los pu n tos aparecen p rcticam en te en la r ectalo


qu e in dica u n a alta igu aldad d e los pesos en la r egr esin p on d erada en la
p en ltim a en la ltim a p on deracin . n e
em plo de ello n os lo prop orcio
n an los p esos etrem os: en el su per iorn o an in gu n a ariacin . an to en
la escala d e la ie
a pon d er acin com o en la d e la n u eael alor m aor
es d e 0
. E n cam b iose n ota u n a pequ e a d ifer en cia en el caso con
m en or p on deracin pu es este en la p en ltim a iteracin tien e u n alor d e
0
00en la ltim a d e 0
11. u n qu e n o p u ed a apr eciar sela recta
m ar ca los p u n tos en los qu e i1i.
u n qu e el pr ogr am a rren o sea capad e m ostr arloses til
er los gr
ficos d e este tip o qu e se gen er ar an en an terior es iteracion es d istin tas d e la
ltim aen la qu esalo qu e se p on ga la toler an cia m u altapr cticam en te
tod os los pu n tos d eb eran coin cidir con la r ecta.

1
New weight
.6

.2

.2

.4

.4

New weight
.6

.8

.8

R IC
10 ..Se c u e n c ia
d e
gr
ic o s
d e
la
r e gr e si n
r o u st a

2
Old weight

.4

.6

.8

Old weight

E n el grfico d e la i
qu ier da aparece el cru ce de p esos tras la pr im er a
iteracin . E l p u n to de p ar tid a (el an tigu o p eso) es qu e tod os los casos ten
gan la pon deracin igu al a 1per oseg n los cr iterios de u b eraqu ellos
qu e estn p or d os eces ale
ados de la d esiacin m edian a reciben u n peso
tan to m en or cu an to m s ale
ad o est de aqu ella. or otr o ladoa la d er eca
ap ar ece el cr u ce tras r ealiar el paso de iteracion es de u b er a ieigts.
os casos alin ead os en el etr em o su perior in d ican tod os aqu ellos qu e p or
ale
arse poco d el
alor de la m ed ian a u ber los pon d er aba con la u n idad.
E n el caso d e iwei
h testos casos se a
u stan n o a u n a igu ald adsin o a u n a
frm u la por eso n o son eactam en te igu ales a 1 n i tan siqu iera en el p ri
m er paso. E l resto son tan to m s par ecid os a los an ter ior es cu an to m s se
u b iqu en en el cen troadoptan d o la relacin u n a form a cu riln ea.
E l p rogr am a rrecon tien e otra op cin qu e perm ite cam biar el lm ite a
p artir d el cu al de
a de r ealiar iter acion es. Se tr ata d e la opcin toleran ce(),
qu e de
a d e r ealiar u n a n u ea iter acin en bu sca de n u eos p esoscu an do
la m aor d iferen cia en tre la an terior la poster ior es m en or qu e el n m er o

E S E
S

p ropor cion ad oqu e ob


iam en te a de estar com pr en did o en tre 0 1 .
am b in pu ede lim itar se el n m er o d e iteracion es d irectam en tem edian te
la opcin iterate(), cu o alor p or om isin est fi
ado en 1.000. Si a n n o
a con ergid o la solu cin a se a alcan ado el n m er o de iteracion es so
licitad asen ton ces el pr ogr am a se d etien e si la ltim a a sid o u n a iteracin
iwei
h tm ien tras qu e si la ltim a a r ealiado u n a u berap lica u n a d el
otr o tip o p ar a cerr ar el p roceso.
n a d e las opcion es m s tiles del pr ogram a d e la regresin r obu sta es
la qu e gen era u n a n u e
a ar iable qu e con tien e los p esos fin ales ob ten idos
tr as las su cesias iter acion es. Se tr ata de la opcin
en wt(n om br eariab le)
tr as la qu e los r esu ltad os de la regresin son in ar ian tes. Su u tilid ad con sis
te en pod er d isp on er p ar a cada caso d e la p on d eracin qu e a sido u tiliada
p ar a obten er los p arm etr os fin ales. Si de d esea con ocer cu les an sido los
p ases qu e m en os peso an ten ido en la r egr esin d eb eran a ad irse dos
in stru ccion es a la de la r egr esin r obu sta con la op cin se alad a.
rreg ltm i lpn b pp a lin tfn ogen t(
ltm i)
sort
ltm i
list pa is ltm i in 1
10

r as lo cu al aparecen listad os los d iepases con pesos m en or es en la


r egr esin r ob u sta:
ILUSTR ACIN
10 ..Lis t a
d e
p e so s
d e
lo s
ca so s
en
la
r e gr e si n
r o u st a

1.
2.
3.
4.
5.
6.
7.
8.
9.
10.

+- - - - - - - - - - - - - - - - - - - - - - - - - - - - +
|
pai s
w_l t mi |
|----------------------------|
|
Tay i ki s t an
. 19891184 |
|
Sur af r i ca
. 40272357 |
|
Sr i Lanka
. 44528413 |
|
Azer bai y an
. 47349819 |
|
Nami bi a
. 47353931 |
|----------------------------|
|
Bot s uana
. 49146373 |
| Est ados Uni dos
. 49712956 |
|
Tur qui a
. 57274883 |
|
Uzbeki s t an
. 61091855 |
|
Mal ai s i a
. 6412604 |
+- - - - - - - - - - - - - - - - - - - - - - - - - - - - +

n o de ellos est m an ifiestam en te in frap on d er adocon tan d o con m en os


d e u n qu in to d e su
alorotr os seis m s tien en u n a p on deracin qu e n o
llega a su m itad .

E ste lm ite fu ncion a para las pon deraciones iwei


htpara las u berse utili
a com o
lm ite este m ism o n m ero m ultiplicado por .

S
S E S S

E s con en ien te r esa lta r d os a sp ectos m u im p or ta n tes d e la r egr esin


r ob u sta . E l p r im er o d e ellos es qu ecom o en tod a r egr esin d e m n im os
cu a d r a d os p on d er a d ossi ca lcu la m os su coeficien te d e d eter m in a cin
su
a lor ser in fer ior a l d e m n im os cu a d r a d os or d in a r ios. E sta es u n a
d e la s r a on es p or la s qu e su a lor n o a p a r ece en la sa lid a . E l segu n d o
es qu e slo es a d ecu a d a p a r a solu cion a r p r ob lem a s d e los r esid u osp er o
si n o los a se p r od u cen r esu lta d os m u sim ila r es a los d e la r egr e
sin n or m a lp er o equ i
oca d osen el ca so d e qu e los d a tos p ob la cion a les
cu m p la n los su p u estos d el m od elo. n e
em p lo
isu a l d e esta s cu estion es
lo ofr ece el gr fico qu e a con tin u a cin se ep on e. Se a n r ea lia d o cu a
tr o r egr esion es: d os lin ea les d os log
log ca d a u n o d e estos p a r es se
a a
u sta d o p or m m im os cu a d r a d os or d in a r ios con r egr esin r ob u s
ta . om o p u ed e a p r ecia r sela s d ifer en cia s en tr e la s d os ltim a s m od a li
d a d es son m n im a sen ca m b iola s r egr esion es m er a m en te lin ea les son
m u d istin ta s d e la s otr a s en la m ed id a en qu e est n a fecta d a s p or u n
gr a n er r or d e esp ecifica cin .

80
60
40
20
0

Tasa de mortalidad in
antil

100

R IC
10 .10 .r
ico
de
co p a r a ci n
d e
r e gr e sio n e s

10000

20000
30000
PNB por unidad de compra

Tasa predicha loglog


Tasa predicha lineal

40000

Tasa predicha loglog y robusta


Tasa predicha lineal y robusta

ar a pr odu cir el gr fico an terior en el qu e la ariab le d ep en d ien te es la


tasa de m or talidad in fan tilla in d ep en dien te el pr odu cto n acion al b ru to per
cpita la de con tr olel n m ero de ln eas telefn icas se a u tiliad o la
sigu ien te lista de in str u ccion es:

E sta ltim a
ariable est in troducida en el grfico en m odo de control. ara ello se a
tom ado com o
alor con stan te de ella su m edia aritm tica.

E S E
S

su m m a rie lin tfn o


local tfn or(m ean )
regress tm i pn bp pa lin tfn o
m atricoefe(b)
gen era te ttm icoef
1

coef
1
1

p n bp pacoef
1

tfn o
rreg tm i p n bp pa lin tfn o
m atrircoefe(b)
gen era te rt
tm ircoef
1

rcoef
1
1

p n bp parcoef
1

tfn o
regress ltm i l
p n b pp a lin tfn o
m atricoefe(b)
gen era te tltm icoef
1

coef
1
1

l
p n b pp acoef
1

tfn o
gen era te tltm iep(tl
tm i)
rreg ltm i lpn b pp a lin tfn o
m atrircoefe(b)
gen era te rtltm ircoef
1

rcoef
1
1

l
p n b pp arcoef
1

tfn o
gen era te rtltm iep(rtltm i)
la bel
a ria ble ttm i
asa p red ica lin eal
la bel
a ria ble rttm i
asa predica lin eal robu sta
la bel
a ria ble tltm i
asa p red ica log
log
la bel
a ria ble rtltm i
asa p red ica log
log robu sta
scatter tltm irtl
tm ittm i rt
tm i pn b pp acon n ect (. l . l) sm b ol(o . o .)

l1title(
asa de m ortalid ad in fa n til
) sort(pn b pp a) n am e(
repla ce)

10 ..R e gr e si n
de
cu a n t ile s
tr o m odo de con segu ir regresion es r ob u stas es la de r ealiar m odelos b a
sados en la estim acin d e la m edian ao cu alqu ier otra m edida de locali
a
cin en lu gar de la m ed ia. E stoen u n p rim er m om en top erm ite qu e los
alor es etr em os de la ar iable d epen dien te ten gan m en os in flu en cia en la
con figu racin d e la r egr esin . E n efectoen lu gar de in ten tar pr edecir la
m edia d e y par a cad a alor de xse tr ata d e p redecir la m ed ian a. or ello
la ecu acin de este tip o d e r egr esin se epr esa del sigu ien te m od o:
(10.)
sien d o p u n n m er o en tr e 0 1a m b os eclu id o sq u e r ep r esen
ta el cu a n til so b r e el qu e se q u ier e r ea lia r la r egr esin . E l ca so m s
com n qu e a d op ta el p r o gr a m a p o r o m isi n es el d el a lo r 0
0q u e
r ep r esen ta a la m ed ia n a . e este m o d o a l escr ib ir la sigu ien te in str u c
cin

S
S E S S

qreg tm i lpn bp pa

se ofr ecen las sigu ien tes estim acion es de los coeficien tes d e la regre
sin :
ILUSTR ACIN
10 ..R e gr e si n
d e
cu a n t ile s
I t er at i on

1:

WLS s um of wei ght ed devi at i ons =

2025. 2391

I t er at i on
I t er at i on
I t er at i on

1: s um of abs. wei ght ed devi at i ons =


2: s um of abs. wei ght ed devi at i ons =
3: s um of abs. wei ght ed devi at i ons =

2007. 8504
1998. 5785
1997. 8248

Medi an r egr es si on
Raw sum of dev i at i ons
3802 ( about 28)
Mi n sum of dev i at i ons 1997. 825

Number of obs =
Pseudo R2

125
0. 4745

-----------------------------------------------------------------------------t mi |
Coef .
St d. Er r .
t
P>| t |
[ 95% Conf . I nt er v al ]
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - l _pnbppa |
- 26. 51133
2. 070181
- 12. 81
0. 000
- 30. 60912
- 22. 41353
_c ons |
263. 1863
17. 2808
15. 23
0. 000
228. 98
297. 3926
------------------------------------------------------------------------------

ora b ien la m e
or for m a d e com p ren der la estim acin d e la r egr esin
cu an tlica es con u n sen cillo e
em plo en el qu e la ariab le in depen dien te
sea dicotm ica se tom e el cu an til 0es decirla m edian a.
m agn ese qu e
ten em os seis casos diid id os en d os gr u pos (a los qu e se les d a arb itr ar ia
m en te los alores de 0 1)en el p rim er gr u po los alores de la
ariable de
p en d ien te son 1m ien tr as qu e los corr espon dien tes al segu n d o gru p o
son . E s eiden te qu e la m ed ian a del pr im er gr u po (x0) es igu al a
m ien tras qu e la del segu n do (x1) es igu al a . E n con secu en ciael alor
d e la con stan te sera igu al a (la m edian a en el gr u po con alor 0 en x) el
alor del coeficien te es igu al a (la d iferen cia en tr e las d os m ed ian as). E l
e
em plo con ten dr a los sigu ien tes datos:
ILUSTR ACIN
10 .0 .a t r i
d e
e
e p lo
para
la
r e gr e si n
d e
cu a n t ile s
1.
2.
3.
4.
5.
6.

X
0
0
0
1
1
1

Y
1
2
3
7
8
9

la regresin adoptar a el sigu ien te asp ecto:

E S E
S

ILUSTR ACIN
1 0.1.R e gr e si n
d e
c u a n t ile s
s o r e
e l
e
e p lo

ict icio
I t er at i on

1:

WLS sum of wei ght ed dev i at i ons =

I t er at i on

1: s um of abs . wei ght ed dev i at i ons =

Medi an r egr ess i on


Raw s um of devi at i ons
Mi n s um of devi at i ons

Number of obs =
18 ( about 3)
4

Ps eudo R2

6
0. 7778

-----------------------------------------------------------------------------Y |
Coef .
St d. Er r .
t
P>| t |
[ 95% Conf . I nt er val ]
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - X |
6
1. 379796
4. 35
0. 012
2. 169073
9. 830927
_cons |
2
. 975663
2. 05
0. 110
- . 7088748
4. 708875
------------------------------------------------------------------------------

os alor es de los coeficien tes son m u obios. am bin lo es la su m a de


d esiacion es. E n este cason o se op er a con d esiacion es al cu ad rad osin o
absolu tas. d em slos r esidu os son p on d er ados en fu n cin d el cu an til con
el qu e se est estim an do la regresin a qu e es lgico qu e las desiacion es
acia la iqu ier da sean m en or es qu e las de la d er eca en el cu ar til pr im ero
p or e
em p loicerersa en el tercero. or ellolos
alores absolu tos d e los
r esidu os an d e pon derar se por en el caso d e qu e sean p ositios p or
(1
) en el d e qu e lo sean n egati
os. sen el caso de la estim acin d el
p rim er cu ar tillos r esid u os positios (dados p or alor es altos) tien en u n
p eso de 0
m ien tr as qu e los n egatios (esdecirlos cor respon d ien tes a los
alor es m s ba
os de la ar iable d epen dien te) ten dr n u n a pon der acin de
1
esto estres
eces su p er ior.
Sin ten er en cu en ta la ar iable in depen dien telos seis casos ar riba m os
tr ados ar ro
an con r especto a la m ed ian a (cin coesto esla sem isu m a de
los casos cen tr alestr es siete) u n a su m a de desiacion es igu al a 1. l
in trodu cir la in for m acin de la ariab le in depen dien tese disp on e de d os
m edian as (tres oco)con r esp ecto a ellasla su m a de las des
iacion es
slo alcan a el
alor de . E l p seu d o se obtien e m edian te la sigu ien te
epr esin :

(10.0)
don de p (yi) es el alor de la p osicin cu an tlica dad a en el con
u n to
d e la m u estr ae
yi el alor pr edico con la ecu acin cu an tlica corr esp on
d ien te a cada u n o de los alor es distin tos d e x. en este casoel alor as
cien de al qu e r ep resen ta la m e
ora en la estim acin de la m ed ian a qu e
su p on e el con ocim ien to d e la(s) ariab le(s) in depen dien te(s).

S
S E S S

E l clcu lo de los coeficien tescom o p u ed e ap reciarse en los resu ltados


sigu e u n a tcn ica iter atia. Se com ien a con u n a ap roim acin u tili
an d o
m n im os cu ad rados p on d er ados
a p artir de ase cam bia la r ecta p re
d ictia siem pr e cu an do im p liqu e u n a m e
or a en la m in im iacin d el
alor
ab solu to de los r esidu os.
a op cin m s til en el p rogram a qrees qu an tile() d on de d eb e especi
ficar se u n
alor en tr e 0 1 d el cu an til de la ariab le d ep en d ien te del qu e se
d esea r ealiar la regresin . ssi se qu ier e reali
ar la p rediccin d el pr im er
cu artil la in str u ccin a d e ad op tar la sigu ien te ep resin :
qreg qu an tile(.)

en cu o caso el resu ltado es:


ILUSTR ACIN
1 0..R e gr e si n
d e l
p r ie r
cu a r t il
I t er at i on

1:

WLS s um of wei ght ed devi at i ons =

3. 6000001

I t er at i on
I t er at i on
I t er at i on

1: s um of abs. wei ght ed devi at i ons =


2: s um of abs. wei ght ed devi at i ons =
3: s um of abs. wei ght ed devi at i ons =

4
3. 5
3

. 25 Quant i l e r egr es s i on
Raw sum of dev i at i ons
Mi n sum of dev i at i ons

Number of obs =
12 ( about 1)
3

Pseudo R2

6
0. 7500

-----------------------------------------------------------------------------Y |
Coef .
St d. Er r .
t
P>| t |
[ 95% Conf . I nt er v al ]
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - X |
6
. 5129548
11. 70
0. 000
4. 575809
7. 424191
_c ons |
1
. 3627138
2. 76
0. 051
- . 0070549
2. 007055
------------------------------------------------------------------------------

E isten otr os p rogram as sim ilar escom o iqre


qu e calcu la regresion es
d e ran gos in ter cu ar tlicossqresqre
qu e r ealian r egresion es cu an
tlicas sim u ltn eas calcu lan los er ror es tp icos con p roced im ien tos iter a
tios.
E ste pr ogr am acom o todos aqu ellos qu e efect an a
u stes de ln eas o
cu rasperm ite a ad ir ar iables al ficero or igin al. E n con cr eto son tr es
las p osibilid ades: los alor es pr edicosel err or tp ico de la p red iccin el
r esidu al. n a d e las posib ilidad es es la poster ior r epr esen tacin gr fica del
a
u stecom o el sigu ien te e
em ploqu e n os perm ite com p arar la r egr esin
lin eal con la regr esin d e la m edian a en la r elacin en tre la tasa de m or tali
d ad in fan til el p rod u cto n acion al per cpita:

E S E
S

u se m u n d oclear
reg tm i pn bp pa
p red ict ttm i
la bel
a r ttm i
red iccin m n im os cu ad rad os
qreg tm i pn bp pa
p red ict qtm i
la bel
a r qtm i
red iccin por cu an tiles
scatter qtm i ttm i pnbppacon nect (.l) sm bol (o.) sort(pnbppa) nam e(
replace)

s se obtien e u n gr fico don de los pu n tos repr esen tan la estim acin d e
la m ed ian am ien tr as qu e la r ecta es la r egr esin lin eal clsica. om o p u ed e
apr eciar sela pr im era pr on ostica
alores m s cen tr ad os en tor n o al pr om e
d io de la ariab le depen dien te (est m en os in clin ad a)al estar su p rediccin
m en os in flu ida por los casos etr em os.

50

50

100

R IC
10 .1 1.r
ico
co p a r a t io
d e
r e gr e si n
d e
la
e d ia n a

ren te
a
la
r e gr e si n
cl sic a

10000

20000
PNB por unidad de compra

Prediccin por cuantiles

30000

40000

Prediccion minimos cuadrados

10 ..R e gr e si n
p or
a n d a s
tr a posib ilidad p ara efectu ar u n a
u ste a los datos qu e perm ite m s flei
b ilidadp or u n lad otam b in ep lor ar la p osible r elacin fu n cion al en tr e
d os
ar iables es la r egr esin por ban d as. E n r ealid ad n o se trata d e n in g n
p roced im ien to qu e calcu le p arm etr ossin o u n a tcn ica ep lor atoria gr
fica para repr esen tar d e m odo fided ign o la relacin en tre u n p ar de aria
b les. e ecoen Stata n o se reali
a con n in gu n a in stru ccin sim ilar a la
d e las r egr esion essin o con el com an d o
raphics.

S
S E S S

ar a r ealiarla aqu e especificar el tipo m an d en la or den


raph
twowaycom o se epu so en el captu lo de gr ficos. on la op cin an ds a
d e ep resarse el n m ero de on as qu e qu ier en a
u starse.
grap toa m b an d tm i pn b pp aba n d s(10)

on elloel grfico es diidido en tan tas on as com o se especifiqu e en


an ds en cada u n a de ellas se a
u sta la m edian a tan to de x com o de yqu e
con en ien tem en te u n idasform an el patrn de relacin en tre am bas
ariables.

20

Median bands
40

60

80

R IC
10 .1.r
ico
de
r e gr e si n
por
a n d a s

10000
20000
PNB por unidad de compra

30000

E n este caso es fcil apr eciar qu e la su cesin d e ln eas m u estran u n a r e


lacin cu r ilin eal en tr e la tasa d e m or talidad in fan til el pr od u cto n acion al
b ru to p er cp ita.

1 0..E
e r cicio s
1.

E n este cap tu lo los e


er cicios son los m ism os qu e en el cap tu lo an te
r ior. e cad a u n o d e ellosabr a qu e reali
ar lo sigu ien te:
etectar cu les son su s pr in cip ales in cu m p lim ien tos d e los su pu es
tos de la regresin .
b ) E n con tr ar casos an m alos tratar de eplicar su ecepcion alidad
tr as lo cu al oler a acer regresion es sin ellos.
c)
u star otr os m od elos rob u stos a los d atosobserado las d iferen
cias en los coeficien tes con los obten id os por el m tod o de m n im os
cu adr ad os or din ar ios.
a)

11
La
r e gr e si n
lo gst ica 1
E l m odelo de r egr esin lin eal es u n a tcn ica de gr an poten cia y ver satilid ad. Perm ite p redecir el com portam ien to d e u n a var iable dep en d ien te en
fu n cin de u n a o m s variab les in depen dien tes y estim ar con pr ecisin la
capacidad explicativa del m odelo (gr acias al coeficien te de d eter m in acin ),
en tr e otras m u cas ven ta
as. Per o tien e u n a restr iccin im por tan te para las
cien cias socialesslo se pu ed e u tiliar con variab les dep en d ien tes p u ram en te cu an titativas (de in ter valo o d e r an ). E n sociologa, la m ayor parte
d e las var iables u e se estu d ian son cu alitativas o categr icas (n om in ales u
or din ales), por lo u e la posib ilidad real d e u so d e la regresin lin eal es bastan te lim itad a. Para este tipo de variab les se pu eden u tiliar las tcn icas de
r egr esin logstica, basadas en el m od elo lin eal, p er o ad aptad as a variab les
categricas. u n u e son algo m s com p le
as de in terp retar u e el m odelo
lin eal y algo m en os p recisas en algu n os asp ectos, p er m iten r ealiar u n an lisis de var iables categr icas eu ivalen te al del m od elo lin eal. a base de tod as estas tcn icas logsticas es el m odelo de r egr esin logstica para var iable
d epen dien te dicotm ica (logit), u e es el u e se in clu ye en este cap tu lo.

1 1.1.E l
m o d e lo
e st a d st ico
ay d os m an eras p rin cip ales de
u stificar el m od elo estad stico d e la regresin logsticala pr im era se b asa en la r elacin ter ica en tr e la variab le dep en d ien te observada (dicotm ica) y u n a variab le d epen dien te in ob ser vad a
o laten te (con tin u a)la segu n d a se b asa en la tr an sform acin d e la var iable
d epen dien te dicotm ica en u n a fu n cin de pr obabilid ad n o lin eal (on g y
reese -).

Para am pliar con ocim ien tos de este captulo y el prxim o se recom ien da especialm ente
el libro on g y reese (), cu yos argu m en tos, propu estas y program as au se refle
an .
am bin son tiles orroa(), ldricy elson (), osm er y em eso () y
ilbe (). u y bsico, en castellan o, en esta m ism a coleccin,
ovell (). am bin se a
pu blicado otro m on ogrfico en castellan o en la coleccin de u adernos de E stadstica (ilva
y arroso ).

11_La regresion logistica.indd 375

06/06/12 09:40

E E

11.1.1.E l
m odelo
de
variable
laten te
u alu ier var iable obser vad a d icotm ica p u ed e con cebirse com o u n a m an ifestacin de otra var iable laten te con tin u a. n a variab le dicotm ica observada in dica la existen cia o n o de u n deter m in ado atribu to, o a la ocu r ren cia
o n o de u n d eterm in ad o su ceso. n o p u ed e im agin arse u e tras tal atribu to
o su ceso existe u n a p rop en sin o u n a p rob ab ilid ad de ocu r ren cia (n o observada, n i n ecesar iam en te obser vab le), u e tien e carcter con tin u o y u e, al
su per ar u n cier to u m b ral, deter m in a la existen cia del atr ibu to u ocu r r en cia
d el su ceso en cu estin . a regresin logstica se pu ede en ten der com o u n a
m od eliacin d e la variable laten te (n o observada) en fu n cin d e la r elacin
obser vada en tre la variab le dicotm ica ob ser vad a y la var iable o variab les
in d ep en d ien tes in tr odu cidas en el m odelo.
E n el e
em plo de asisten cia a m an ifestacion es u e se em plear a lo largo
de este apartado, la variable resu ltado o depen dien te es dicotm ica, al tom ar
slo dos valoressi el in dividu o n o a asistido a u n a m an ifestacin y si el
in dividu o lo a eco en determ in ado periodo. E s con cebible u e esta variable depen da de otra variable su byacen te con tin u a u e se pu ede llam ar propen sin a m an ifestarse, por e
em plo. e eco, es excesivam en te restrictivo
el resu m ir toda la in form acin sobre la asisten cia a m an ifestacion es en u n a
variable dicotm ica, pu esto u e se pu ede n o aber asistido n u n ca pese a ten er
u n a actitu d m u y favorable acia ellas, o se pu ede aber asistido sin dem asiado
en tu siasm o, por e
em plo. a (in observada) propen sin a m an ifestarse podra
tom ar, por e
em plo, el valor m n im o en u n a person a u e n o se a m an ifestado
n i probablem en te se m an ifestar por su s con viccion es o valoresvalores m edios en au ellas person as u e se an m an ifestado algu n a ve, pero sin m u co
en tu siasm o, y alcan ara el valor m xim o en au ellos u e n o slo se ayan
m an ifestado an teriorm en te, sin o u e se m an ifiestan y volvern a acerlo de
m an era asidu a. a variable dicotm ica se pu ede en ten der com o u n a m an ifestacin de esa variable laten te con tin u a, pu esto u e a partir de u n determ in ad o
n ivel de propen sin a m an ifestarse (lo u e pu ede den om in arse u n n ivel u m bral) lo m s probable es u e el in dividu o se aya m an ifestado (y lo con trario
si la propen sin del in dividu o est por deba
o de ese n ivel u m bral).
E l grfico .m u estra la relacin ipottica en tre la variable laten te
propen sin a m an ifestarse y u n a variable in depen dien te con tin u a cu alu iera
(por e
em plo, la edad). E l e
e vertical iu ierdo represen ta la variable laten te
o terica (de a el asterisco tras la y), y el e
e ori
ontal la variable independiente
observada (la edad). a ln ea u e cru a el grfico represen ta la relacin en tre

tro e
em plo, tal vem s claro, es el del acu erdo con u n a opin in poltica. na person a
puede estar de acu erdo o en desacu erdo con la frase sin partidos n o puede aber dem ocracia
(si esta variable est codificada com o variable dicotm ica). Pero lo m s probable es u e las
person as ten gan opiniones m s m ati
adas, existiendo un contin uo de opiniones, desde el desacu erdo absolu to asta el acuerdo total. e n u evo, existira u n n ivel u m bral a partir del cu al el
en trevistado respon dera s a la pregu nta.

11_La regresion logistica.indd 376

06/06/12 09:40

am bas variables, com o u n a tpica recta de regresin , slo u e en este caso es


terica tam bin , pu esto u e m u estra la relacin en tre la edad y la propen sin
a m an ifestarse, E(y
x).
a cu estin estriba en cm o se represen tara la variable observada dicotm ica. om o se a dico an tes, la probabilidad de aber asistido a u n a m an ifestacin au m en ta con la propen sin a m an ifestarse, de m odo u e a partir de
u n n ivel
u m bral de ylo m s probable es u e el in dividu o s se aya m an ifestado (o sea, u e si yu m bral,
y si yu m bral,
y ). El n ivel u m bral est
represen tado grficam en te en el valor de y* (m arcado con ln ea discon tin u a).
a relacin en tre la variable laten te con tin u a y la dicotm ica observada n o es
perfecta, sin o estocstica, con u n cierto n ivel de errorpor ello, la probabilidad
de ocu rren cia de y (dicotm ica observada) asociada a cada n ivel de y* (con tin u a laten te) est represen tada por el rea som breada para tres valores ficticios
de x. El valor de la variable laten te (propen sin a m an ifestarse) asociado a la
edad de est tan por en cim a del n ivel de u m bral u e la probabilidad de
aber asistido a u n a m an ifestacin ser prcticam en te igu al a para los u e
tien en esta edad. En torn o a los a os la ln ea de regresin de la variable
laten te se corta con el n ivel u m bral, por lo u e a esta edad la in determ in acin
es m xim ala probabilidad de u e u n in dividu o aya asistido a u n a m an ifestacin a esa edad es prcticam en te la m ism a u e la probabilidad de u e n o aya
asistido. El rea de probabilidad de ocu rren cia del su ceso est claram en te por
deba
o del n ivel de u m bral para los u e tien en a os (o m s), por lo u e
la probabilidad de aber asistido a m an ifestacion es ser prcticam en te n u la
en esas edades. a probabilidad de ocu rren cia del su ceso para cada valor de
x (de aber asistido a m an ifestacion es para cada edad), de acu erdo con este
m odelo, sera n o lin eal, m u y sem e
an te a la ln ea pu n teada de color gris u e se
m u estra en el grfico (cu yo e
e est represen tado al lado dereco).
GR F ICO
11 .1.R e la ci n
entre
la
va r ia b le
la t e n t e
y
la
va r ia b le
d ico t m ica
o b se r va d a
co n
una
va r ia b le
in d e e n d ie n t e
Pr(y=1)
1

y*

y=1
0.5

=0
y=0

E(y*|x)

Pr(y=1|x)

0
25

40

55

70

85

u en teeelaboracin a partir de ong y reese (-).

11_La regresion logistica.indd 377

06/06/12 09:40

E E

a regresin logstica se pu ede en ten d er, por tan to, com o u n a m odeliacin de la relacin en tre u n a var iable dicotm ica dep en d ien te obser vad a
y u n a o m s variab les in d ep en dien tes, tal y com o se m u estr a en el grfico ., asu m ien do la existen cia de u n a variable laten te con tin u a su byacen te.
E n trm in os form ales, la relacin en tr e la var ia ble laten te y las va ria b les in d epen dien tes d el m od elo (r ep resen ta da en el gr fico .) es la
sigu ien te
(.)
on de la con stan te est r ep resen tada p or b0, los coeficien tes asociados a
cada var iable x por el resto de b, y el er ror aleator io por
i (se tr ata de u n a
ecu acin estn d ar de regresin ).
a relacin en tre la variab le depen dien te d icotm ica ob ser vad a y la var iable laten te p u ede form u larse del sigu ien te m od o

(.)
Por tan to, para u n valor deter m in ado de u n a sola x, la pr obabilidad de
u e la var iable d icotm ica tom e u n valor d e ser la sigu ien te
(.)
u stitu yen d o d e (.) y r eor gan ian do los tr m in os
(.)
o u e vien e a dem ostrar u e la pr ob abilid ad d e ocu r ren cia d e y d ep en d e n o slo de su r elacin con las var iables in depen dien tes del m odelo, sin o
tam b in d e la distribu cin d el er ror d e la var iable laten te (r ep resen tado en
la por las r eas som b readas).
a d istr ibu cin del err or de la variab le laten te n o es con ocid a, y por tan to se a d e recu rr ir a algu n a distr ibu cin ter ica para d esp e
ar la ecu acin
y pod er calcu lar el m od elo de r egr esin n o lin eal par a var iable d ep en d ien te
d icotm ica. E l m od elo pr obit es el u e d eriva d e asu m ir u e se distr ibu ye
n orm alm en te (con m edia y var ian a d e ), m ien tras u e el m odelo logit
d er iva de asu m ir u e se distrib u ye d e m an er a logstica (con m edia y var ian
a p
). a fr m u la de (.) para el m od elo pr ob it, p or tan to, es

(.)

11_La regresion logistica.indd 378

06/06/12 09:40

la del m odelo logit, m u co m s sen cilla, es

(.)
om o se pu ede in ferir del gr fico .y de las ecu acion es (.) y (.),
en fu n cin de la d istr ib u cin u e se asign e al err or de la variab le laten te, la
cu r va d e pr ob abilid ad estim ad a por el m odelo ser liger am en te d ifer en te.
i se asu m en er ror es n orm alm en te d istr ibu idos (m od elo p rob it), la cu r va
ten d er a ap roxim ar se m s rpidam en te a los e
es u e si se con sid er an los
er rores con u n a d istr ib u cin logstica (m od elo logit). Por tan to, los coeficien tes var iarn liger am en te. Per o, en la pr ctica, los r esu ltad os su stan tivos
ser n m u y sim ilar es (pese a u e los coeficien tes n o son d ir ectam en te com p arables), p or lo u e u tiliar u n m odelo u otro dep en d e m s de las pr efer en cias del in vestigador u e d e n in gu n a otra cosa. E n este libr o se em p lea
n icam en te el m odelo logit, u e es el u e m s se u tili
a en las cien cias sociales (sobr e todo en sociologa), p robab lem en te p or su m ayor facilidad de
in terp retacin al poder expr esar se en fu n cin de cocien tes de r aon es (odds
ratio),
com o se exp licar m s adelan te.

11.1.2.E l
m odelo
de
probabilidad
n o
lin eal
n a
u stificacin m s sen cilla, u e n o reu iere recu r rir a la existen cia de
variab les laten tes su byacen tes a la var iable dicotm ica obser vad a, es la u e
d eriva de u n a sim ple tran sfor m acin del m odelo de regresin p ar a var iable
d epen dien te d icotm ica en u n m odelo d e pr obabilid ad n o lin eal, u tilian d o el con cepto de cocien te de r aon es. E sta
u stificacin p er m itir tam b in
u n a p rim er a apr oxim acin a la in ter pr etacin d e los r esu ltad os del m od elo
d e r egr esin logstica.
n a va r ia b le d icot m ica s lo p u ed e tom a r d o s va lo r es, o . i
se u tilia el m od elo d e r egr esi n lin ea l est n d a r co n u n a va r ia b le d ico t m ica co m o va r ia b le d ep en d ien te, lo s va lo r es p r ed ico s d e la va r ia b le d ep en d ien te p u ed en ser m a yo r es u e o m en o r es u e , en fu n ci n d e su r ela cin co n la s va r ia b les in d ep en d ien tes, lo u e o b via m en te
n o tien e n in g n sen tid o. E l m o d elo d e p r ob a b ilid a d lin ea l ser a el sigu ien te
(.)
m o p u ed e m od ificar se el lado iu ierd o d e la ecu acin p ar a con str e ir su ran go d e a n a m an era d e acer lo es con ver tir las p rob ab ilida-

11_La regresion logistica.indd 379

06/06/12 09:40

E E

d es en razon es , divid ien do la pr obabilidad de ocu r ren cia del su ceso p or la


p robab ilidad d e n o ocu r ren cia.

(.)
Por e
em plo, la ran de aber p articip ado en algu n a m an ifestacin p ara
el total d e los en cu estados es igu al a la probabilidad de aber particip ad o divid ida p or la p rob ab ilidad de n o ab er p articipado, es decir, ,,,.
as raon es in d ican la relacin (o proporcin ) en tre la probabilidad d e ocu rren cia d el su ceso y la prob abilid ad de n o ocu rren cia. E n este caso, la p robab ilidad d e aber particip ad o en algu n a m an ifestacin rep resen ta u n d e
la p rob ab ilidad d e n o ab er participad o. am bin podra ab erse calcu lad o la
ran de n o ab er participad o fren te a la d e ab er participad o

(.)
E n cu yo caso el r esu ltad o u biese sido ,,,. sea, es ,
veces m s p rob ab le n o ab er p ar ticipado n u n ca u e ab er p articipado en
algu n a m an ifestacin para u n caso seleccion ado al aar en la m u estra.
a ran vara d e , cu an d o la pr obabilid ad de ocu rr en cia del su ceso
es y la de n o ocu r ren cia , a , cu an d o la p rob ab ilidad de ocu rr en cia
d el su ceso es y la d e n o ocu r ren cia es . Para con segu ir u e vare de - a
, se u tili
a el logar itm o n ep er ian o de la ran . u an do la r an es m en or
u e , su logar itm o es n egativo, y cu an do es m ayor u e , es positivo. l
logar itm o n ep er ian o de la ran se le d en om in a logit y es lo se u tilia com o
variab le depen dien te en la ecu acin d e la regresin logstica

(.)
e m od o u e el m od elo de regresin logstica es eu iva len te a l m odelo d e r egr esin lin ea l con la difer en cia d e u e tra n sfor m a la var ia ble
depen dien te en el loga ritm o de su ra
n , p a ra con segu ir a s u e va re d e

E l trm in o in gls odds n o tien e u n a tradu ccin clara al espa ol. E n los pases an glosa
on es, odds (en plural) es u n trm in o m u y u tiliado en el m u ndo de las apu estas, y se su ele tradu cir com o pu n tos de ven ta
a o sim plem en te tanto
con tra
tanto, expresan do las probabilidades a
favor y en contra de u n a apu esta, ue determ in arn las gan an cias relacion adas con tal apu esta.
lgu n os au tores ue an escrito sobre logit en castellan o proponen el trm in o castellan i
ado
ods (
ovell ). in em bargo, au se em plear el trm in o razn
para den om inarlo, m ien tras u e ratio ser tradu cido por cocien te.

11_La regresion logistica.indd 380

06/06/12 09:40

- a , y sobr e ese va lor estim a la ecu acin de la r egresin . E sto es lo


u e a ce la in ter pr eta cin d e la regresin logstica ba sta n te m s com plica da u e la de la r egr esin lin eal, pu esto u e los coeficien tes del m od elo
de regresin logstica n o expr esan de m an er a directa (com o s ocu r re en
el ca so d e la r egr esin lin ea l) la r ela cin en tr e la va r ia ble in d ep en dien te
y la dep en d ien te, sin o la r ela cin en tre la var ia ble in d epen dien te y el
loga ritm o
de
la
ra zn
de
la
ocu rren cia
de
un
determ in ado
su ceso.
Por ta n to,
n o p u ed en in terp reta r se los coeficien tes d ir ecta m en te sob re el m odelo de
r egr esin logstica estim a d o. E s n ecesar io tr a n sform ar la ecu a cin logstica p ar a u e exp rese los coeficien tes de u n m od o in terp reta b le. ay dos
for m a s d e acer estola pr im era es elim in an d o los loga ritm os la ecu acin
logstica origin a l de ta l m odo u e la ecu a cin se expr ese en ra
on es (en
lu ga r d e en su s loga ritm os), y p or ta n to los coeficien tes expr esen la va r iacin u e la s va riab les in d epen dien tes p rodu cen en la r a
n d e ocu r ren cia
de u n d eterm in a d o su ceso o ca r acter stica . a segu n da , algo m s com ple
a
de efectu a r, p er o m s f cil d e in ter pr eta r, es tr a n sform a n d o la ecu a cin
pa r a u e expr ese d ir ecta m en te la s p roba b ilida des d e ocu r ren cia d el su ceso
estu dia do.
e acu erd o con el p rim er procedim ien to, la ecu acin u e expr esa la
variab le dep en d ien te en raon es sera

(.)
o u e n o es m s u e la m ism a ecu acin (.), en la u e se a desp e
ado el logar itm o del lado iu ierd o de la ecu acin p ara u e este exp rese
slo la ra
n . Por tan to, los coeficien tes wi in d ican cm o vara la ran de la
variab le dep en d ien te cu an do la var iable in depen dien te var a en u n a u n idad.
E ste coeficien te d e la ecu acin logstica, exp resado en raon es, se den om in a
cocien te de r a
on es, y tien e u n a in terpr etacin diferen te al coeficien te de
u n a ecu acin d e r egr esin n orm al. E n u n a regresin n orm al, el coeficien te
in dica en u m ed ida au m en ta el valor d e la variab le d epen dien te cu an d o
au m en ta en u n o la in d epen dien teen u n a r egr esin logstica exp resada en
form a de r a
on es, el coeficien te exp resa en u m ed ida se m u ltip lica la ran de la variable d ep en dien te cu an d o la in d ep en d ien te au m en ta en u n o. E s
d ecir, el cocien te de raon es m ide el efecto en trm in os de tasa d e cam bio,
n o en cu n tas u n idad es au m en ta o d ism in u ye la d ep en d ien te. n cocien te
d e r aon es su p er ior a in dica u e el efecto de la variab le in depen d ien te en
cu estin es positivo (au m en ta la ran de ocu r ren cia d el su ceso estu d iad o), u n cocien te de r a
on es in ferior a in d ica u n efecto n egativo (r edu ce
la ran ) y u n cocien te d e r a
on es de in d ica au sen cia de efecto. e este
m od o, si en este e
em p lo (estu d ian do la p articipacin en m an ifestacion es),

11_La regresion logistica.indd 381

06/06/12 09:40

E E

el coeficien te cocien te de raon es asociado a la var iable gn ero (om br e


m u
er) fu era d e ,, se dir a u e el eco de ser m u
er r ed u ce a la m itad
la posib ilidad d e ab er par ticip ad o en algu n a m an ifestacin , con r esp ecto
a la posib ilidad d e aber p articipado sien do om br e, esto es, dism in u ye a la
m itad la ran d e la par ticip acin . odo esto se ver con m s detalle en el
apar tado de an lisis, con u n e
em plo m s con cr eto.
am b in p u ede despe
ar se la ecu acin a n m s p ar a u e expr ese la var iable d ep en d ien te en p robab ilidad d e ocu rr en cia del su ceso y

(.)
E cu acin u e es idn tica a la (.) (a la u e se lleg con el m od elo de
variab le laten te), y u e expr esa la r elacin en tre u n a var iable dicotm ica
y, expr esad a com o pr ob abilid ad de ocu rr en cia del su ceso y, y u n a o
m s variab les in depen dien tes. E l resu ltado d el m od elo n o se saldr del ran go -, y la ln ea d e r egr esin de pr obabilid ad pr ed ica ten dr u n a form a
su avi
ad a, d e s, d e tal m od o u e cu an do la ln ea se ap roxim e a o a in crem en tos gran des en las variab les in d ep en d ien tes se cor resp on d ern con
in crem en tos cada vem en or es en la pr obabilidad d e la d epen dien te (com o
u ed m ostr ad o an ter iorm en te en el gr fico .).

11 ..E s t im a ci n
d e l
m o d e lo
n a vecon tem p la d o el fu n d a m en to m a tem tico d el m od elo d e r egr esin logstica , se exa m in a a con tin u a cin m ed ia n te u n e
em p lo la estim a cin con ta ta y la in ter p r eta cin d e los p a r m etr os y coeficien tes
esen cia les d e este p r oced im ien to esta d stico. E l p r op sito d el e
em p lo ya
com en a d o es estu d ia r u tip o d e p er son a es m s fr ecu en te o p r ob a b le
u e a ya a sistid o a m a n ifesta cion es a lgu n a veen su vid a , con va r ia b le
d ep en d ien te d icotm ica (a a sistid o a lgu n a vea u n a m a n ifesta cin
n o a a sistid o n u n ca ). om o va r ia b les in d ep en d ien tes, se em p lea r n
d istin ta s va r ia b les sociod em ogr fica s ta n to cu a n tita tiva s com o cu a lita tiva s (in gr esos, ed a d , estu d ios, situ a cin la b or a l, gn er o y ta m a o d e b ita t). o u e se p er sigu e es con str u ir u n m od elo u e exp liu e la m a yor
ca n tid a d p osib le d e va r ia b ilid a d d e la va r ia b le d ep en d ien te con el m en or
n m er o p osib le d e va r ia b les in d ep en d ien tes (es d ecir, el m od elo m s p a rsim on ioso).

as variables cualitativas ue se in clu yan com o variables in depen dien tes en la regresin
deben estar codificadas com o ficticias, lo u e ya se a explicado en la seccin ..

11_La regresion logistica.indd 382

06/06/12 09:40

a estim acin del m od elo de r egr esin logstica se r ealia p or el m todo


d e m xim a verosim ilitu d . E ste m todo estim a los valor es d e los p ar m etr os
b de la regresin u e con m ayor pr obabilid ad p u ed en ab er gen er ad o los
valor es de la var iable depen dien te d e la m u estra, si las asu n cion es del m od elo son cier tas . e calcu la u n a fu n cin d e verosim ilitu d u e in dica cu l
es la pr obabilidad de u e par a u n os d eterm in ad os p arm etr os b se ayan
ob ser vad o los valor es m u estr ales. E n u n pr oceso iter ativo se van p rob an d o
d istin tos valores d e los par m etros b asta u e se en cu en tran los coeficien tes u e m axim ian tal fu n cin d e ver osim ilitu d (o sea, los coeficien tes u e
m s ver osm ilm en te cor respon den a los valores m u estrales)tales coeficien tes ser n los estim ados para u n determ in ado m odelo.
E ste p roceso iterativo se m u estra en la salida de la in stru ccin logit,
cu yo for m ato gen eral es el sigu ien te
lo git variab le
d ep en dien te listade va riab les
in depen dien tes

E n con secu en cia, en el pr im er e


em plo m ostr ado la in stru ccin con creta
es com o sigu e
logit m an if m u
er ed ad i.estu d ios i.in gresos

as variab les u e se an especificado com o in depen dien tes son sexo


com o d icotm ica (m u
er, si es m u
er, si n o), edad
(con tin u a), estu dios
(con sider ad a com o factor con tres valor esp rim ar ios, u e act a com o categor a base, secu n d ar ios
y su perior es

), e in gresos
(tam bin con ver tid a
en factor con tres categorasm en os d e .pesetas al m es
categora
b ase
, de .a .p esetas y m s d e .). E n tr e todas las var iab les sociod em ogr ficas se an in clu id o estas cu atro poru e se sosp eca u e
son las u e m e
or exp lican la frecu en cia r elativa de u e u n a p er son a aya
asistid o algu n a vea u n a m an ifestacin .
o pr im ero u e ap ar ece en la ilu stracin .es el pr oceso iter ativo d e
estim acin d el m od elo a tr avs del m todo de m xim a ver osim ilitu d . tata
m u estra los valores su cesivos de la fu n cin de ver osim ilitu d p ar a los distin tos p arm etr os u e va estim an do. E n la iteracin , todos los coeficien tes
valen m en os la con stan te, y en iter acion es su cesivas se van ap roxim an d o
valor es de los coeficien tes u e in cr em en tan el valor d e la fu n cin de ve
as asu n cion es son las abitu ales de los m odelos de regresin ue n o falten variables
im portantes en el m odelo, u e no aya m u lticolin ealidad en tre las variables indepen dien tes,
etc. ase el segu ndo captulo dedicado a la regresin.

e eco, n o se m axim i
a directam en te la fun cin de verosim ilitu d, sin o su logaritm o
(log
lieliood), lo u e sim plifica la com pu tacin . E ste log
lieliood es el ue aparece en la
salida de tata de logit.

11_La regresion logistica.indd 383

06/06/12 09:40

E E

r osim ilitu d . om o pu ede apr eciar se, en cad a iteracin el logar itm o d e la
ver osim ilitu d es m ayor (m en os n egativo en este caso), au n u e dado u e
en cada iteracin se apr oxim a m s la fu n cin a su m xim o, cada iter acin
a ade m en os valor. u an d o el m ecan ism o iter ativo con sidera u e ya n o es
n ecesario segu ir refin an d o la estim acin , p or u e ya las iter acion es n o a ad en p rcticam en te n ada d e verosim ilitu d al m odelo, se detien e el pr oceso y
m u estr a los coeficien tes estim ad os. om o se pu ede ver, la d ifer en cia en tre
el log
lieliood de la iter acin y el d e la iteracin es m n im a, por lo u e
ya n o es n ecesario segu ir refin an d o la estim acin . E n tres iteracion es se an
con segu id o estim ar los coeficien tes u e m s verosm ilm en te p u ed en aber
p rodu cid o los valores observados de la var iable depen dien te.
ILR CI
11 .1.R e gr e si n
lo gst ica
I
I
I
I
I

t
t
t
t
t

er at
er at
er at
er at
er at

i
i
i
i
i

on
on
on
on
on

0:
1:
2:
3:
4:

l
l
l
l
l

og
og
og
og
og

l
l
l
l
l

i
i
i
i
i

k el
k el
k el
k el
k el

i
i
i
i
i

hood
hood
hood
hood
hood

Logi st i c r egr es s i on
Log l i k el i hood = - 2164. 7337

=
=
=
=
=

- 2459.
- 2168.
- 2164.
- 2164.
- 2164.

6045
0953
7366
7337
7337
Number of obs
LR c hi 2( 6)
Pr ob > c hi 2
Ps eudo R2

=
=
=
=

3717
589. 74
0. 0000
0. 1199

-----------------------------------------------------------------------------mani f |
Coef .
St d. Er r .
z
P>| z |
[ 95% Conf . I nt er v al ]
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - muj er |
- . 400606
. 0738638
- 5. 42
0. 000
- . 5453763
- . 2558357
edad |
- . 0145314
. 0023736
- 6. 12
0. 000
- . 0191836
- . 0098792
es t udi os |
2 |
. 6236568
. 0934946
6. 67
0. 000
. 4404109
. 8069028
3 |
1. 42194
. 1148799
12. 38
0. 000
1. 19678
1. 647101
i ngr es os |
2 |
. 5415312
. 0833178
6. 50
0. 000
. 3782313
. 7048311
3 |
. 618273
. 1250371
4. 94
0. 000
. 3732047
. 8633413
_c ons |
- . 3795612
. 1479147
- 2. 57
0. 010
- . 6694687
- . 0896536
------------------------------------------------------------------------------

E stos coeficien tes estim ados ap ar ecen a con tin u acin . os resu ltados
u e pr opor cion a tata p ara el logit son sim ilares a los d e la r egr esin . rr ib a a la dereca aparece el n m er o de observacion es y u n a p ru eba estadstica d e sign ificacin del m odelo b asad a en el . on u n n ivel de con fian a
d el , el m od elo es sign ificativo si la pr obabilidad u e aparece es in fer ior
a ,. E n este caso, pu ede d ecirse u e la r elacin en tr e los coeficien tes d el
m od elo y la p robab ilidad d e ab er participad o algu n a veen u n a m an ifestacin es sign ificativa estadsticam en te. Por ltim o, ap arece en esta colu m n a
d e estad sticos el p seu d o . om o su pr opio n om b re in dica, es u n estad stico an logo al , u e in dica la b on d ad d e a
u ste del m odelo a los datos.
u n u e n o tien e la in m ed iated e in terp retacin d el de la regresin lin eal, u e directam en te in d ica u pr oporcin de la varian a d e la var iable
d ep en d ien te es explicado por el m odelo, es u n a ap roxim acin b asad a en

11_La regresion logistica.indd 384

06/06/12 09:40

u n a com par acin de la ver osim ilitu d d el m od elo slo con la con stan te
,
con la ver osim ilitu d del m odelo con todos los p ar m etros estim ad os

(.)

ien do la ran de verosim ilitu d del m odelo com pleto (


u ll) o final del
ue se desea estim ar la bon dad, y
la del m odelo
u e slo posee la con stan te.
u n u e n o sea tan preciso com o el 2 d e la regresin lin eal, el pseu do-2
es u n a m edida til d el a
u ste del m odelo a los datos, y pu ede servir par a
com p ar ar la capacidad exp licativa de m odelos d istin tos.
eb a
o de estos estadsticos apar ecen los coeficien tes, del m ism o m od o
u e en la r egr esin lin eal. a p rim er a colu m n a m u estr a los coeficien tes par a
cada var iable de la r egr esin logstica. eg n estos coeficien tes, la ecu acin
estim ada ser a

(.)
ico con p alabras, el logaritm o d e la ran d e aber participad o en algu n a m an ifestacin es igu al a -,m s ,si se tien en estu d ios secu n d arios, m en os ,p or cad a a o de edad , etc. la vista de esta ecu acin ,
resu lta eviden te u e, a diferen cia d e la regresin lin eal, en el m od elo logit n o
se pu eden in terp retar directam en te los coeficien tes. ab er u e el ser m u
er
d ism in u ye en ,el logaritm o d e la ran de aber particip ad o algu n a veen
u n a m an ifestacin n o sirve p ara m u co. E l logaritm o de la ran es u n a m ed ida d e prob abilid ad in in teligib le, d ificilsim a d e in terp retar tal cu al. E s n ecesario tran sform ar la ecu acin logit origin al en u n a ecu acin m s fcilm en te
in terpretable, u e m u estre la relacin en tre las variab les in depen dien tes y la
d ep en d ien te d el m odelo d e m an era m s com pren sible. E xisten varias estrategias diferen tes u e p erm iten in terp retar el m odelo logit m s fcilm en te. Pero
esto se ver m s ad elan te, en el apartado de in terpretacin d el m od elo. Por
el m om en to, a d e en ten derse cm o se estim a la ecu acin logit y sab erse u
son los estadsticos u e se gen eran con esta in stru ccin de tata.
E l r esto de las colu m n as d e coeficien tes son exactam en te igu ales u e las
u e ap arecen en la salid a d e tata para u n a r egr esin lin eal, y la in terp retacin tam bin es esen cialm en te la m ism a. par ece el er r or tpico d e cad a
coeficien te, su valor z y la p rob ab ilidad asociada a ese valor z (u e in d ica si
el coeficien te es estadsticam en te sign ificativo), y los in ter valos de con fian a
d e cad a coeficien te. o m erece la p en a exten derse m u co m s au , p u esto
u e, com o ya a u edado dico, en el m od elo logit la in ter pr etacin n o se
ace sobr e los coeficien tes com o en la r egr esin lin eal, sin o sob re las p red iccion es o los cocien tes de raon es, com o se ver m s ad elan te.

11_La regresion logistica.indd 385

06/06/12 09:40

E E

ed ia n te la or den logit se m u estr a n dos p ru eba s d e sign ifica cin d iferen tesp or u n la d o, el test d e ci , u e in d ica la sign ifica cin del m odelo
com pleto (o sea , asta u p u n to la r ela cin existen te en tr e la var ia ble d epen dien te y el con
u n to d e var ia bles in depen dien tes es sign ifica tiva )por
otro la do, a pa rece el test de z pa ra ca da coeficien te, in d ica n d o a sta u
pu n to ca d a coeficien te tien e u n efecto sign ifica tivo en la ecu a cin . d icion alm en te se pu eden rea li
a r otra s pr u eb a s de iptesis sob re los coeficien tes d e la ecu a cin p u ede in ter esa r, por e
em p lo, sab er si u n coeficien te es
igu a l a u n determ in ad o va lor, o si dos coeficien tes tien en el m ism o efecto
sobr e la va riab le depen dien te, o si el efecto d e dos coeficien tes d iferen tes
es sim u lt n ea m en te igu a l a . a y d os in stru ccion es u e p er m iten r ea li
a r pr u eb a s de ip tesis sob re los coeficien tes d e u n m odelo logit tr as la
estim a cin test (u e r ealia el test d e a ld) y lrtest (u e realia u n test
de coeficien te de verosim ilitu d o lieliood
ra tio).
E sta dsticam en te n o ay
m u cos a rgu m en tos pa ra pr efer ir u n o u otroa m bos son a sin tticam en te eu iva len tes (slo difieren en m u estra s peu e as, cu a n to m a yor es la
m u estr a, los resu lta dos u e m u estr a n son m s cer ca n os, a sta llegar a ser
pr cticam en te idn ticos en m u estr as gra n des). Por ello, slo se explica a
con tin u a cin la pr u eb a d e a ld (m edia n te la in tr u ccin test) por u e r esu lta m s sen cilla d e u sa r.
Par a r ealiar u n a pr u eba de iptesis con la in stru ccin test, basta con
escr ib ir a con tin u acin la exp resin u e se u ier a com pr ob ar r efer id a a los
coeficien tes d e u n m od elo logit. E l test se r efer ir al ltim o m odelo logit
estim ad o (ay u e ten er cu id ad o con esto, p u esto u e la in stru ccin test
n o in d ica a u m odelo se r efier e, lo u e p u ed e in du cir a err or). on u n os
e
em p los u edar m s claro el u so d e esta in str u ccin , u e, p or otr o lad o,
es sim ilar al corr espon dien te a la regresin com n .
i se desea com pr obar si u n coeficien te es sign ificativo (sign ificativam en te distin to de ), sim plem en te se escribe test segu id o p or el n om br e de
coeficien te. E n el caso de la var iable edad,
la in stru ccin ser a la sigu ien te
test ed ad

el resu ltado de ap licar la se presen ta a con tin u acin


ILR CI
1 1..r u e b a
de
i t e sis
d e
un
a r m e t r o
d e
la
r e gr e si n
lo gst ica
( 1)

[ mani f ] edad = 0
chi 2( 1) =
Pr ob > c hi 2 =

37. 48
0. 0000

om o se p u ed e ob ser va r, en este ca so ta ta r ea li
a la p r u eb a d e a ld
com p r ob a n d o si el coeficien te ed a d tien e u n va lor sign ifica tiva m en te d is-

11_La regresion logistica.indd 386

06/06/12 09:40

tin to d e , o sea , si la ed a d tien e r ea lm en te efecto sob r e el eco d e


a b er p a r ticip a d o en a lgu n a m a n ifesta cin . E l test d a u n d e ,, u e
p a r a u n gr a d o d e lib er ta d (p u esto u e slo se com p r u eb a u n coeficien te) tien e u n a p r ob a b ilid a d d e ocu r r en cia m en or u e ,. Por ta n to,
el coeficien te d e ed a d es sign ifica tiva m en te d istin to d e , p u esto u e la
p r ob a b ilid a d d e u e el coeficien te fu er a en la p ob la cin es m n im a en
el m od elo.
E ste u so de la in str u ccin test n o es el m s in teresan te, p or u e la salid a
n or m al del logit ya m u estr a la sign ificacin de cada u n o d e los coeficien tes
p or separ ad o (con los valor es z). am b in m u estra la sign ificacin de tod os
los coeficien tes
u n tos (o sea, la d el m odelo). Pero lo u e n o m u estr a es la
sign ificacin d e tod as las com bin acion es posib les de los coeficien tespar a
esto s u e ser im pr escin d ible u sar la ord en test. Por e
em plo, se p u ede estar in ter esado en ver si los coeficien tes edad y m u
er son sim u ltn eam en te
igu ales a (si las d os variab les n o tien en efecto con
u n to im p or tan te sob re
la p ar ticipacin en m an ifestacion es). Par a ello, abr a u e escr ib ir segu idos
los n om br es d e am b as variab les
test edad m u
er

E n cu yo caso, el r esu ltad o se pr esen ta de este m odo


ILR CI
11 ..r u e b a
d e
i t e sis
d e
m s
d e
un
a r m e t r o
d e
la
r e gr e si n
lo gst ic a
( 1)
( 2)

[ mani f ]
[ mani f ]
c hi
Pr ob

edad = 0
muj er = 0
2( 2) =
> chi 2 =

65. 09
0. 0000

, com o cabr a esperar, d esp u s d e u e fu era sign ificativo el coeficien te


aislado d e la var iable edad,
se dem u estr a u e en el m od elo el valor de los
coeficien tes ed ad y m u
er n o son sim u ltn eam en te igu ales a .
dem s de com pr obar el valor efectivo de u n coeficien te, m ed ian te la
exp resin var iable valor, se p u ede u erer saber si el efecto de d os coeficien tes es el m ism o. Por e
em plo, p u ed e in teresar saber si los in gr esos m ed ios (.in gr esos) y altos (.in gr esos) tien en la m ism a frecu en cia relativa d e
asisten cia a m an ifestacion es
test .in gresos.in gresos

u alu ier variable factori


able, es decir, con valores en teros, pu ede ser em pleada com o
variable ficticia m edian te la expresin .nom brevar en m u cas in stru ccion es de tata. E xcepcion es, por e
em plo, a esta regla se en cu en tran en la rdenes m ean y tabu late.

11_La regresion logistica.indd 387

06/06/12 09:40

E E

ILR CI
11 ..r u e b a
d e
i t e sis
d e
igu a ld a d
de
a r m e t r o s
en
la
r e gr e si n
lo gst ica
( 1)

[ mani f ] 2. i ngr es os - [ mani f ] 3. i ngr es os = 0


c hi 2( 1) =
0. 42
Pr ob > c hi 2 =
0. 5173

En este caso, no puede reca


arse la iptesis nu la de ue el efecto de tener ingresos m edios sea igu al ue el efecto de tenerlos altos (o, com o aparece refle
ado, ue .ingresos m en os .ingresos es igual a )la diferencia entre
los valores de am bos coeficientes n o es significativam ente distinta de (es dem asiado alta la probabilidad de u e en la poblacin el valor real de la diferen cia en tre el coeficien te d el valor en in gresos y el del valor de la m ism a variable sea igu al a ).

11 ..ia gn st ico
d e l
m o d e lo

gu al u e en la r egr esin lin eal, tr as la estim acin d el m odelo y an tes d e


su in terp retacin es n ecesar io estu d iar el grado de a
u ste d e la regresin
logstica a los datos. E ste paso es im portan te parap rim er o, detectar p osib les p rob lem as en el m od elo, sean deb idos a datos in cor rectos, a u n a m ala
especificacin de las var iables o a cu alu ier otra cau sa, y segu n d o, valorar
su cap acidad explicativa. E ste paso es, por tan to, im por tan te, au n u e a m en u do se obvie y se pase directam en te a la in terp retacin tr as la estim acin
d el m odelo d e r egr esin logstica.
u sign ifica a
u ste d el m odelon a regresin lo u e tr ata es de pr ed ecir el valor u e tom a la var iable d ep en d ien te en fu n cin de la o las variab les
in d ep en d ien tes. m en os u e la pr ed iccin sea p er fecta (lo u e n u n ca es posib le en con trar, especialm en te en el m bito de las cien cias sociales), abr
u n deter m in ado m ar gen de err or. Pu es b ien , a ese err or es a lo u e se r efiere
el con cep to de a
u ste del m od elo. u an to m ayor sea el er ror de pr ediccin
(m en os acierte la ecu acin de r egr esin el valor u e realm en te tom a la var iable d ep en d ien te), m en or ser el a
u ste del m odelo, y vicever sa.
ase en trm inos an alticos. un ue todo m odelo de regresin (inclu ido el
logit), com o m uestra la ecuacin (.), trata de expresar el valor de la probabilidad de ue yen fun cin de los valores u e tom en las x, tam bin ay ue tener en cuenta ue siem pre abr un cierto m argen de error en esta prediccin
(.)
E ste trm in o tam bin pu ede expr esar se com o difer en cia en tre los valor es obser vad os d e y y los valores esp er ados seg n la ecu acin de regresin
(.)

11_La regresion logistica.indd 388

06/06/12 09:40

E n esto se b asa casi tod o el an lisis del a


u ste del m odelo. e trata sim p lem en te de ver en u m ed ida este es capad e p redecir los valores u e
tom a en r ealid ad la var iable d epen dien te en fu n cin de los valores u e tom an las in d epen dien tes. u n u e la idea bsica es siem p re la m ism a, ay
m u y d istin tos m od os d e estu diar el a
u ste d el m odelo. u se estu diar n
d osel estu dio grfico d e resid u ales e in flu en cia, y el estu dio de m edidas
escalares de a
u ste u tili
an d o la in stru ccin
itstat.
E l r esidu o es exactam en te lo u e ap ar ece en la ecu acin (.)es la
d ifer en cia en tre el valor obser vado y el esper ad o en fu n cin de la ecu acin
d e regr esin . Pu ed e exp resarse en trm in os d e logaritm os, com o ap arece en
la ecu acin m en cion ad a, o en trm in os d e pr obabilidades, com o se u tili
ar
a con tin u acin par a sim p lificacin de las frm u las. E n u n m odelo d e regresin lin eal se p u eden estu d iar los r esidu os tal cu al, p ero en el m od elo logit
es n ecesario estan d ar iarlos, par a su m e
or in terp retacin . E n la r egr esin
logstica, las pr ediccion es son frecu en cias o pr obabilidades (u e van de a
) y los valor es obser vados in divid u ales son siem pr e o . in em b argo, sigu ien do a osm er y em eso(), para el clcu lo de los resid u os, tata
n o u tili
a estos valores in d ividu ales, sin o la esperan a p ara cad a d eter m in ad a com b in acin de valores d e x, es decir, Pr (y
). u an to m s cercan a
sea esta pr obabilid ad a ,la p robab ilidad p redica p or el m od elo, m s alta
ser la var ian
a de la diferen cia en tre tal pr obabilid ad y el valor observado,
p u esto u e la fr m u la d e su var ian a es

(.)
p artir de esta estim acin de la varian a, se pu ede obten er el resid u o
d e Pear son , d ividien d o la d iferen cia en tr e la p robab ilidad r eal y la esperad a,
p or su err or tp ico, es d ecir, p or la r acu adr ada de (.).

(.)
este es el p r ob lem a la va r ia n
a de los r esid u a les de u n m odelo de
r egr esin logstica n o es om ogn ea . sea , u e el err or es eter osced stico y la estim a cin d e r esid u a les es in cor recta . tr o p r ob lem a d el
r esid u o d e Pea r son es u e n o p osee u n a d esvia cin tpica igu a l a . Pa r a
ob ten erla , es n ecesa r io u tilia r el r esid u o tip ifica d o p r op u esto p or Pr egib on (), u e r esu elve este p r ob lem a d ivid ien d o, com o en el ca so
d e la r egr esin , el a n ter ior p or
, sien do i la ca r ga d e la s va r ia b les
in d ep en d ien tes.

11_La regresion logistica.indd 389

06/06/12 09:40

E E

(.)
Par a obten er los resid u ales logsticos con tata, de la m ism a m an era
u e en la regresin , es n ecesar io crear u n a n u eva u e alm acen e la d ifer en cia
p ar a cada ob servacin en tre el valor obser vado de la var iable d epen dien te
y el valor pr edico p or el m odelo. E n este caso, la variable depen d ien te es
asisten cia
a
m an i
estacion es

los valores u e tom a son (si a asistido a u n a


m an ifestacin algu n a ve) o (si n o a asistido n u n ca). E l m od elo logit, por
su parte, pr edice p ar a cada com b in acin de variables in dep en d ien tes cu l
es la p robab ilidad d e u e aya asistid o a algu n a m an ifestacin en fu n cin
d el n ivel de estu dios, la edad, los in gr esos y el gn ero. Por tan to, el residu al
en este caso ser la d ifer en cia en tr e el valor observado (lgicam en te en tre
y ) y la p rob ab ilidad pr edica (tam b in en este in ter valo). Por las r aon es an teriorm en te exp licad as, es p referible u tiliar el r esidu al tipificado d e
Pear son (.). om o en la r egr esin , con tata, tras u n a estim acin logstica, se pu ede gen erar esta variab le de resid u ales de Pearson estan dari
ados
m edian te la op cin rstan dard de la in stru ccin predict
p red ict resm a n if, rs
la bel va r resm an if
esid u os estan d ari
a dos
list m an if resm an if in
if resm an if.

a variable resid u al alm acen a aora la diferen cia en tre la p rob ab ilidad
p redica d e ab er asistid o y el eco d e aber asistid o o n o (seg n la frm u la
vista en
.
). tilian d o la in stru ccin list pu eden exam in arse los prim eros casos, para obten er u n a id ea del con ten id o d e la variable residu al
ILR CI
1 1..List a d o
de
r e sid u o s
e st a n d a r ia d o s
+- - - - - - - - - - - - - - - - - - - +
| mani f
r es mani f |
|-------------------|
1. |
1
- . 3140299 |
4. |
1
1. 006958 |
7. |
1
1. 685212 |
+- - - - - - - - - - - - - - - - - - - +

om o pu ede verse, la variab le r esidu al es u n a var iable estan dari


ada,
p or lo u e la m ayor parte de los casos estn en tre y , y ob viam en te
cu an to m ayor es su valor, es p or u e el caso obser vad o est m s ale
ado de
lo p red ico por el m odelo.
Per o lo u e in ter esa n o es estu diar los residu ales de cad a ob servacin ,
sin o cm o se a
u stan los d atos obser vados al m od elo logit gen erad o. Par a

11_La regresion logistica.indd 390

06/06/12 09:40

ello, es m e
or repr esen tar los r esid u ales grficam en te. E sto tien e dos ven ta
as. Pr im er o, p erm ite acerse u n a id ea gen er al del a
u ste del m odelo a los
d atos, al m ostr ar todos los datos en u n grfico, y detectar fcilm en te casos
extrem os p ar a su in sp eccin m s d etallad a. , segu n do, d ado u e se pu eden
r epr esen tar los resid u ales
u n to con cu alu ier otr a var iable d el m od elo (en
u n grfico de d os d im en sion es d e tata), p u ed en detectar se sesgos o d eficien cias en el a
u ste. odo ello pu ede ver se m e
or con el e
em plo u tili
ad o.
e van a m ostrar en u n grfico los residu os en fu n cin de la variab le edad.
E s p reciso fi
arse en d os cosasprim ero, en la existen cia de casos extrem os,
u e se salgan m u y m arcadam en te de las pred iccion es del m od elosegu n d o,
en la existen cia de relacin en tre la edad y los residu ales. E n el grfico n o se
debe en con trar relacin algu n a en tre la variable edad y la variab le residu al
si ay in dicios de tal relacin , es u e el m odelo est m al especificado (falta
algu n a variab le u e est relacion ada con la ed ad ). Para acer este grfico,
pu ede u tiliarse la ord en scatter de tata (vase el captu lo de grficos)
sca tter resm a n if eda d, yla bel(-) n a m e(, replace)

ap arece el sigu ien te grfico

Residuos estandarizados
0

GR F ICO
1 1..Gr
ico
de
r e sid u o s
e st a n d a r ia d o s
so b r e
una
va r ia b le
in d e e n d ie n t e

20

40

60
edad

80

100

om o p u ede apr eciar se, la m ayor p arte d e los casos est en tr e -y , y


se d istr ib u yen de m an er a bastan te u n iform e p or ar rib a y p or d eb a
o d el .
ay m en os casos con form e avan a la ed ad, per o eso n o es u n a d eficien cia
d el m od elo, sin o el sim p le eco d e u e en la m u estra ay m en os in d ivid u os de ed ades avan adas. Por tan to, al m en os en lo u e respecta a la edad ,

11_La regresion logistica.indd 391

06/06/12 09:40

E E

p ar ece u e el m odelo est b ien esp ecificado. Pu ed e acer se lo m ism o con


las otras var iables, in clu so con variab les n o in clu idas en la ecu acin logstica, para ver si se detecta algu n a r elacin con los resid u ales. i fu ese as, se
d eb er a r ep lan tear el m od elo y ver si es n ecesario in tr od u cir algu n a variab le
o efecto n u evo.
E n el grfico d e r esidu ales por ed ad apar ecen algu n os casos extrem os y
extr a os. E specialm en te llam a la aten cin u n caso de edad m u y avan ada y
m u y m al a
u ste (r esidu al m u y gran de, su perior a ). u an do existen casos
m u y extrem os, resu lta recom en d able estu d iarlos in d ivid u alm en te con cier to
d etalle. Pero par a ello es n ecesario id en tificar los. e u m odoay u n a
m an era d e detectar casos extr em os, n o grfica, u e r esu lta m s con ven ien te
cu an d o se cu en ta con m u cos casos y la r ep resen tacin gr fica n o p er m ite
id en tificar con claridad las ob ser vacion es p ar ticu lares. on siste en , u n a ve
gen er ad a la var iable resid u al, m ar car con u n a n u eva variab le (llam ad a au
extr em o) las observacion es u e ten gan u n valor ab solu to m u y alto en tal
variab le para estu diar las aisladam en te. e pu ede acer d el sigu ien te m odo
recod e resm a n if (. -.
.) (else), in to(extrem o)
sort resm an if
list m an if resm an if ed ad sexo in gresos estu dios if extrem o, clea n

e este m od o , se an m arcad o com o extrem os diecasos, au ellos con


residu o estan dariad o su p erior a ,. on la in stru ccin list o sim plem en te
estu d ian do la m atrid e datos directam en te en el revisor (brose) p u ed en
an aliarse m s deten id am en te estos casos extrem os p ara tratar d e detectar
p osibles problem as en el m odelo logit. n a orden acin p revia de los resid u os
estan dariad os tam bin es m u y til p ara m e
orar la com pren sin d e lo u e
ocu rre en los casos an m alos o m al p redicos por la regresin logstica.
ILR CI
1 1..List a d o
de
lo s
r e sid u o s
e s t a n d a r ia d o s
e t r e m o s
r es mani f
2. 73281
2. 73281
2. 883978
3. 025724
3. 025724
3. 025724
3. 025724
3. 025724
3. 025724
3. 025724

mani f
1
1
1
1
1
0
1
1
0
1

s exo
Muj er
Muj er
Muj er
Hombr e
Hombr e
Hombr e
Hombr e
Hombr e
Hombr e
Hombr e

edad
74
74
92
56
56
56
56
56
56
56

Pr i
Pr i
Pr i
Pr i
Pr i
Pr i
Pr i
Pr i
Pr i
Pr i

mar i
mar i
mar i
mar i
mar i
mar i
mar i
mar i
mar i
mar i

os
os
os
os
os
os
os
os
os
os

es t
y
y
y
y
y
y
y
y
y
y

udi os
menos
menos
menos
menos
menos
menos
menos
menos
menos
menos

De 150. 0000 a
De 150. 0000 a
Menos de
Menos de
Menos de
Menos de
Menos de
Menos de
Menos de
Menos de

i ngr esos
300. 000
300. 000
150. 000
150. 000
150. 000
150. 000
150. 000
150. 000
150. 000
150. 000

u riosam en te, tata trata los valores perdidos de u n a variable lgica com o verdaderos.
Por eso en la recodificacin para obten er la variable lgica extrem o, los valores perdidos, represen tados con un pu n to, son recodificados al valor .
ese en cm o delan te del -,ay u n
pun to aislado, u e representa cu aluier valor perdido.

11_La regresion logistica.indd 392

06/06/12 09:40

E l estu d io d e los r esidu os p er m ite, por tan to, com p rob ar el n ivel d e a
u ste d e los datos obser vados a los pr ed icos por el m odelo. Per o los r esidu ales
slo in d ican la existen cia de casos extr em os, n o la in flu en cia u e estos casos
tien en sobr e el m odelo de regresin logstica. esto ltim o p u ed e ser a n
m s im p or tan te. u pn gase u e ay u n caso u e a sido m al codificad o y
tien e u n valor absu r do en la variab le depen d ien te (con r especto a su s valor es en las var iables in depen dien tes), p or lo u e se a
u sta m u y m al al m odelo
logstico. E l p roblem a p rin cip al u e pr esen ta este caso n o es u n m al a
u ste
(d esp u s de todo el u e u n caso a
u ste m al n o tien e dem asiada im por tan cia
en s), sin o el eco d e u e p u ed e aber d istor sion ad o la p rop ia estim acin
d el m odelo gen eran do u n os coeficien tes en la ecu acin logstica in corr ectos.
i se r ecu erd a, m s arr ib a la estim acin del m od elo logstico se r ealiaba
p or el m todo de m xim a verosim ilitu du n p roceso estad stico u e estim a
los coeficien tes de la ecu acin logstica u e m s pr obablem en te gen er an
los valores ob ser vad os d e la variab le depen d ien te. Por tan to, si ay valores
er rn eos en la var iable d epen dien te, la estim acin de los coeficien tes estar
sesgada, n o ser corr ecta, p u esto u e se b asa en los valores observados.
u an do se estu d ian los resid u os, p or tan to, n o slo es im p or tan te d etectar los casos u e se a
u stan m al al m od elo, sin o tr atar de evalu ar u
in flu en cia tien en estos casos. E viden tem en te, los casos u e d eb en estu diar se
con m s detalle son au ellos u e n o se a
u sten bien a la ecu acin logstica
y ad em s e
er
an u n a in flu en cia im p or tan te.
m o p u ed e apr eciar se la in flu en cia de los casos in d ividu ales sobr e el
m od eloE l con cep to clave p ar a en ten d er el estu dio de la in flu en cia en la r egr esin es el sigu ien tela in flu en cia de u n caso se m ide a tr avs d el cam bio
u e pr odu ce en el m odelo su elim in acin d el p roceso d e estim acin . sea,
si al u itar u n caso en con cr eto el m odelo cam bia m u co (los coeficien tes,
la con stan te, la sign ificacin ), se dice u e ese caso e
er ce u n a gran in flu en ciasi p rcticam en te n o ay cam bios en el m odelo, la in flu en cia de tal caso
ser peu e a. Pu esto u e resu ltara m u y com plicado r ealiar u n a estim acin n u eva para valorar la in flu en cia de cad a caso (u itn d olo del m odelo y
r epitien do la estim acin ), lo u e en la pr ctica se u tili
a es la apr oxim acin
d e Pr egib on (on g y reese, ) llam ad o en tata dbeta . ado u e
esta m edid a es eu ivalen te a la d istan cia de ood e la regresin lin eal, a
veces se le llam a tam bin d e ese m od o.
E l estu dio de la in flu en cia de los casos en tata es igu al u e el d e los
r esidu alesse gen era u n a var iable n u eva u e alm acen a la in form acin de la
in flu en cia de cad a caso y se estu dia tal var iable. a or den para gen er ar la
variab le d e in flu en cia tam bin es la m ism a, predict, slo u e en este caso
con la opcin dbeta

a frm u la del dbeta de Pregibon esCi

11_La regresion logistica.indd 393

ri 2 hi
(1 hi ) 2

, i fu e definido en (.).

06/06/12 09:40

E E

p red ict coo, d beta


su m m a rie coo, d etail
cou n t if coo. coo.
list m an if coocoo. coo.

Poster iorm en te, se pu ede r ealiar u n a distribu cin de su s fr ecu en cias y,


si se en con tr ar an valores excesivam en te altos, realiar u n listado d e au ellos
con valores extr em os. om o se p u ed e ap reciar, en la ilu str acin ., n o es
este el caso en tan to u e el m xim o valor es ,. e todos m odos, si se exam in an las person as u e con tien en estos valor es extr em os d e Pr egibon son
, todas ellas m u
er es d e a os con b a
os estu dios y b a
os in gr esos.
ILR CI
1 1..E st a d st ica s
y
list a d o
d e
c a so s
in
lu ye n t e s
Pr egi bon' s dbet a
------------------------------------------------------------Per c ent i l es
Smal l est
1%
2. 53e- 06
2. 00e- 09
5%
. 0000521
2. 00e- 09
10%
. 0002681
6. 39e- 08
Obs
3717
25%
. 0017877
6. 39e- 08
Sum of Wgt .
3717
50%
75%
90%
95%
99%

. 0066305
. 0194973
. 0361494
. 0524679
. 090478

.
.
.
.

Lar gest
1024203
1024203
1024203
1024203

Mean
St d. Dev .

. 013848
. 0180839

Var i anc e
Sk ewnes s
Kur t osi s

. 000327
2. 254821
9. 039001

c ook >. 10 & cook<. = 34

67.
68.

cook
. 1024203
. 1024203

mani f
0
0

s ex o
Muj er
Muj er

edad
70
70

es t udi os
Pr i mar i os y menos
Pr i mar i os y menos

i ngr esos
Menos de 150. 000
Menos de 150. 000

n m odo p orm en oriad o de estu diar el a


u ste del m od elo a los datos es
a travs del an lisis de resid u ales e in flu en cia, tal y com o se acaba de exp licar. Pero otra m an era de estu diar lo m ism o u e se u sa a m en u do y tam bin
resu lta m u y til, sob re todo a la ora de com parar el a
u ste d e d os m od elos
d iferen tes, es m ed ian te el u so de m ed idas resu m en del n ivel d e a
u ste. E n
este caso, en lu gar de estu diar el a
u ste de cad a u n a d e las ob servacion es y
d etectar an om alas, se trata d e resu m ir en u n solo estadstico el grad o d e
a
u ste de u n m od elo a los d atos. E xisten m u cas m edid as diferen tes d e a
u ste
apropiad as para m od elos d e regresin logsticaau se estu diarn las m s
im portan tes u e ap arecen en el p rogram a
itstat del con
u n to d e u tilidad es
p ara variab les d ep en d ien tes categricas, ost, de on g y reese () .
e trata de u n con
un to de u tilidades ado u e ay ue descargar por
nternet, pu es n o
vien e in corporada en la versin estndar de tata. Para in stalar el pau ete, basta reali
ar u n a
bsu eda con la orden n et
searcsegu ida de la especificacin post, e in stalar la versin u e
m s se aproxim e a la de tata u e ten ga in stalada el u su ario.

11_La regresion logistica.indd 394

06/06/12 09:40

a sin taxis d e la ord en


itstat par a estu d iar el a
u ste es extr em ad am en te
sen cillabasta con escrib ir la in str u ccin u n a vea
u stad o el m odelo en
cu estin .
fitstat

ras lo cu al aparece el resu ltad o de la ilu stracin ..


ILR CI
11 ..e d id a s
d e
a
u st e
d e
la
r e gr e si n
lo gst ic a
Meas ur es of Fi t f or l ogi t of mani f
Log- Li k I nt er cept Onl y :
D( 3710) :
Mc Fadden' s R2:
ML ( Cox- Snel l ) R2:
Mc Kel v ey & Zavoi na' s R2:
Var i ance of y * :
Count R2:
AI C:
BI C:
BI C us ed by St at a:

- 2459. 605
4329. 467
0.
0.
0.
4.
0.
1.
- 26169.
4387.

120
147
191
068
687
169
226
012

Log- Li k Ful l Model :


LR( 6) :
Pr ob > LR:
Mc Fadden' s Adj R2:
Cr agg- Uhl er ( Nagel k er k e) R2:
Ef r on' s R2:
Var i anc e of er r or :
Adj Count R2:
AI C* n:
BI C' :
AI C used by St at a:

- 2164.
589.
0.
0.
0.
0.
3.
0.
4343.
- 540.
4343.

734
742
000
117
200
150
290
167
467
418
467

om o p u ed e a p r ecia r se, esta or d en m u estr a u n a gr a n ca n tid a d d e


d ifer en tes esta d sticos d e d ia gn stico d e la r egr esin logstica . o va n
a exp lica r se a u tod os los esta d sticos u e a p a r ecen , p er o s los m s
im p or ta n tes. E n la p r im er a fila a p a r ecen los loga r itm os d e la ver osim ilitu d (
) d el m od elo com p leto (og-i

u ll
odel) y d e a u ella (
) d el
m od elo u e slo in clu ye la con sta n te (og-i

n tercept
n ly). E stos son
los r esu lta d os p r in cip a les d el p r oceso d e estim a cin p or m xim a ver osim ilitu d . om o se exp lic m s a r r ib a , la fu n cin d e ver osim ilitu d se
p u ed e en ten d er com o la p r ob a b ilid a d d e u e los d a tos ob ser va d os en la
m u estr a a ya n sid o gen er a d os p or u n os d eter m in a d os coeficien tes. Por
ta n to, la ver osim ilitu d d el m od elo slo con la con sta n te es u n a m ed id a
d e la p r ob a b ilid a d d e u e los d a tos ob ser va d os a ya n sid o gen er a d os p or
u n m od elo logstico en el u e tod os los coeficien tes va len o, lo u e es
lo m ism o, u n m od elo en el u e la s va r ia b les in d ep en d ien tes n o tien en
n in g n efecto im p or ta n te sob r e la va r ia b le d ep en d ien te. Por el con tr a r io,
la ver osim ilitu d d el m od elo com p leto es u n a m ed id a d e la p r ob a b ilid a d
d e u e los d a tos a ya n sid o gen er a d os p or u n m od elo logstico en el u e
tod os los coeficien tes son im p or ta n teso sea , en el u e tod a s la s va r ia b les in d ep en d ien tes tien en efecto sob r e la d ep en d ien te. a com p a r a cin
d e a m b a s r a on es d e ver osim ilitu d (la d el m od elo slo con la con sta n te
y la d el m od elo com p leto) p er m ite com p r ob a r si r ea lm en te la s va r ia b les
in d ep en d ien tes tien en efecto sob r e la d ep en d ien te. i la ver osim ilitu d
d el m od elo com p leto es sign ifica tiva m en te m a yor u e la d el m od elo slo
con la con sta n te, p u ed e d ecir se u e lo m s p r ob a b le es u e la s va r ia b les

11_La regresion logistica.indd 395

06/06/12 09:40

E E

in d ep en d ien tes d el m od elo ten ga n r ea lm en te efecto sob r e la va r ia b le d ep en d ien te .


Par a con ocer la ver osim ilitu d d el m od elo es n ecesar io com par ar am bas
m edidas de ver osim ilitu d , reali
an d o u n test d e ip tesis estadstico. Pero
n o es n ecesario u e se efect e m an u alm en te, p u esto u e tata r ealia este
test au tom ticam en te. E sto es lo u e apar ece en la segu n d a fila, segu n d a
colu m n a de la salid a de
itstatel test (test de la ran de ver osim ilitu d ).
a m edida u e ap arece com o () es u n a pr u eb a de d e la sign ificacin
d e la difer en cia en tr e el m odelo slo con la con stan te y el m od elo com pleto. om o siem p re, la ip tesis n u la es u e todos los coeficien tes excepto la
con stan te son igu ales a , y la ip tesis altern ativa (u e se acepta si n o pu ed e aceptar se la n u la) es u e los coeficien tes son sign ificativam en te distin tos
d e . a fr m u la exacta de esta p ru eba de iptesis es
(.)
eba
o del ap ar ece la pr obabilidad asociada al valor de la pr u eba y
a su s gr ados de libertad . a p robab ilidad en este caso de u e en la realid ad
tod os los coeficien tes d e la ecu acin logstica fu eran igu ales a es in fer ior
a ,, p or lo u e pu ede r eca
ar se la ip tesis n u laal m en os u n o d e los
coeficien tes u e aparecen en el m odelo logstico estim ad o es sign ificativam en te distin to d e .
E n la sigu ien te fila apar ece la m ed id a de a
u ste m s im p or tan te del m od elo logartm icoel seu do
2 o cadden
2. om o ya u ed exp licado
este estad stico m s arr ib a (en el apar tado d e estim acin del m od elo), n o
r eu ier e u e se repita su fr m u la. o obstan te, es p reciso com en tar u e

u n to con el seu do
2 estn d ar aparece el a
u stad o, u e sim p lem en te cor rige el eco de u e el pr im ero au m en ta ar tificialm en te al a ad ir n u evas
variab les, restan do al n u m erador d el pseu do
2 el n m ero d e p ar m etros
(coeficien tes m s la con stan te) del m od elo. Por esta r an , el a
u stado es
pr eferible al estn d ar.

(.)
as tres sigu ien tes filas n o se com en tan , p oru e son slo otros tip os de
m en os u tiliad os abitu alm en te y u n as m ed idas b asad as en el m od elo d e
variab le laten te (y*) u e n o in teresan en este con texto .

e eco, el de cadden (com o se explica en el apartado de estim acin del m odelo) es precisam ente el com plem en tario de la ra
n de am bas verosim ilitu des.

os grados de libertad eu ivalen al n m ero de coeficientes de la ecu acin () o, si se


prefiere, igual al n m ero de parm etros m enos el u e representa a la con stan te b .

P a r a exp lica cion es a cer ca d e estos esta d sticos, va se on g y r eese (, p .


y ss).

11_La regresion logistica.indd 396

06/06/12 09:40

a fila u e m erece la sigu ien te m en cin es la del ou n t


2. as d os
m ed idas u e aparecen en esta fila estn b asad as en la com p aracin de los
valor es obser vados en la m u estra y los p redicos por el m odelo, con traste
u e pu ede ob ten er se m ed ian te la or den estat
classi
ication , d espu s d e la
estim acin d el m odelo.
estat classification

Por su ced er a u n estim ad or, es esta u n a in str u ccin sim ilar a predict,
au n u e en este caso su resu ltado n o sea cr ear u n a ser ie de n u evas variab les,
sin o u n a tab la de con tin gen cia, segu ida de u n con
u n to d e estadsticos sob re la cor recta clasificacin d e la variab le m an ia p ar tir d e los p redictor es
em p leados en la ecu acin logstica.
ILR CI
1 1..a b la
de
cla si
ica c i n
d e
la
r e gr e si n
lo gst ica
Logi s t i c model f or mani f
- - - - - - - - Tr ue - - - - - - - Cl as s i f i ed |
D
~D |
Tot al
- - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - +- - - - - - - - - - +
|
629
396 |
1025
|
766
1926 |
2692
- - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - +- - - - - - - - - - Tot al
|
1395
2322 |
3717
Cl as s i f i ed + i f pr edi c t ed Pr ( D) >= . 5
Tr ue D def i ned as mani f ! = 0
-------------------------------------------------Sens i t i v i t y
Pr ( +| D)
45. 09%
Spec i f i c i t y
Pr ( - | ~D)
82. 95%
Posi t i ve pr edi c t i v e val ue
Pr ( D| +)
61. 37%
Negat i ve pr edi c t i v e val ue
Pr ( ~D| - )
71. 55%
-------------------------------------------------Fal s e + r at e f or t r ue ~D
Pr ( +| ~D)
17. 05%
Fal s e - r at e f or t r ue D
Pr ( - | D)
54. 91%
Fal s e + r at e f or c l ass i f i ed +
Pr ( ~D| +)
38. 63%
Fal s e - r at e f or c l ass i f i ed Pr ( D| - )
28. 45%
-------------------------------------------------Cor r ec t l y c l ass i f i ed
68. 74%
--------------------------------------------------

om o r epetid am en te se a in sistid o, el m odelo logit pr ed ice la p robab ilid ad d e ocu r ren cia de u n su ceso. Pu es b ien , en con son an cia con ello, en tod os au ellos casos en los u e el m odelo p rediga m s de ,d e p robab ilidad
d e ocu rr en cia, la pr ediccin ser u e ocu rr a (
lassi
ied)y en todos los casos en los u e el m odelo d u n a pr ob abilid ad in fer ior a ,, se p ron osticar
u e n o su ceder (-
lassi
ied). E l ou n t
2 es sim p lem en te la p rop orcin d e
p red iccion es cor rectas seg n este cr iterioo sea, en u p orcen ta
e de casos
la p rediccin derivada del m odelo de r egr esin logstica acierta. a fr m u la
es, p or tan to

11_La regresion logistica.indd 397

06/06/12 09:40

E E

(.)
ien d o
ilas cu atr o fr ecu en cias d e la tab la d e clasificacin y ofr ecien do
el su m ator io d e las casillas con idn tico n dice (i
), el n m ero de casos en
los u e la pr ed iccin coin cid e con la realidad en cada u n a de los dos posib les tipos d e r esu ltad os (
) y (-
) el m odelo acier ta en el , de
los casos, lo u e par ece u n por cen ta
e bastan te alto d e acier to. em asiado
alto, de eco. E l ou n t
2 pu ede dar u n a im pr esin excesiva d e cap acidad
p redictiva del m odelo por u n a r an m u y sim p ledad o u e los valores u e
p u ed e tom ar la var iable depen dien te en u n m od elo logstico son slo d os (
o ), se p u ed e acertar en m s del d e los casos sim plem en te cogien do
tod os los casos de la categor a u e ten ga m s casos. E n este e
em plo, d ad o
u e se sab e u e el de los en cu estad os n o an asistido a n in gu n a m an ifestacin , sim p lem en te pr on ostican do siem p re la categora se asegu r a
m s de u n de acier tos . Por tan to, el ou n t
2 n o sir ve para com p arar
con dicion es de p artida d iferen teses n ecesar ia u n a m edida u e ten ga en
cu en ta cu n to se m e
ora la capacidad d e pr ed iccin con el m odelo estim ado, con respecto al sim p le con ocim ien to d e la categora con m s casos.
E sto es exactam en te lo u e ace el d

ou n t
2. E ste estadstico es u n a
m od ificacin del an terior, u e elim in a d e la cu en ta d e acier tos los r elacion ados con el m ar gin al d e fila m ayor

(.)
ien d o m axi (
i ) la fr ecu en cia m ar gin al m s alta en tr e la ocu rr en cia o
n o del fen m en o u e se u iere p ron osticar. E n este e
em plo ser n los .
in d ividu os u e n u n ca an id o a u n a m an ifestacin , en lu gar de los .
u e s lo icieron .
os subn dices i y son pecu liares en esta tabla de dim en siones . i sign ifica la presen cia () o ausen cia () de la calidad de la variable dependien te ( y ). den ota el pron stico por la regresin logstica de presencia (o ) o au sen cia (o -). e este m odo,
11 es el
n m ero de casos u e se an m anifestado y de los u e se predice u e se m an ifestaron
sera
por el con trario el n m ero de casos u e n o se an m an ifestado y de los u e el m odelo au gu ra
u e no lo an eco. an to
1 com o
1 son errores, pu es im plican a los casos con predicciones
distintas de la realidad. onsecuen tem en te, la su m a de todas las
ies igual a n .

a sen sibilidad (sensitivity en la ilu stracin .) es la probabilidad de clasificar certeram en te a alguien con la categora positivam ien tras ue la especificidad (speci
icity,
ibidem )
es la proporcin de clasificaciones correctas para los u e poseen em pricam en te u n a categora
n egativa. e acierta m s predicien do a u ien es n o asisten a m an ifestaciones (,) u e a
u ienes lo acen (,).

11_La regresion logistica.indd 398

06/06/12 09:40

E sta m edid a es m s
u sta, p or tan to, pu esto u e in dica la pr oporcin
d e aciertos m s all de los u e derivaran sim plem en te d e p on er todas las
ap u estas en el m ayor m ar gin al. om o pu ed e com p rob ar se fcilm en te, en
este caso, la pr op orcin es m u co m en orel m odelo logit estim ado slo
in cr em en ta la capacidad d e acierto en u n , con respecto a la u e se
ten d ra sim p lem en te pr ed icien do para todos los casos el valor m s com n
(o sea, la n o participacin en m an ifestacion es). o es u n r esu ltad o dem asiad o alto, p er o in dica u e el m odelo tien e cierta capacid ad par a pr ed ecir la
asisten cia a m an ifestacion es.
os dos ltim os estadsticos u e aparecen en la salida de
itstat,

, son las llam adas m edidas


de
in
orm acin . on m edidas de a
u ste especialm en te dise adas para com parar distin tos m odelos, in clu so con diferen tes
m u estras. E l
en con creto es u n a m edida m u y til para com parar regresion es logsticas con distin to n m ero de coeficien tes, com o podr verse a
con tin u acin .
E l

(aie

n
orm ation
riteria)
se calcu la u tili
an d o la verosim ilitu d del m odelo y el n m er o d e p ar m etr os. a fr m u la es

(.)

es

la verosim ilitu d del m odelo y el n m ero d e par m etros. E l

valor de
es in ter pr etab le sobr e todo en la com par acin , m s u e en s
m ism oel m od elo con u n
m en or es el m e
or a
u stad o.
E l
(ayesian

n
orm ation
riterion ) es u n a m edida a n m s til par a
com p ar ar distin tos m odelos logit, pu esto u e est m e
or d esar rollada tericam en te. E st b asad a en la ver osim ilitu d del m od elo en cu estin y en su s
p ecu liares grados de liber tad (sien do estos igu al a n --)
(.)
E l
es u n a
u ste del
u e u tili
a el o r a
n de verosim ilitu d
d el m od elo, el n m ero de coeficien tes () y el de casos (n )
(.)

om o p u ed e a p r ecia r se en la ilu str a cin ., la or d en


itsta t p r od u ce d os va lor es
d e
y
. E llo es d eb ido a u e a y cier ta s d iscr ep a n cia s en los d eta lles d e la fr m u la
d e ta ta y la u e u sa n on g y r eese (). s, el
u e ca lcu la ta ta n o divid e
p or n el r esu lta d o. a fr m u la d e
d e ta ta (e-) es
.
u n a p a r en tem en te sien d o d istin ta , la r esta d e los r esu lta d os en tr e m od elos p r op or cion a
los m ism os r esu lta dos, por lo u e la s in d ica cion es d el cu a dr o .son ta m b in a plica b les. P a r a ob ten er los r esu lta dos d e ta ta sin in sta la r el p a u ete d e post, la in str u ccin
es
esta t
ic.

11_La regresion logistica.indd 399

06/06/12 09:40

E E

om o en el ca so del
, el
es sob re tod o in ter esa n te p a ra com pa ra r m odelos d istin tos, m s u e pa ra in ter pr eta r su va lor en trm in os
ab solu tos. E n p rin cip io, cu a n to m s n ega tivo es el
, m e
or es el a
u ste. a difer en cia en el
d e d os m odelos d istin tos in d ica u m od elo
es m s corr ecto. a ftery () prop u so u n a s p au ta s de in terp reta cin de
la diferen cia en el
(o
) de dos m odelos d istin tos. E n fu n ci n d e la
d ifer en cia
1 -
2 , la evid en cia d e u e el m o d elo m s cor r ecto es el
segu n d o ser
CR O
1 1.1 .a b la
de
in t e r r e t a c i n
en
la
c o m a r a c i n
de
m o d e lo s

i
e r e n cia
IC1
IC

E vid e n cia
de
u e
e l
se gu n d o
m o d e lo

e s
m e
or
u e
e l
r im e r o

E n tre y

bil

E n tre y

aon able

E n tre y

u erte

s de

u y fu erte

11 ..Co m a r a ci n
d e
m o d e lo s
veces r esu lta difcil decidir u va r ia bles d eb er n in clu ir se en u n m odelo
de regresin , sea logstica , lin ea l o de cu a lu ier otr o tip o. E n pr in cipio,
a la ora d e elegir la in clu sin o exclu sin de u n a determ in a da var ia ble
en u n m od elo d e r egresin m ltip le, se pu ede op ta r por r a
on es ter icas
o por ra
on es estad stica s. a ra
n terica lleva ra a in trod u cir a u ella s
va r ia bles u e pa recen r elevan tes en fu n cin de la teor a o la s iptesis de
pa rtida . a r a
n esta dstica lleva ra a elegir la s va r ia bles u e m u estra n u n
m a yor gra do de asocia cin estad stica con la va ria b le depen dien te u e se
desea exp lica r. ea lm en te, a la or a d e d ecid ir u var ia bles se in clu yen
en el m od elo, a n d e u tili
a rse a m b os tipos d e ra
on es. e a d e ten er en
cu en ta la asocia cin esta d stica en tr e la s va riab les, per o el sim p le eco
de u e exista a sociacin n o
u stifica la in clu sin o n o de u n a d eterm in a d a
va r ia ble en el m od elo d e r egr esin . l u tili
a r tcn ica s esta dstica s m u ltiva r ia bles com o la u e con tem p la este cap tu lo, se cor re el r iesgo de p er der
com p leta m en te la su sta n cia ter ica p or desa rr olla r m od elos m a tem ticos
m u y ela bor ad os, con a ltos gra dos de a socia cin y de rob u steesta dstica,
pero n in g n in ters su stan tivo. a esta dstica n o es m s u e u n a er ra m ien ta d e a n lisis, u e sir ve pa ra com p rob ar la va lidede con cep tos e
iptesis d esa r rolla d as ter icam en te.
n a tcn ica u tili
a d a m u y a m en u d o a la or a d e seleccion a r la s va r ia b les u e se a n d e in clu ir en u n m od elo d e r egr esin es el lla m a do

11_La regresion logistica.indd 400

06/06/12 09:40

m tod o d e seleccin p or p a sos. on siste b sica m en te en in tr od u cir o elim in a r la s va r ia b les in d ep en d ien tes en eta p a s su cesiva s, estu d ia n d o la va lid ed el m od elo en ca da u n a d e ella s, p a r a u ed a r se fin a lm en te con a u el
m od elo u e m s se a
u ste a los d a tos. sica m en te a y d os tip os d e seleccin p or p a sosd e in cor p or a cin p r ogr esiva o d e elim in a cin p r ogr esiva .
E n el p r im er ca so se tr a ta d e ir a a d ien d o va r ia b les in d ep en d ien tes a l
m od elo, com pr oba n d o la sign ifica cin d el m odelo en ca d a p a so y d e ca d a
va r ia b le in d ep en d ien te y n o in cor p or a n d o a u ella s va r ia b les u e n o a a d en sign ifica cin a l m od elo o u e n o son sign ifica tiva s ella s m ism a s. E l
segu n d o tip o d e seleccin p or p a sos d e va r ia b les con siste en p a r tir d e u n
m od elo con el m a yor n m er o p osib le de va r ia b les in d ep en dien tes seg n
el p la n tea m ien to terico u e se r ea lice, p a r a elim in a r p r ogr esiva m en te
la s va r ia bles u e n o sea n sign ifica tiva s o cu ya elim in a cin n o a fecte d e
m a n er a im por ta n te a la sign ifica cin d el m od elo. E n cu a lu ier a d e los
ca sos, a y u e ten er en cu en ta u e a m b os m todos d e seleccin p or p a sos slo a p or ta n
u stifica cion es tcn ica s, esta d stica s, p a r a la in clu sin o
n o de u n a o va r ia s va r ia b les en el m od elocom o se a d ico a n tes, esta s

u stifica cion es esta d stica s n o b a sta n p or s sola s p a r a opta r p or la in clu sin o n o d e u n a va r ia ble, sin o u e es n ecesa r io u e estn vin cu la d a s a u n
ra
on a m ien to su sta n tivo.
a in stru ccin
itstat de tata es u n a p oten te er ram ien ta para la seleccin d e var iables con el m todo p or p asos, pu es apor ta u n a in for m acin m u y til par a com par ar dos m odelos d istin tos y decidir cu l es m e
or.
om o se acaba d e ver, la or den
itstat se u tilia despu s de la estim acin d el
m od elo, y m u estra distin tas m edid as escalares de a
u ste d el m odelo. dem s de esto,
itstat p er m ite gu ar dar en m em or ia las m ed idas de a
u ste d e
u n m odelo d eter m in ado, y lu ego com p ar arlas con las d e otr o m od elo para
d eterm in ar cu l es el u e m e
or se a
u sta a los datos observados. ase a
con tin u acin u n e
em plo
u ietly logit m an if m u
er eda d i.estu dios i.in gresos am adeca sa estu d ian te
u ietly fitsta t, save
u ietly logit m an if m u
er eda d i.estu dios i.in gresos am adeca sa
fitstat, d if

on el sigu ien te resu ltado

11_La regresion logistica.indd 401

06/06/12 09:40

E E

ILR CI
11 .1.Co m a r a ci n
d e
la s
m e d id a s
de
a
u st e
entre
m o d e lo s
Model :
N:
Log- Li k I nt er c ept Onl y
Log- Li k Ful l Model
D
LR
Pr ob > LR
McFadden' s R2
McFadden' s Adj R2
ML ( Cox - Snel l ) R2
Cr agg- Uhl er ( Nagel k er k e) R2
McKel vey & Zav oi na' s R2
Ef r on' s R2
Var i anc e of y*
Var i anc e of er r or
Count R2
Adj Count R2
AI C
AI C* n
BI C
BI C'
BI C used by St at a
AI C used by St at a
Di f f er ence of

Cur r ent
l ogi t
3700
- 2448. 039
- 2146. 163
4292. 326( 3692)
603. 753( 7)
0. 000
0. 123
0. 120
0. 151
0. 205
0. 197
0. 154
4. 098
3. 290
0. 693
0. 182
1. 164
4308. 326
- 26041. 472
- 546. 240
4358. 054
4308. 326

8. 137 i n BI C'

Saved
l ogi t
3700
- 2448. 039
- 2146. 123
4292. 246( 3691)
603. 833( 8)
0. 000
0. 123
0. 120
0. 151
0. 205
0. 197
0. 154
4. 098
3. 290
0. 692
0. 180
1. 165
4310. 246
- 26033. 335
- 538. 104
4366. 191
4310. 246

Di f f er enc e

0.
- 0.
0.
0.
0.
- 0.
0.
- 0.
- 0.
0.
- 0.
0.
0.
0.
0.
- 0.
- 1.
- 8.
- 8.
- 8.
- 1.

0
000
040
080( 1)
080( 1)
778
000
000
000
000
000
000
000
000
001
002
001
920
137
137
137
920

pr ov i des s t r ong s uppor t f or c ur r ent model .

Not e: p- val ue f or di f f er enc e i n LR i s onl y val i d i f model s ar e nes t ed.

a p a la b r a u ietly a n tes d e cu a lu ier in str u ccin sim p lem en te a ce


u e ta ta n o m u estr e el r esu lta d o d e la in str u ccin , a u n u e rea lice los
c lcu los o estim e el m od elo. E n el e
em p lo p r im er o se estim a u n m od elo
logit con la s va r ia b les estu dios,
edad,
si el in d ivid u o es estu d ia n te, si es
a m a d e ca sa , n ivel d e in gr esos y si el in divid u o es m u
er. u ego, se gu a rda n los r esu lta d os d e la or den
itsta t en m em or ia con la op cin sa ve. e
estim a a con tin u a cin el otr o m od elo, el u e se d esea com p a r a r con el
pr im er oes el m ism o m od elo, p er o sin la va r ia b le estu dian te. esp u s se
in tr odu ce la or d en
itsta t con la op cin di
, lo u e a ce u e ta ta m u estr e
u n a com p a r a cin en tr e la s m ed id a s d e a
u ste ca lcu la d a s p or
itsta t p a r a
los d os m od elos, el u e in cor p or a la va r ia b le estu dian te
y el u e n o. a
colu m n a cu rren t (a ctu a l) m u estr a la in for m a cin d el ltim o m od elo estim a d o, y la colu m n a sa ved (gr a b a d o), la d el m od elo a n ter ior, a u el d el u e
se gu a r d a r on los d a tos con la op cin d el m ism o n om b r e. E n este ca so, el
m od elo cu rren t
es el u e n o in cor p or a la va r ia b le estu dian te
y el m od elo
saved
es el u e s u e la in cor p or a . a ter cer a colu m n a m u estr a sim p lem en te la d ifer en cia en tr e los r esu lta dos cu rren t
y sa ved, p a r a fa cilita r su
com pa r a cin .
E n el apar tado de a
u ste d el m odelo ya se a exp licad o cm o in ter pr etar
cada u n a de las m ed idas u e aparecen en la salida de
itstat. a com par acin de las m edid as de am bos m od elos p u ed e ser virn os par a decidir cu l
es m e
or. E specialm en te in teresan te es la com p ar acin d el estadstico
,

11_La regresion logistica.indd 402

06/06/12 09:40

p u esto u e ap orta u n cr iter io bastan te fiab le para elegir en tr e d os m od elos


su cesivos en u n a seleccin p or p asos d e var iables. E n la tab la ap arecen
u n os criterios p ara in ter pr etar las d ifer en cias en el
de d os m odelos d e
r egr esin logstica. E n la p ropia salida de la in stru ccin
itstat, cu an do es
u tiliad a para com p ar ar d os m odelos, aparece u n a prim era in ter pr etacin
d e u in d ica el
con respecto a u m od elo es m e
or. E n este caso, la
d ifer en cia en el
su gier e u e el m odelo cu rren t (el segu n d o, el u e n o in corp ora la variab le estu dian te)
es m s corr ecto u e el m odelo saved (el u e
s u e la in cor pora). Por tan to, p arece u e se d eb er a p refer ir el m od elo sin
la var iable estu dian te.
a in stru ccin
itstat, por tan to, es de gran u tilidad para la seleccin
d el m od elo m e
or a
u stad o seg n el m tod o p or p asos (stepise). Pu ed en
irse estim an d o su cesivos m od elos, a adien d o o elim in an do variab les seg n
p are
ca m s adecu ad o en fu n cin d e lo u e su gier a la com p aracin de cad a
p ar de m odelos su cesivos m edian te
itstat, ad em s d e, p or su pu esto, en fu n cin de lo u e sea tericam en te relevan te.
dem s de la in stru ccin
itsta t,
di
, u e p rop or cion a el con
u n to d e
pr oced im ien tos Post, con las in stru ccion es or igin a les d e la versin .
de ta ta y sigu ien tes se p u ed en presen ta r diversa s com p ar a cion es d e m odelos, in clu yen d o m s de d os, u e n o in clu ye la p ru eba esta dstica de la
diferen cia , p er o u e, en con tr a pa rtida , perm ite rea li
ar a l m ism o tiem p o
el con traste en tre los par m etros. a in stru ccin en cu estin es estim ates
y pa r a su ela bora cin , a l igu a l u e la u e se a ca ba d e ver, es pr eciso rea li
ar la en va r ios p asos. u n u e su u so es ilim itad o, com o e
em p lo se van a
u tili
a r tr es m odelos
er r u icos o a n ida dos, esto es, u n a serie d e m odelos
u e slo se d iferen cia n en tre s en u e u n o d e ellos ca rece de u n su bcon
u n to de va riab les d el otro, p er o n o dispon e d e va riab les de la s u e ca r e
ca el pr im ero o, d ico con otr as pa la br as, los m od elos
er r u ica m en te
in fer iores tien en m en os va ria bles u e los su p er iores y n in gu n a de ella s
diferen tes.
E n el e
em plo en cu estin se con sidera el m odelo
er r u icam en te su per ior el com pu esto por la va riab le eda d, la d icotm ica m u
er,
la s va riab les
ficticia s cor respon d ien tes a los in gr esos fam ilia res (i.in gresos), la s va riab les ficticia s de estu d ios (i.estu dios)
y la s va ria b les ficticia s de la situ a cin
lab ora l (
u bila do,
pa rado,
estu dia n te
y a m a decasa ,
con sider n dose com o
ba se la person a ocu pa d a) . E n el segu n d o m od elo se elim in a r n d os d e esta s, de
an d o slo la s corr esp on dien tes a
u bila do
y a m a deca sa. , fin a lm en te, en el ter cer m odelo, se descar ta n esta s ltim a s, por lo u e desa pa rece
tod o in dicio de situ a cin lab ora l.

a situ acin laboral tam bin abra podido ser in troducida com o variable factor. o se
a eco de este m odo para m ostrar ue es posible m e
clar variables in dicadores con variables
factores y, sobre todo, poru e la salida es m u co m s clara, ya u e con los factores slo se
m u estra el cdigo y no la etiu eta del valor. E s m s ilustrativo estu dian te ue .

11_La regresion logistica.indd 403

06/06/12 09:40

E E

logit m a n if m u
er ed ad i.estu dios i.in gresos
u bila do p arad o estu dian te
am ad ecasa
estim ates store odelo, title(
odelo su p erior
)
logit m a n if m u
er ed ad i.estu dios i.in gresos
u bila do a m ad ecasa if e(sa m p le)
estim ates store odelo, title(
odelo in term ed io
)
logit m a n if m u
er ed ad i.estu dios i.in gresos if e(sam p le)
estim ates store odelo, title(
odelo in ferior
)
estim ates table odeloodeloodelo, sta r stats( llll cirp aic bic)

om o p u ed e apr eciarse, las in str u ccion es pr eceden tes con stan d e tr es


p ar es de ln eas, u n o para cada m odelo y u n a fin al en la u e se com bin an los
tr es m odelos. ada p ar con sta d e la in stru ccin logit, pr opiam en te d ica ,
y d e otra (estim ates), u e graba (store) la in form acin del m odelo p reced en te ba
o el n om b re u e el u su ario con sid er e m s op or tu n o en este caso,
od elo, od eloy od elo, r esp ectivam en te, y con la etiu eta u e volu n tariam en te se escriba en la opcin title (exto desead o). E n la ltim a
in stru ccin se con
u gan los tres m od elos con la m ism a in stru ccin estim ates
segu ida d e table y los m odelos u e se d esean com par ar. esta ltim a con vien e a adir le la opcin star, u e es la u e coloca los asteriscos a los coeficien tes sign ificativos, y la op cin stats
acom p a ad a d e los estadsticos cor respon dien tes a cada m odelo u e se d esea aparecan en cad a u n o de ellos.
os p osibles para las r egr esion es logsticas son (n m er o de casos), ll
(logar itm o de la ver osim ilitu d del m odelo base), ll (logaritm o de la ver osim ilitu d del m od elo evalu ad o), ci2
(el test d e la r a
n de ver osim ilitu d), r p
(el p seu d o 2), aic y bic (criterios de in for m acin d e aie y b ayesian o) .

on ob
eto de reali
ar las pru ebas de los m odelos
erru icos con el m ism o n m ero
de caso, con viene e
ecu tar en prim er lu gar el m odelo con m s parm etros y, a con tinu acin ,
los sigu ien tes tenien do cu idado de inclu ir en la in struccin logit la seleccin i

e(sam ple), con


ob
eto de ue slo traba
e con los casos del m odelo an terior.

a orden original de tata estim ates


table,
a diferencia de la in stru ccin
itstat,
didel
m dulo Post, u tilia la sigu ien te frm u la BICk
2ln L( Mk ) p ln n , u e es euivalente en las
com paraciones.

11_La regresion logistica.indd 404

06/06/12 09:40

ILR CI
11 .11 .E o sici n
d e
a r m e t r o s
con
sign i
ica ci n
d e
va r io s
m o d e lo s
-------------------------------------------------------------Var i abl e |
Model o1
Model o2
Model o3
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - muj er | - . 40227661* * *
- . 25954549* *
- . 26264363* *
edad | - . 01448026* * *
- . 00657854*
- . 00597551
est udi os |
2 |
. 62288533* * *
. 5919637* * *
. 58675585* * *
3 |
1. 4243038* * *
1. 3544712* * *
1. 3472467* * *
i ngr esos |
2 |
. 54855537* * *
. 52480584* * *
. 52926195* * *
3 |
. 63062047* * *
. 57590225* * *
. 58352454* * *
j ubi l ado |
- . 47203306* * *
- . 47685376* * *
amadec as a |
- . 60354102* * *
- . 59545554* * *
par ado |
. 02651879
es t udi ant e |
. 10327419
_c ons | - . 38311017* *
- . 57134389* * *
- . 60620518* * *
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - N |
3700
3700
3700
l l _0 | - 2448. 0392
- 2448. 0392
- 2448. 0392
l l | - 2153. 3079
- 2140. 208
- 2139. 9926
c hi 2 |
589. 46276
615. 66246
616. 09327
r 2_p |
. 12039488
. 12574603
. 12583403
ai c |
4320. 6157
4298. 416
4301. 9852
bi c |
4364. 1284
4354. 3608
4370. 3622
-------------------------------------------------------------l egend: * p<0. 05; * * p<0. 01; * * * p<0. 001

E n la ilu str acin .ap ar ecen los tr es m odelos, desde el m s sim p le


a la iu ierd a asta el m s com ple
o de la dereca. E n ellos apar ecen los
coeficien tes logsticos (au n u e con la op cin e
orm p odr an m ostr arse en
su lu gar los cocien tes d e r a
on es
vid.
in
ra
), segu idos de la in for m acin
d e las caractersticas de cad a m odelo. l seleccion ar par a todos ellos los
m ism os casos, el resu ltado de las d os pr im eras ln eas d e los estadsticos
( (n ) y ll, esto es,
), son igu ales p ar a los tr es m od elos. Pu ede fcilm en te dedu cir se de los datos u e los tres m od elos son sign ificativos, con
idn ticos valor es de p seu d o r 2, p er o p or los d os cr iter ios d e in for m acin , el
p refer ible (por ten er los m en or es) es el m odelo cen tral, u e es el u e con tien e tod os los parm etr os sign ificativos del m od elo su perior.
E n el e
em plo a n ter ior se a u tili
a d o la op cin sta r d e la in str u ccin
estim ates
tables, u e a ad e estr ellas a los coeficien tes sign ifica tivos de u n
m od elo. n a a lter n ativa a ella es la in tr odu ccin de otros esta dsticos. E xisten cu a tro opcion es, u e da n cu en ta de ca da u n o d e ellosb (form ato)
pa r a los coeficien tes p ropiam en te d icosse(for m a to)t(for m a to), y
p(form a to) p a ra la sign ifica cin del valor de t. om o se dedu ce de su
sin taxis, el u su a rio p u ed e especifica r el n m ero de decim a les u e se van a
m ostr a r a tr a vs d el op ta tivo (form a to). E l sigu ien te e
em plo m u estr a la
m ism a tab la de la ilu str a cin ., pero se a n om itido los esta dsticos
del m od elo, los coeficien tes se m u estr a n slo con u n decim a l y ap a recen
los er ror es tp icos con d os cifra s d ecim a les y la s sign ifica cion es en n ota cin cien tfica .

11_La regresion logistica.indd 405

06/06/12 09:40

E E

estim ates ta ble od eloodelood elo, b (.f) se(.f) p (.e)

iem p re y cu an d o se u bieran grabad o an teriorm en te los tres m odelos citad os, el resu ltado de la an terior in stru ccin aparece en la ilu stracin ..
ILR CI
1 1.1.Ocio n e s
d e

or m a to
en
la
r e se n t a ci n
d e
m o d e lo s
----------------------------------------------Var i abl e | Model o1
Model o2
Model o3
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - muj er |
- 0. 4
- 0. 3
- 0. 3
|
0. 07
0. 08
0. 08
|
5. 6e- 08
1. 5e- 03
1. 4e- 03
edad |
- 0. 0
- 0. 0
- 0. 0
|
0. 00
0. 00
0. 00
|
1. 2e- 09
4. 0e- 02
7. 3e- 02
est udi os |
2 |
0. 6
0. 6
0. 6
|
0. 09
0. 09
0. 09
|
3. 0e- 11
3. 6e- 10
6. 1e- 10
3 |
1. 4
1. 4
1. 3
|
0. 12
0. 12
0. 12
|
0. 0e+00
0. 0e+00
0. 0e+00
i ngr es os |
2 |
0. 5
0. 5
0. 5
|
0. 08
0. 08
0. 09
|
5. 1e- 11
5. 4e- 10
7. 4e- 10
3 |
0. 6
0. 6
0. 6
|
0. 13
0. 13
0. 13
|
5. 0e- 07
5. 5e- 06
5. 7e- 06
j ubi l ado |
- 0. 5
- 0. 5
|
0. 14
0. 14
|
5. 7e- 04
6. 0e- 04
amadecas a |
- 0. 6
- 0. 6
|
0. 13
0. 13
|
2. 0e- 06
4. 4e- 06
par ado |
0. 0
|
0. 14
|
8. 5e- 01
es t udi ant e |
0. 1
|
0. 16
|
5. 2e- 01
_cons |
- 0. 4
- 0. 6
- 0. 6
|
0. 15
0. 16
0. 17
|
9. 9e- 03
3. 0e- 04
3. 2e- 04
----------------------------------------------l egend: b/ s e/ p

11 ..In t e r r e t a ci n
d e l
m o d e lo
e llega, por fin , a lo u e r ealm en te in teresala in ter pr etacin de los r esu ltados d el m od elo logit. on respecto a la regresin lin eal, ay u n par
d e aspectos u e ay u e ten er en cu en ta, u e acen la in terp retacin de la
r egr esin logstica con sid er ablem en te m s com plicada.
Pr im er o, com o ya se a com en tado a lo lar go d e este captu lo, ay u e
con siderar u e los coeficien tes d el m odelo logit tal cu al n o sir ven par a su
in ter pr etacin . i se r ecu erd a la ecu acin b sica d el logit

(.)

11_La regresion logistica.indd 406

06/06/12 09:40

p u ede verse u e la variable depen dien te ap arece en u n a form a n o directam en te in terpretable, por lo u e el efecto sob re ella d e las variab les in d ep en d ien tes n o se p od r estu diar d e m an era directa. Por e
em p lo, en el m od elo
p resen tado, el coeficien te d e la variab le edad
tien e u n valor de -,. u
sign ificad o sociolgico tien e u e por cada a o d e edad d ism in u ya en ,
el logaritm o d e la ran de asisten cia a m an ifestacion esPoco se pu ede decir
d e este dato, salvo u e m u estra u n efecto n egativo. Para estu diar el m odelo
logit, ser n ecesario tran sform ar la ecu acin origin al, com o se vio en (.) y
en (.), para con segu ir coeficien tes u e p u ed an ser in terp retados.
ay dos tran sfor m acion es d e la ecu acin logit or igin al u e p er m iten su
in terp retacin in m ed iata. a pr im era su pon e elim in ar el logaritm o del lad o
d er eco de la ecu acin origin al. espe
an d o

(.)
E n este caso, los valor es de los coeficien tes in dican cm o vara la ran
d e ocu rr en cia del su ceso m edid o p or la variab le depen dien te en fu n cin d e
u n cam b io de m agn itu d en el valor d e las var iables in depen d ien tes. E sta
form a d e in ter pr etar los resu ltados d el logit ser la exp licad a en el ap ar tado
a, pero, au n u e es u n a for m a vlida d e in terp retar u n a r egr esin logstica,
sigu e sien do b astan te com ple
a, p or u e el cam bio en la var iable d epen dien te se expr esa en trm in os d e (cocien te d e raon es), con cep to asu m ible en
teor a, pero poco in tu itivo. era m u co m s fcil si el cam b io en la variab le
d ep en dien te se exp resara sim plem en te en trm in os de p rob ab ilidad de ocu r ren cia del su ceso estu d iado.
e
or com p ren sin , p or tan to, p u ed e con segu irse m edian te u n a segu n da
tran sfor m acin d e la ecu acin logit or igin al u e en el lado der eco expr ese
las var iacion es en la pr ob abilid ad de ocu r ren cia d el su ceso. esp e
an do

(.)
ora b ien , esta ecu acin tien e u n pr oblem a, p u esto u e expr esa u n a
fu n cin n o lin eal. E sto u iere d ecir u e el efecto de u n a var iable in depen d ien te sobr e la var iable depen dien te es diferen te seg n el valor u e ten gan tod as las dem s var iables in dep en d ien tes, adem s de seg n su p ropia
m agn itu d. E n la r egr esin lin eal, el efecto d e las variab les d el m odelo es
in depen dien te y con stan teel cam bio en la var iable in dep en d ien te pr odu ce
siem pre el m ism o cam b io en la d epen dien te, d a igu al cu l sea el valor d e las
otras variab les d el m od elo. a m agn itu d d e ese cam b io es la u e se exp resa
en el valor del coeficien te asociado a cada variab le in depen dien te en la r e-

11_La regresion logistica.indd 407

06/06/12 09:40

E E

gresin lin eal. Pero en el caso d e la r egr esin logstica, dado u e el cam bio
u e pr ovoca cad a var iable en la p rob abilid ad d e ocu rr en cia del su ceso estu d iado d ep en d e del valor d e todas las dem s variab les, n i siu ier a se pu ed e
asociar u n coeficien te a cada var iable in depen dien te cu an do el m odelo est
expr esad o en pr obabilidades com o en (.) . Por tan to, ay u e cam b iar
totalm en te la estr ategia de an lisis. a m an era d e estu diar u n a ecu acin
logstica en form a pr ob abilstica es u tilian d o las p rob ab ilidad es pr ed icas
por el m od elo p ar a valores esp ecficos de las variab les in d epen dien tes. E sta
segu n d a estr ategia d e in terpr etacin se ver en el apar tado ...

11..1.
n terpretacin
a
travs
de
cocien tes
de
razon es
Par a u e se m u estre la ecu acin logit en tr m in os de cocien tes de r a
on es,
ay u e a adir la op cin or (o escrib ir sin opcin la in stru ccin logistic, en
lu gar de logit).
i ya se an pedido los coeficien tes n orm ales, n o es n ecesar io r ep etir el con
u n to de variab les, pu esto u e tata recu er da la ltim a lista
d e variables, en caso d e u e n o se esp ecifiu e n in gu n a. ase u e m u estra
esta opcin en el e
em plo segu ido
ILR CI
11 .1 .R e gr e si n
lo gst ic a
con
co cie n t e
d e
r a o n e s
Logi s t i c r egr es s i on

Log l i k el i hood = - 2164. 7337

Number of obs
LR c hi 2( 6)
Pr ob > c hi 2
Pseudo R2

=
=
=
=

3717
589. 74
0. 0000
0. 1199

-----------------------------------------------------------------------------mani f | Odds Rat i o


St d. Er r .
z
P>| z|
[ 95% Conf . I nt er v al ]
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - muj er |
. 669914
. 0494824
- 5. 42
0. 000
. 5796236
. 7742692
edad |
. 9855737
. 0023394
- 6. 12
0. 000
. 9809993
. 9901695
est udi os |
2 |
1. 865738
. 1744364
6. 67
0. 000
1. 553345
2. 240957
3 |
4. 145156
. 476195
12. 38
0. 000
3. 309443
5. 191905
i ngr es os |
2 |
1. 718636
. 143193
6. 50
0. 000
1. 4597
2. 023505
3 |
1. 85572
. 232034
4. 94
0. 000
1. 452382
2. 37107
------------------------------------------------------------------------------

om o p u ed e ver se, el for m ato d e la salid a es el m ism o u e el del logit


n orm al. e eco, los datos m ostrad os son id n ticos salvo en cu atr o colu m n asla de cocien te d e raon es (odds
ratio)
y la de su s corr espon dien tes

E ste problem a slo existe cu an do se u tilia la form a probabilstica de la ecu acin logit. i se estudia la ecu acin en trm in os de cocien te de raon es, se obtien en coeficien tes de
variacin con stan tes para cada variable, por lo u e el anlisis se reali
a de m an era an loga al
de la regresin lineal. e eco, la ecu acin logit en trm in os de cocien tes de raon es es u na
ecu acin lin eal. om o se ver m s adelante, esto es as poru e la ecu acin logit n o expresa
probabilidades, sin o cam bios en el cocien te de las ra
ones.

11_La regresion logistica.indd 408

06/06/12 09:40

er rores tpicos e in tervalos d e con fian a. E sto es as por u e r ealm en te se


trata del m ism o m odelo, slo u e exp resado de m an er a d iferen te.
m o p u ed en in ter p r eta r se los cocien tes d e r a
on esos va lor es d e
la colu m n a cor r esp on d ien te exp r esa n cu n to va r a la r a
n d e ocu r r en cia d el su ceso en fu n cin d el ca m b io en la s va r ia b les in d ep en d ien tes, es
d ecir cu a n d o la va r ia b le in d ep en d ien te en cu estin a u m en ta en u n a u n id a d , cu n to va r a la r a n d e a sisten cia a m a n ifesta cion es. Pu ed e a s d ecir se u e el ten er estu d ios secu n d a r ios (va lor d e estu d ios) in cr em en ta
la r a n d e a sisten cia a m a n ifesta cion es ,veces. ecu r d ese lo u e es
r a n es la r a
n u e r ep r esen ta la fr ecu en cia ocu r r en cia d e u n su ceso
sob r e la fr ecu en cia d e su n o ocu r r en cia . E l d a to u e m u estr a la colu m n a
d e los cocien tes d e r a on es exp r esa el ca m b io u e exp er im en ta la m en cion a d a r a
n , cu a n d o u n a va r ia b le in d ep en d ien te va r a en u n a u n id a d .
i el cocien te d e r a
on es a socia d o a u n a va r ia b le es su p er ior a , la r a n a u m en ta cu a n d o a u m en ta el va lor d e la va r ia b le (com o es el ca so
d e los d os coeficien tes r esp ectivos d e estu d ios e in gr esos)p or ta n to, la
va r ia b le tien e u n efecto p ositivo sob r e la p r ob a b ilid a d d e ocu r r en cia d el
su ceso. i el coeficien te m ostr a d o es in fer ior a , la r a n d e ocu r r en cia
d el su ceso d ism in u ye cu a n d o a u m en ta en u n a u n id a d la va r ia b le in d ep en d ien te en cu estin . E n este ca so, esto ocu r r e con la va r ia b le m u
er
cu a n d o el en tr evista d o es m u
er (la va r ia b le m u
er p a sa d e a ) la r a
n
d e a sisten cia a m a n ifesta cion es d ism in u ye a l ten er u e ser m u ltip lica d a
p or ,(con r esp ecto a la d e los om b r es).
E n la in ter pr etacin de los resu ltados d e u n logit a travs de los cocien tes de r aon es, ay u e ten er m u y en cu en ta u e n o se est tr atan d o
d ir ectam en te sobr e las p rob ab ilid ad es d e ocu rr en cia del su ceso estu diad o,
sin o sobr e cm o varan las raon es de ocu rr en cia del su ceso en fu n cin d e
las var iables in d ep en d ien tes. lo p u ed en estu diar se las variacion es de las
p rob ab ilidad es si se tien e en cu en ta el con
u n to d e variab les in depen dien tes.
Por ello, p ara el estu d io d e las pr obabilidades p redicas para cad a caso, ay
u e u tili
ar u n as tcn icas de an lisis d ifer en tes, u e se ver n en el p rxim o
ap ar tado. as var iacion es en las raon es son d e m u co in ters p ar a el estu d io de u n logit por u e p er m iten cu an tificar el efecto relativo de las d istin tas
variab les in d epen dien tes sobr e la var iable depen dien te. Pero n o sir ven p ar a
acer pr ed iccion es.
igu ien d o con la in terp retacin d el an lisis del e
em plo en cu estin , las
var iables u e tien en u n efecto positivo sob re la pr ob abilid ad d e asisten cia a
m an ifestacion es son estu dios
(m s p rob ab ilid ad cu an tos m s estu dios) e in gresos (d em ). as variab les sexo
y edad
afectan n egativam en te. on r especto
a la m agn itu d de este efecto, ay u e ten er en cu en ta u n p ar de cu estion es.
Pr im ero, u e las var iacion es positivas y n egativas en los cocien tes d e raon es
son d ifciles de com parar in m ediatam en te, p or u e n o tien en el m ism o ran go
de variacin . as var iacion es n egativas van de a y las positivas d e a
in fin ito. E sto es as p or u e el cocien te d e r aon es expr esa u pr opor cin

11_La regresion logistica.indd 409

06/06/12 09:40

E E

r ep resen ta la r an d espu s d el efecto d e la var iable in d ep en d ien te fren te a


la ran an tes de tal efecto. Por e
em plo, el valor de ,en el valor de estu dios
sign ifica u e cu an do el in d ividu o tien e estu dios secu n d arios, la r a
n
d e asisten cia a m an ifestacion es es ,veces su perior u e cu an d o n o tien e
estu d ios o tien e estu dios p rim ar ios. E l valor de ,asociad o a la var iable
mu
er
u ier e decir u e cu an do el in d ividu o es m u
er, la ran de asisten cia
a m an ifestacion es es ,veces in fer ior a cu an do es om b re. u var iable
tien e m s efectos sobre la pr obabilid ad de asisten cia a m an ifestacion es, estu dios
secu n darios
o sexo
E s d ifcil de decir por u e los ran gos d e los efectos
p ositivos y de los efectos n egativos son d istin tos. Para acerlos com p arables,
ay u n a fcil solu cin se pu ede calcu lar el valor in ver so d e u n o de los d atos.
E l valor de ,d e variacin asociado a la variab le m u
er
es eu ivalen te a
u n efecto p ositivo de ,(
,,). Por tan to, el efecto de los estu dios
m ed ios es su p er ior al efecto de la variab le m u
er.
tr a cu estin a ten er en cu en ta al estab lecer com par acion es en tr e distin tos cocien tes d e raon es es el r an go de variacin de las variables in d ep en d ien tes. E l valor d e la cor respon d ien te colu m n a repr esen ta cu n to var a la
r an cu an d o la var iable in depen dien te var a en u n a u n id ad . gicam en te,
la var iacin en u n a u n id ad d e u n a variab le d u m m y com o m u
er, u e slo
p u ed e ten er dos valores, y , es m u co m s im por tan te u e la var iacin
en u n a u n idad d e u n a variab le con tin u a com o ed ad , u e pu ede ten er valores
u e van de a . Pu ede obser var se fcilm en te cm o todas las variab les
d icotm icas aparen tan u n efecto su stan cialm en te m ayor u e la n ica var iab le con tin u a in clu ida en el m odelo, la ed ad .
Par a su p er ar este pr oblem a com p ar ativo de los d istin tos coeficien tes
cu an d o tien en r an gos difer en tes, pu ede em p lear se el p rogram a del con
unto de u tilid ades para logit ost u e lista coeficien tes. a in stru ccin es
listcoe
, u e a d e em p lear se tras la estim acin logit estn d ar. i se a ade la
opcin elp se ob tien e u n a descr ip cin de lo u e sign ifican las ab reviatu r as
u tili
adas en los en cabeam ien tos de las colu m n as.
ILR CI
1 1.1.List a d o
d e
coe
ic ie n t e s
lo gs t ico s
y
co cie n t e s
d e
r a o n e s
l ogi t ( N=3717) : Fac t or Change i n Odds
Odds of : 1 v s 0
---------------------------------------------------------------------mani f |
b
z
P>| z|
e^ b
e^ bSt dX
SDof X
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - muj er |
- 0. 40061
- 5. 424
0. 000
0. 6699
0. 8186
0. 4997
edad |
- 0. 01453
- 6. 122
0. 000
0. 9856
0. 7650
18. 4357
2. est udi os |
0. 62366
6. 671
0. 000
1. 8657
1. 3205
0. 4457
3. est udi os |
1. 42194
12. 378
0. 000
4. 1452
1. 6754
0. 3629
2. i ngr es os |
0. 54153
6. 500
0. 000
1. 7186
1. 3018
0. 4870
3. i ngr es os |
0. 61827
4. 945
0. 000
1. 8557
1. 2237
0. 3266
----------------------------------------------------------------------

11_La regresion logistica.indd 410

06/06/12 09:40

om o pu ede apreciarse in m ediatam en te, esta orden m u estra m s in form acin u e la in stru ccin origin al logit,
or. as tres prim eras colu m n as m u estran los coeficien tes logit estn dar (b),
su valor z
(z)
y su probabilidad (
z
).
a cu arta colu m n a m u estra el cocien te de ra
on es, el m ism o u e m u estra
la an terior in stru ccin logit,
or. a colu m n a u e in teresa au es la u in ta
(ebtd), u e m u estra el cam bio en las ra
on es para u n in crem en to de la
variable in depen dien te de u n a desviacin tpica. l u tili
ar com o u n idad de
variacin de la variable in depen dien te su desviacin tpica, todos los coeficien tes pu eden com pararse en tre s. e este m odo, aparece cm o la m agn itu d
relativa de la variable edad au m en ta su stan cialm en te al m edirla en desviacion es tpicasde eco, tien e u n efecto en la ra
n m ayor (m s prxim o a )
u e la variable m u
er
(m s prxim a a ), au n u e en u n prin cipio pareciera lo
con trario. alcu lan do los valores in versos de edad
y mu
er, para com parar su s
m agn itu des con el resto de las variables, pu ede con clu irse la in terpretacin
de los cocien tes de ra
on es. E l in verso de edad
es ,y el de m u
er
es ,.
anto el nivel de estudios com o el nivel de ingresos afectan positivam ente a la
probabilidad de aber asistido a alguna m anifestacin. a edad y el gnero afectan, en cam bio, negativam ente (cuanto m s edad tiene el individuo, ay m enos
probabilidad de ue aya asistido a alguna m anifestaciny, adem s, las m u
eres
tienen m enos probabilidad de aber asistido ue los om bres). na veestandari
adas todas las m edidas, la variable ue tiene un efecto m s im portante en la
probabilidad de m anifestarse es el nivel de estudioscuantos m s estudios, m s
probabilidad de aber asistido a m anifestaciones. am bin bastante im portante,
aunue m enos, es la variable edad,
en el sentido ya explicado.
ngresos
y gnero
presentan tam bin una asociacin significativa, aunue m enos im portante.

11..2.
n terpretacin
a
travs
de
prediccion es
n a segu n d a m an era d e estu diar los resu ltados d e u n a r egr esin logstica
es, com o ya se a alu dido m s ar riba, a tr avs d e las pr ed iccion es del m odelo p ara valor es especficos d e las var iables in d ep en d ien tes. E sta for m a tien e
la ven ta
a d e u e los resu ltados son m s in tu itivos u e los d er ivados del estu dio de los cocien tes de r a
on es, u e n o de
an de ser u n a m edid a r elativam en te com ple
a y difcil d e in terp retar. Per o esta for m a tam poco es sen cilla,
p u esto u e la fu n cin logit en trm in os pr ob abilsticos n o es lin eal, com o ya
se a r efle
ado, lo u e ace con siderablem en te m s com p le
o su an lisis. E s
p reciso n otar u e la regresin logstica n o es u n a tcn ica sen cilla y reu iere
d e u n a cier ta pr ctica sob re todo en la in terp retacin de los par m etros.
tata in cor por a pocas err am ien tas para estu diar la r egr esin logstica
a travs de las p rob abilid ad es pr edicas. Por ello, au se u tiliar n b sicam en te los p rogr am as d el con
u n to de er ram ien tas ost.
e a explicado m s arriba u e el efecto de u n a variable in depen dien te
sobre la depen dien te en u n m odelo logit en form a probabilstica depen de del

11_La regresion logistica.indd 411

06/06/12 09:40

E E

valor de todas las variables in clu idas en el m odelo, as com o de su propia m agn itu d. Por ello, n o es posible ten er u n coeficien te asociado a cada variable in depen dien te u e exprese el efecto de esa variable sobre la variable depen dien te
de m an era probabilstica. ay dos m an eras de estu diar este efecto ten ien do
en cu en ta el problem a alu didou n a, m an ten er todas las variables en u n valor
determ in ado (n orm alm en te, pero n o n ecesariam en te, la m edia) y acer variar
slo u n a variable, estu dian do cm o afecta a las prediccion es del m odelola
otra form a con siste en dar valores especficos a todas las variables del m odelo,
seg n in terese, y ver u prediccin arro
a el m odelo en esos casos.
a prim era de las dos estrategias de an lisis se pu ede desarrollar m edian te
la in stru ccin prcan ge. E sta m u estra cm o afecta la variacin de u n a o m s
variables en la prediccin de ocu rren cia del su ceso estu diado, m an ten ien do
con stan tes el resto de las variables in trodu cidas en el m odelo (en la m edia). Por
e
em plo, se pu ede estu diar cm o afecta el eco de ser m u
er sobre la probabilidad de aber participado en m an ifestacion es. a in stru ccin n ecesaria sera
logit m a n if m u
er ed ad estu estu in grin gr
p rcan ge m u
er, from to

el resu ltado de ap licar la aparece en la pr xim a ilu str acin .


ILR CI
1 1.1 .E
e ct o
so b r e
la
va r ia b le
d e e n d ie n t e
de
lo s
c a m b io s
en
una
in d e e n d ie n t e
d ico t m ica
l ogi t : Changes i n Pr edi c t ed Pr obabi l i t i es f or mani f

muj er

f r om:
x =mi n
0. 4058

muj er

t o:
x +1/ 2
0. 3123

Pr ( y | x)

0
0. 6431

x=
s d( x ) =

es t u2
. 273339
. 445733

t o:
di f :
x =max mi n- >max
0. 3139
- 0. 0919
di f :
- +1/ 2
- 0. 0917

f r om:
x=0
0. 4058

f r om:
x- 1/ 2s d
0. 3802

t o:
x+1/ 2s d
0. 3342

edad
46. 6718
18. 4357

i ngr 2
. 386333
. 486974

t o:
x=1
0. 3139

di f :
0- >1
- 0. 0919

f r om:
x - 1/ 2
0. 4040

di f :
- +s d/ 2 Mar gEf c t
- 0. 0459
- 0. 0919

1
0. 3569
est u3
. 15604
. 362942

i ngr 3
. 121334
. 326559

muj er
. 518698
. 499717

as erram ien tas ost contem pladas en este apartado no fun cionaban con variables
factores en el m om en to en el u e se redact este texto. Por ello, an tes de aplicarlas, se vu elve
a e
ecutar la regresin logstica em plean do variables ficticias con valores
. esde la versin
, tata in corpora la instru ccin m argin s y, desde la , m argin splot, u e pu ede acer lo fu n dam ental de prcange y prvalu e y otras operaciones tam bin con factores y con otros m odelos.
s detalles y explicaciones de esta n u eva orden se pueden en con trar en el m an u al (tata
-y -).

11_La regresion logistica.indd 412

06/06/12 09:40

in la opcin
rom to se m u estr a la m ism a in for m acin , pero m en os detallada. E n este caso, d e eco, la ord en prcan ge
m u estra m u ca m s in form acin d e la verd aderam en te n ecesar ia, pu esto u e al tr atarse de u n a
variab le d icotm ica ficticia slo pu ede ten er d os valores (y ), y la op cin

rom to
m u estra in for m acin p ar a m u cos otros valores p osibles. ase lo
u e pu ede in ter pr etarse de la ilu stracin .. a p rim era colu m n a (
rom

xm in ) m u estra la pr ob abilid ad u e p red ice el m odelo par a u n in divid u o


con el valor m ed io en todas las var iables in depen dien tes salvo en la var iab le m u
er,
en la u e adop ta el valor . sea, se trata de la p rediccin d e
la p rob ab ilidad (,) d e aber asistid o a algu n a m an ifestacin en el caso
d e u e se estu vier a an te u n om br e con caractersticas m edias en cu an to
a estu dios, ed ad e in gresos. a segu n da colu m n a (to

xm ax)
m u estr a la
p rob ab ilidad p redica par a u n in divid u o d e id n ticas caractersticas p er o
con valor en la variab le m u
er.
Par a la m u
er m edia, p or tan to, la pr obabilid ad de aber asistido a algu n a m an ifestacin es de ,, seg n el m odelo
logstico. Por tan to, ser m u
er redu ce la pr ob abilid ad de ab er asistid o a
algu n a m an ifestacin en ,para u n a p erson a de caracter sticas m edias,
lo u e ap arece en la ter cer a colu m n a. as sigu ien tes colu m n as con in for m acin de tip o
rom
to
n o tien en r elevan cia par a el caso d e variab les ficticias,
(m s tar de, se estu diar u n a var iable con tin u a, edad,
en la u e s u e tien en r elevan cia). a
o las colu m n as de
rom
to,
aparece la pr obabilid ad d e
ocu rr en cia y n o ocu rr en cia del su ceso con los valores de todas las var iables
in depen dien tes en su s m edias. ba
o d el tod o ap ar ecen pr ecisam en te estos
valor es m edios, los u e se an u tili
ad o para acer las p rediccion es, y su s
d esviacion es tp icas.
e estu d ia a con tin u acin el efecto sob re la pr obabilidad de asisten cia
a m an ifestacion es de la variable edad,
en este caso, dado u e la var iable es
con tin u a, p u ed e ob ten er se m u ca m s in for m acin r elevan te con la in stru ccin prcan ge.
ILR CI
1 1.1.E
ecto
so b r e
la
va r ia b le
d e e n d ie n t e
de
lo s
ca m b io s
en
una
in d e e n d ie n t e
n u m r ica
l ogi t : Changes i n Pr edi c t ed Pr obabi l i t i es f or mani f

edad

edad

f r om:
x =mi n
0. 4570

t o:
di f :
x =max mi n- >max
0. 2156
- 0. 2414

t o:
di f :
x +1/ 2
- +1/ 2
0. 3552
- 0. 0033

Pr ( y | x )

0
0. 6431

x=
s d( x ) =

est u2
. 273339
. 445733

11_La regresion logistica.indd 413

f r om:
x - 1/ 2sd
0. 3882

f r om:
x =0
0. 5223

t o:
x =1
0. 5187

di f :
0- >1
- 0. 0036

f r om:
x - 1/ 2
0. 3585

t o:
di f :
x +1/ 2sd
- +s d/ 2 Mar gEf ct
0. 3267
- 0. 0614
- 0. 0033

1
0. 3569
est u3
. 15604
. 362942

edad
46. 6718
18. 4357

i ngr 2
. 386333
. 486974

i ngr 3
. 121334
. 326559

muj er
. 518698
. 499717

06/06/12 09:40

E E

a prob abilid ad de u e u n in dividu o con car acter sticas m edias en todas


las var iables pero con el valor m n im o d e la variab le edad
(a os) aya
asistido a algu n a m an ifestacin es de ,. a pr ob abilid ad de u e u n in dividu o con la edad m xim a (a os) aya asistid o a algu n a m an ifestacin
es de ,. Por tan to, el efecto de la edad es n egativo, red u cin dose en
pu n tos p orcen tu ales la pr ob abilid ad de asisten cia a algu n a m an ifestacin
cu an d o la edad p asa de su valor m n im o a su valor m xim o. E ste efecto r esu lta (sociolgicam en te) cu rioso, p u esto u e en pr in cipio, cu an to m s
edad, es m s p osible u e el in divid u o aya ten ido la op or tu n idad d e asistir
a algu n a m an ifestacin en su vid ael r esu ltado d el an lisis del logit es con tr ario a lo u e in tu itivam en te parece m s pr obable, e in dica pr ob ablem en te
u n efecto gen er acion al, seg n el cu al las p er son as d e m s ed ad (con u n os
valor es m en os ten d en tes a la p ar ticip acin p oltica, tal vepor el legad o d e
la dictadu r a) tien en m en os p ropen sin a la p articipacin poltica u e los

ven es. os r esu ltad os from x, fr om xy dif-n o deben ten er se en


cu en ta en este caso, pu esto u e n o tien en sen tido. E l m odelo sim p lem en te
extien d e el efecto n egativo d e la edad asta el valor m n im o absolu to (),
per o obviam en te n o tien e n in g n sen tid o el estu diar la pr ob abilid ad de asisten cia a m an ifestacion es de u n a p er son a d e cer o o d e u n a o.
s in teresan tes son las sigu ien tes colu m n as. a colu m n a from x-

m u estr a el valor de la p red iccin d e asisten cia a m an ifestacion es p ar a u n a


per son a de edad m ed ia m en os m edio a ola colu m n a sigu ien te m u estr a lo
m ism o m s m ed io a o. Por tan to, lo u e se calcu la au es la variacin de
la pr ob abilid ad de asisten cia a m an ifestacion es en fu n cin de var iacion es
m u y p eu e as d e la ed ad idea u e es m u y prxim a a la d er ivada de u n a
fu n cin en u n p u n to o pen dien te d e la cu rva. e tr ata de ver cu l es la tasa
de cam bio de la var iable d ep en d ien te estu d ian do cm o r esp on de a var iacion es d e peu e a m agn itu d de la var iable in d epen dien te. a diferen cia en tre
estas d os colu m n as pr op orcion a la tasa d e cam bio estim ada en torn o a los
valor es m edios de la var iable in d epen dien te, lo u e se pu ede tam bin tom ar
com o u n a estim acin del efecto m argin al (con ter m in ologa m s pr opia d e
la econ om a) d e la edad (en torn o a su m ed ia) sobr e la prob abilid ad de asisten cia a m an ifestacion es (u e en este caso es -,).
as tr es sigu ien tes colu m n as tien en u n a fu n cin p ar ecidase trata d e ver
cm o r esp on d e la var iable depen d ien te a cam bios en la in d epen dien te, slo
u e en este caso, en ved e m edio p u n to (a o, por tr atarse de la ed ad), se
le su m a y se le r esta m edia desviacin tp ica, lo u e de alg n m odo estan dar ia la estim acin de la tasa de cam bio m ar gin al (lo u e pod ra u tiliarse
par a com p arar tasas de cam bio de distin tas variables, con d istin tos r an gos).
E n este caso es d e -,.
Pa ra el ca so de var ia bles con tin u as, u n a m a n era d iferen te per o m u y in teresa n te d e m ostra r la m ism a in form a cin u e la in str u ccin prcan ge
es
a tr avs d e gr ficos. Pu ede a cer se u n gr fico u e m u estr e la relacin en tre la eda d y la pr oba bilida d de a sisten cia a m a n ifesta cion es, m a n ten ien do

11_La regresion logistica.indd 414

06/06/12 09:40

la s otra s va ria b les en la m ed ia , igu a l u e ocu rr a con prca n ge. Pa r a acer


esto pu ede u tili
a rse la or den prgen . a sin taxis de esta es la sigu ien te
se teclea pr im ero la pa la b ra prgen
segu id a por la va ria b le in depen dien te
u e u iere an a li
a rse (en este ca so edad),
y lu ego, en las opcion es, se esp ecifica n los va lor es in iciales y fin a les de la va ria b le in depen d ien te u e se
u tili
a r n en la pr ed iccin y se esp ecifica el n om b re u e se le u iere pon er
a la var ia ble n u eva u e gen era la in stru ccin . o u e a r en ton ces prgen
es cr ea r u n a n u eva var ia ble u e con ten dr la p rediccin u e aga el logit
de su pr oba bilid a d d e a sisten cia a m a n ifesta cion es p a ra ca da va lor de la
va ria ble edad. i se a ad e la opcin ci gen er ar ta m b in los in ter va los de
con fia n
a de los pr ed ictor es. od o ello se pu ede ver m e
or con u n e
em p lo
p rgen ed ad, from () to () gen erate(edad ) ci

a an ter ior in str u ccin m u estra el r esu ltad o u e se pr esen ta a con tin u acin , d on d e apar ecen las m edias de las var iables in depen dien tes, p er o, en
r ealid ad , lo u e gen era son tres n u evas variab les con valores com pr en did os
en tr e y de la var iable edad.
ILR CI
11 .1.List a d o
de
la
a lica c i n
de
la
in st r u cci n
p r gen
l ogi t : Pr edi c t ed v al ues as edad v ar i es f r om 18 t o 95.
est u2
. 27333871

x=

est u3
. 15603982

edad
46. 671778

i ngr 2
. 38633306

i ngr 3
. 12133441

muj er
. 51869787

Por o m isin s lo en los p r im er os ca so s d el ficer o , la in str u cci n prgen cr ea tr es n u eva s va r ia b les con el n om b r e esp ecifica d o en tr e
p a r n tesis tr a s gen era te
ter m in a d o en x,
p
y p1.
a va r ia b le eda dx sim p lem en te a lm a cen a va lor es a in ter va los igu a les d e la m en cio n a d a va r ia b le in d ep en d ien teeda dp
con tien e la s p r ob a b ilid a d es p r ed ica s d e u e
el in d ivid u o n o a ya a sistid o a n in gu n a m a n ifesta cin (o sea , d e u e
m a n if) y edadp1, d e u e el in d ivid u o a ya a sistid o (m a n if). a s va r ia b les edadplb,
edadp1lb,
edadpu b
y edadp1u b
con tien en los in ter va los
d e con fia n a (in fer ior y su p er ior ) d e la s p r ob a b ilid a d es p a r a ca d a va lor
d e x. o u e in ter esa sa b er es cm o va r a en fu n cin d e la ed a d la p r ob a b ilid a d d e a sisten cia a m a n ifesta cion es, lo u e p u ed e m ostr a r se con
sen cillem ed ia n te u n gr fico d e r a n go u e r efle
e los in ter va lo s d e con fia n a d e la p r ed iccin d e p r ob a b ilid a d d e a sisten cia a m a n ifesta cion es
p or ed a d es.

e pu ede m odificar el n m ero de pu ntos gen erados con la opcin n cases().

11_La regresion logistica.indd 415

06/06/12 09:40

E E

gra ptoay ra rea eda dp lb edad pu b eda dx,

yla bel((.).) n am e(, rep lace)

xtitle(
a lores distin tos de edad
)

ytitle(
an go d e p roba bilidad de acu dir a m an ifestacin
)

a con tin u acin aparece el grfico con los on ce p u n tos u e gen er a la


in stru ccin .

Rango de probabilidad de acudir a manifestacin


0
.1
.2
.3
.4
.5

GR F ICO
1 1..Gr
ico
de
r o b a b ilid a d e s
r e d ica s
a r a
d ist in t o s
va lo r e s
de
una
va r ia b le
in d e e n d ie n t e

20

40

60
Valores distintos de edad

80

100

om o p u ed e apr eciar se, el grfico .m u estr a cm o vara la pr obabilidad d e asisten cia a m an ifestacion es en fu n cin de la ed ad, m an ten ien do
tod as las dem s var iables d el m odelo con stan tes en su valor m edio.
Pu eden in clu so com p licar se algo m s las cosas y p lasm ar en u n m ism o
grfico m s de u n a var iable. Por e
em p lo, se pu ede m ostrar cm o var a la
p robab ilidad de asisten cia a m an ifestacion es en fu n cin de la edad y d el gn ero. E llo se pu ede acer apr ovecan d o la p osibilidad u e b rin d a la or den
prgen d e esp ecificar el valor d e las otr as var iables del m odelo, con la opcin
x(variab levalor ). i se esp ecifica n in g n valor d e n in gu n a variab le, prgen
m an tien e todas las var iables en su m ed ia salvo la u e sirve p ar a acer la
p rediccin . Per o con esta op cin p u ed e otor gar se u n valor esp ecfico a u n a
o m s var iable seg n se d esee. ase con u n e
em plo p ar a u n a m e
or com p ren sin de este pr oceso.

11_La regresion logistica.indd 416

06/06/12 09:40

p rgen ed ad, from () to() gen erate(ed ad om b re) x(m u


er) ci
p rgen ed ad, from () to() gen erate(ed ad m u
er) x(m u
er) ci
label variable edad om b rep
P(y
om b res)
label variable edad m u
erp
P(y
mu
eres)
grap toa y (ra rea eda dom breplb ed adom brepu b eda dx)

(ra rea ed adm u


erp lb eda dm u
erp u b ed ad x),

ylab el((.).) n am e(, repla ce)

xtitle(
alores d istin tos d e eda d
)

ytitle(
an go de prob abilida d d e a cu dir a m an ifesta cin
)

legen d (la bel(


P(y
om b res)
) la bel(
P(y
mu
eres)
))

om o pu ed e com p rob arse, la prim era in stru ccin es an loga a la vista


m s arriba p ara gen erar las p rediccion es d el m odelo en fu n cin d e la ed ad .
a diferen cia est en u e se a ade la op cin x(m u
er), u e lo u e ace es
m an ten er la variab le m u
er
en el valor al acer la p red iccin . Por tan to, la
p rediccin realiad a sob re la p rob ab ilid ad de asisten cia a u n a m an ifestacin
en fu n cin de la edad en este caso slo se refiere a los om bres. ras esta in stru ccin para la pred iccin d e los om bres, aparece otra sim ilar p ara las m u
eres. espu s, slo u eda pon erles etiu eta y solicitar el grfico com p u esto.

Rango de probabilidad de acudir a manifestacin


0
.1
.2
.3
.4
.5

GR F ICO
1 1..Gr
ico
de
r o b a b ilid a d e s
r e d ica s
a r a
d ist in t o s
va lo r e s
de
una
va r ia b le
co n t in u a
y
otra
va r ia b le
d isc r e t a

20

40

60
Valores distintos de edad

1
ombres

80

100

1
mu
eres

e pu ed e apr eciar u e este m u estra la pr ob abilid ad p red ica de asisten cia a m an ifestacion es en fu n cin d e la edad p ar a om bres y m u
er es. d e-

11_La regresion logistica.indd 417

06/06/12 09:40

E E

m s, pu ed e advertirse cm o la d iferen cia en tre om bres y m u


er es es m en or
con form e avan a la ed ad, asta el pu n to d e u e su s in tervalos se cr u an .
a se a exam in ado cm o se pu eden estu diar las p rob ab ilidad es m an ten ien do todas las var iables en u n valor con stan te m en os u n a (o m s), la(s)
u e in teresa an aliar. e m en cion tam b in u e aba otr a m an er a de estu d iar los resu ltados d el logit en fu n cin de su p rob ab ilid ad a travs de la
p rediccin d e la p robab ilidad de ocu rr en cia d el su ceso estu diad o par a u n
caso especfico. a idea fu n dam en tal d e esta segu n d a for m a de acer la
in ter pr etacin d el logit es el estu d io de per files. e especifica en u n a ord en
u n p er fil r elevan te p ar a la in vestigacin , d n d ole u n os valores d eter m in ados
d e las variab les in dep en d ien tes, y el pr ogr am a p rop or cion a u n a pr ed iccin
u tili
an do el m odelo estim ado. a in stru ccin u e se u tilia para r ealiar
esta pr ediccin es prvalu e (tam b in in clu id o en ost). con tin u acin se
m u estr a su u so a travs d el m odelo em p leado en este cap tu lo.
i se d esea con ocer u p robab ilidad de ab er asistid o a u n a m an ifestacin ad
u dica el m od elo a u n a p erson a
oven d e a os sin estu d ios, es
pr eciso trad u cir este perfil en tr m in os d e variab les (edad2,
p or u n lad oy
estu 2estu ,
por el otr o, para r efer ir se a n o ten er estu dios). E l r esto d e las
variab les se m an tien en en su s valores m edios, p u esto u e n o in ter esan par a
este caso. a in str u ccin es prvalu e y esta n ecesita u n a opcin x para in d icar
los valores corr esp on dien tes al perfil y u n a op cin rest
para in dicarle con
u estad stico se traba
ar en el r esto de las var iables.
p rvalu e, x(estu estu ed ad ) rest(m ean )

d em s de las pr obabilidades (y su s in tervalos de con fian


a) d e u e
ocu rr a (y n o ocu r ra) el su ceso estu diad o, el r esu ltad o m u estra cad a u n o de
los valores d e las variab les in d ep en dien tes con los u e se calcu lan d icas
estim acion es
ILR CI
11.1.C lcu lo
d e
r ob a b ilid a d e s
de
o cu r r e n c ia
d e
la
va r ia b le
d e e n d ie n t e
a r a
d e t e r m in a d os
va lo r e s
d e
la s
va r ia b le s
in d e e n d ie n t e s
l ogi t : Pr edi ct i ons f or mani f
Conf i dence i nt er v al s by del t a met hod

Pr ( y=1| x ) :
Pr ( y=0| x ) :

x=

es t u2
0

0. 3393
0. 6607
es t u3
0

95% Conf . I nt er v al
[ 0. 3035,
0. 3751]
[ 0. 6249,
0. 6965]
edad
25

i ngr 2
. 38633306

i ngr 3
. 12133441

muj er
. 51869787

a ilu stracin .es r elativam en te sen cilla d e com pr en d er. u estra


la pr obabilid ad d e ocu r ren cia del su ceso
r(y1
x)y la de n o ocu rr en cia

11_La regresion logistica.indd 418

06/06/12 09:40

r(y
x)
. Por tan to, la p robab ilidad d e u e u n
oven de a os sin estu dios aya asistido a algu n a m an ifestacin es d e ,. l lado apar ece el
in tervalo de con fian
a de la pr ediccin , con u n d e pr obabilidades, y
d eba
o los valor es d e las variab les in d ep en d ien tes u e se u tili
ar on para
r ealiar la p rediccin .
om o p u ed e f cilm en te a p r ecia r se, esta for m a d e estu d ia r los r esu lta d os d el logit es la m s in tu itiva y f cil d e com p r en d er. Per m ite estu d ia r cu l es la p r ob a b ilid a d d e ocu r r en cia d el su ceso estu d ia d o a socia d a
a p er files esp ecficos d e la s va r ia b les in d ep en d ien tes. E l p r ob lem a u e
tien e es u e a cer u n a n lisis d eta lla d o d el efecto d e tod a s la s va r ia b les
in d ep en d ien tes es u n a op er a cin m u y ted iosa , p u esto u e es n ecesa r io ir
esp ecifica n d o u n o p or u n o tod os los p er files. om o e
em p los (p r op u estos
ta n slo p a r a u e el p r op io lector los in ter p r ete) se m u estr a n a con tin u a cin u n p a r d e p er files m s (p er son a con a os y estu d ios a ltosy
p er son a d e cin cu en ta y u n a os sin estu d ios). a s in str u ccion es ser a n
la s sigu ien tes
p rva lu e, x(estu estu edad ) rest(m ea n )
p rva lu e, x(ed ad estu estu ) rest(m ea n )

los r esu ltad os d e aplicar las son los u e se m u estran en la sigu ien te
ilu stracin
ILR CI
11 .1.C lcu lo
d e
r o b a b ilid a d e s
de
o cu r r e n c ia
de
la
va r ia b le
d e e n d ie n t e
a r a
otr o
a r
d e
co n
un to
de
va lo r e s

de
la s
va r ia b le s
in d e e n d ie n t e s

11_La regresion logistica.indd 419

06/06/12 09:40

E E

11 ..E
e r cicio s
. on sid er an do com o variab le r esu ltad o el u so de
n ter n et en los doce ltim os m eses (E stu dio Pregu n ta ), em p lea el sexo, la edad (r ecodificada en tres in ter valos) y los estu dios en u n m odelo logstico bin ar io.
u var iable parece ten er m ayor in flu en ciaom p ara estos resu ltados
con los ob ten idos en el p rim er y en el tercer e
er cicio del captu lo de
tab las ().
. E m p lean do el b ar m etro de abr il (cis), o cu alu ier otr o d e en ero,
abr il,
u lio u octu b re, tom a com o variab le d ep en d ien te la in ten cin d e
voto, elim in an d o a u ien es n o apor ten u n a op cin con cr eta, crea dos
var iables dicotm icasvotar al PP y votar al PE . om o variab les in dep en d ien tes, se te su giere u e em plees la exp osicin a d istin tos m ass
m edia
(P.a-P.c) la id eologa, la edad y la religin .

11_La regresion logistica.indd 420

06/06/12 09:40

12
R e gr e si n
lo gst ica
para
va r ia b le
o r d in a l

y
m u lt in o m ia l
El m odelo de regresin logstica bin ario, visto h asta ah ora, es la base de toda
u n a fam ilia de m odelos estadsticos de gran u tilidad para las cien cias sociales,
pu esto qu e se pu eden u tilizar para variables depen dien tes cu alitativas de distin tos tipos y con distin tos objetivos de in vestigacin . En este captu lo se explicarn brevem en te las dos exten sion es m s u tilizadas del m odelo de regresin
logstica bin ario, el logit ordin al y el logit n om in al
ologit y m logit en tata
.
Existen otros m odelos derivados de la regresin logstica bin aria qu e se pu eden
u tilizar para variables cu alitativas, pero su u so es m u ch o m en os h abitu al, por
lo qu e para su estu dio se rem ite al lector in teresado a u n texto especializado
com o el de on g y reese
o el de osm er y em esh o

1 2.1.E l
m o d e lo
e st a d st ico
d e l
lo git
o r d in a l
a regresin logstica or din al es u n a exten sin d e la r egr esin logstica bin ar ia. or tan to, par a exp licar el m od elo estad stico su byacen te, se sigu e
la m ism a exp licacin u tilizad a en la seccin .p ar a explicar el m odelo
b in ario. a pr im era ap roxim acin , por tan to, se basa en la idea de qu e tr as
la var iable dep en d ien te ord in al existe u n a var iable laten te con tin u am s
tarde, se ab ord ar otr a apr oxim acin b asad a en el con cep to d e cocien te d e
r azon es y pr obabilid ades n o lin eales.
n a variab le ord in al es aqu ella en la qu e pu eden or den arse las categor as, p er o se d escon oce la distan cia existen te en tr e ellas
si se con ocier a, se
tratar a de u n a var iable de in tervalo o razn
. ese a qu e es relativam en te
com n u tilizar m odelos de regresin lin eal estn dar p ar a este tip o d e var iab les, este tr atam ien to es in adecu ad o, pu es vu ln er a los su pu estos m s b sicos d e la r egr esin lin eal
prin cipalm en te por el h ech o d e qu e las distan cias
en tr e categor as son d escon ocidas y n o con stan tes
. E l m odelo d e regresin
logstica ord in al es el m od elo ad ecu ado par a este tip o d e var iables, tan com u n es en las cien cias sociales.
n ejem plo tp ico de var iable ord in al es el grado d e acu erdo con u n a
p regu n ta de actitu d es p olticas. E n este apartad o u tilizarem os u n ejem p lo

E E

d e este tipo sacado del estu d io d el


, qu e recoge el gr ad o d e acu er do
con la sigu ien te afirm acin los par tid os se critican m u ch o en tr e s, pero
en r ealid ad todos son igu ales. n tes qu e n ada con vien e con ocer la d istr ibu cin de la var iable.
tabu la te p

as posib les respu estas son m u y de acu erd o, d e acu er do, en desacu er do y m u y en desacu er do. u an do se r ealiz la en cu esta
m ar zo d e

, u n de la pob lacin se declar m u y de acu erd o con esta afirm acin , u n de acu erd o, u n en desacu erd o y u n m u y en d esacu erd o, lo qu e refleja u n con sider ab le grado de desafeccin h acia los p ar tid os
p olticos
las categor as de acu erd o y m u y de acu er do alcan zan en total u n
del total de las r espu estas
. asi u n d e los en cu estad os n o r espon d ier on a la p regu n ta.
ILUSTR I
1 2.1.ist r ib u ci n
d e

r e cu e n c ia s
d e
la
va r ia b le
o r d in a l
l os par t i dos s e |
c r i t i c an muc ho |
ent r e s , per o en |
r eal i dad t odos |
s on i gual es |
Fr eq.
Per cent
Cum.
- - - - - - - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - muy de ac uer do |
895
16. 96
16. 96
de ac uer do |
2, 350
44. 54
61. 50
en des ac uer do |
1, 443
27. 35
88. 86
muy en des ac uer do |
284
5. 38
94. 24
n. s . |
275
5. 21
99. 45
n. c . |
29
0. 55
100. 00
- - - - - - - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - Tot al |
5, 276
100. 00

ese a qu e las cu atr o categor as de r esp u esta posible pu edan r ecoger m s


o m en os bien las opin ion es de la gen te con respecto a la pr egu n ta p , est
clar o qu e la opin in su byacen te qu e se trata d e captar con esta pr egu n ta n o
est con stitu ida de m an er a n atu ral en estas cu atro opcion es discr etas y n etam en te d iferen ciadas, sin o qu e pr ob ablem en te exista u n con tin u o m u ch o
m s diverso d e opin ion es desd e el total acu er do h asta el total d esacu er do.
E se con tin u o su byacen te
qu e pod ra den om in arse desafeccin con los partidos polticossera la variab le laten te sob re la qu e se con stru ir el m odelo
d e r egr esin logstica or din al en este caso.
e m an er a sim ilar a com o se ab ord an terior m en te
grfico .para
la regresin logstica bin ar ia, el grfico .m u estra gr ficam en te la r elacin
tericaen tr e la variab le laten te y la variable depen d ien te ord in al
obser vada, con u n a var iable in dep en d ien te. e n u evo, la ln ea E
y
xm u estr a la r elacin en tre la var iable laten te y la variable in d ep en d ien teen este

caso
pu r am en te ilu str ativo
, la edad au m en tar a claram en te la desafeccin
p artidista.
ara la r epr esen tacin de la var iable depen dien te or din al de desafeccin
p artidista, p u ed e su p on er se qu e existe u n a ser ie d e valores u m bral qu e p erm iten r elacion ar la var iable laten te con tin u a con la var iable obser vada ord in al. n in d ividu o cu yo n ivel de d esafeccin partidista sea m u y bajo
en la
variab le laten te con tin u arespon d er con tod a p robab ilidad m u y en d esacu erd o a la pregu n ta. u n ivel d e d esafeccin pod ra au m en tar d e m an er a
m od erada sin qu e cam biar a su r espu esta a esta pr egu n ta, h asta qu e llegar a
u n p u n to en qu e r espon dier a en d esacu er do en lu gar de m u y en desacu erd o. E n ese m om en to, su n ivel de d esafeccin laten te h abr a su per ad o
el u m br al qu e sep ara la p rim er a de la segu n d a categora de r esp u esta en
la pr egu n ta p . u n ivel d e d esafeccin podr a segu ir au m en tan do h asta
el p u n to de su p erar el sigu ien te u m br al y em p ezara a estar de acu er do
con la fr ase, o in clu so p odr a llegar a su p er ar el ter cer y ltim o u m br al y
estar m u y de acu er do. E stos tr es n iveles u m b ral estn r epr esen tad os en el
gr fico .por tr es ln eas discon tin u as h orizon tales, etiqu etadas com o t 1,
t 2 y t 3. u an d o la ln ea qu e relacion a la variab le laten te y la ed ad
en el eje
d e ab scisasest p or d eb ajo d el n ivel t 1, el in dividu o ten der a r espon der
m u y en desacu er do, cu an d o est en tr e t 1 y t 2, ten der a r esp on der en
d esacu erd o, etc.
R I
12 .1.R e la ci n
entre
va r ia b le
la t e n t e
y
va r ia b le
o r d in a l
o b se r va d a
co n
una
va r ia b le
in d e p e n d ie n t e
y*
0
y=4

3
y=3

2
y=2

1
y=1 E(y*

25

40

55

70

|x)

85

u en teeelaboracin a partir de ong y reese

om o en el m odelo bin ar io, la r elacin en tre la var iable laten te y la var iable ordin al obser vada es estocstica, p or lo qu e est som etid a a u n cierto n ivel de err or r epr esen tado en el gr fico .por las r eas som br ead as
acopladas a cad a u n a de las ed ad es d estacadas en la ilu stracin . a var iable

E E

laten te d e desafeccin p oltica est por d eb ajo del u m b ral t 1 p ar a los qu e


tien en a os, por lo qu e la pr ediccin sera qu e en la m ayor p ar te d e los
casos r espon der an m u y en d esacu er do
au n qu e h ay u n r ea con sid er ab le
qu e cae por en cim a d e este u m br al, p or lo qu e tam bin h ay u n a pr obabilid ad im p ortan te d e qu e algu n os casos r esp on dan en desacu er do
. E l r ea
d e pr obab ilidad asociad a a los qu e tien en a os alcan za los dos u m b rales
m en ores, p or lo qu e la pr ediccin ser a qu e es m u y poco pr obable qu e estn
m u y de acu erd o con la fr ase, y la pr obabilid ad m ayor ser a qu e respon dier an en d esacu erdo, etc. ar a cad a u n o d e los n iveles de u m br al
o pu n tos
d e cor te, com o se den om in ar n m s adelan te
, p u ed e dibu jar se u n a cu rva
en form a de sem ejan te a la qu e se m ostr p ar a la r egr esin logit en el
grfico ., p u esto qu e el m odelo de regresin logstica or din al es n o lin eal,
com o el de la regresin logstica b in aria.
om o se pu ede ap reciar, el m od elo de r egr esin logstica ord in al es an logo al d e r egr esin logstica bin ar io, con la im p or tan te diferen cia d e qu e en
lu gar de ten er u n n ico pu n to d e corte qu e relacion a p robab ilsticam en te la
variab le laten te y la variab le ob ser vad a, h abr tan tos pu n tos d e cor te com o
categor as ten ga la variab le or din al
m en os u n o
, y estos p u n tos d e cor te
estarn su per pu estos de m an er a acu m u lativa, com o se m u estra en el gr fico .. e h ech o, y com o se ver d e m an era pr ctica m s adelan te, el m od elo d e regresin logstica b in ario se pu ede en ten der com o u n m odelo logstico ord in al en el qu e slo h ay d os categoras ord en ad as.
as ecu acion es qu e r elacion an la var iable laten te y la variab le ord in al
obser vada tam b in son an logas a las vistas m s atr s p ar a el m od elo bin ar io
ecu acion es
.a
.

. a r elacin en tr e la var iable laten te y las


variab les in dep en d ien tes qu e se in tr odu zcan en el m odelo se pu ed e r esu m ir
en la sigu ien te ecu acin

.
a r elacin en tr e la variab le depen d ien te or din al ob ser vad a y la variab le
laten te es m s com p leja qu e en el caso d e la var iable b in aria por la existen cia de var ios p u n tos de cor te

.
E n este caso, con cu atro categor as p ar a la variab le or din al y, por tan to,
tr es p u n tos de cor te

a p r ob ab ilid a d d e ocu r r en cia d e cad a u n a d e la s cu a tr o ca tegor a s


p ar a u n valor d e x es el r ea b a jo las cu r vas som b r ea d a s m ostr ad as en el
gr fico .

.
u stitu yen d o
.y despejan d o se llega a la fr m u la d e pr obabilid ad
p redich a seg n el m od elo logit or din al

.
a ecu acin
.es equ ivalen te a la ecu acin
.qu e se m ostr
p ara el m od elo bin ar io. om o en el m od elo bin ar io, la form a con creta qu e
ad op te el m odelo depen de de la distr ibu cin qu e se su pon ga p ar a el trm in o
d e er ror, qu e en el m od elo logit tien e u n a m edia de y varian za d e p
.
a ju stificacin del logit or din al m ed ian te u n m odelo de p robab ilidad
n o lin eal es m s sen cilla, y tam bin deriva d e la del m od elo b in ario. ada
categor a d e la variab le d ep en d ien te ord in al se p u ed e tr an sform ar en u n
cocien te d e r azon es, divid ien do la pr obabilid ad de obten er esa categor a o
u n a categora m en or p or la p rob ab ilidad de ob ten er u n a categora m ayor.
ien do m u n a categor a cu alqu iera excepto la categor a su p er ior de la var iable depen dien te

.
E l m od elo logit derivar a de u tilizar el logaritm o n eperian o d e
.
com o el lado d e u n a ecu acin de regresin p ar a cad a categor a de la var iab le dep en d ien te

.
as frm u las par a el clcu lo d e cocien te d e r azon es, etc., se pu eden der ivar d e m an er a an loga a com o se h izo en el apar tado .par a el m od elo
b in ario.

1 2.2.E st im a ci n
e
in t e r p r e t a ci n
d e l
m o d e lo

gu al qu e en el logit bin ar io, el m odelo se estim a p or u n procedim ien to d e


m xim a verosim ilitu d , p or lo qu e n o es n ecesario repetir cm o fu n cion a

E E

este pr oced im ien to


vase apartado .m s atrs
. er o, en este con texto,
u n ejem p lo con creto d e estim acin de u n logit or din al per m itir en ten der
m ejor las d iferen cias con el m od elo bin ar io.
e van a u tilizar las m ism as var iables in depen dien tes qu e se u saron en
el ejem plo an ter ior
el de la p articipacin en m an ifestacion espar a estim ar
u n m odelo de regresin or din al sob re la var iable d e desafeccin par tid ista
qu e se h an pu esto com o ejem p lo en las p gin as an ter iores . a or den d e
tata par a el logit ord in al es ologit, y se u tiliza exactam en te igu al qu e la
in stru ccin logit, p on ien d o p rim er o la var iable depen dien te y d etrs las var iables in d epen dien tes
ologit dep estu estu edad in grin grm u jer

om o se r efleja en la ilu str acin ., el resu ltado d e la orden ologit es


sim ilar al de la in str u ccin logit, excepto en u n a cosan o ap ar ece la con stan te, y ap ar ecen en su lu gar tres n u evos coeficien tes llam ados cu t1, cu t2 y
cu t3. om o ya h abr su pu esto el lector, estos tres coeficien tes corr espon den
a los tres valor es u m br al de la variab le laten te qu e se d escr ibi an teriorm en te. ealm en te, la in terp retacin d e estos p u n tos d e corte d e la r egr esin logstica ord in al es casi idn tica a la d e la con stan te de u n a r egr esin
logstica bin ar ia. E stos tr es pu n tos de corte r epr esen tan las pr obabilidades
acu m u ladas de ocu rr en cia d e las tres categoras in ferior es de la variab le
d ep en d ien te
la cu ar ta categor a n o es n ecesario in clu irla, p u es la p rob ab ilid ad acu m u lada es en ese casocu an do tod as las var iables in depen dien tes
d el m od elo valen , au n qu e por su pu esto exp resadas en trm in os de logar itm os de su s cocien tes d e r azon es (odds ratio). E l pr oceso de estim acin d el
m od elo em pieza
la iter acin cer oh acien do estos pu n tos de cor te igu ales
a los por cen tajes observados d e respu esta de cad a u n a de las categoras de
la var iable depen dien te, d el m ism o m odo qu e en la r egr esin logstica b in aria la estim acin em pieza con la con stan te sien do igu al al porcen taje de
r esu ltad os p ositivos en la var iable d ep en d ien te. E l pr oceso d e iteracin va
m od ifican do estos p u n tos d e cor te, ju n to con los valor es de los coeficien tes,
b u scan do los valores qu e m s verosm ilm en te p u d ieran h ab er pr od u cido los
r esu ltad os obser vad os
com o se explica en el ap ar tado .
.

e h a tran sform ado la variab le depen dien te


el cu a rto tem de la tercera pregu n ta del
estu dio
para h acer el a n lisis m s cm odo, elim in a n do los n o sabe
n o con testa

qu e a veces se colocan com o valor in ter m edio, lo qu e n o es tota lm en te correcto, pu esto qu e


n o en ca ja n en la m trica de la va riable ordin al en cu estin
, e in virtien d o los cdigos otorgados en el cu estion ario a la s respu estas para qu e aqu ellos au m en ten con form e a u m en ta la
desafeccin

recode p

.a
.b
, gen
dep

ILUSTR I
1 2.2.R e gr e si n
lo gst ic a
o r d in a l
de
la
o p in i n
so b r e
lo s
p a r t id o s
p o lt ic o s
I
I
I
I

t
t
t
t

er at
er at
er at
er at

i
i
i
i

on
on
on
on

0:
1:
2:
3:

l
l
l
l

og
og
og
og

l
l
l
l

i
i
i
i

k el
k el
k el
k el

i
i
i
i

hood
hood
hood
hood

=
=
=
=

- 4230.
- 4162.
- 4162.
- 4162.

6463
4171
1521
1521

Or der ed l ogi s t i c r egr es si on

Number of obs
LR c hi 2( 6)
Pr ob > c hi 2
Pseudo R2

Log l i kel i hood = - 4162. 1521

=
=
=
=

3530
136. 99
0. 0000
0. 0162

-----------------------------------------------------------------------------dep |
Coef .
St d. Er r .
z
P>| z|
[ 95% Conf . I nt er v al ]
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - es t u2 |
- . 345338
. 0846675
- 4. 08
0. 000
- . 5112833
- . 1793928
es t u3 |
- . 7965289
. 1025494
- 7. 77
0. 000
- . 9975221
- . 5955358
edad |
- . 006256
. 0020093
- 3. 11
0. 002
- . 0101941
- . 0023178
i ngr 2 |
- . 2177021
. 0731058
- 2. 98
0. 003
- . 3609868
- . 0744174
i ngr 3 |
- . 4079552
. 1117292
- 3. 65
0. 000
- . 6269403
- . 18897
muj er |
. 1970506
. 0633609
3. 11
0. 002
. 0728655
. 3212357
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - / c ut 1 |
- 3. 310537
. 1458847
- 3. 596466
- 3. 024608
/ c ut 2 |
- 1. 157784
. 130701
- 1. 413953
- . 9016142
/ c ut 3 |
1. 015081
. 1305644
. 7591794
1. 270982
------------------------------------------------------------------------------

a relacin en tre la con stan te del logit bin ario y los pu n tos de corte en el
logit ordin al se pu ede ilu strar del sigu ien te m odo. E l logit bin ario qu e se gen er m s atrs para la variable de asisten cia a m an ifestacion es fu e el sigu ien te
ILUSTR I
1 2..R e gr e si n
lo gst ica
b in a r ia
d e
la
a sist e n cia
a
m a n i
e st a cio n e s
I
I
I
I

t
t
t
t

er at
er at
er at
er at

i
i
i
i

on
on
on
on

0:
1:
2:
3:

l
l
l
l

og
og
og
og

l
l
l
l

i
i
i
i

k el
k el
k el
k el

i
i
i
i

hood
hood
hood
hood

Logi s t i c r egr es s i on

Log l i kel i hood = - 2168. 7488

= - 2463. 521
= - 2172. 6106
= - 2168. 7572
= - 2168. 7488
Number of obs
LR c hi 2( 6)
Pr ob > c hi 2
Pseudo R2

=
=
=
=

3721
589. 54
0. 0000
0. 1197

-----------------------------------------------------------------------------mani f |
Coef .
St d. Er r .
z
P>| z|
[ 95% Conf . I nt er v al ]
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - es t u2 |
. 6304916
. 0933244
6. 76
0. 000
. 4475791
. 813404
es t u3 |
1. 422758
. 1148576
12. 39
0. 000
1. 197642
1. 647875
edad |
- . 0145194
. 0023696
- 6. 13
0. 000
- . 0191637
- . 0098751
i ngr 2 |
. 5353647
. 0832126
6. 43
0. 000
. 3722711
. 6984584
i ngr 3 |
. 6102257
. 1249707
4. 88
0. 000
. 3652877
. 8551638
muj er |
- . 4031246
. 073787
- 5. 46
0. 000
- . 5477444
- . 2585047
_c ons |
- . 3741699
. 1476936
- 2. 53
0. 011
- . 663644
- . 0846958
------------------------------------------------------------------------------

i, en vez d e la ord en logit, se u tiliza el ologit con las m ism as var iab les

E E

ologit m a n if estu estu eda d in grin grm u jer

el r esu ltad o es el m ostrado en la ilu stracin .


ILUSTR I
12 ..R e gr e si n
lo gst ica
o r d in a l
d e
la
a sist e n cia
a
m a n i
e st a c io n e s
I
I
I
I

t
t
t
t

er at
er at
er at
er at

i
i
i
i

on
on
on
on

0:
1:
2:
3:

l
l
l
l

og
og
og
og

l
l
l
l

i
i
i
i

k el
k el
k el
k el

i
i
i
i

hood
hood
hood
hood

Or der ed l ogi st i c r egr ess i on

Log l i k el i hood = - 2168. 7488

= - 2463. 521
= - 2172. 6106
= - 2168. 7572
= - 2168. 7488
Number of obs
LR chi 2( 6)
Pr ob > c hi 2
Ps eudo R2

=
=
=
=

3721
589. 54
0. 0000
0. 1197

-----------------------------------------------------------------------------mani f |
Coef .
St d. Er r .
z
P>| z |
[ 95% Conf . I nt er val ]
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - est u2 |
. 6304916
. 0933244
6. 76
0. 000
. 4475791
. 813404
est u3 |
1. 422758
. 1148576
12. 39
0. 000
1. 197642
1. 647875
edad |
- . 0145194
. 0023696
- 6. 13
0. 000
- . 0191637
- . 0098751
i ngr 2 |
. 5353647
. 0832126
6. 43
0. 000
. 3722711
. 6984584
i ngr 3 |
. 6102257
. 1249707
4. 88
0. 000
. 3652877
. 8551638
muj er |
- . 4031246
. 073787
- 5. 46
0. 000
- . 5477444
- . 2585047
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - / cut 1 |
. 3741699
. 1476936
. 0846958
. 663644
------------------------------------------------------------------------------

om o pu ede ap reciarse fcilm en te, los resu ltados son absolu tam en te
igu ales, con la salvedad de qu e la con stan te se tran sfor m a en u n cu tpoin t

m an ten ien do el m ism o valor, pero cam b ian do el sign o d eb ido a la difer en te
p ar am etrizacin
.
a in terp retacin del m od elo de regresin logstica ord in al es sim ilar a
la d e u n m od elo bin ar io
y lo d ich o en los apar tados an terior es de este cap tu lo se ap lica d ir ectam en te
, con dos d ifer en cias im por tan tespr im ero, el
m od elo ord in al m ostrar u n a ser ie de pu n tos d e corte cu ya in ter pr etacin
es an loga
au n qu e ob viam en te n o idn ticaa la de la con stan te en u n a
r egr esin logstica bin ar iasegu n do, si el an lisis se cen tr a en la p rediccin
d e p rob ab ilidad es d e respu esta, se obten d r siem p re tan tas p rob ab ilid ad es
com o categor as ten ga la variab le depen dien te
en lu gar de u n a n ica pr ob ab ilidad d e ocu rr en cia com o se ob ten dra en el caso del logit bin ar io
. i
el an lisis se cen tr a en el an lisis d e cocien tes d e razon es (odds ratio) o en
el cam bio m argin al asociad o a cada coeficien te, la in ter pr etacin del logit
ord in al es pr cticam en te id n tica a la del logit b in ario.
el m ism o m od o qu e se pr oced a con la regresin logstica, tr as la estim acin de u n m odelo logit or din al se pu ede solicitar u n a descripcin m s
d etallad a d e las var ian tes d e los coeficien tes m edian te la or den listcoef.

ologit d ep estu estu eda d in grin grm u jer


listcoef

l m ostrar los cocien tes d e razon es (odds ratio) con listcoef, n o apar ecen
los pu n tos de cor te, pu esto qu e estos cocien tes son relativos, y se ap lican
p or igu al a tod as las categor as. E n efecto, el m odelo d e logit or din al asu m e qu e el efecto de los coeficien tes es el m ism o
en trm in os r elativos, r ecu rd ese qu e se tr ata de u n m odelo n o lin eal
, o qu e las ln eas qu e asocian
la p robab ilidad de ocu rr en cia de cad a u n a de las categor as d e la var iable
d epen dien te con las variab les in d ep en d ien tes son par alelas
en el sigu ien te
su b apartad o se ver esto con m s d etalle
.
ILUSTR I
12 ..o e
ic ie n t e s
d e l
m o d e lo
o r d in a l
d e
la
d e sa
e cc i n
p o lt ic a
ol ogi t ( N=3530) : Fac t or Change i n Odds
Odds of : >m v s <=m
---------------------------------------------------------------------dep |
b
z
P>| z |
e^ b
e^ bSt dX
SDof X
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - es t u2 |
- 0. 34534
- 4. 079
0. 000
0. 7080
0. 8559
0. 4505
es t u3 |
- 0. 79653
- 7. 767
0. 000
0. 4509
0. 7464
0. 3672
edad |
- 0. 00626
- 3. 114
0. 002
0. 9938
0. 8926
18. 1702
i ngr 2 |
- 0. 21770
- 2. 978
0. 003
0. 8044
0. 8990
0. 4888
i ngr 3 |
- 0. 40796
- 3. 651
0. 000
0. 6650
0. 8735
0. 3316
muj er |
0. 19705
3. 110
0. 002
1. 2178
1. 1035
0. 5000
----------------------------------------------------------------------

a in ter pr etacin d e los cocien tes de razon es es, p or tan to, id n tica a
la del m odelo logstico bin ar io. a variab le qu e tien e u n m ayor efecto es,
claram en te, el n ivel d e estu diosla r azn de d esafeccin p oltica d ism in u ye
a m en os d e la m itad para los qu e tien en estu d ios altos con respecto a los
qu e tien en estu dios b ajos, y u n ter cio p ar a los qu e tien en estu d ios m edios.
as m u jeres tien den a u n a m ayor d esafeccin qu e los h om b res, la edad tien e u n efecto n egativo sob re la desafeccin
a m s edad , m en os d esafeccin
p oltica
, as com o los in gr esos
a m ayor n ivel d e in gr esos, m en or r azn de
d esafeccin poltica
. od os los coeficien tes son estadsticam en te sign ificativos, y la qu in ta colu m n a
qu e m u estr a los coeficien tes estan dar izad os, p ar a
p oder com par ar loscon fir m a qu e el n ivel d e estu d ios es la variab le qu e tien e u n m ayor im p acto
n egativosobr e la desafeccin poltica.
om o se dijo an ter ior m en te, si se em plean las pr obabilidades pr ed ich as
p or el m od elo, los r esu ltados del logit ord in al difieren liger am en te de los del
logit bin ar io, pu esto qu e siem pre h abr qu e an alizar varias p rob ab ilidad es
d istin tas, tan tas com o categor as ten ga la var iable depen dien te. or ejem p lo, si se in ten ta estim ar la p robab ilidad d e desafeccin poltica par a d os

E E

p er files distin tosu n o, h om br e d e cu aren ta a os, con estu dios e in gresos


altos, y otro, m u jer de cu aren ta a os, con estu d ios e in gresos b ajos, h a d e
u tilizar se el pr ogr am a prvalu e d e SPost
explicad o con d etalle en la seccin
..del captu lo an terior
.
p rvalu e, x
estu estu ed ad in grin grm u jer

om o se r efleja en la ilu stracin ., la in str u ccin an terior gen era


cu atro pr ediccion es, u n a par a cada categor a d e la var iable d ep en dien te.
or ejem plo, la p rob ab ilidad d e respon d er m u y de acu erd o con la frase d e
d esafeccin par tid ista
yes d e u n en el pr im er per fil, m ien tras qu e
en el segu n do p erfil alcan za u n
se h an escogid o p erfiles extrem os con
fin es ilu str ativos
.
ILUSTR I
12 ..r e d icc io n e s
d e l
m o d e lo
o r d in a l
de
la
d e sa
e cci n
p o lt ica
ol ogi t : Pr edi c t i ons f or dep
Conf i dence i nt er v al s by del t a met hod

Pr ( y=1|
Pr ( y=2|
Pr ( y=3|
Pr ( y=4|

x=

x) :
x) :
x) :
x) :

est u2
0

0.
0.
0.
0.
es t u3
1

1138
4112
3816
0934

[
[
[
[

95% Conf . I nt er v al
0. 0898,
0. 1377]
0. 3753,
0. 4471]
0. 3450,
0. 4183]
0. 0741,
0. 1127]

edad
40

i ngr 2
0

i ngr 3
1

muj er
1

. pr v al ue, x ( es t u3=0 est u2=0 edad=40 i ngr 2=0 i ngr 3=0 muj er =0)
ol ogi t : Pr edi c t i ons f or dep
Conf i dence i nt er v al s by del t a met hod

Pr ( y=1|
Pr ( y=2|
Pr ( y=3|
Pr ( y=4|

x=

x) :
x) :
x) :
x) :

es t u2
0

0.
0.
0.
0.
est u3
0

0448
2427
4924
2201

[
[
[
[
edad
40

95% Conf . I nt er v al
0. 0368,
0. 0528]
0. 2189,
0. 2665]
0. 4747,
0. 5102]
0. 1952,
0. 2449]
i ngr 2
0

i ngr 3
0

muj er
0

12 ..
E l
su p u e st o
de
r e gr e sio n e s
p a r a le la s

o
r a o n e s
p r o p o r cio n a le s
n ltim o ap u n te a n tes de pa sa r a la r egr esin logstica m u ltin om ia l. om o
se h a explica do an ter iorm en te, en el logit ord in a l existe u n n ico coeficien te pa ra cad a va ria b le in dep en d ien te. o qu e esto qu iere decir es qu e el logit

or din a l a su m e qu e el m od elo logstico qu e describe la relacin en tr e la s


va ria b les in depen dien tes y ca da u n o de los p ar es ord en a d os qu e se pu eden
for m a r en tre categor a s a dya cen tes de la va ria ble d epen dien te es el m ism o
si n o fu er a a s, se n ecesita r a u n m odelo distin to pa ra ca da pu n to de corte, o p ar a ca da p ar posib le d e ca tegor a s de la va ria b le dep en d ien te, con
d istin tos coeficien tes pa ra ca da va riab le in depen dien te
com o su ced e, por
ejem p lo, en el m od elo m u ltin om ia l
. E ste su pu esto, lla m a d o d e r egr esion es
p ar a lelas o r a zon es p rop or cion a les, n o siem pr e se cu m p le, y cu a n do n o es
a s es n ecesa rio r evisa r el m odelo o in clu so u tiliza r otr o p a ra describ ir los
d atos.
E xisten d os p r u eb as esta d sticas en tata qu e p er m iten com p r ob a r si
los d atos n o cu m p len el su p u esto d e r egr esion es p ar alela s. a p r im er a se
ob tien e con el p r ogr a m a om odel, qu e n o est d isp on ib le en el p a qu ete estn d a r d e ta ta , p er o se p u ed e d esca r gar d e
n ter n et con la in str u ccin ssc
in stall
ssc in stall om od el

n a vez in stalada, la pr u eba de regresion es par alelas se ejecu ta escr ib ien do la p alabr a om odel, segu ida d e logit
p u es el m odelo en cu estin es el
logsticoy d esp u s la especificacin d el m odelo d el qu e se desea obten er
in form acin . E n el ejem p lo actu al h abr a qu e escr ibir
om od el logit dep estu estu eda d in grin grm u jer

a p arte su perior d e su r esu ltad o sim p lem en te r epite la salid a d e la ord en ologit estn d ar. o qu e in teresa es la p arte in fer ior, en la qu e se m u estr a
u n a pr u eb a de sob re el su pu esto de regresion es paralelas. E l valor d e es
d e ,, qu e para grados de libertad d a u n a sign ificativid ad de ,.
E l resu ltado de este test su gier e qu e los d atos n o se adecu an al su pu esto de
r egr esion es par alelas, p u esto qu e el n ivel d e sign ificacin est p or debajo
d el valor cr tico de ,.

ssc descarga paqu etes y fich eros del (Statistical Software om pon ents) qu e form an
parte del rch ivo del oston ollege.

E E

ILUSTR I
12 ..r u e b a
d e l
su p u e st o
de
r e gr e sio n e s
p a r a le la s
en
la
r e gr e si n
lo gst ica
o r d in a l
I
I
I
I

t
t
t
t

er at
er at
er at
er at

i
i
i
i

on
on
on
on

0:
1:
2:
3:

l
l
l
l

og
og
og
og

l
l
l
l

i
i
i
i

k el
k el
k el
k el

i
i
i
i

hood
hood
hood
hood

Or der ed l ogi t est i mat es

Log l i k el i hood = - 4162. 1521

=
=
=
=

- 4230.
- 4162.
- 4162.
- 4162.

6463
4171
1521
1521
Number of obs
LR chi 2( 6)
Pr ob > c hi 2
Ps eudo R2

=
=
=
=

3530
136. 99
0. 0000
0. 0162

-----------------------------------------------------------------------------dep |
Coef .
St d. Er r .
z
P>| z |
[ 95% Conf . I nt er val ]
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - est u2 |
- . 345338
. 0846675
- 4. 08
0. 000
- . 5112833
- . 1793928
est u3 |
- . 7965289
. 1025494
- 7. 77
0. 000
- . 9975221
- . 5955358
edad |
- . 006256
. 0020093
- 3. 11
0. 002
- . 0101941
- . 0023178
i ngr 2 |
- . 2177021
. 0731058
- 2. 98
0. 003
- . 3609868
- . 0744174
i ngr 3 |
- . 4079552
. 1117292
- 3. 65
0. 000
- . 6269403
- . 18897
muj er |
. 1970506
. 0633609
3. 11
0. 002
. 0728655
. 3212357
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - _cut 1 |
- 3. 310537
. 1458847
( Anc i l l ar y par amet er s )
_cut 2 |
- 1. 157784
. 130701
_cut 3 |
1. 015081
. 1305644
-----------------------------------------------------------------------------Appr oxi mat e l i k el i hood- r at i o t es t of pr opor t i onal i t y of odds
acr os s r es pons e c at egor i es:
c hi 2( 12) =
26. 02
Pr ob > c hi 2 =
0. 0107

a otr a pr u eb a estadstica disp on ible es u n test de ald dise ad o esp ecficam en te p ar a com pr obar si u n m od elo logstico cu m ple el su pu esto d e
r egr esion es p ar alelas, y for m a par te del paqu ete d e in str u ccion es SPost de
on g y r eese
qu e se h a u tilizad o a m en u do en este cap tu lo, por lo qu e
ya debe estar in stalada
. E sta pr u eb a d a m s in for m acin qu e la pr im era,
p u esto qu e m u estra la con trib u cin d e cada coeficien te a la violacin d el su p u esto d e r egr esion es par alelas, lo qu e per m ite r evisar el m odelo y afin ar lo
si es n ecesario. a in str u ccin es bran t, segu id a d e la op cin detail
b ran t, d eta il

e n u evo, lo qu e in teresa es la p arte in ferior d el resu ltado, qu e m u estra


la pru eb a estad stico. E l valor d e d e este test
el asociado a todas las variab leses m u y parecid o al del an terior, p or lo qu e se con firm a qu e el m odelo es
p roblem tico. ebajo del resu ltad o para el m od elo glob al aparece la m ism a
p ru eba para cada variab le in d ividu al, qu e p erm ite d escu b rir qu e slo u n a variable in d ep en d ien te viola el su p u esto d e regresion es p aralelas, y es el gn ero.
om o se m u estra en la sigu ien te salida d e tata, elim in an d o esta variable d e
la ecu acin , d eja de in cu m plirse el su p u esto d e regresion es p aralelas.

ILUSTR I
1 2..r u e b a
de
r e gr e sio n e s
p a r a le la s
de
r a n t

Es t i mat ed c oef f i ci ent s f r om j - 1 bi nar y r egr ess i ons


es t u2
es t u3
edad
i ngr 2
i ngr 3
muj er
_c ons

y >1
- . 5015509
- . 72265037
- . 00963421
- . 34940201
- . 48946785
. 52981587
3. 4305133

Br ant Tes t of Par al l el

y >2
- . 41440488
- . 87996476
- . 00746843
- . 28486464
- . 43298489
. 26463519
1. 2539669

y >3
- . 1813542
- . 63582219
- . 00308335
- . 07959308
- . 33855764
. 01476179
- 1. 1783949

Regr es s i on As s umpt i on

Var i abl e |
chi 2
p>c hi 2
df
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - Al l |
25. 70
0. 012
12
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - es t u2 |
4. 01
0. 135
2
es t u3 |
2. 77
0. 251
2
edad |
2. 56
0. 279
2
i ngr 2 |
4. 00
0. 135
2
i ngr 3 |
0. 39
0. 824
2
muj er |
11. 69
0. 003
2
---------------------------------------A si gni f i cant t est s t at i s t i c pr ov i des ev i dence t hat t he par al l el
r egr es si on as sumpt i on has been v i ol at ed.

ologit d ep estu estu eda d in grin gr


b ran t, d etail
ILUSTR I
1 2..r u e b a
de
r e gr e sio n e s
p a r a le la s
de
r a n t

Br ant Tes t of Par al l el

Regr es s i on As s umpt i on

Var i abl e |
chi 2
p>c hi 2
df
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - Al l |
14. 00
0. 173
10
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - es t u2 |
4. 41
0. 110
2
es t u3 |
2. 89
0. 236
2
edad |
2. 91
0. 234
2
i ngr 2 |
4. 74
0. 093
2
i ngr 3 |
0. 72
0. 698
2
---------------------------------------A si gni f i cant t est s t at i s t i c pr ov i des ev i dence t hat t he par al l el
r egr es si on as sumpt i on has been v i ol at ed.

1 2..
R e gr e s i n
lo gst ica
para
va r ia b le
d e p e n d ie n t e

n o m in a l
or ltim o, en este captu lo se discu tir b revem en te el m odelo de regresin
logstica m u ltin om ial. e trata de u n a n u eva exten sin d el m odelo logsti-

E E

co b in ario, cu ya lgica es a n m s sen cilla qu e en el caso del logit ord in al

p u esto qu e en realidad se basa en el clcu lo d e varios m od elos bin arios


sim u ltn eos
, p ero con siderab lem en te m s difcil de in terpretar. or ello, se
h ar m en os n fasis en la d iscu sin d el m odelo estadstico y m s en la in terpretacin de los resu ltad os, a travs de la d iscu sin d e u n ejem plo con creto.
n a variable categrica es m u ltin om ial cu an do pu ede tom ar m s d e dos
valores pero estos valores n o se p u ed en orden ar. n ejem p lo d e variab le m u ltin om ial es el recu erdo d e voto o la in ten cin de voto, p or los qu e cada
in divid u o pu ed e optar por u n a serie de op cion es distin tas
p artidosqu e en
prin cipio n o se en cu en tran orden adas en fu n cin de n in g n criterio. E l m odelo logstico bin ario ayu d a a verificar los factores d eterm in an tes de qu e u n
in divid u o tom e u n a opcin fren te a otra
o fren te a todas las d em s
. on tan do con esta h erram ien ta, se p od ran estim ar varios m odelos b in arios qu e,
u n o a u n o, u tilizaran com o variable d ep en d ien te d istin tas altern ativas b in arias d e voto, tom an d o com o referen cia u n partido en con cretoas, se p u ed e
elaborar u n m odelo exp licativo de la p rob ab ilid ad d e votar al E fren te a
la d e votar al en fu n cin de los estu dios, el sexo, la edad y los in gresos
lu ego, la p robab ilidad d e votar a
fren te al con los m ism os factores explicativosm s tard e, la p robab ilidad de voto a p artid os n acion alistas fren te
al , y, p or ltim o, la probabilidad de voto a otros p artidos fren te al . E n
con ju n to, estos cu atro m odelos logsticos b in arios p roporcion aran u n a idea
com p leja d e los factores explicativos de la opcin partid ista.
e m odo sim ilar a lo exp resado en
.
, cad a u n o d e estos m odelos
logsticos bin ar ios se car acter izara por las sigu ien tes frm u las

.
o qu e h ace la in str u ccin m logit d e tata es casi exactam en te estoestim ar de m an era sim u ltn ea tan tos logit b in arios com o categoras m en os u n a

j-ten ga la variab le dep en d ien te m u ltin om ial, a adien d o algu n as restr iccion es especficas par a d ar cu en ta del h ech o d e qu e se tr ata d e u n con ju n to
exh au stivo y m u tu am en te exclu yen te de eleccion es
p or ejem plo, los coeficien tes de las com par acion es bin ar ias deben su m ar y u tilizan d o la m ism a

m u estra par a tod as las com paracion es


si se solicitar an los logit bin ar ios
m ostrad os en
.de u n o en u n o, cad a m odelo u tilizar a u n a m u estr a
d istin ta
.

1 2..E st im a ci n
e
in t e r p r e t a ci n
d e l
m o d e lo
tilizan do la en cu esta postelector al d el
de
estu d io
, se recodifica la variab le de r ecu erd o d e voto en cin co categoras

, E ,
,
n acion alistas y otros
, elim in an d o a los qu e n o votaron y a los qu e n o con testaron a la pr egu n ta. ar a estim ar u n m od elo m u ltin om ial d e esta variab le
sob re n ivel de estu d ios, edad, in gresos y gn ero, se em p lea la in stru ccin
m logit del m ism o m odo qu e se h an u tilizado logit u ologit
m logit voto estu estu eda d in grin grm u jer

E l resu ltado es m u y sim ilar al del logit bin ario, excep to en u n a cosa
m u estra cu atro b loqu es de coeficien tes en lu gar de u n o. ad a u n o d e los bloqu es d e coeficien tes qu e aparecen es u n m odelo logstico b in ario qu e com p ara la prob abilid ad de voto al partido m ostrado al com ien zo d e cad a b loqu e
fren te a la probabilidad d e voto al
, qu e es la categora de referen cia.
or om isin , la in stru ccin ologit seleccion a la pr im er a categor a d e la
variab le d epen dien te com o categor a de r eferen cia. E n este caso tien e sen tido
pu esto qu e el fu e el p ar tid o qu e gan las eleccion es d e , r esu lta
ad ecu ado u tilizar lo com o refer en cia par a las com par acion es bin ar ias
, p er o
si se deseara fijar otr a categor a de referen cia, h abr a qu e h acer lo u tilizan d o
la op cin base
d e la in stru ccin m logit. or ejem plo, escr ibien d o b ase

,
la categora d e r efer en cia sera el E en vez d el
.
om o en los m od elos bin ario y ord in al, la in terp retacin d e los coeficien tes del logit m u ltin om ial n o es in m ediata, sin o qu e h ay qu e r ecu r rir a
la tran sfor m acin d e estos coeficien tes en cocien tes de razon es o en pr ob abilid ad es. E n el caso d el logit m u ltin om ial, la in ter pr etacin se com p lica
a n m s al ten er n o u n n ico m od elo, sin o tan tos com o categoras ten ga la
variab le d epen dien te m en os u n o
o sea, cu atro en este caso
. a in ter pr etacin de los r esu ltad os r equ ier e el an lisis sim u ltn eo d e la in for m acin
con ten id a en todos los b loqu es de coeficien tes.

a in stru ccin listcoef del con ju n to de u tilidades Spost


de on g y reese
p erm ite u n a p rim er a ap roxim acin a la in terp retacin de los resu ltados del

En el m om ento de escribir estas pginas, tanto la instruccin listcoef com o m logplot del m dulo SPost no funcionaban en la versin de tata con los m odelos m ultinom iales de la versin .
ara poderlas ejecutar sin problem as hay que anteceder la orden m logit de la instruccin version 1.
egn los autores, se espera solucionar en una prxim a revisin de estos program as ado.

E E

m od elo m u ltin om ial, b asad a en los cocien tes de r azon es. or defecto, esta
ord en , ejecu tad a tras u n m odelo m u ltin om ial, m u estra el efecto d e cada var iable in depen dien te sob re todas las com b in acion es p osibles de categor as
d e la variab le d ep en d ien te, lo qu e qu iere decir qu e en este caso la salida de
listcoef abarcara varias pgin as.
ILUSTR I
1 2.1.R e gr e si n
m u lt in o m ia l
d e l
vo t o
so b r e
e st u d io s

in gr e so s

ed ad
y
g n e r o
I
I
I
I
I

t
t
t
t
t

er at
er at
er at
er at
er at

i
i
i
i
i

on
on
on
on
on

0:
1:
2:
3:
4:

Mul t i nomi al

l
l
l
l
l

og
og
og
og
og

l
l
l
l
l

i
i
i
i
i

k el
k el
k el
k el
k el

i
i
i
i
i

hood
hood
hood
hood
hood

=
=
=
=
=

l ogi s t i c r egr es s i on

Log l i k el i hood = - 3348. 5891

- 3443.
- 3355.
- 3348.
- 3348.
- 3348.

9749
8843
7016
5892
5891
Number of obs
LR chi 2( 24)
Pr ob > c hi 2
Ps eudo R2

=
=
=
=

2745
190. 77
0. 0000
0. 0277

-----------------------------------------------------------------------------vot o |
Coef .
St d. Er r .
z
P>| z |
[ 95% Conf . I nt er val ]
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - PSOE
|
est u2 |
- . 2761143
. 1216149
- 2. 27
0. 023
- . 5144752
- . 0377533
est u3 |
- . 3350645
. 1536301
- 2. 18
0. 029
- . 636174
- . 033955
edad |
- . 0118825
. 0028957
- 4. 10
0. 000
- . 017558
- . 006207
i ngr 2 |
- . 4300943
. 1033985
- 4. 16
0. 000
- . 6327517
- . 2274369
i ngr 3 |
- . 5357216
. 1666942
- 3. 21
0. 001
- . 8624362
- . 209007
muj er |
. 0468428
. 0892647
0. 52
0. 600
- . 1281129
. 2217985
_cons |
. 4292741
. 1875246
2. 29
0. 022
. 0617328
. 7968155
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - IU
|
est u2 |
. 2634419
. 2116822
1. 24
0. 213
- . 1514476
. 6783315
est u3 |
. 7091275
. 2312174
3. 07
0. 002
. 2559497
1. 162305
edad |
- . 0238329
. 0054325
- 4. 39
0. 000
- . 0344804
- . 0131854
i ngr 2 |
- . 0798113
. 1839424
- 0. 43
0. 664
- . 4403317
. 2807091
i ngr 3 |
- . 4557999
. 271775
- 1. 68
0. 094
- . 9884691
. 0768694
muj er |
- . 4344044
. 1619694
- 2. 68
0. 007
- . 7518586
- . 1169502
_cons |
- . 851463
. 3311246
- 2. 57
0. 010
- 1. 500455
- . 2024708
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - NAC
|
est u2 |
. 1777215
. 1857499
0. 96
0. 339
- . 1863416
. 5417845
est u3 |
. 248793
. 2168983
1. 15
0. 251
- . 1763199
. 6739059
edad |
- . 0052523
. 0046174
- 1. 14
0. 255
- . 0143022
. 0037976
i ngr 2 |
. 2194708
. 1670888
1. 31
0. 189
- . 1080172
. 5469587
i ngr 3 |
. 2243626
. 2354624
0. 95
0. 341
- . 2371352
. 6858604
muj er |
- . 2053962
. 1407716
- 1. 46
0. 145
- . 4813035
. 070511
_cons |
- 1. 58083
. 3045848
- 5. 19
0. 000
- 2. 177805
- . 9838552
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - OTR
|
est u2 |
. 0814243
. 2598894
0. 31
0. 754
- . 4279495
. 590798
est u3 |
. 8242985
. 2652403
3. 11
0. 002
. 304437
1. 34416
edad |
- . 0374769
. 0067912
- 5. 52
0. 000
- . 0507873
- . 0241665
i ngr 2 |
- . 2583509
. 2267261
- 1. 14
0. 255
- . 7027259
. 186024
i ngr 3 |
. 1483741
. 2768184
0. 54
0. 592
- . 39418
. 6909281
muj er |
- . 2173894
. 1883927
- 1. 15
0. 249
- . 5866323
. 1518535
_cons |
- . 7795759
. 3901126
- 2. 00
0. 046
- 1. 544183
- . 0149693
-----------------------------------------------------------------------------( vot o==PP i s t he base out come)

E s con ven ien te, por tan to, delim itar la p rod u ccin d e coeficien tes a tr avs de las op cion es pvalu e

, qu e h ace qu e slo se m u estren los coeficien tes


qu e son estad sticam en te sign ificativos al n ivel m arcado en el parn tesis, y

gt, qu e h ace qu e slo se m u estr en las com p aracion es en u n a d ireccin


si
n o, se m u estra la m ism a com paracin d os veces, por ejem plo E fren te
a y fr en te a E
.
listcoef, p va lu e
.gt

u n con estas opcion es, la tab la


m ostr ad a en la ilu stracin .sigu e
sien d o b astan te exten sa, pero es m u ch o m s m an ejable p or h ab er elim in ad o in form acin r ed u n dan te o in n ecesar ia. E l resu ltado de listcoef para el
m od elo logstico m u ltin om ial es sem ejan te a la d el m odelo bin ar io, con la
d ifer en cia d e qu e los coeficien tes se r efieren a las com par acion es en tr e las
categor as m ostr adas en el lado izqu ierd o d e la tabla, y los coeficien tes asociad os a cada var iable depen dien te se m u estr an en b loqu es. or ejem p lo, la
tab la m u estra qu e la prob abilid ad de voto al E fr en te al dism in u ye
con for m e au m en tan los estu dios, p u esto qu e el cocien te de razon es par a las
variab les in d ep en d ien tes d icotm icas estu 2
estu dios m ediosy estu 3
estu d ios su p er iorestien en u n valor sign ificativo in ferior a . a pr obabilid ad d e
voto a
fren te al voto al o al E au m en ta con el n ivel de estu d ios,
as com o la pr ob abilid ad d el voto n acion alista o d el voto a otras op cion es
p olticas.

E E

ILUSTR I
1 2.11 .List a
de
co e
icie n t e s
sign i
ica t ivo s
d e
una
r e gr e si n
m u lt in o m ia l
Var i abl e: es t u2 ( s d=. 44680195)
Odds compar i ng
|
Al t er nat i v e 1
|
t o Al t er nat i ve 2 |
b
z
P>| z |
e^ b
e^ bSt dX
- - - - - - - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - PSOE
- PP
|
- 0. 27611
- 2. 270
0. 023
0. 7587
0. 8839
IU
- PSOE
|
0. 53956
2. 460
0. 014
1. 7152
1. 2726
NAC
- PSOE
|
0. 45384
2. 321
0. 020
1. 5743
1. 2248
---------------------------------------------------------------Var i abl e: es t u3 ( s d=. 37290877)
Odds compar i ng
|
Al t er nat i v e 1
|
t o Al t er nat i ve 2 |
b
z
P>| z |
e^ b
e^ bSt dX
- - - - - - - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - PSOE
- PP
|
- 0. 33506
- 2. 181
0. 029
0. 7153
0. 8825
IU
- PSOE
|
1. 04419
4. 260
0. 000
2. 8411
1. 4761
IU
- PP
|
0. 70913
3. 067
0. 002
2. 0322
1. 3027
NAC
- PSOE
|
0. 58386
2. 504
0. 012
1. 7929
1. 2432
OTR
- PSOE
|
1. 15936
4. 187
0. 000
3. 1879
1. 5409
OTR
- PP
|
0. 82430
3. 108
0. 002
2. 2803
1. 3599
---------------------------------------------------------------Var i abl e: edad ( s d=17. 951914)
Odds compar i ng
|
Al t er nat i v e 1
|
t o Al t er nat i ve 2 |
b
z
P>| z |
e^ b
e^ bSt dX
- - - - - - - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - PSOE
- PP
|
- 0. 01188
- 4. 103
0. 000
0. 9882
0. 8079
IU
- PSOE
|
- 0. 01195
- 2. 133
0. 033
0. 9881
0. 8069
IU
- PP
|
- 0. 02383
- 4. 387
0. 000
0. 9764
0. 6519
NAC
-IU
|
0. 01858
2. 798
0. 005
1. 0188
1. 3959
OTR
- PSOE
|
- 0. 02559
- 3. 696
0. 000
0. 9747
0. 6316
OTR
- NAC
|
- 0. 03222
- 4. 138
0. 000
0. 9683
0. 5607
OTR
- PP
|
- 0. 03748
- 5. 518
0. 000
0. 9632
0. 5103
---------------------------------------------------------------Var i abl e: i ngr 2 ( s d=. 48991269)
Odds compar i ng
|
Al t er nat i v e 1
|
t o Al t er nat i ve 2 |
b
z
P>| z |
e^ b
e^ bSt dX
- - - - - - - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - PSOE
- PP
|
- 0. 43009
- 4. 160
0. 000
0. 6504
0. 8100
NAC
- PSOE
|
0. 64957
3. 734
0. 000
1. 9147
1. 3747
---------------------------------------------------------------Var i abl e: i ngr 3 ( s d=. 3388137)
Odds compar i ng
|
Al t er nat i v e 1
|
t o Al t er nat i ve 2 |
b
z
P>| z |
e^ b
e^ bSt dX
- - - - - - - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - PSOE
- PP
|
- 0. 53572
- 3. 214
0. 001
0. 5852
0. 8340
NAC
- PSOE
|
0. 76008
2. 996
0. 003
2. 1385
1. 2937
NAC
-IU
|
0. 68016
2. 052
0. 040
1. 9742
1. 2592
OTR
- PSOE
|
0. 68410
2. 350
0. 019
1. 9820
1. 2608
---------------------------------------------------------------Var i abl e: muj er ( s d=. 50005045)
Odds compar i ng
|
Al t er nat i v e 1
|
t o Al t er nat i ve 2 |
b
z
P>| z |
e^ b
e^ bSt dX
- - - - - - - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - IU
- PSOE
|
- 0. 48125
- 2. 872
0. 004
0. 6180
0. 7861
IU
- PP
|
- 0. 43440
- 2. 682
0. 007
0. 6477
0. 8047
----------------------------------------------------------------

ese a que la orden listcoef hace la in tepretacin del logit m ultinom ial m ucho m s sencilla que la instru ccin m logit de tata, sigue siendo bastante com plicada por la cantidad tan enorm e de coeficien tes y valores que hay que tener
en cuenta de m anera sim ultnea. En el m ism o conjunto de u tilidades Spost, hay
un program a especfico que perm ite una interpretacin visual m u cho m s sencilla de los resu ltados del logit m ultin om ial. Este program a es m logplot . ras la
estim acin del m odelo m ultinom ial anterior, si se introdu ce la sigu iente lnea
m logplot estu estu eda d in grin grm u jer, std
sp
.

se con sigu e qu e se r ep resen ten sim u ltn eam en te todas las variab les in dep en d ien tes d el m odelo
estu 2, estu 3, edad, in gr2, in gr3 y m u
er
. a op cin
std
especifica qu cam bio en las variab les in d ep en d ien tes qu iere m ostr arse en el gr ficopara var iables dicotm icas se esp ecifica el valor , y p ar a
edad , qu e es con tin u a, se m ar ca con la opcin s, qu e r epr esen ta el cam bio
en el cocien te d e razon es asociad o a u n au m en to d e u n a d esviacin tp ica

h ay qu e especificar u n valor p ara cada var iable in d ep en d ien te en la opcin


std
. a opcin p p erm ite qu e se m u estre si la d ifer en cia en tre coeficien tes
es sign ificativa
con ln eas, com o pu ede apr eciar se en el gr fico .
.
R I
1 2.2.r
ico
de
d ist a n c ia s
en tre
co cie n t e s
d e
r a n
de
la
r e gr e si n
m u lt in o m ia l
Factor Change Scale Relative to Category PP
.48
.63
.83
1.08

et

0
1

et3

StCoef

ingr
ingr3
0
1

er
0
1

P
P

0
1

.43

1.86

0
1

ea

1.4

.73
.46
.19
.08
Logit Coefficient Scale Relative to Category PP

.3

.6

.89

a in stru ccin m logview perm ite generar el m ism o tipo de grficos qu e m logplot pero de
m an era interactiva, a travs de un cu adro de dilogo.

E E

E n el grfico .se m u estr an de m an er a visu al los cocien tes de r azon es asociados a cad a u n a d e las categoras d e la var iable d epen dien te
en
el eje h or izon tal
, p ara cad a valor d e las var iables in depen dien tes
en el eje
ver tical
. ad a categora se r ep resen ta a tr avs d e la pr im era letr a d e su
etiqu eta, con la categor a d e r efer en cia
el en este casoocu pan do siem p re el valor d e
pu esto qu e es el p u n to d e refer en cia para los cocien tes de
r azon es de todas las d em s categorasd e ah se d ed u ce qu e la otra qu e
n o est en el cen tro siem p re cor respon d e al E
. a distan cia en tr e categoras, por tan to, r efleja el im p acto de cad a var iable in d ep en d ien te sobr e la
p robab ilidad de voto a cad a partido p oltico. or ejem p lo, el gr fico m u estra
clar am en te cm o la razn de voto al E fr en te al r esto de las categor as
d ism in u ye en fu n cin de los estu dios. E l voto a
y otr os p ar tidos es m u ch o m s p rob ab le p ar a los qu e tien en estu d ios su perior es qu e par a los qu e
tien en estu dios elem en tales
las letr as y estn m u y a la d er ech a
. as
ln eas qu e con ectan d os partidos in d ican qu e la diferen cia en tr e ellos n o es
sign ificativa a u n de n ivel de ,
el especificado en la ord en
as, par a los
estu d ios su p erior es
segu n d o bloqu e
, la d iferen cia en tre el cocien te de razon es de voto al E y todos los d em s par tid os es sign ificativa, m ien tras
qu e la d iferen cia en tr e el voto a
y a los partidos n acion alistas o a otr os
n o es sign ificativa
p u esto qu e estn u n id os por u n a ln ea
.
a m ayor p ar te de las otr as tcn icas par a ayu d ar a la in ter pr etacin d e
los r esu ltad os d el m odelo logstico bin ario
com o el u so de pr obabilid ades,
visto en el apar tado .d el captu lo an ter iortam b in se p u ed en ap licar al
m od elo m u ltin om ial.

12 ..
E l
su p u e st o
de
in d e p e n d e n cia
de
a lt e r n a t iva s

ir r e le va n t e s
E n el m odelo d e regresin logstica m u ltin om ial, las razon es de ocu r ren cia
(odds) de cad a p ar de valor es d e la var iable d ep en d ien te n o deb en ser afectad as por el r esto de las alter n ativas posib les
a adir o elim in ar altern ativas
n o deb e m od ificar los coeficien tes
. e trata d el su p u esto d e in dep en d en cia
d e alter n ativas ir relevan tes, qu e r equ ier e qu e cad a u n a de las p osibles alter n ativas est n etam en te diferen ciad a y sea valor ada d e m an er a in d ep en d ien te p or el qu e tom a la decisin . i n o se cu m ple este su pu esto, el m od elo
m u ltin om ial n o r esu lta adecu ad o, pu es pu ede d ar lu gar a coeficien tes in cor rectos .

E s h abitu al en in vestigacin em prica la u tilizacin del m odelo probit m u ltin om ial


cu an do se vuln era el su pu esto de in dependen cia de alternativas irrelevan tes
en tata, el m odelo probit m u ltin om ial se puede calcu lar con la orden m probit, pero, cu an do se in cum ple la
condicin m en cion ada, es preferible em plear asm probit
. uesto que el m odelo probit asu m e
qu e los errores son norm ales, los errores de distin tas altern ativas pueden estar correlacionados, y por tan to se su pon e qu e el m odelo probit n o se ve afectado por la vuln eracin de este

E s u n su p u esto a lta m en te r estr ictivo, qu e es d ifcil qu e se cu m p la en


m u ch os p r ocesos d e d ecisin en el m u n d o r ea l. or ejem p lo, p u ed e a firm a r se qu e la op cin en tr e d os p a r tid os en el voto n o d ep en d e d el r esto
d e los p a r tid os existen tesa en tr a d a d e u n n u evo p a r tid o d e cen tr oizqu ier d a en escen a , p or ejem p lo, p od r a a fecta r a la s p r ob a b ilid a d es d e
voto d el E fr en te a l
. o ob sta n te, se h a d em ostr a d o qu e en la
m a yor p a r te d e los ca sos, el m od elo logit m u ltin om ia l es a d ecu a d o p a r a
el a n lisis d e p r efer en cia s d e voto, p u esto qu e en la p r ctica el n m er o
d e p a r tid os p olticos tien d e a ser r ela tiva m en te esta b le, y p or ta n to n o se
vu ln er a el su p u esto
o y E n d er sb y
. a r a tr a ta r d e en ten d er
la s p a u ta s d e voto
a p oster ior ip a r a u n a ser ie d e va r ia b les in d ep en d ien tes, com o en el ejem p lo a ctu a l, el m od elo logstico m u ltin om ia l p u ed e ser
p er fecta m en te a d ecu a d o.
a in stru ccin m logtest, in clu ida en el paqu ete Spost d e on g y reese,
p er m ite la realizacin de u n par de test estad sticos para evalu ar si los datos
vu ln er an el su pu esto de in depen den cia d e altern ativas irr elevan tes
los test
d e au sm an y el d e m all-siao, p ar a m s d etalles van se on g y reese
p . y sigu ien tes
. E n esen cia, estos test lo qu e h acen es elim in ar alter n ativas u n a a u n a, y com pr obar si los coeficien tes r estan tes var an de m an er a sign ificativa. n resu ltado sign ificativo, por tan to, obligar a a rech azar
la h iptesis n u la de qu e los d atos satisfacen la r estr iccin d e in d ep en d en cia
d e altern ativas ir relevan tes, y p or tan to d eb er a u tilizarse otr o m odelo p ar a
r ealizar el an lisis
por ejem plo, volver a u n m odelo m s sim ple d e tip o
b in ario
.
ar a realizar estas p ru ebas estadsticas , se u tiliza las ord en m logtest segu id a d e las op cion es au sm an y sm siao.
m logtest, h au sm an sm h siao

su pu esto. ero, com o explican on g y reese


, p.
, esto es in correcto, pu esto qu e el
m odelo probit m ultinom ial tam bin asu m e la in dependen cia de altern ativas irrelevan tes, y los
resu ltados son en la m ayor parte de los casos idn ticos a los de la in stru ccin m logit.

am bin de m odo algo m s com plejo puede efectu arse la com probacin del su pu esto
de in dependen cia de altern ativas irrelevan tes con la in stru ccin au sm an de tata. ara u n a
explicacin de su u so en los m odelos m u ltin om iales, vase tata -.

E E

ILUSTR I
12 .1 2.R e su lt a d o s
de
la s
p r u e b a s
d e
a u sm a n
y
Sm a ll
sia o
* * * * Hausman t est s of I I A as s umpt i on ( N=2745)
Ho: Odds( Out c ome- J v s Out c ome- K) ar e i ndependent of ot her al t er nat i v es.
Omi t t ed |
c hi 2
df
P>c hi 2
ev i dence
- - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - PSOE |
0. 262
21
1. 000
f or Ho
IU |
- 0. 509
19
----NAC |
5. 579
21
1. 000
f or Ho
OTR |
- 0. 059
21
-------------------------------------------------Not e: I f c hi 2<0, t he es t i mat ed model does not
meet as ympt ot i c as sumpt i ons of t he t es t .
* * * * Smal l - Hsi ao t est s of I I A as sumpt i on ( N=2745)
Ho: Odds( Out c ome- J v s Out c ome- K) ar e i ndependent of ot her al t er nat i v es.
Omi t t ed |
l nL( f ul l ) l nL( omi t )
chi 2
df
P>chi 2
ev i dence
- - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - PSOE |
- 842. 489
- 832. 172 20. 634
21
0. 481
f or Ho
IU |
- 1362. 391 - 1347. 485 29. 811
21
0. 096
f or Ho
NAC |
- 1304. 436 - 1293. 449 21. 975
21
0. 401
f or Ho
OTR |
- 1489. 086 - 1477. 799 22. 575
21
0. 367
f or Ho
-------------------------------------------------------------------

m bas p ru ebas con firm an qu e el m odelo con stru id o n o tran sgred e el


su pu esto d e in depen den cia d e alter n ativas irr elevan tes
las d ifer en cias en tre
el m odelo com pleto y los m od elos a los qu e se h a elim in ado u n a altern ativa
n o son sign ificativas
.
u n qu e las p ru ebas d e la ord en m logtest p u ed en ayu d ar al in vestigad or
a evalu ar si el m odelo estim ado cu m ple el su pu esto d e in depen den cia d e alter n ativas irr elevan tes, en ocasion es pu eden d ar r esu ltados con tr adictor ios,
p or lo qu e pu ede ser difcil llegar a u n a con clu sin clara. E l criterio ltim o,
p or tan to, es la evalu acin r azon ada qu e realice el prop io in vestigador de
h asta qu p u n to las d istin tas op cion es d e la var iable d ep en d ien te realm en te
estn n etam en te diferen ciadas y su s altern ativas son valor adas d e m an era
in d ep en d ien te.

12 ..E
e r cicio s
. san d o el barm etro d e abril de
situ acin de crisis econ m ica
,
seleccion a com o variab le depen d ien te la prim era p regu n ta
valoracin
d e la situ acin econ m ica gen eral
. ran sfrm ala p ara qu e p u ed a ser
con sid erada ord in al y la categora m s positiva ten ga m ayor pu n tu acin .
eleccion a, fin alm en te, com o in depen dien tes al m en os el estatu s
con las
cin co categoras qu e el
con sidera
, la in ten cin d e voto
d os ficticias,
al m en os con los d os partidos p rin cip alesy otra variab le qu e con sid eres
relevan te. p lica u n m odelo logit ord in al y com en ta los resu ltados.

. az el ejer cicio de la pgin a , pero en lu gar de con siderar d os var iables bin ar ias com o d ep en d ien tes, em plea el voto com o m u ltin om ial
con valoresE , , n acion alistas,
y otr os.

13
E l
a n lisis
d e
la
h ist o r ia
de
a co n t e cim ie n t o s
co n
St a t a
E n los ltim os 20 a os el an lisis d e h istoria de acon tecim ien to (even t h istory an alysis en in gls) se h a aplicado d e form a crecien te en los estu d ios
de sociologa y d e cien cia p oltica 1. E n trm in os gen eralesel an lisis d e la
h istoria d e acon tecim ien tos (d e ah ora en ad elan te ) perm ite in estigar
los factores u e in flu yen en u e su ceda u n acon tecim ien to dado. n acon te
cim ien to p u ed e defin irse com o u n cam io de tip o cu alitatio de la u n id ad d e
an lisisd esde el estad o j al estad o ku e ocu rre en u n m om en to con creto
del tiem po. E l e
em p lo u e se desarrolla en este cap tu lo se refiere a la tran
sicin desde la con d icin de parad o (estado j) a la de ocu p ad o (estad o k).
eido a u e los lm ites d e esp acio oligan a ser m u y selecti
osel o

etio d e este captu lo es p rop orcion ar u n a in tr odu ccin sim ple a los fu n
d am en tos del y m ostr ar algu n as aplicacion es u tili
an do el pr ogr am a
tata. E n gen er al h an pr im ad o los aspectos ap licad os sore los d etalles
form ales y estadsticos. E n la p rim a seccin se pr oporcion a u n sin ttico
com p en d io sor e u es el y cm o fu n cion a. E n la segu n d a seccin se
p resen tan las in str u ccion es sicas de tata p ar a el y en la ter cer a las
tcn icas n o param tr icas d e an lisis d escr iptio. in alm en teen la cu arta
seccin se descrien los m odelos m u ltiar iados m s sim p les de la tasa de
tran sicin con tiem po con tin u o.

1 3.1.Qu
e s
y
c m o
fu n cio n a
e l
AH A
E l perm ite in estigar los cam ios d e tip o cu alitatio de la u n id ad d e
an lisis u e ocu r ren en u n m om en to con creto del tiem p o y en tre u n con
1
an to los tem as u e se tratan en este captu lo com o los aspectos m s sofisticados del
u e au n o se discu ten son desarrollados de form a eh au stia en un a m onografa pu licada en
la oleccin u adern os etodolgicos del
(ern ardi 200). E l presen te captu lo se asa en
dich a m on ografaa la u e se rem iten los lectores in teresados para profu n diar en el estu dio del
. ara otros artcu los y m anu ales de in trodu ccin al ase llison (1)am agu ch i
(11)tran g (1)etersen (1)erm u n t (1) y lossfeld y oh er (2001).

E E

u n to lim itad o y eh au stio d e estad os. E l con


u n to de estados en tre los
cu ales su ceden los cam ios se den om in a espacio de los estados (lossfeld y
oh er 2001). sim ism oes im por tan te en fati
ar u e con las tcn icas de
el in ter s r eside en an aliar n o slo el tipo d e cam iosin o tam in
cu n do ocu rr e. a p rop ia n ocin d e acon tecim ien to su pon e la eisten cia
d e u n in teralo d e tiem p o an ter ior al cam iodesd e j h asta k. E l in teralo
d e tiem po u e la u n id ad de an lisis pasa en estad o in icial (j)an tes de u e
su ceda el acon tecim ien to (esto escu an do ocu r re el cam io al estad o k)se
d efin e com o episodio o du racin . E n gen er alu n episod io est defin ido por
cu atr o tipos de in for m acin la fech a d e in iciola fech a de fin el estad o d e
or igen y el estado de destin o. E l estad o d e or igen j se refier e al estado u e
caracteria la u n idad d e an lisis an tes de u e se cu m p la el acon tecim ien
tom ien tr as u e el estad o de destin o se r efiere a la con dicin d esp u s del
acon tecim ien to.
E l tipo d e proceso m s sim p le u e se pu ede an ali
ar es u n pr oceso con
u n n ico episodio y dos estados. on sider am os com o e
em p lo la tr an sicin
d esd e la con dicin de solter o a la con d icin de casado por pr im er a e(as
tro 1). om o el pr im er m atr im on io es u n acon tecim ien to irr ep etileh ay
u n n ico episodio par a cada u n idad d e an lisis. d em sel cam io p u ed e
su ceder slo en tre d os estadosel de soltero y el d e casado. u an d o los esta
d os son m s d e d osse h ala de pr ocesos m u lti-estado o con riesgos com p e
titios (com petin g risk). or e
em plola salida del desem pleo pu ede ocu rr ir
tan to con u n a tr an sicin a la ocu pacin com o a la in actiid ad. in alm en te
cu an do el acon tecim ien to se pu ede repetir m s de u n a epara la m ism a
u n id ad de an lisisel p roceso se defin e com o m u lti-episdico. on sideran d o
d e n u eo el e
em p lo d e la salida del desem pleocada in d iidu o p u ed e caer
en el d esem p leo m s de u n a ea lo lar go de su car rer a ocu p acion al ypor
lo tan top u ed e oser
ar se m s d e u n episod io de desem pleo para cada in
d iidu o.
tr a distin cin im p orta n te a ten er en cu en ta es la u e se d a en tre da tos
con d u ra cion es de tip o con tin u o y d iscr eto. E n el pr im er ca soel acon teci
m ien to pu ede su ced er en cu alu ier m om en to del tiem pola d u ra cin del
ep isodio es u n a a riale con tin u a y se m id e con u n n m er o r ea l p ositio u e
en p rin cip io p u ed e ser fra ccion a r io. E n el segu n do ca soel a con tecim ien to
su ced e slo en in ter
a los d iscretos de tiem po y la du r a cin del episodio se
m id e con n m eros en teros y positios (12etc.). pica m en telos da tos
de tip o discr eto se en cu en tra n en dos situ a cion es. E n p rim er lu ga rcu a n do
a u n u e el a con tecim ien to p u ed a en p rin cipio su ced er en cu alu ier m om en
to d el tiem p ola s in form a cion es d ispon iles n o son lo a sta n te p recisa s
com o pa ra con sid er a r la s d u ra cion es con tin u a s. ich o de otr a m a n er a los
da tos d e tipo discr eto en este caso lo son p or u n a fa lta de pr ecisin en la
in for m a cin d ispon ile. E n segu n d o lu ga rcu a n d o los a con tecim ien tos son
in tr n seca m en te d iscretoses d ecirslo su ceden en m om en tos con cr etos y
pr ecisos en el tiem po. a d istin cin en tr e du r acin con tin u a y d iscreta es

im porta n te p oru e en los dos ca sos se p recisa la a p lica cin d e tcn ica s d e
a n lisis distin ta s. E ste ca ptu lo se cen tr a slo en los da tos con d u ra cion es
d e tipo con tin u o u e son los m s h a itu ales en las a p lica cion es d e socio
loga y cien cia s poltica s 2 . E n el cu a dr o 1.1 se r ecogen d e form a sin ttica
la s defin icion es de los con ceptos m s im porta n tes p resen ta dos h a sta au .
on r esp ecto a la s tcn ica s tr a d icion a les d e a n lisis d e tip o tr a ser sa l
el p er m ite tr a ta r d e for m a a d ecu a d a la s d u r a cion es cen su r a d a s y es
p ecifica r a r ia les in d ep en d ien tes u e se m od ifica n en el tiem p o . E l p r o
lem a d e la s d u r a cion es cen su r a d a s tien e u e er con el h ech o d e u e en
la m a yor a d e la s in estiga cion es la s in for m a cion es sor e la s d u r a cion es
d e los ep isod ios est n in com p leta s. E l ca so m s tp ico es el d e la cen su ra
a la derech a u e ocu r r e cu a n d o se con oce la fech a d e in icio d el ep isod io
p er o cu a n d o a ca a el p er iod o d e oser a cin el a con tecim ien to d e in ter s
tod a a n o h a su ced id o. or e
em p lose sa e u e u n in d iid u o h a em p e
a d o a esta r d esem p lea d o en m a yo d e 200y u e sigu e esta n d o d esem
p lea d o en en er o d e 200m om en to en el u e se a p lica la en cu esta . E l ep i
sod io d e d esem p leo en este ca so n o h a ter m in a d o con u n a con tecim ien to
y la d u r a cin cor r esp on d ien te (m eses) se con sid er a com o cen su r a d a a
la d er ech a . in en tr a r en m s d eta llescon el es p osile tr a ta r la s
d u r a cion es cen su r a d a s a la d er ech a sin sesgos en la s estim a cion es.

2
dem ssi los in ter
alos discretos del tiem po en el cual se oser
an los acon tecim ien
tos son peu e oslos m odelos estadsticos con tiem po discreto son u n a aproim acin a los
de tiem po contin uo yen la prcticalos resultados son eu ialen tes. ara un a discu sin m s
profu n diada del para datos con duracin discreta
ase ern ardi (200).

ay un a tercera ran de tipo estadstico para em plear el u e n o se ilu stra au .


e trata de la form a de las distriu cion es estadsticas de las du racion es u e su ele iolar los
su pu estos en la ase de los m odelos de regresin lin eal de m n im os cu adrados (ernardi 200).

ara u na discu sin detallada de todos los tipos de censu ra y los prolem as a ellas aso
ciados
ase lossfeld y oh er (2001).

E E

CUAD
13 .1.o s
c o n ce t o s
sico s
d e l
AH A
Aco n t e cim ie n t o

Ca m io
de
la
u n id a d
de
a n lisis
d e l
e st a d o
j
a l
e st a d o
k

E pisodio
roceso con un solo
episodio y dos estados

u racin antes de u e su ceda el acon tecim ien to


roceso con un solo episodio para cada u n idad de an lisis y
dos estados entre los u e su cede el cam io (e
em ploprim er
m atrim on ioestados de soltero y casado)

roceso m ulti
estado

roceso con m s de dos estados (e


em plodesem pleo
estados de desem pleadoem pleado e inacti
o)

roceso m ulti
episdico

roceso en ue el acon tecim ien to se pu ede repetir m s de


un a
epara cada u n idad de anlisis (e
em plodesem pleo)

iem po contin uo

E l acon tecim ien to puede su ceder en cu alu ier m om ento del


tiem po

iem po discreto

E l acon tecim ien to sucede slo en m om en tos con cretos del


tiem po o las in form acion es dispon iles no son los
su ficien tem en te precisas com o para con siderar las du racio
nes con tin u as

a otra car acter stica fu n dam en tal del es u ead em s d e an ali


ar especficam en te la din m ica del acon tecim ien to in
estigad oper m ite
con siderar ariales in dep en d ien tes u e se m odifican en el tiem po. e esta
m an erael con sien te in estigar cm o u n cam io en la
ar iale X en
el tiem po t in flu ye sor e la pr open sin a u e su ced a el acon tecim ien to in
estigadoes deciru n cam io en la
ar iale Yen u n m om en to sigu ien te d el
tiem po t. or m alm en te

(1.1)
a s a r ia les X u e se m o d ifica n en el tiem p o p u ed en r efer ir se ta n to
a ca r a cter stica s in d iid u a les d e la s u n id a d es d e a n lisis co m o a fa cto r es
co n tetu a les u e o p er a n a n iel m a cr o . o r e
em p lo a l estu d ia r la d u r a
ci n d e lo s ep isod io s d e d esem p leop u ed e in estiga r se cm o in flu yen en
la tr a n sici n d el d esem p leo a l em p leo ta n to fa ctor es m a cr o (p o r e
em p lo
la s a r ia cion es m en su a les en la in fla ci n o el n m er o d e p u esto s d e tr a
a
o cr ea d os) com o fa cto r es u e a ta en a la s ca r a cter stica s in d iid u a les
d e los en tr eista d o s (p o r e
em p lo los ca m ios en su situ a ci n fa m ilia r o
el fin d e la p er cep ci n d el su sid io d e d esem p leo). r ecisa m en te gr a cia s
a la p o siilid a d u e o fr ecen d e ea lu a r el efecto d el ca m io d e u n a a r ia
le in d ep en d ien te sor e la p r oa ilid a d d e u e su ced a u n ca m io en la
a r ia le d ep en d ien tea lgu n o s a u to r es a fir m a n u e la s tcn ica s d el

r ep r esen ta n u n a n u ea a p r oim a cin a la in estiga ci n em p r ica d e la s


r ela cio n es ca u sa les (lossfeld y oh er 2001) .
E l con cepto clae d el es el d e la tasa d e tran sicin . or m alm en te

(1.2)
d on d e es la d u r a cin a n tes d e u e su ced a el a con tecim ien to. E n
otr os tr m in oses el tiem p o u e la u n id a d d e a n lisis p a sa en el esta d o
d e or igen j h a sta el m om en to d e la tr a n sicin a l esta d o d e d estin o k. a
ta sa d e tr a n sicin r(t)jk ep r esa p or lo ta n tola p r oa ilid a d in sta n t n ea
d e u e el a con tecim ien to ocu r r a en el in ter
a lo d e tiem p o in fin itesim a l
t-tcon la con d icin d e u e el een to n o h a ya ocu r r id o a n tes d e t. a
ta sa d e tr a n sicin se in ter p r eta com o la p r op en sin a ca m ia r d esd e el
esta d o d e or igen j a l esta d o d e d estin o k en el m om en to t. a con d icin
t sign ifica u e esta p r op en sin a l ca m io es d efin id a con r esp ecto
a l con
u n to d e u n id a d es d e a n lisis tod a a en r iesgo d e ep er im en ta r
el a con tecim ien to en el tiem p o tes d ecirel con
u n to d e u n id a d es d e
a n lisis cu ya d u r a cin es m a yor o igu a l a t. or m a lm en tela ta sa d e tr a n
sicin n o p u ed e ser in ter p r eta d a com o u n a p r oa ilid a d p or u e p u ed e
a su m ir a lor es m a yor es u e 1. in em a r gosi el in ter
a lo d e tiem p o t-t
es p eu e oen ton ces

(1.)
a tasa de tr an sicin se ap roim aen este casoa la pr oailid ad con di
cion al de u e el acon tecim ien to ocu r ra en in ter alo t-t (lossfeld y oh er
2001). E s im por tan te resaltar u e la tasa de tr an sicin d efin id a en la fr
m u la (1.2) con tien e d os tip os de in for m acion esla calid ad del cam io des
d e j a k y la d u r acin an tes de u e el cam io ocu rr a. a tasa de tran sicin
est adem s relacion ada con otr os d os im por tan tes con cep tos estadsticos
la fu n cin d e su p er ien cia y la fu n cin de den sid ad .
a fu n cin de la d istr iu cin (t) d escr ie la p roailid ad de u e la
d u racin de u n episodio sea m en or o igu al a t. ich o con otr as palaras
la pr oailid ad de u e u n acon tecim ien to ocu r ra en el in teralo de 0 a t.
orm alm en te

lu strar el fun cion am iento de la tcn ica de particin del episodio (episode splitting) u e
perm ite defin ir las
ariales u e se m odifican en el tiem po reuerira m ucho m s espacio ue
el de u e se dispon e. ara diferen tes e
em plos de defin icin de ariales u e se m odifican en
el tiem po con tata
ase el captu lo en ernardi (200).

E E

(1.)
d em sse defin e la fu n cin d e su per
i
en cia (t) com o la fu n cin
com plem en taria de (t)

(1.)
a fu n cin de su perien cia (t) descrie la pr oailid ad de u e la du
r acin d e u n episod io sea com o m n im o igu al a t. ich o de otr o m odola
p roailidad d e u e la u n id ad de an lisis h aya soreiido en el estado j
h asta el tiem p o t. E n el e
em plo de la salid a del desem pleo(t) ep resara
la proailid ad de segu ir estan d o d esem p leado en el tiem p o t.
in alm en tela fu n cin de den sidad
(t) d escr ie la proailid ad in s
tan tn ea in con d icion al de u e u n acon tecim ien to ocu r ra en el in teralo de
tiem po in fin itesim al t-t

(1.)
E s im p ortan te d estacar la diferen cia en tr e la tasa de tr an sicin y la fu n
cin d e d en sidad. E n la fu n cin d e den sidad la pr oailid ad d e u e ocu rr a
el acon tecim ien to n o est con d icion ad a a la su per
i
en cia h asta el tiem po
tm ien tr as u e en la tasa d e tr an sicin la pr oailid ad se com pu ta slo
con r esp ecto a las u n idad es de an lisis u e se h an u edado en r iesgo de
eper im en tar el acon tecim ien to. E istead em su n a relacin en tre la tasa
d e tran sicin la fu n cin de den sid ad y la fu n cin d e su p er ien ciad e tal
m an era u e (lossfeld y oh er 2001)

(1.)
or ltim ola idea cen tr al del es con sider ar la tasa d e tr an sicin
r(t) com o la ar iale d epen dien te y d efin ir u n m odelo d e la tasa de tran si
cin de la sigu ien te m an er a
(1.)
on u n m odelo de la tasa d e tr an sicin se estu d ia cm o la pr open sin a
p asar d esde el estado j al estado kes decirla p rop en sin de u e ocu rr a el

acon tecim ien toar a en fu n cin d e u n con


u n to d e
ariales in d epen dien
tes X y d e u n a fu n cin (t) del tiem po. os coeficien tes epr esan la in
flu en cia de
ariales ep licati
as X sore la tasa de tr an sicin . olien do al
e
em plo de la salida d el d esem p leocon u n m od elo d e la tasa de tr an sicin
p odr a estu d iarse cm o la p rop en sin p ar a en con trar u n tr aa
o d ep en d e
d el gn er odel n i
el de ed u cacin del estado ci
il y de las con d icion es m a
cr o d el m er cad o d e traa
o (
ar iales X)as com o de la du r acin m ism a del
ep isodio de desem pleo (fu n cin (t)).
E n defin iti
ael m odelo d e la tasa de tr an sicin resu m e toda la lgica
d el . E n pr im er lu garel an lisis se cen tra en las din m icas del cam io
d e u n a con d icin a otr a a lo lar go del tiem p o. sel o
etio es eplicar la
p rop en sin a u e d ich o cam io ocu r ra. ar a ello se an alia cm o la pr o
p en sin al cam io depen de d e u n con
u n to d e ariales in depen dien tesen
p articu lar ar iales u e se m od ifican en el tiem p oy de la prop ia d u racin
d el pr oceso.

1 3..
E l
AH A
co n
St a t a

in st r u ccio n e s
a r a
d e fin ir

lo s
d a t o s
E n tata tod as las in str u ccion es p ara an aliar d atos d e h istor ias d e acon te
cim ien tos em p iean con el pr efi
o stu e es la ar eiatu r a de su rvival tim e.
ara pod er u tiliar las r den es u e em p iean p or st es n ecesario u e los
d atos h ayan sido d efin id os pr e
iam en te com o datos de h istoria de acon te
cim ien tos. a in stru ccin p ara defin ir los d atos com o h istor ia d e acon teci
m ien tos en tata es stset. ara ilu str ar cm o fu n cion a la in stru ccin stset
se lan a a con tin u acin u n e
em p lo con creto u e se r efiere a la d u racin
d e episod ios de desem pleo. E n este casoel acon tecim ien to in estigad o es
la tr an sicin d esd e el desem pleo h asta la ocu p acin . E l fich ero d e d atos
se llam a u n em ploym en t.dta. os episod ios d e los su
etos u e tod a
a estn
d esem p leados en el m om en to d e la en tr eista se con sideran cen su r ados a la
d erech a. E n la ilu stracin 1.1 se pr esen tan algu n os episod ios del fich er o de
d atos con sid er ado y la d escr ipcin de las ariales in depen dien tes .

ara u na descripcin m s detallada del fich ero de datos


ase ernardi (200).

E E

USAC

1 3.1 .a r ia le s
y
a lu n o s
e iso d io s
d e l
fich e r o
d e
d a t o s
r e la t io s
a
la s
d u r a cio n e s
de
lo s
e iso d io s
de
d e se m le o
(u n em p loym en t.d ta )
Var i abl e
Desc r i pc i n
------------------------------------------id
Nmer o de i dent i f i c aci n
or g
Es t ado de or i gen ( 0=des empl eado; t odos l os epi s odi os t i enen c omo
est ado de or i gen 0)
des t
Es t ado de des t i no ( 0=c ens ur ado a l a der ec ha, es dec i r des empl eado en
el moment o de l a ent r evi s t a, 1=empl eado, 2=i nact i v o)
begi n
Fecha de i ni c i o en mes es del s i gl o
end
Fecha de f i n en mes es del s i gl o
dat ei nt
Fecha de l a ent r ev i st a en mes es del s i gl o
s ex
Gner o ( 1=v ar n, 0=muj er )
dbi r t h
Fecha de nac i mi ent o en mes es del si gl o
c ohor t
Cohor t e de naci mi ent o ( 1=nac i ant es de 1940, 2=nac i ent r e
1940 y 1959, 3=nac i des pus de 1959)
c oh2
Cohor t e 1940- 1960 ( 1 s i c ohor t =2, O s i no)
c oh3
Cohor t e >1960 ( 1 s i cohor t =3, O s i no)
---------------------------------------------------------------------id
1000031
1000031
1000031
1000043
1000051
1000061
1000062
1000071
1000112

or g
0
0
0
0
0
0
0
0
0

dest
1
1
0
0
1
0
0
1
2

begi n
953
1063
1167
1101
982
1170
1170
982
928

end
967
1099
1168
1171
990
1171
1171
992
934

dat ei nt
1168
1168
1168
1171
1170
1171
1171
1170
1169

s ex
0
0
0
0
1
1
0
1
0

dbi r t h
708
708
708
797
702
662
669
587
628

c ohor t
2
2
2
3
2
2
2
2
2

a ar iale egin se r efiere a la fech a de in icio del episod io d e desem


p leo y la ar iale en d a su fin . odas las
ar iales u e se r efieren a fech as
(egin en ddatein t y dirth ) estn cod ificadas en m eses del siglou e in di
can el n m er o de m eses tran scu rr idos d esd e el pr in cipio d el siglo . s
el
alor 1en m eses d el siglosign ifica en ero d e 1002 fer er o de 100 y
as su cesiam en te. E n gen eralla fr m u la par a p asar d e u n a cod ificacin en
m eses y a os a u n a en m eses del siglo es
(1.)
or e
em ploa la fech a ar il d e 10 le cor respon d e en m eses d el siglo
el alor . as frm u las para la con
er sin in
er sad e m eses del siglo a
m es y a oson

(1.10)
or e
em plola fech a 2 en m eses d el siglo corr espon de a octu re del
11 . E l p roceso in
estigad o en este e
em p lo es m u lti
episd ico y m u lti

E sto poru e 2
12 1 y resta 10u e corresponde al m es de octu re.

estad o. E s m u lti
ep isdico poru e cad a en treistad o p u ed e h aer ten id o
m s de u n episod io de d esem p leo. or e
em ploel su
eto con el n m er o d e
iden tificacin igu al a 100001 tien e tres episodios de desem pleolos d os pr i
m er os term in an con u n a tr an sicin a la ocu p acin com o in dica la ariale
dest con
alor 1m ien tras u e el ter cer o est cen su r ad o a la der ech acom o
in dican las ariales dest con alor 0 y en d igu al a la fech a d e la en tr eista.
d em sel pr oceso es m u lti
estadoya u e la salida del desem pleo pu ede
ocu rr ir ien con u n a tran sicin a la ocu pacin ien con la in acti
idad. i

m on os en el su
eto con el n m ero de iden tificacin igu al a 1000112. u
ep isodio d e d esem p leo em piea en la fech a 2y acaa en la fech a con
u n a tr an sicin a la in actiid adcom o in dica la ar iale dest con
alor 2.
om o se d i
o an terior m en tela in str u ccin sica p ar a d efin ir los d atos
com o h istor ia de acon tecim ien to en tata es stset. u form u lacin m s sim
p lela sigu ien te
stset artem poralfailu re(arin terru p )

d on de vartem poral es la ariale u e in dica la du r acin an tes de u e


ocu rr a el acon tecim ien to o an tes de la cen su ra a la derech avarin terru p es
la ariale u e in dica si el ep isodio term in a con u n acon tecim ien to o si est
cen su rado a la d erech a. i se om ite
ailu re(ar in ter ru m p )tata con sid er a
u e tod os los episod ios acaan con u n acon tecim ien to. u an do la
ar iale
d efin id a com o varin terru p es m ayor u e 0tata in ter pr eta u e los ep isodios
acaan con u n acon tecim ien tosi es igu al a 0 o in lid otata con sider a los
ep isodios com o cen su rados a la der ech a.
tr a posiilid ad es u tili
ar la op cin
ailu re(arin ter ru p n u m list). on
esta opcin tata in terp reta u e acaan con u n acon tecim ien to tod os los
ep isodios para los cu ales la ariale d efin id a varin terru p es igu al a u n o d e
los alores n u m ricos especificados en la lista n u m list. odos los d em s ep i
sod ios son con sid er ad os com o cen su r ados a la d erech a.
E isten m u ch as otr as op cion es en stset u e p er m iten tratar con estru c
tu ras de d atos m u y com ple
as . E n p ar ticu laren los e
em p los de este liro
se u tiliarn las opcion es origin (n om r e
ar ) e id(n om re
ar )
stset artem poralfailu re(arin terru p ) origin (n om rear) id (n om re
a r)

a opcin origin (n om r ear) se u tilia p ara especificar u n a


ariale u e
iden tifica la fech a de in icio d el episod io. E sta op cin es til cu an d o la fech a

ara la gam a com pleta de opcion es


ase tata (200g).

E E

d e in icio n o es igu al a 0. a opcin id(n om r ear) se u tilia para in dicar u e


u n pr oceso es m u lti
episdico .
ar a defin ir las du r acion es d e los ep isod ios d e desem pleo com o datos
p ar a el se pr ecisan las d os in stru ccion es sigu ien tesla pr im era par a
cargar los d atos en la m em or ia y la segu n d a p ara defin irlos
u se u n em ploym en tclear
stset en d origin (egin ) fail(dest1)

e u tili
a la opcin origin ( ) para d efin ir u e el ep isodio in icia en la
fech a in d icada por la ariale egin . on la opcin
ail(dest1) se esp e
cifica u e la tran sicin de in ter s es la tr an sicin a la ocu pacin y u e la
tran sicin a la in actiid ad tien e u e ser con siderad a com o eu ialen te a u n a
cen su ra a la derech a. E n la ilu str acin 1.2 se p resen tan los r esu ltad os de
la aplicacin de la in stru ccin stset. e los episodios de d esem p leo
ter m in an con u n a tran sicin a la ocu pacin . dem spar a el su
eto con el
n m er o de id en tificacin igu al a 1000112 u e sale d el d esem p leo en la fech a
con u n a tr an sicin a la in actiidad (dest2)la ar iale d es igu al a 0.
i tam in fu er a in ter esan te in
estigar la tr an sicin a la in actiidad con el
fin d e com parar los m ecan ism os u ed esd e la con d icin de desem plead o
d eter m in an la salida del m ercado d e traa
o o la
u elta a la ocu p acin se
r a n ecesario oler a defin ir los datos com o h istor ias d e acon tecim ien tos
u tili
an d o stsetp er o esta eespecifican do u e el acon tecim ien to su ced e
cu an do la
ar iale dest es igu al a 2 10 . a ln ea de in stru ccin cor respon d ien
te sera
stset en d origin (egin ) fail(dest2)

E n este casoel n m er o de acon tecim ien tos es igu al a 0 y las tr an si


cion es a la ocu pacin son con sid er adas com o cen su ras a la der ech a. sla
ariale d es igu al a 0 p ar a el episod io d el su
eto con el n m er o d e id en ti
ficacin igu al a 100001.
i n o se h u iera esp ecificado la opcin
ail( )u tili
an do la sigu ien te
in stru ccin

a opcin id(varnam e) es adem s im prescin dile an tes de efectu ar u na su di


isin de
los episodios (episode splittin g) para definir
ariales ue se m odifican en el tiem po. ore este
tem a
ase ern ardi (200).
10
ecurdese u e en la ilustracin 1.2 se especifica ue las categoras de la
ariale dest
son 0cen surado a la derecha1em pleado y 2in actio.

stset en dorigin (egin )

tata hara considerado u e todos los episodios acaaan con u n acon te


cim ientosin distinguir entre episodios censurados a la derechatran sicion es a la
ocu pacin y transiciones a la inacti
idad. ipor otro ladose h uiera escrito
stset en dorigin (egin ) fa il(d est)

USAC

13 ..De fin ici n


d e
u n em p lo ym en t.d ta co m o
fich e r o
a t o
a r a
e l
AH A
* acont ec i mi ent o def i ni do c omo t r ans i c i n a l a oc upac i n
f ai l ur e event :
dest == 1
obs. t i me i nt er v al :
( or i gi n, end]
exi t on or bef or e:
f ai l ur e
t f or anal ys i s:
( t i me- or i gi n)
or i gi n:
t i me begi n
---------------------------------------------------------------------973 t ot al obs .
0 ex c l us i ons
---------------------------------------------------------------------973 obs . r emai ni ng, r epr esent i ng
734 f ai l ur es i n si ngl e r ecor d/ s i ngl e f ai l ur e dat a
17922 t ot al anal y s i s t i me at r i s k, at r i s k f r om t =
0
ear l i est obser ved ent r y t =
0
l as t obs er v ed exi t t =
119
l i st
i d or g des t begi n end _d _t _t 0 i n 1/ 9, nod nol noob c l ean
id
or g
des t
begi n
end
_d
_t
_t 0
1000031
0
1
953
967
1
14
0
1000031
0
1
1063
1099
1
36
0
...
1000071
0
1
982
992
1
10
0
1000112
0
2
928
934
0
6
0
* acont
f
obs. t
exi t
t

ec i mi ent o def i ni do c omo t r ans i c i n a l a i nact i vi dad


ai l ur e event :
dest == 2
i me i nt er v al :
( or i gi n, end]
on or bef or e:
f ai l ur e
f or anal ys i s:
( t i me- or i gi n)
or i gi n:
t i me begi n
-----------------------------------------------------------------973 t ot al obs .
0 ex c l us i ons
---------------------------------------------------------------------973 obs . r emai ni ng, r epr esent i ng
80 f ai l ur es i n si ngl e r ecor d/ s i ngl e f ai l ur e dat a
17922 t ot al anal y s i s t i me at r i s k, at r i s k f r om t =
0
ear l i est obser ved ent r y t =
0
l as t obs er v ed exi t t =
119
l i st
i d or g des t begi n end _d _t _t 0 i n 1/ 9, nod nol noob c l ean
id
or g
des t
begi n
end
_d
_t
_t 0
1000031
0
1
953
967
0
14
0
1000031
0
1
1063
1099
0
36
0
...
1000071
0
1
982
992
0
10
0
1000112
0
2
928
934
1
6
0

E E

tata h ara in terp retado u e todos los episod ios con


ar iale dest
m ayor de 0 y u e n o fu eran casos per did os ter m in an con u n acon tecim ien
tosin distin gu ir en tr e las tr an sicion es a la ocu p acin y las tr an sicion es a
la in acti
idad. in alm en tecae d estacar u e el pr oceso h a sido defin ido
con u n solo episod io. E n otr as palar ascada episod io es an aliad o p or su
cu en tain depen dien tem en te d e otr os een tu ales episod ios de desem pleo d el
m ism o su
eto. ar a defin ir los datos com o m u lti
ep isdico se pu ede u tiliar
la op cin id en la or den stset.

13 .3 .a
fu n ci n
de
su e r ie n cia
E l gr fico 1.1 p resen ta la fu n cin d e su perien cia par a la salid a del
d esem p leo y m u estr a la p rop or cin de episod ios de d esem p leo (e
e er tical)
u e tod aa n o h an term in ado con u n a tran sicin a la ocu pacin en fu n
cin d e la d u racin d e los episod ios (e
e h ori
on tal). u ede as com pr oarse
u e m s d e la m itad de los episod ios de desem pleo acaan con u n a tr an si
cin a la ocu pacin d u ran te el p rim er a op er o u n o d e cad a cu atro tien e
u n a du racin su perior a los m eses.

C
1 3.1.u n ci n
d e
su e r ie n cia
a r a
la
sa lid a
d e l
d e se m le o
1.00

0.75

Funcin de supervivencia

0.50

0.25

0.00
0

12

24

36
48
60
72
84
Duracin del episodio de desempleo

96

108

120

ar a estim ar las fu n cion es d e su p er ien cia se p u ed e u tili


ar el estim a
d or d e aplan y eier. in en trar en los d etalles for m ales (par a ellos
ase
lossfeld y oh er 2001)la in stru ccin de tata par a calcu lar u n a fu n cin
d e su p er
i
en cia con el estim ador de aplan y eier es sts. a ord en sts
graph pr odu ce u n grfico con la fu n cin d e su per
i
en ciam ien tras u e
sts list m u estra u n listad o con los alor es d e la m ism a. ara pod er e
ecu tar
esta ord en es n ecesar io u e los d atos se h ayan d efin id o preiam en te com o

h istorias de acon tecim ien tos m ed ian te la in stru ccin stset. i se u ier en
com p ar ar las fu n cion es de su p erien cia par a d iferen tes gru poses decir
p ara difer en tes alor es d e u n a ariale in depen d ien telas in str u ccion es u e
se pr ecisan son
sts grap h y(
arlist)
sts listy(arlist)

d on d e va rlist es u n a lista d e a r ia les d e tip o ca tegr ico. a s in s


tr u ccion es en ta ta p a r a la estim a cin d e la s fu n cion es d e su p er i
en cia
h a n d e ser.
u se u n em ploym en t.dtaclear
stset en dorigin (egin ) fa il(d est1)
sts grap h yla el(an gle(h orion tal)) lael(0 (12) 120)

title(u ra cin del ep isodio d e d esem pleo)

title(u n cin de su per


i
en ciap osition (0) rin g(0))
n a m e(
replace)
sts grap h yla el(an gle(h orion tal)) lael(0 (12) 120)

title(u ra cin del ep isodio d e d esem pleo)

title(u n cion es d e su per


i
en cia)

y(coh ort) n a m e(
repla ce)

E l gr fico 1.2 p resen ta la s fu n cion es de su p er


i
en cia p a ra la d u r a
cin de los ep isodios d e d esem p leos pa ra tr es coh ortes de n a cim ien to. a
fu n cin de su p er
i
en cia pa r a la coh or te m s
o
en (los n a cidos en 10 o
d esp u s) est por dea
o de las otra s fu n cion es. E sto sign ifica u e los m s

en es sa len m s r pid am en te d el desem pleo u e los d em s 11.

11
a eolu cin con saltos y la rusca cada de la fu ncin de superien cia de la
cohorte m s an ciana al fin al del interalo de oseracin se deen a su escaso nm ero de casos.

E E

C
1 3..u n ci n
d e
su e r ie n cia
a r a
la
sa lid a
d e l
d e se m le o
a r a
t r e s
co h o r t e s
de
e d a d .
o d e lo s
d e
t r a n sici n
co n
t ie m o
co n t in u o
unciones de super
iencia
1.00

0.75

0.50

0.25

0.00
0

12

24

36
48
60
72
84
Duracin del episodio de desempleo
cohort = 1940
cohort = 1960

96

108

120

cohort = 1940
1960

13 ..
o d e lo s
de
la
t a sa
d e
t r a n sici n
co n
t ie m o

co n t in u o
E n trm in os gen er alesu n m odelo de la tasa d e tr an sicin p u ed e ser espe
cificad o com o

(1.11)
sse estu dia la tasa de tr an sicin en fu n cin de u n ector de
ariales
in d ep en d ien tes Xt y de la du racin t del pr oceso. os coeficien tes epr e
san el efecto de Xt sor e la tasa d e tr an sicin y son los factor es u e in teresa
estim ar.
E n tr e los m odelos de la tasa de tr an sicin la esp ecificacin m s com n
de la ecu acin gen eral (1.11) es

(1.12)
a ecu a cin (1.12) d escr ie los m od elos p r op or cion a les d e la ta sa
d e tr a n sicin . a for m a fu n cion a l d e la r ela cin en tr e la s a r ia les Xt y
la ta sa d e tr a n sicin es ep on en cia l p or u e la ta sa d e tr a n sicin n o p u e
d e a su m ir a lor es n ega tios. d em sr esp ecto a la for m u la cin gen er a l
d e la ecu a cin (1.11)la fu n cin (t) en (1.12) in d ica u e la p a u ta d e

d ep en d en cia tem p or a l d el p r oceso es igu a l p a r a tod a s la s oser


a cion es.
E n tr m in os m s tcn icosesto eu ia le a d ecir u e n o h a y efectos d e
in ter a ccin en tr e la s
a r ia les Xt y el tiem p o t. E n otr a s p a la r a sel tiem
p o n o con d icion a el efecto d e la s a r ia les Xt sor e la ta sa d e tr a n sicin .
E stos m od elos son d en om in a d os p r op or cion a les p or u e se a sa n en el
su p u esto d e u e los efectos d e la s a r ia les Xt in d u cen slo a d esp la
a
m ien tos p r op or cion a les d e (t) h a cia a r r ia o h a cia a a
osin m od ifica r
su for m a .
ar a estim ar los coeficien tes es n ecesar io form u lar u n su pu esto sor e
la for m a de (t). on este fin se pu ede elegir en tr e
ar ias distriu cion es
p aram tr icas. E n tr e las distriu cion es m s com u n es para an aliar d atos d e
d u racion es se en cu en tr an las distriu cion es epon en cialom pert
ei
u ll y log
logstica y epon en cial con stan te a in teralos. E n el grfico 1.
se pr esen tan e
em plos d e grficos de la tasa de tran sicin p ar a algu n as de
estas d istriu cion es. E l m odelo de la tasa de tran sicin m s sim ple es el
ep on en cial y su p on e u e (t) es con stan te en el tiem po 12

(1.1)
E l su pu esto d e con stan cia de la tasa d e tran sicin im p lica u e el r iesgo
d e u e ocu r ra el acon tecim ien to n o
ar a en fu n cin del tiem po. E sto sig
n ifica u e el p roceso n o tien e m em or iala erosim ilitu d d e u e ocu r r a el
acon tecim ien to es la m ism a
u sto al pr in cipio del p roceso com o en m om en
tos p osterior es d el tiem p o.
a tasa d e tran sicin del m odelo om per tse epr esa com o

(1.1)
E ste m odelo im p lica u e la tasa d e tr an sicin es m on otn ica crecien te
si el par m etro es m ayor u e 0 o m on otn ica d ecr ecien te si es m en or
u e 0. i es igu al a 0el m odelo om p er teu iale al m odelo epon en
cial. a solu cin m s com n p ara esp ecificar los efectos d e las
ar iales
in depen dien tes es in trodu cir lo a tr a
s d el par m etro acon aep( X). a
m ism a n otacin se u tili
ar tam in p ar a los otr os m odelos p aram tr icos.
e este m odo el par m etro epr esa la for m a d e depen den cia tem p or al del
m od eloy el p arm etr o a se u tilia p ar a estim ar los efectos de las ariales
in depen dien tes. E n el len gu a
e estad sticoel p arm etr o a se defin e com o
p arm etr o secu n dario (an cillary).
12
a pr esen ta cin de los m odelos con sider ad os se lim ita a su s p r opiedad es m s ge
n er ales.

E E

E l m odelo om pertd e la ecu acin (1.1) es de tip o p rop or cion al.


om o ya se h a m en cion ado poco an tesel su p u esto d e este m od elo es u e
el efecto d e las
ar iales Xt n o se m od ifica a lo largo d el in teralo tem por al
con siderad o. ich o de otra for m au e el efecto d e las
ar iales Xt se tr adu ce
en u n despla
am ien to (h acia ar riasi el efecto es positioo h acia aa
osi
el efecto es n egatio) de la pau ta d e dep en d en cia tem por al con tr olad a por el
p ar m etro per o n o in flu ye en su form a. E ste m odelo se h a u tili
ad o para
estu d iar los acon tecim ien tos de m oilidad ocu p acion ald em ostran do u e la
tasa de tran sicin de u n traa
o j a otr o tr aa
o k dism in u ye en fu n cin d el
tiem po tr an scu r rid o en el m ercado de tr aa
o (r en sen y u m a 11).
tr o m odelo em plead o fr ecu en tem en te en las aplicacion es d el en
las cien cias sociales es el m od elo d e eiu ll. or e
em plol
a(12)
em ple este tip o de m od elo en u n estu dio clsico sor e la accin colecti
a
p ar a an aliar cm o el tiem po trascu rr ido d esde el ltim o een to de p rotesta
in flu ye sor e la pr oailid ad de u e su ceda el sigu ien te. sim ism oarr oll
y an n an (2000) lo u tiliaron p ara estu d iar el r iesgo d e u ier a de las cor
p or acion es e in d u strias en fu n cin del tiem p o d esd e su fu n dacin . a tasa
d e tr an sicin p ara el m odelo eiu ll es igu al a
(1.1)
Este m odelo im plica u n a tasa de tran sicin m on otn ica crecien te si el pa
rm etro es m ayor u e 1 o m on otn ica decrecien te si el parm etro es m en or
u e 1. i es igu al a 1 eu iale al m odelo epon en cial. a solu cin m s com n
es in trodu cir el efecto de las ariales in depen dien tes a tras del parm etro a
con aep( X). e otien e as u n m odelo eiu ll de tipo proporcion al.
n u lter ior m odelo par am trico u esin em ar gon o p er ten ece a la
fam ilia d e los m odelos p rop orcion ales de la ecu acin (1.12)es el m odelo
log
logstico. plicacion es de esto tipo de m od elo se en cu en tran en los estu
d ios de las din m icas fam iliares (iem an n 1y 12) y de la d em ogr afa
d e las or gan iacion es (arr oll y an n an 2000). a tasa de tr an sicin del
m od elo log
logstico es 1

(1.1)
os efectos de las
ariales in depen dien tes se especifican a tras del par
m etro acon aep( X). E ste m odelo es m s fleile u e los an terioresya u e
si es m en or o igu al a 1la tasa de tran sicin es m on otn icam en te decrecien te
m ien tras u e si es m ayor u e 1tien e u n a form a de cam pan a (grfico 1.d).
1
E isten en literatura param etriacion es altern ati
as para este m odelo. u se sigu e la
param etri
acin u tiliada en lossfeld y oh er (2001).

in a lm en teel m od elo ep o n en cia l co n sta n te a in ter a los es u n a es


p ecifica cin d el m o d elo ep o n en cia l sim p le. E l in ter a lo tem p or a l se
d iid e en a r io s in ter a lo s p eu e osse su p on e u e la ta sa d e tr a n si
ci n es con sta n te en ca d a in ter a lo y u e p u ed e a r ia r d e u n in ter a lo a
o tr o. o r m a lm en te(t) co n siste en u n a ser ie d e a r ia les d icot m ica s
d d d n con d 1 en el in ter a lo tem p or a l t -t d 1 en el in ter a lo
tem p o r a l t -t ... d n 1 en el in ter a lo tem p or a l t n --t n . E n este ca so el
in estiga d or tien e u e elegir el n m er o y la eten sin d e los in ter a
lo s en lo s cu a les se d iid e el e
e tem p or a l d el p r o ceso p er o n o tien e
u e fo r m u la r n in g n su p u esto sor e la for m a fu n cion a l d e (t). n a
eestim a d o el m od elo lo s co eficien tes r ela tio s a la s a r ia les d ico
t m ica s u e id en tifica n lo s in ter a los p er m iten r eco n str u ir la p a u ta d e
d ep en d en cia tem p or a l d el p r o ceso . r ecisa m en tep or esta fleiilid a d
y p or n o r eu er ir su p u esto s a p r io r i sor e la for m a d e la d ep en d en cia
tem p o r a l d el p r o ceso el m od elo ep on en cia l con sta n te a in ter a lo s se
h a co n er tid o en la elecci n m s co m n en tr e los m od elos d e la ta sa d e
tr a n sici n p a r a r ea lia r u n .

C
13 .3.E
e m lo
d e
r fic o s
d e
la
t a sa
d e
t r a n sicio n e s

r(t)
0 .5 11.522.53

Gompertz

r(t)
0 .5 11.522.53

Exponencial

2
t

a=1

a=0.5

a=1 b=0.5

a=2

a=1 b=0.5

a=1 b=0

r(t)
0 .5 11.522.53

Loglogstico

r(t)
0 .5 11.522.53

Weibull

t
a=1 b=0.5
a=1 b=1

t
a=1 b=1.5

a=1 b=3
a=1 b=0.5

a=1 b=1

E E

... odelos de la tasa de tran sicin con tiem po con tin u o


con tata
E l m od o d e estim ar m odelos p ar am tricos de la tasa d e tr an sicin con
tiem po con tin u o es u tilian d o streg. ar a su u sose p recisa h aer defin ido
p re
iam en te los d atos com o ep isodios con la in str u ccin stset. a sin tais
sica de la ord en streg es la sigu ien te
st r e

a rlist
d ist (d istn am e)

d on de varlist in dica la lista d e


ar iales in depen dien tes Xt y distn am e
especifica la distriu cin de la tasa d e tr an sicin a estim ar. e este m od ose
p u ed e elegir en tr e la distr iu cin epon en cialeiu llom p er tlog
n or
m allog
logstico o gam m a. E isteadem su n am p lio aan ico de op cion es
p ar a streg. E n lo u e sigu e se tratar de eplicar au ellas u e n os p ar ecen
m s tiles p ar a r ealiar u n . an to en la ilu str acin 1.com o en la
ilu str acin 1.se pr esen tan los r esu ltad os de la estim acin de u n m od elo
ep on en cial y d e u n m odelo om p ertcon las
ariales r elatias al gn er o
(se) y las coh ortes de p er ten en cia (cohy coh sien do cohla categor a de
r efer en cia) par a la salid a d el desem pleo.

streg secoh 2 coh dist(ep) n oh r

E n el m odelo 1 la opcin dist(ep) especifica u e la tasa d e tr an sicin


es de tip o ep on en cialm ien tras u e con la op cin n oh r se m u estran los
coeficien tes de los efectos de las
ar iales y n o las ratios de las tasas de
tran sicin (en r e
ese eplica en u con sisten estos ltim os). i se con
sid erapor e
em plola
ar iale se(igu al a 1 p ar a los h om r es y a 0 para
las m u
eres)el coeficien te estim ado (0
2) es positio y estadsticam en te
sign ificatio. or esose p u ed e con clu ir u e la pr open sin a r ealiar la tr an
sicin a la ocu pacin es m ayor p ara los h om r es u e para las m u
er es. E n
el caso d e los m od elos pr op orcion ales de la tasa d e tran sicin el efecto de
u n a ariale p u ede ser in terp retad o com o la ar iacin por cen tu al d e la tasa
si tod as las dem s
ar iales p er m an ecen con stan tes y slo se m odifica la
ariale con sid erada.
or m alm en te

(1.1)

don de Xi cor r esp on d e a u n cam io en los alor es d e la ariale Xi r


es la ariacin porcen tu al en la tasa d e tran sicin asociad a a dich o cam io
y i es el coeficien te estim ado para la ar iale Xi. i la ar iale Xi es d icot
m icacom o en este caso Xi1 y

(1.1)

USAC

1 3.3 .o d e lo
e o n e n cia l
y
o m e r t
a r a
la s
d u r a cio n e s
d e
lo s
e iso d io s
d e
d e se m le o

m o d e lo
1
* model o 1
f ai l ur e _d:
anal y s i s t i me _t :
or i gi n:
I
I
I
I
I

t
t
t
t
t

er at
er at
er at
er at
er at

i
i
i
i
i

on
on
on
on
on

0:
1:
2:
3:
4:

Ex ponent i al

l
l
l
l
l

og
og
og
og
og

l
l
l
l
l

des t == 1
( end- or i gi n)
t i me begi n
i
i
i
i
i

k el
k el
k el
k el
k el

i
i
i
i
i

hood
hood
hood
hood
hood

=
=
=
=
=

- 1546.
- 1491.
- 1486.
- 1486.
- 1486.

1636
1689
9766
9488
9488

r egr es s i on - - l og r el at i v e- haz ar d f or m

No. of s ubj ec t s =
No. of f ai l ur es =
Ti me at r i s k
=
Log l i kel i hood

973
734
17922
- 1486. 9488

Number of obs

973

LR chi 2( 3)
Pr ob > chi 2

=
=

118. 43
0. 0000

-----------------------------------------------------------------------------_t |
Coef .
St d. Er r .
z
P>| z|
[ 95% Conf . I nt er v al ]
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - sex |
. 2575632
. 0739688
3. 48
0. 000
. 1125871
. 4025394
c oh2 |
. 8885871
. 1985
4. 48
0. 000
. 4995343
1. 27764
c oh3 |
1. 445604
. 1952503
7. 40
0. 000
1. 06292
1. 828287
_c ons |
- 4. 429246
. 1947556
- 22. 74
0. 000
- 4. 81096
- 4. 047532
------------------------------------------------------------------------------

i se com p aran los h om res y las m u


eresla
ar iacin en la tasa de
tran sicin a la ocu pacin es igu al a(ep (0
2)
1)100(1

1) 100
0. or lo tan tose p u ed e con clu ir u e la tasa de tr an sicin al traa
o es
u n 0 m ayor p ara los h om res u e para las m u
eres. am in se p u ed e
calcu lar la r atio d e las tasas d e tran sicin d e los h om r esr(h)y de las
m u
eresr(m )

(1.1)
e esto m od ola tasa d e tran sicin a la ocu pacin d e los h om res es
1
eces la d e las m u
eres. d ich o sin n m eroslos h om r es salen del

E E

d esem p leo con astan te m s facilid ad u e las m u


er es. ara oten er la ratio
d e las tasas de tr an sicin en lu gar de los coeficien tes es su ficien te escr iir
la in stru ccin streg sin la opcin n oh r.
E n el m odelo 2u e se estim a con la op cin dist(gom p)es u n m odelo
om per t. os r esu ltad os d e este m odelo m u estr an u e el coeficien te d el
p ar m etro gam m a (u e cor respon d e al p arm etr o d e la ecu acin (1.1))
es m en or de 0.
streg secoh 2 coh dist(gom p ) n oh r

E ste resu ltado in d ica u e la tasa d e tr an sicin es m on otn ica decrecien


tees decirla pr open sin a salir d el desem pleo d ism in u ye en fu n cin d el
tiem po u e se h a tran scu rr ido en esta con d icin . a estim acin del m od elo
om per tn os lleap or lo tan toa r ech a
ar el su pu esto d e estailid ad en
el tiem po d e la tasa de tran sicin u ecom o se h a istoest en la ase
d el m od elo ep on en cial. s com o se h a esp ecificado el m odelo om pert

sera posile estim ar otros m odelos param tr icos com o el eiu ll y el log
logsticom edian te las opcion es dist(ei) y dist(logl) 1.

o se presentan au estas estim aciones por falta de espacio.

USAC

1 3..o d e lo
e o n e n cia l
y
o m e r t
a r a
la s
d u r a cio n e s
d e
lo s
e iso d io s
d e
d e se m le o

m o d e lo

* model o 2
f ai l ur e _d:
anal y s i s t i me _t :
or i gi n:

des t == 1
( end- or i gi n)
t i me begi n

Fi t t i ng c ons t ant - onl y model :


I
I
I
I
I

t
t
t
t
t

er at
er at
er at
er at
er at

i
i
i
i
i

on
on
on
on
on

0:
1:
2:
3:
4:

Fi t t i ng f ul l
I
I
I
I
I

t
t
t
t
t

er at
er at
er at
er at
er at

i
i
i
i
i

on
on
on
on
on

l
l
l
l
l

og
og
og
og
og

l
l
l
l
l

i
i
i
i
i

k el
k el
k el
k el
k el

i
i
i
i
i

hood
hood
hood
hood
hood

=
=
=
=
=

- 1546. 1636
- 1488. 497
- 1484. 7369
- 1484. 7314
- 1484. 7314

l
l
l
l
l

i
i
i
i
i

k el
k el
k el
k el
k el

i
i
i
i
i

hood
hood
hood
hood
hood

=
=
=
=
=

- 1484.
- 1447.
- 1445.
- 1445.
- 1445.

model :

0:
1:
2:
3:
4:

l
l
l
l
l

og
og
og
og
og

7314
5164
2048
1962
1962

Gomper t z r egr es s i on - - l og r el at i ve- haz ar d f or m


No. of s ubj ec t s =
No. of f ai l ur es =
Ti me at r i s k
=
Log l i kel i hood

973
734
17922
- 1445. 1962

Number of obs

973

LR chi 2( 3)
Pr ob > chi 2

=
=

79. 07
0. 0000

-----------------------------------------------------------------------------_t |
Coef .
St d. Er r .
z
P>| z|
[ 95% Conf . I nt er v al ]
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - sex |
. 2224324
. 074057
3. 00
0. 003
. 0772832
. 3675815
c oh2 |
. 8207023
. 198552
4. 13
0. 000
. 4315475
1. 209857
c oh3 |
1. 256413
. 1961255
6. 41
0. 000
. 8720137
1. 640812
_c ons |
- 3. 934596
. 2007817
- 19. 60
0. 000
- 4. 328121
- 3. 541071
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - gamma |
- . 0189706
. 0022907
- 8. 28
0. 000
- . 0234603
- . 0144808
------------------------------------------------------------------------------

a eleccin en tr e difer en tes m odelos de la depen den cia tem por a l d e


p en d e fu n da m en ta lm en te d e la teor a u e se u iere com pr oa r o de los
con ocim ien tos preios del in
estiga d or con resp ecto a l p roceso a n alia do.

m a gn esepor e
em p lou e n u estra teor a de r efer en cia pr e u e la p ro
p en sin a sa lir d el desem pleo dism in u ye d e for m a m on ton a con el pa so
d el tiem po d eid opor e
em p loa u n efecto estigm a . E n ese ca so se po
d ra a
u star la dep en d en cia tem por al con u n m odelo om p er to eiu ll
ya u e a m os im plica n u n a ta sa de tra n sicin m on ton a en el tiem po. i
p or el con tra r ion u estr a teor a su giere u e la ta sa de tra n sicin crece h as
ta u n d eterm in a d o m om en to del tiem po pa ra decr ecer d esp u sel m od elo
m s a decu a d o sera el log
logsticou e p erm ite u n a depen den cia tem pora l
con for m a de ca m p an a . E n cu a lu ier ca soresu lta opor tu n o estim ar m o

E E

delos con d ifer en tes a


u stes y com pa ra r su s sign ificacion es estad stica s. s
se pu ede elegir la form a fu n cion al d e dep en d en cia tem pora l d e la ta sa d e
tr an sicin m s a decu ad a pa r a descriir los da tos u e se estn an a lian d o
(er n a rd i 200). i n o se tien e u n a teor a pr ecisa sore la for m a de la
depen den cia tem pora l de la ta sa d e tr a n sicin u n a solu cin em plea d a con
m u ch a fr ecu en cia es op ta r pa r a m odelos sem ipa r am tricos u e d e
a n la
fu n cin (t) sin especifica r y estim a n los efectos d e las ar ia les X. E n tr e
los m odelos sem ip ar a m tricoslos m s com u n es son el m odelo d e oy el
m odelo ep on en cia l con sta n te a in ter alos (pieceise con stan t epon en tial
m odel). con tin u acin se pr oporcion a u n a r ee in tr odu ccin a l m odelo
de o.

... l m odelo o
E l m od elo pr opu esto por o(12) ofr ece u n a estim acin de los coeficien
tes a tra
s d e u n m tod o d e la
er osim ilitu d pa r cia l y de
a la fu n cin (t)
sin esp ecifica r 1. E l m od elo d e op er ten ece a la fa m ilia d e los m od elos
pr oporcion a les yp or lo ta n tose a sa en el su pu esto d e u e los efectos de
la s ar ia les X in du cen slo d esp laa m ien tos pr oporcion a les h a cia a rr ia o
a a
o d e (t)sin m odifica r su form a . E n ta ta la in str u ccin p a ra estim a r
u n m odelo de oes stcoel cu a l reu iere h a er defin ido p reia m en te los
da tos com o h istor ia de a con tecim ien tos con la ord en stset. E n la ilu stra cin
1.se pr esen ta n los r esu lta d os de la estim a cin de u n m odelo opa ra la
du r acin d e los episod ios de desem pleo. os coeficien tes estim ad os se in
terp reta n de la m ism a m an er a u e p a ra los otr os m odelos p ropor cion ales.
ta ta u tili
a p or d efecto el m tod o d e r eslo p a r a con tr ola r u e n o
h a ya a gr u p a cion es en la d istr iu cin d e la s d u r a cion esesto esu e n u
m er osos ep isod ios a ca en en el m ism o m om en to d el tiem p oh ech o u e
com p lica r a la estim a cin d e la er osim ilitu d p a r cia l1. om o se a p r ecia
n o h a y n in g n coeficien te p a r a el efecto d e la d u r a cin d e la legisla tu r a
sor e el r iesgo d e d isolu cin d e los goier n oses d ecirla fu n cin (t) se
d e
a si esp ecifica r. d em slos coeficien tes estim a d os p a r a la s a r ia les
in d ep en d ien tes son m u y p a r ecid os a los d el m od elo om p er td e la ilu s
tr a cin 1..

1
ara u n a ilustracin de cm o fu ncion a el m todo de estim acin con erosim ilitu d par
cial
ase el pn dice
en ern ardi (200).
1
ara m s detalles sore las com plicacion es relacion adas con la eistencia de agru pa
m ien tos (ties) en la distriu cin de las du raciones y sore los
arios m todos para tratarlas

ase tata (200g12


12).

USAC

1 3..o d e lo
Co
a r a
la s
d u r a c io n e s
de
lo s
e iso d io s
d e
d e s e m le o
s t cox sex c oh2 c oh3,

nohr

f ai l ur e _d:
anal y s i s t i me _t :
or i gi n:
I t er at
I t er at
I t er at
I t er at
I t er at
Ref i ni
I t er at

i on 0:
l
i on 1:
l
i on 2:
l
i on 3:
l
i on 4:
l
ng es t i mat
i on 0:
l

og
og
og
og
og
es :
og

l
l
l
l
l

des t == 1
( end- or i gi n)
t i me begi n
i
i
i
i
i

k el
k el
k el
k el
k el

i
i
i
i
i

hood
hood
hood
hood
hood

=
=
=
=
=

- 4454.
- 4419.
- 4418.
- 4417.
- 4417.

3466
3661
0157
9969
9969

l i k el i hood = - 4417. 9969

Cox r egr ess i on - - Br es l ow met hod f or t i es


No. of s ubj ec t s =
No. of f ai l ur es =
Ti me at r i s k
=
Log l i kel i hood

973
734
17922
- 4417. 9969

Number of obs

973

LR chi 2( 3)
Pr ob > chi 2

=
=

72. 70
0. 0000

-----------------------------------------------------------------------------_t |
Coef .
St d. Er r .
z
P>| z|
[ 95% Conf . I nt er v al ]
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - sex |
. 2272679
. 0741742
3. 06
0. 002
. 0818891
. 3726467
c oh2 |
. 814659
. 1989799
4. 09
0. 000
. 4246656
1. 204653
c oh3 |
1. 223955
. 1969942
6. 21
0. 000
. 8378532
1. 610056
------------------------------------------------------------------------------

ara con clu irel m od elo d e oh a sido trad icion alm en te u n a eleccin
m u y pop u lar en tre los in estigadores socialesu is p or la relatia facilid ad
con la u e se pu ede estim arin clu so con las p rim eras
ersion es de pau etes
estadsticos estn dares com o y . in em argosu lim itacin prin
cipal es la de n o proporcion ar n in gu n a in form acin sore la p au ta d e dep en
den cia tem poral d el proceso in estigado. or esta ra
n se aprecia u n a clara
ten den cia a u tiliar el m od elo epon en cial con stan te a in teralos en tre los
m odelos sem ip aram tricos en los ltim os a os (ern ard i 20010).

1 3..E
e r cicio s
1.

2.

tilia el fich er o m arriage.dta con ten ido en la p gin a ed e este liro


y estim a la fu n cin d e su per
ien cia u tili
an do el estim ador d e ap lan
y eier.
san d o el fich er o m arriage.dtaestim a u n m odelo epon en cial con las
ariales gn ero y n ivel de edu cacin .
n ter pr eta los coeficien tes estim a
d os p ar a estas
ar iales. on stru ye despu s u n m odelo d e oy u n
m od elo om pert
.

14
An lisis d e d a t o s d e e n cu e st a co n St a t a

E n cien cias sociales casi n u n ca se trabaja directam en te con d atos d e la p oblacin objeto d e estu dio. Pu esto qu e en la m ayor p arte d e los casos se estu dian poblacion es m u y gran d es, costossim as de an alizar directam en te, se
su ele recu rrir a la realizacin de en cu estas adm in istrad as a u n a m u estra p robabilstica d el u n iverso en estu dio. E l prin cipio fu n dam en tal en el m u estreo
es la aleatoried ad: sobre ese prin cipio est d esarrollad a tod a la estadstica
in feren cial, com o se a ep licad o en la segu n d a parte del cap tu lo destin ad o
al an lisis d e u n a sola variable. i se elige al azar u n n m ero determ in ado
de in dividu os (m u estra n ) de u n a poblacin de u n determ in ado tam a o (poblacin N), los resu ltad os obten id os con los d atos de la m u estra (estadsticos
m u estrales) se podrn u tilizar p ara estim ar los datos p oblacion ales reales
(parm etros poblacion ales), den tro de u n ran go p roporcion ad o por las probabilid ades de la cu rva n orm al con u n determ in ado n ivel d e con fian za.
odo lo visto asta a ora en este m an u a l sigu e estos pr in cip ios. a estim a cin d e pa r m etros, los err or es tpicos, las pr u eba s d e ip tesis, la s
r egr esion es, etc., qu e asta a or a se a n eplica do, p ar ten d el su p u esto de
qu e los d atos a n a liza dos pr ovien en d e u n a m u estr a a lea tor ia sim ple d e la
p ob lacin ob jeto d e estu dio. Por ta n to, siem pr e qu e se a n a licen d a tos esta d sticos gen era d os tra s u n m u estreo a lea tor io sim p le, se pu eden a p lica r la s
tcn ica s ta l com o a n sido ep lica da s a sta el m om en to. Per o qu ocu r r e
si la en cu esta rea liza d a n o sigu i u n m u estreo aleatorio sim pleealm en te,
en la m a yora de la s oca sion es, en la s cien cia s socia les n o se u tiliza m u estreo alea torio sim ple, pu esto qu e se r equ ier en m u estra s m u y gr an d es de
p ob lacion es m u y dispersa s en el esp a cio geogr fico. s ab itu a lm en te,
se u tiliza n form a s de m u estr eo com pleja s, con seleccin n o estr icta m en te
a lea tor ia d e los ca sos, a tr avs d e la con str u ccin d e estr a tos, con glom er ad os o cu ota s, en los qu e las pr oba bilida des d e ca d a in dividu o d e ser selec-

E n tem as de errores m u estrales destacan osran


y is

. am bin pu eden
con su ltarse zorn y ncez respo

, Prez
y, de m odo aplicado a en cuestas,
odrgu ez su n a

E E

cion ad o va r a n
n o son idn tica s com o en el m u estreo a lea tor io sim p le
.
Pu es bien , si los da tos n o r esp on den a u n m u estr eo a lea tor io sim p le, la
a plicacin literal de la s tcn ica s vista s a sta aor a p u ede da r lu ga r a estim a cion es y pa r m etros sesga dos, a s com o a la a cepta cin com o ver da dera s de ip tesis qu e r ea lm en te son fa lsa s. Por su pu esto, eso n o qu ier e d ecir
qu e n o se pu ed an u tilizar las tcn ica s esta dstica s vista s a sta a or a , per o
es n ecesar io u tiliza r las er ra m ien ta s qu e ta ta n os pr opor cion a p a ra el
a n lisis de da tos de m u estr as com p leja s. E so es lo qu e se eplicar en este
ca p tu lo.

14 .1 .

Aju st e s e n e l a n lisis d e m u e st r a s co m p le ja s

om o se acab a de decir, el su pu esto de todas las p ru ebas estadsticas an alizadas en el cu er po de este libr o, qu e tien en com o m isin la gen eralizacin
d e los r esu ltad os de en cu estas r ep resen tativas, es el m u estreo aleator io sim p le. Pero en la m ayor p ar te d e las en cu estas socioecon m icas, el m u estreo
qu e se u tiliza n o es
dir ectam en tealeator io, n i sim ple. E l desar r ollo de las
tcn icas de m u estr eo com plejas a p er m itido r ed u cir los costes de la in vestigacin m edian te en cu estas y a u n tiem p o au m en tar la fiab ilid ad de los r esu ltados. E l in con ven ien te d e estas tcn icas com p lejas es qu e n o se p u ed en
an alizar los d atos directam en te com o si de m u estras aleator ias sim p les se
tr ataran , sin o qu e d eb en r ealizarse u n a serie d e aju stes p revios.
as ven tajas d el m u estr eo com p lejo se en tien den m ejor m edian te u n
ejem p lo. E n el su p u esto d e qu e se desee r ealizar u n a m u estr a r epr esen tativa
d el con ju n to de los esp a oles m ayor es de a os. i, sobr e la base d el cen so, se seleccion ar an de m an er a pu r am en te aleator ia .in d ivid u os par a
acer les u n a en trevista p er son al, el coste de la realizacin d e estas en tr evistas sera eager adam en te alto, d eb ido a la n ecesid ad de desplazar se p or
tod a la geografa esp a ola d e los en trevistador es
.desplazam ien tos
aleator ios p or toda E spa a
. E ste coste se p u ed e r ed u cir con sid er ablem en te
si en lu gar de seleccion ar d irectam en te a los .in d ividu os, se escogen
aleator iam en te seccion es cen sales , y d en tro d e cada seccin cen sal se
etr aen diez in divid u os al azar. E n lu gar de .desplazam ien tos, slo es
p reciso realizar , pu esto qu e p or d efin icin las d iez en trevistas d e cad a
seccin cen sal estar n m u y pr im as espacialm en te
el d esplazam ien to
d en tro d e cad a seccin p u ed e realizar se a pie
. s se su ele r ealizar ab itu alm en te en este tip o d e en cu estas, y este tip o d e m u estr eo se llam a m u estreo
p olietp ico.
dem s d e ven tajas en tr m in os d e coste, el m u estr eo com p lejo pu ed e
ten er ven tajas en tr m in os d e fiab ilidad de los resu ltados. i se p reten de

as seccion es censales son las zon as qu e perten ecen a u n m ism o colegio electoral.

ANLIS IS DE DATOS CON S TATA

estu d iar las form as d e or gan izacin del trabajo en las em presas espa olas,
se sabe qu e ay m u cas diferen cias en cm o organ izan el trabajo las em p resas gr an d es y las pequ e as, por lo qu e r esu lta d e gran in ters disp on er
d e d atos fiables p ar a am b os tipos de em pr esas. Per o las em p resas gr an d es,
au n qu e de gran relevan cia econ m ica y social
p or la gran can tidad de em p leo qu e con cen tr an
, son pocas en trm in os n u m ricos: ay m u cas m s
em p resas p equ e as qu e gr an des. asta tal p u n to qu e si se realizar a u n a
seleccin aleatoria sim p le, abra m u csim as em pr esas pequ e as y m u y
p ocas em pr esas gr an des: tan p ocas qu e n o se p odr an gen er alizar los r esu ltados obten id os a su segm en to. Par a evitar este pr ob lem a, p u eden divid ir se
las em pr esas en d os gru p os: gran des y pequ e as, y realizar u n a m u estra
in depen dien te en cad a gr u p o. s, se d isp on d r d e su ficien tes em p resas de
am b os tipos y p od rn gen eralizarse los resu ltados par a am b os casos. E ste
tipo de m u estr eo se den om in a m u estreo estratificado.
E n la pr ctica, la m ayor p ar te d e las en cu estas qu e se realizan sobre
tem as sociales y econ m icos u tilizan u n m u estr eo com plejo, u tilizan d o
m u estreos polietpicos y estratificados en su cesivas etapas. e con sigu e as
r edu cir costes y am p liar la r epr esen tatividad de los resu ltados. Pero estos
p rocedim ien tos de m u estr eo obligan a realizar aju stes sob re los d atos an tes
d e an alizar los.
a razn p or la qu e n o se p u ed en u tilizar los datos de m u estr as com p lejas directam en te, sin aju stes, es m u y sen cilla: los estim adores estar an
sesgados. E n los ejem p los eplicados, en el m u estreo polietp ico, es m u y
p osible qu e aya relacin en tr e los in dividu os p er ten ecien tes a u n a m ism a
seccin cen sal
en u n m ism o b arr io se com par ten n orm alm en te estatu s socioecon m ico y valor es cu ltu rales
, p or lo qu e si se ace u n a estim acin
sim ple, n o se tien e en cu en ta qu e pu ede aber in d ivid u os cu yos valor es estn asociad os
rom p ien do u n o de los su p u estos bsicos d e la in fer en cia estadstica
en el otr o ejem plo, en el qu e se plan tea u n m u estr eo estr atificad o
d e las em pr esas espa olas, si se estim ara la m edia d e u so d e tu rn os de tr ab ajo, sald ra m u co m s alta qu e la m edia real, p u esto qu e en la seleccin
efectu ada las em p resas gr an d es estn sobr err ep resen tadas, y las em p resas
gr an d es u tilizan m s sistem as de tu r n os qu e las em p resas p equ e as. od o
p rocedim ien to com plejo d e m u estr eo requ iere, p u es, la aplicacin de aju stes
p osterior es a los d atos para qu e estos pu edan ser an alizados.

1 4.2.

P o n d e r a cio n e s, e st r a t o s y co n glo m e r a d o s

os in str u m en tos pr in cipales par a realizar los aju stes qu e per m itan gen er alizar los resu ltados d e en cu estas con m u estras com p lejas son los sigu ien tes:
a Pon deracion es: las pon deracion es son la for m a pr in cip al de aju star
los datos de en cu esta a los p ar m etr os poblacion ales. E n el m u es-

E E

tr eo aleatorio sim ple la pr obabilid ad de seleccin d e cad a in d ividu o


de la m u estra es la m ism aen el m u estr eo com p lejo, en cam bio, la
pr obabilidad d e seleccin d e los in d ividu os es distin ta, seg n el estr ato al qu e perten ezcan , seg n cu otas, etc. a pon der acin es la in ver sa de la pr obabilidad d e qu e u n in dividu o aya sid o seleccion ad o
en la m u estr a. l ap licar la a los in dividu os d e la m u estra, se vu elve
a la pr oporcin de la p ob lacin objeto d e estu d io.
Por ejem p lo, en el caso an ter ior de la m u estra d e em p resas esp a olas: las em pr esas gr an des su p on en u n del total d e las em p resas esp a olas, pero
por las razon es an tes m en cion ad asin ter esa ten er su ficien tes em pr esas gran d es, com o u n d e la m u estra
p ar a pod er gen er alizar. Por tan to, la p robab ilidad de seleccion ar u n a
em p resa gr an d e es m u co m ayor qu e la d e seleccion ar u n a em p resa pequ e a: si se u b ier a seleccion ado por sim ple azar, ab ra u n a
em p resa gran de d e cada diezp er o al ap licar estr atificacin con afijacin con stan te se d isp on e d e cin co d e cad a diez. sea, su prob abilid ad de ser seleccion adas es cin co veces m ayor qu e la pr obabilid ad
qu e ten d ran en u n m u estreo aleator io sim p le. Por tan to, a las em p resas gran des ab r qu e aplicarles u n a pon d er acin de
, o sea
d e ,. on las em pr esas p equ e as ocu r r e lo con tr ar io. i se u b iera
eco m u estr eo aleatorio, se abr an seleccion ado n u eve em pr esas
con el m u estr eo estr atificad o slo se an etrad o cin co. u pr ob ab ilidad d e seleccin es m en or

de la qu e u b iera sido en u n
m u estr eo aleator io, p or lo qu e debe ap licar se u n a p on d er acin de

, o sea de ,a las em p resas pequ e as. p lican d o estos p esos, los


r esu ltad os qu e se ob ten gan ser n p er fectam en te r ep resen tativos del
con ju n to d e las em p resas esp a olas.
a p on dera cin n o slo se u tiliza cu a n do eiste estra tifica cin ,
sin o siem pr e qu e aya seleccin n o a lea tor ia
p er o sigu ien d o u n
criter io pr oba bilstico con ocidode los in dividu os. d em s, ta m bin se u sa p a ra cor regir a p osterior i los err or es d e m u estr eo derivad os de la n o respu esta . Por ejem p lo, si tr as la rea liza cin de u n a
en cu esta se ob ser va qu e la n o r esp u esta se a con cen tra do pr in cipa lm en te en los om b res, d e m od o qu e a y sob rerr epr esen ta cin
de m u jer es
lo qu e sesga los resu ltad os
, p u ed e a plica rse u n a pon der acin d istin ta a om b res y a m u jeres d e m odo qu e los om br es
y la s m u jeres recu peren en la m u estra el por cen ta je qu e tien en en
la p oblacin .
a u tilizacin de las p on d eracion es sirve p rin cipalm en te p ara la
r ealizacin d e estim acion es cor rectas de los par m etros pob lacion ales. om o se acaba de ver en el ejem p lo d e la m u estr a estr atificad a
d e las em pr esas esp a olas, si n o se em plean las pon der acion es en
u n a m u estra n o aleatoria, las m edias y pr op orcion es d e la m u estr a
n o coin cidir n con las de la pob lacin .

ANLIS IS DE DATOS CON S TATA

E n tata, las pon der acion es m u estrales se llam an pweights. orm alm en te se disp on e de u n a variab le de p on d eracin en la base d e
datos
qu e d eber estar d ocu m en tad a en la m etodologa d e la en cu esta
, variab le qu e con tien e p ar a cad a caso el in verso de su probabilidad de seleccin en la m u estra. Par a ap licar la p on deracin a los
casos, slo es pr eciso in dicar a tata cu l es esta var iable con la in stru ccin sv
set, qu e se eplica en el ejem p lo del sigu ien te ap ar tado.
b stratos: com o se a visto en el caso an ter ior, la u tilizacin d e estr atificacin deter m in a
al m en os en p ar telas pon deracion es de los
datos m u estr ales. a estr atificacin tam b in ace n ecesar ia
o al
m en os r ecom en dablela u tilizacin de in for m acin sobr e los estr atos en s. u an do se realiza estratificacin d e la m u estr a, r ealm en te
se r ealiza u n a m u estr a in depen dien te en cada estr ato. Por ello, si se
in dica a tata cu les son estos estr atos
tam bin con la or den sv
set
, p odr tr atarlos com o m u estr as estadsticam en te in d ep en dien tes, lo qu e p rob ab lem en te redu cir los er ror es tpicos, p er m itien d o
acer p ru ebas de iptesis m s aju stadas y fiab les.
E sto tam bin tien e u n a ep licacin r elativam en te in tu itiva. orm alm en te se r ealizan los estr atos bu scan do qu e ten gan cierta om ogen eidad y r elacin en lo qu e resp ecta a lo qu e a de estu diar se. E n
el caso d e las em pr esas espa olas, se sabe qu e las em pr esas gr an des
or gan izan el tr abajo de m an era m u y d istin ta a las pequ e as. Per o,
dado qu e las em pr esas gr an des son m u y pocas, esta diferen cia pr cticam en te n o qu edar a recogida en la m u estr a
ab ra m u y pocos
casos diferen tes
, por lo qu e p rob ab lem en te n o ser a estadsticam en te sign ificativa. E n cam b io, al estr atificar y sob rerr epr esen tar
las em pr esas gr an d es, pu eden com parar se su s valor es con los de las
em p resas pequ e as de m an er a fiable, d e m od o qu e podr n com p robarse con m ayor facilid ad las ip tesis de in vestigacin .
i la p on deracin es im por tan te para la estim acin d e p arm etros
esto es, para saber si la m edia d e la m u estr a es igu al qu e la
m ed ia d e la pob lacin , por ejem p lo
, la u tilizacin de los estratos es
n ecesar ia par a la estim acin de los err ores y par a la com pr ob acin
ad ecu ada de iptesis. in esp ecificar los estratos, los err ores tp icos
ar rojan valor es m ayor es, por lo qu e se red u cen las p rob abilid ad es d e
recazar las ip tesis n u las cu an d o estas son realm en te falsas.
c on glom erados: en las en cu estas sociales el u so de con glom erad os
o u n idades pr im arias de m u estreo es m u y abitu al, pr in cipalm en te
p or el aorr o de costes qu e su p on e. E sta tcn ica perm ite evitar la
d ispersin pr opia d el m u estr eo aleatorio sim ple, seleccion an d o los
casos en agru p acion es localm en te cer can as m s fcilm en te accesib les en m en or p er iodo d e tiem po.
E l prob lem a qu e p resen ta el m u estreo p or con glom erados es qu e
las observacion es de u n m ism o con glom erad o n o son in d ep en d ien -

E E

tes, vu ln eran do as el su p u esto de in dep en d en cia de la m ayor parte


de las tcn icas estadsticas. E s p resu m ib le qu e person as d e u n m ism o b arrio
si el b arrio es el con glom eradose asem ejen m s en tre
s qu e person as de barrios distin tos. i n o se u tiliza la in form acin
sobre los con glom erados, la estim acin d e errores tpicos ser m en or
de lo qu e en realid ad debera ser
p u esto qu e la agru pacin en con glom erad os red u ce la variab ilid ad d e m an era sesgada
, corrin dose
el riesgo de aceptar com o sign ificativas diferen cias en tre p arm etros
qu e n o deberan serlo para u n n ivel de con fian za determ in ado.
E n u n a m ism a m u estra se pu eden realizar etapas su cesivas de
seleccin
p or ejem p lo, pr im ero ciu dad es, d en tro de ciu dad es b ar rios y den tr o d e b ar r ios in divid u os
. Pese a qu e la in form acin de
con glom erad os tam b in p u ede u tilizar se p ar a la estim acin d e err or es tpicos, tata n o perm ite m s qu e u tilizar la in for m acin de u n a
n ica u n idad pr im aria d e m u estr eo
P
Prim ary am plin g n it

,
p or lo qu e en las cir cu n stan cias de este ejem plo sera deseab le op tar
p or la pen ltim a u n idad seleccion ada en el m u estr eo
en el caso
an terior, los b ar r ios
.
E l cu adr o .resu m e lo qu e debe ten er se en cu en ta a la ora d e tr ab ajar con d atos d e m u estras com p lejas.
ay u n a ltim a cu estin im p or tan te qu e debe ten er se en cu en ta al tr ab ajar con datos m u estrales. a u tilizacin o n o de los in stru m en tos en u m er ad os resu lta m s o m en os cr tica en fu n cin d e los objetivos de n u estr o
an lisis. i lo qu e se pr eten d e es estim ar a travs d e los d atos m u estrales los
p ar m etros p oblacion ales
p or ejem p lo, si se qu iere estim ar el p orcen taje
d e voto a u n p artido en fu n cin de u n a en cu esta p reelector al
, la u tilizacin
d e pon der acion es es absolu tam en te fu n d am en tal. i lo qu e se persigu e es
estar m u y segu ros de qu e los r esu ltad os d e la m u estra son cercan os a los
r eales, o si el objetivo fu n dam en tal es r ealizar u n a p ru eba de iptesis d e
sign ificacin con los datos m u estrales, n o slo d eb en em p learse las pon d er acion es, sin o tam bin los con glom er ados y los estratos, siem p re y cu an do
se disp on ga de la in form acin . or a b ien , si lo qu e se d esea es estu d iar la
r elacin en tr e dos o m s variab les
el efecto de la clase social sob re la in ten cin de voto, por ejem plo
, la u tilizacin d e p on deracion es, con glom er ados
y estratos es m u co m en os im p ortan te. iertam en te, si n o se u tilizan , ay
m ayor p rob ab ilid ad de equ ivocar se, p or ejem p lo, en la estim acin d e los
p ar m etros d e la regresin , as com o d e er rar en la sign ificacin d e estos

un qu e las u n idades de m u estreo m s all de la se alada com o prim aria tam bin pueden tener u n efecto sobre los errores tpicos, el error qu e pu ede derivar de su no u tilizacin
es realm en te irrisorio. i se desea, n o obstan te, u tilizar esta in form acin en la estim acin de
parm etros y errores tpicos, pu ede em plearse un program a ya totalm en te especializado com o
.

ANLIS IS DE DATOS CON S TATA

p arm etr os
r ecazan d o parm etr os qu e r ealm en te s son sign ificativos o,
lo qu e es peor
pero m s difcil
, acep tan do parm etr os r ealm en te n o sign ificativos
. Per o, sin d u da, el pr oblem a es m en or, pu esto qu e de lo qu e
se trata en este caso es de allar r elacion es en tre variab les, n o de pr ed ecir o estim ar los p ar m etros poblacion ales. b viam en te, es m u co m en os
im por tan te sobr eestim ar o in fraestim ar ligeram en te
la diferen cia su ele ser
p equ e a en m od elos d e r elacion es en tr e var iablesu n a relacin en tr e d os o
m s var iables qu e equ ivocarse en la estim acin del voto a u n deter m in ado
p artido. i eiste relacin en tre clase social y voto, aparecer en los r esu ltad os, au n qu e la clase alta est in frar repr esen tad a en r elacin con la baja el
p rob lem a estriba en qu e sea m s d ifcil gen er alizar los resu ltados.
CUADR 14 .1 .

n st r u m e n t o s d e a ju st e s m u e st r a le s y co n se c u e n cia s

ectos sor e
la estim a cin
d el p a r m etr o
p ola cion a l

ectos sore
los errores
tp icos y los test
d e ip tesis

Ponderaciones

m portante

inguno

lta, evita tanto erro-


peigt
res en las estim aciones
com o la aceptacin de
iptesis falsas

E stratos

inguno

m portan te,
los reduce

aja, aunque puede strata

reducir considerablem ente el error de las


estim acion es perm itiendo resultados m enos conservadores

onglom erados inguno

m portan te,
los am pla

edia, evita el que los psu

errores tpicos sean


anorm alm ente bajos
y de ese m odo aceptem os com o ciertas
iptesis dudosas

m p o r t a n cia d e su u so
p a r a e l a n lisis

p cin d e
svyset e n
St a t a

a recom en d acin , por tan to, es qu e para la estim acin d e parm etros
p ob lacion ales, p ara realizar pred iccion es y p ru ebas d e ip tesis se u tilicen
siem p re los in stru m en tos de an lisis de en cu esta. Para el estu dio d e la asociacin en tre dos o m s variables, tam b in se recom ien d a la u tilizacin siem p re
qu e sea posib le d e la in form acin d el m u estreo, p ara poder afin ar m s el an lisis y acerlo m s rob u sto y fiab le. Pero si n o es p osible o resu lta ecesivam en te com p licado, se pu ede acer el an lisis sin u tilizarla, au n qu e ten ien d o
m u ca m s cau tela en lo qu e resp ecta a la validez etern a d e los resu ltad os.

E E

14 .. Un e je m p lo p r ct ico co n St a t a . a s r d e n e s svy
ay d os m an eras de trab ajar con d atos d e m u estr as com p lejas en tata. a
p rim er a es u tilizan d o las in str u ccion es abitu ales de tata, a adien d o u n as
opcion es especficas para u tilizar datos d e en cu esta . a segu n da m an era,
la m s recom en d ab le, con siste en u tilizar las pr ein str u ccion es svd e tata,
qu e son u n con ju n to d e rd en es especficam en te creadas para tr abajar con
datos d e m u estr as com plejas. asi cada in str u ccin de an lisis estad stico
en tata tien e su corr elativa or den sv
, qu e es eactam en te la m ism a, pero
aju stada para tr abajar con d atos de en cu esta. s, regress tien e sv
:regress,
logit tien e sv
:logit, etc. E n p rin cip io, fu n cion an eactam en te igu al qu e su
equ ivalen te sin pon der acin , ya ep licada, por lo qu e n o se con tem pla d eten id am en te la eplicacin d e cad a or den sv
, sin o qu e m s bien se ep lica el
fu n cion am ien to gen eral de estas in stru ccion es.
u an do se tr ab aja con d atos de en cu esta, lo pr im ero qu e es n ecesar io
acer es acu d ir a la docu m en tacin d e los datos y estu diar en detalle cu l
fu e la m etod ologa segu ida en el m u estr eo. i se u tiliz m u estreo aleator io
sim ple, n o ace falta u sar las in stru ccion es sv
. i se u tiliz algu n a form a
de m u estreo com p lejo, se deben bu scar los tr es elem en tos vistos m s arr iba

pon d er acin , con glom er ad os y estratosy u tilizar los qu e sean r elevan tes,
en fu n cin del d ise o m u estr al y d e la in for m acin d ispon ib le. a variable
de p on deracin su ele estar p resen te en la gran m ayor a de las bases de datos
de en cu esta, lo qu e n o ocu r re con la in form acin sobr e u n idades p rim ar ias
y estr atos. veces la d e con glom erados
o u n idad es p rim ar ias de m u estreo
est disp on ible: en m u cas en cu estas, p or ejem p lo, u n a d e las var iables es
la seccin cen sal. a variab le de estratos, en cam bio, n o su ele apar ecer en
los d atos pr op orcion ados por los in stitu tos estadsticos. E n algu n os casos es
posible recon stru irla con la in form acin d e la docu m en tacin m etodolgica

por ejem p lo, si ay d os estr atos en fu n cin del tam a o d e la em p resa


m s
y m en os de trabajadores
, se pu ede crear u n a var iable, estrato, qu e con ten ga si tien e m en os de tr abajad ores y si tien e m s
, m ien tr as qu e
en otr as ocasion es es im p osib le. om o ya se a d ico, la n o u tilizacin d el
estr ato n o com pr om ete la estim acin de parm etr os, sin o qu e sim p lem en te
ace qu e los er ror es tpicos sean m ayor es
vase seccin .
.
n a vez con ocida la in for m acin m u estr al, d ebe p rop orcion rsela a tata m edian te la ord en sv
set. E sta in str u ccin sir ve eclu sivam en te par a eso,
par a decirle a tata cu les son las var iables de p on deracin , con glom erad os
y estr atos.

E sto es posible a adien do a la instru ccin


por ejem plo, a regressla opcin
pweight
peso
an tes de la com a
, don de peso es la variable de ponderacin si la m u estra es polietpica,
a de se alarse cu l es la variable qu e con tien e in form acin sobre las un idades prim arias de
m u estreo con la opcin clu ster
variable
. in em bargo, regress no perm ite ten er en cu en ta los
estratospara ello an de em plearse las rden es sv
.

ANLIS IS DE DATOS CON S TATA

... stablecer la in
orm acin m u estral: la in stru ccin svyset
ase u n ejem plo. e va a estu diar, con la n cu esta de alidad de ida en el
raba
o de , la satisfaccin de los asalar iados con su em pleo. i se estu dia la m etodologa de esta en cu esta, se d escu br e qu e se r ealiz u n m u estreo trietp ico con estr atificacin de las u n id ades d e p rim er a etapa. as
u n idades de pr im er a etap a fu er on seccion es cen sales, qu e se estr atificar on
en fu n cin del tam a o del m u n icipio, estab lecin dose cin co estr atos con
m u estras in d ep en d ien tes. en tr o de cad a seccin cen sal, se seleccion ar on
fam ilias
u n idad es d e segu n d a etap ay den tr o de las fam ilias, a p oblacin
ocu pad a de m s de a os
u n id ades d e ter cer a etapa
. r as la realizacin
d e la en cu esta, se ap licar on factores d e r eequ ilib rio o aju ste p ar a cor r egir
las d iferen cias d e la m u estra fin al con la p ob lacin en tr m in os de situ acin
p rofesion al, edad y seo. Por tan to, en este caso eisten los tres elem en tos
vistos m s arr ib a.
E n la docu m en tacin se advier te u n a variab le d e p on d eracin , llam ad a pon d, as com o u n a variab le
vqu e in cor pora in for m acin sobr e el
n m er o d e or den d e la seccin cen sal. e lo qu e n o se dispon e es de u n a
variab le qu e con ten ga los estr atos, y tam poco p u ed e r econ str u irse, pu esto
qu e, au n qu e eiste u n a var iable d e tam a o del m u n icip io, las categor as
n o coin ciden con las qu e se aplicaron en la estr atificacin de las seccion es
cen sales. Por ello, se em p lear p on deracin y u n idades p rim ar ias, p er o n o
los estr atos
con lo qu e son pr evisibles er ror es tpicos algo m ayores d e los

r eales
.
Par a dar a tata esta in for m acin , se em p lea la in str u ccin sv
set con el
p eso en tr e corcetes y las op cion es n ecesarias, slo psu (), en este ejem p lo, y
p ara obten er u n a descr ip cin d el resu ltado se u tiliza la in stru ccin sv
des.
svyset
p eigtp on d
, psu
v
svyd es

a pan talla de r esu ltad os d e tata m u estr a, en con secu en cia, la disp osicin m u estr al:

e m odo aproim ado podra utilizarse la com u n idad au tnom a


vy
o el bitat
v
com o estratos. E n el ficero con los ejem plos de este captu lo se an in cluido las in struccion es
con esa especificacin, para qu e el u su ario las cam bie para los ejercicios fin ales.

E E

USR AC
14 .1.

De sc r ip ci n d e la m u e st r a c o m p le ja

Sur v ey: Des c r i bi ng st age 1 s ampl i ng uni t s


pwei ght :
VCE:
Si ngl e uni t :
St r at a 1:
SU 1:
FPC 1:

St r at um
-------1
-------1

pond
l i near i zed
mi s s i ng
<one>
v294
<z er o>

#Uni t s
-------430
-------430

#Obs
-------5998
-------5998

#Obs per Uni t


---------------------------mi n
mean
max
-------- --------------10
13. 9
15
-------- --------------10
13. 9
15

a u tiliza cin de la ord en sv


set requ ier e la sigu ien te in for m acin : la
pon dera cin (pweight), los estr a tos (strata ) y los con glom er ad os (psu ).
om o en sv
set slo se a n especifica d o pweight y psu , tata con sid era
qu e slo ay u n estra to, qu e in clu ye a toda la m u estra . i u b ier a estr a tos,
se deber a especifica r stra ta (estra to) tra s la op cin psu . r as sv
set, se a
in tr odu cido la in stru ccin sv
des, qu e sirve pa ra d escr ibir la in for m a cin
sob re la m u estr a a lm a cen ad a en la m em or ia d e ta ta. r as estos elem en tos, ap a rece u n r esu m en de los da tos de los estra tos y los con glom er a dos:
el n m ero d e estr a tos qu e a y, cu n tos con glom era dos a y p or estr ato, y
cu n ta s observa cion es p or estra to y p or con glom era do. E n este caso, slo
ay u n estra to, con P
u n ida des p rim ar ia sy .observa cion es.
ad a u n a de la s u n id a des p rim ar ia s tien e en tre y observa cion es, con
u n a m edia d e ,
a pr oim a da m en te fu eron en trevista d os in dividu os
en ca da con glom er a do
.

... stim acin de m edias proporcion es


n a vez qu e se dispon e d e la in form acin sobre las caractersticas d e la
m u estr a y la p on d er acin , se p u ed en r ealizar estim acion es con las in str u c
cion es sv
. as rd en es par a r ealizar estim acion es p oblacion ales u n ivariab les son distin tas d e su s equ ivalen tes sin m u estreo, p or lo qu e ser n ep licadas con m ayor d etalleal con tr ario qu e las r den es d e an lisis estadstico
b ivar iado y m u ltivar iado, qu e son b sicam en te igu ales a su s om logas sin

ay qu e prestar aten cin a la versin que se em plea de tata, ya qu e con an terioridad


a la versin , las in stru ccion es svn o se form u laban com o preinstru cciones, sin o com o instru cciones precedidas por la palabra sv
. E sto im plica dos diferen cias prin cipales: u na, los dos
pun tos con los qu e ay qu e escribir las nu evas rden esla otra es que las opciones de su rve
an de aparecer an tes de los dos pun tos, en lu gar de al fin al, com o an teriorm ente.

ANLIS IS DE DATOS CON S TATA

p on deracin , p or lo qu e slo se con tem p lar n algu n os ejem p los. E n tod os


los casos se com par ar n los r esu ltados con y sin el u so de pon der acion es y
P, para ilu str ar su u tilid ad .
ase en pr im er lu gar cm o estim ar p rop orcion es. n a var iable qu e sirve de in d icad or apr oim ad o de la satisfaccin laboral es la de b squ eda
d e u n em p leo distin to d el actu al
si algu ien bu sca otr o em p leo, n o debe de
estar m u y con ten to con el qu e ya tien e
. E n la ilu str acin .se m u estra
la estim acin d e la p ropor cin de per son as qu e b u scan otr o em pleo sin u tilizar la in form acin de la m u estr a
con la orden tabu late, qu e se eplica en
los cap tu los y y con la in stru ccin sv
: proportion , qu e es su equ ivalen te p ar a m u estras com plejas:
tab u late vif asal
svy, su bp op
a sal
: p roportion v

E stas dos in stru ccion es gen er an sen d as estim acion es de las p rop or cion es de la variable b su eda de otro em pleo:

USR AC
14 .2 .

st im a ci n d e p r o p o r cio n e s e n m u e st r a s c o m p le ja s

bsqueda de |
ot r o empl eo |
Fr eq.
Per c ent
Cum.
- - - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - si
|
451
9. 63
9. 63
no |
4, 232
90. 37
100. 00
- - - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - Tot al |
4, 683
100. 00

Sur v ey : Pr opor t i on es t i mat i on


Number of s t r at a =
Number of PSUs
=

_pr op_1: v42 =


_pr op_2: v42 =

1
430

Number
Popul at
Subpop.
Subpop.
Des i gn

of obs
i on s i ze
no. obs
s i ze
df

=
=
=
=
=

5998
6020
4683
4799. 5
429

si
no

-------------------------------------------------------------|
Li near i z ed
| Pr opor t i on
St d. Er r .
[ 95% Conf . I nt er v al ]
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - v 42
|
_pr op_1 |
. 1042389
. 0055767
. 0932778
. 1151999
_pr op_2 |
. 8957611
. 0055767
. 8848001
. 9067222
--------------------------------------------------------------

om o slo son de in ter s los valor es d e los asalar iados, se seleccion an


aqu ellos casos en los qu e la var iable asal es igu al a . qu ay qu e co-

E E

m en tar u n a cu estin im p ortan te. u an d o se trabaja con d atos de m u estras


com plejas, y se qu iere u tilizar u n a su bm u estr a
com o, por ejem p lo, en este
caso los asalar iados
, n o se p u ed en sim plem en te qu itar los datos d e la m atr iz
por ejem p lo, con la in str u ccin dropy an alizar los datos seleccion ad os. a p on d eracin est eca para qu e el total de las ob ser vacion es d e la
m u estr a sean r ep resen tativas d el total d e los in divid u os de la pob lacin : si
se trab aja con u n a su b m u estra esa p on d er acin n o sir ve. Por eso, cu an d o se
d eseen u tilizar su bm u estr as, com o en este caso, abr qu e u tilizar la opcin
su bpop() de las r den es sv
. on esa opcin
d en tro del p ar n tesis, debe
aber u n a var iable qu e ten ga u n valor d istin to de
recom en d ab le el en
aqu ellos casos en qu e se n ecesiten in clu ir en el an lisis
, tata u tiliza todas
las ob ser vacion es, au n qu e las estim acion es slo acen referen cia a los casos
d e la su b m u estra especificad a. s, p u ed en estu diar se su b m u estr as sin ten er
r esu ltados sesgad os.
Pa sa n d o ya a l a n lisis en s d e la s sa lid a s d e a m b a s ta b la s
con y sin
p on d er a cion es
, se p u ed e ver cla r a m en te la d ifer en cia en la s estim a cion es d e los p a r m etr os p ob la cion a les u tiliza n d o la in for m a cin d el m u estr eo. in p on d er a cin , la estim a cin d el p or cen ta je d e a sa la r ia d os qu e
b u sca otr o em p leo es d el ,. l u tiliza r la in for m a cin d el m u estr eo,
la estim a cin es d e ,
en la sa lid a d e sv
:proportion n o a p a r ece
com o p or cen ta je, sin o com o p r op or cin sob r e
,

, o sea , ca si u n
p u n to m s. ep en d ien d o d e los ob jetivos d el a n lisis, el er r or d e la estim a cin p u ed e ser m s o m en os im p or ta n te
u n p u n to en la estim a cin
d el p or cen ta je d e p a r o p u ed e ten er u n a gr a n im p or ta n cia , p or ejem p lo
.
E n cu a lqu ier ca so, si se d isp on e d e la in for m a cin m u estr a l, p or r a zon es
d e cor r eccin y d e va lid ez cien tfica , siem p r e es a con seja b le u sa r la en
la s estim a cion es. os er r or es tp icos d e la s p r op or cion es, ob via m en te,
ta m b in son m s cor r ectos, lo qu e p er m ite esta b lecer u n os in ter va los d e
con fia n za cr eb les.
E n el caso de estim acin de m ed ias, la in stru ccin pasa a ser sv
:m ean ,
en lu gar de sv
:proportion .
ci vif valsat
svy, su bp op
valsa t
: m ean v
esta t effects

ANLIS IS DE DATOS CON S TATA

USR AC
14 .. st im a ci n d e m e d ia s e n m u e st r a s co m p le ja s
Var i abl e |
Obs
Mean
St d. Er r .
[ 95% Conf . I nt er v al ]
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - v92 |
4648
7. 100473
. 0290105
7. 043599
7. 157348

Sur v ey : Mean es t i mat i on


Number of s t r at a =
Number of PSUs
=

1
430

Number
Popul at
Subpop.
Subpop.
Des i gn

of obs
i on si z e
no. obs
si z e
df

=
=
=
=
=

5998
6020
4648
4763. 2
429

-------------------------------------------------------------|
Li near i z ed
|
Mean
St d. Er r .
[ 95% Conf . I nt er val ]
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - v92 |
7. 085379
. 0371132
7. 012433
7. 158325
----------------------------------------------------------------------------------------------------------------------|
Li near i z ed
|
Mean
St d. Er r .
DEFF
DEFT
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - v92 |
7. 085379
. 0371132
1. 6584
1. 28779
----------------------------------------------------------

E n la ilu stracin .se m u estr a en pr im er lu gar la m ed ia de satisfaccin con el trabajo u tilizan d o la in str u ccin ci, qu e n os d a, ad em s de la
m ed ia, los in ter valos de con fian za de esa m edia . E iste d ifer en cia, au n qu e
p equ e a. in pon deracin , la m ed ia d e satisfaccin en el tr abajo de los asalariad os esp a oles es de ,con p on deracin es liger am en te in fer ior, d e
,. E n cam b io, el er r or tpico d e la m edia en los d atos pon der ad os es m ayor
,fren te a ,
, com o corr esp on de a u n m u estr eo por con glom er ados en dos etap as, lo qu e afecta tam b in al in tervalo d e con fian za, qu e en
la m u estra p on derada es m ayor. e n u evo, las d ifer en cias en la estim acin
n o son m u y gran des, au n qu e algo m ayores son los err ores tp icos.
E sp ecialm en te r evelad or es el clcu lo del efecto del dise o
is
,
qu e se ob tien e con la or den estat e

ects . E ste estad stico in d ica la eficien cia del m u estreo u tilizad o en los d atos. esu lta de d ividir la varian za ob ten ida con los d atos m u estrales en tr e la var ian za qu e se ab ra ob ten ido, si la

om o en el caso anterior, slo se in clu yen los casos de in dividu os asalariados. Por eso,
se especifica la clu sula ivalsat . E n este caso, tam bin se eclu yen aqu ellos casos en los
que n o ay respu esta a la variable satis
accin . a m ism a variable
valsat, igu al a u n o en
los asalariados qu e respon den a la pregu n ta de satisfaccin se u tiliza para definir la su bpoblacin
opcin su bpopde la in stru ccin sv
m ean .

n tes de la versin de tata, el efecto del dise o se proporcion aba au tom ticam en te
al solicitar la m edia. esde esta versin , ay qu e pedirlo eplcitam en te m edian te la orden estat
e

ects.

E E

m u estr a u bier a sid o aleator ia sim ple. u an to m s pequ e o sea el valor d e


e

, m s eficien te es el m u estr eo aplicad o, y vicever sa. alor es m en ores a


in d ican u n a redu ccin en la varian za
y, p or tan to, u n a m u estr a m ejor a la
qu e se abra ob ten ido si se u b iera realizado m u estr eo aleator io sim p le

valor es su p er ior es a in dican u n au m en to en la varian za y, p or tan to, u n


m u estr eo m en os eficien te qu e el aleatorio sim p le. E n este caso el valor es
,, in d ican d o u n a m u estr a m en os eficien te qu e la obten id a con m u estr eo
aleator io sim p le. E sta m en or eficien cia se eplica por dos cosas: prim ero,
p or qu e au n qu e sea m en os eficien te es m s barata
com o decam os, los con glom er ados redu cen los costes au n qu e au m en tan los er ror es tpicos
y, segu n do, porqu e al n o d isp on er de la in form acin n ecesar ia sob re los estr atos
p ar a in trod u cirla en las estim acion es con r den es sv
, la var ian za estim ada
es an orm alm en te alta
deber a ser m en or
. in alm en te, e
t es la r az cu ad rada del efecto del m u estreo.

... om paracin de m edias tablas de con tin gen cia


i se d esea r ealizar estim acion es realm en te aju stad as y fiab les, es absolu tam en te n ecesario u tilizar las p on deracion es y el r esto de la in form acin
m u estr al. Par a an alizar r elacion es en tr e variab les, en p rin cip io, n o es tan
crtico el u so de la in form acin m u estral, au n qu e tam bin es m u y acon sejab le, pu es redu ce la posib ilid ad d e com eter err ores.
Par a m ostrar u n ejem plo de d ifer en cias, se p resen ta a con tin u acin la
r elacin en tre b squ eda d e otro em p leo y satisfaccin en el tr abajo, realizan d o u n a com par acin de m edias:
b ysort v: ci vif valsat
svy, su bp op
valsa t
: m ean v, over
v

e su pon e qu e se con oce la in str u ccin b


sort, qu e sir ve para ejecu tar
in stru ccin en dos o m s categor as d e u n a var iable determ in ada. E n este
caso, se d esea ob ten er m ed ian te la ord en ci la m edia y el in tervalo d e con fian za de la satisfaccin en el tr abajo en fu n cin de si el trabajador est
b u scan do otr o em p leo. os tr abajad ores qu e estn bu scan do otr o em p leo
tien en u n a satisfaccin labor al bastan te m en or
casi dos p u n tosqu e los
qu e tien en in ten cin de p er m an ecer en l, al m en os a cor to plazo. as difer en cias en tre las estim acion es con y sin pon d er acin son pequ e as, d e
n u evo, au n qu e algo m ayores en el caso d e los tr abajad ores qu e estn b u scan d o otr o em p leo
de ,a ,
. os err ores tpicos son algo m ayores
tam b in en am b os casos, lo qu e agr an da los in ter valos de con fian za de la
estim acin de la m edia. ay qu e llam ar la aten cin sobre la im por tan cia
d e este eco. u n qu e aqu n o su cede, pod ra ocu rr ir qu e el err or tpico se

ANLIS IS DE DATOS CON S TATA

agran d ase tan to con la pon d er acin qu e los in tervalos de con fian za al
se cr u zasen , d e m odo qu e n o se tu vier a segu r id ad p ar a decir qu e la difer en cia ob ser vad a en tr e las m edias de am bos gru p os eistier a r ealm en te en
la p oblacin y n o se d eb iera a er ror es de m u estreo. Por ello, es acon sejab le
u tilizar la in form acin sobr e p on d eracion es y con glom er ad os en la estim acin de m edias y p ropor cion es.

USR AC
14 .4 .

s t im a ci n p o r in t e r a lo s d e la s m e d ia s e n d o s gr u p o s

- > v 42 = si
Var i abl e |
Obs
Mean
St d. Er r .
[ 95% Conf . I nt er v al ]
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - v92 |
449
5. 52784
. 1076234
5. 31633
5. 739349
_______________________________________________________________________________
- > v 42 = no
Var i abl e |
Obs
Mean
St d. Er r .
[ 95% Conf . I nt er v al ]
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - v92 |
4199
7. 268635
. 0287981
7. 212176
7. 325095

Sur v ey : Mean es t i mat i on


Number of s t r at a =
Number of PSUs
=

_s ubpop_1: v 42 =
_s ubpop_2: v 42 =

1
430

Number
Popul at
Subpop.
Subpop.
Des i gn

of obs
i on si z e
no. obs
si z e
df

=
=
=
=
=

5998
6020
4648
4763. 2
429

si
no

-------------------------------------------------------------|
Li near i z ed
Over |
Mean
St d. Er r .
[ 95% Conf . I nt er val ]
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - v 92
|
_s ubpop_1 |
5. 562022
. 1067634
5. 352177
5. 771866
_s ubpop_2 |
7. 2633
. 0365404
7. 19148
7. 335121
--------------------------------------------------------------

E l ejem p lo sigu ien te es d e tablas de con tin gen cia. om o en los casos
an ter iores se solicita en p rim er lu gar el an lisis sin pon d er ar y lu ego el pon d erado par a qu e se adviertan las difer en cias.
tab u late vvif asa l , col
svy, su bp op
a sal
: tabu la te vv, ob s col per se ci

on la in str u ccin sv
:tabu late pu ede obten erse u n cru ce de var iables
idn tico al realizad o con la in stru ccin tabu late, ya eplicada en el captu lo
d e tablas. E l for m ato es p ar ecido, au n qu e p ara con segu ir qu e m u estre las

E E

obser vacion es com o la in str u ccin tabu late y las p rop orcion es en p orcen tajes, deben a adir se las op cion es obs y per. o qu e m u estran am bas tab las
es u n cr u ce de la var iable qu e in dica si el trabajador est bu scan do otro
em pleo, p or or ar io n octu r n o
parece razon ab le qu e el orar io n octu rn o
lleve a los trab ajador es a n o estar tan con ten tos con su em pleo y, por tan to,
a bu scar otr o
. a relacin , tan to en la tabla con pon der acin com o en la
tab la sin ella, n o es sign ificativa
seg n las p ru ebas d el ciy d e la
. l
aplicar pon der acin y P, los p or cen tajes d e los qu e qu ier en cam biar su
em pleo se elevan , sobr e tod o en el caso de los qu e tr abajan siem p re d e n oce. os estad sticos de asociacin de las variab les n o ap arecen en la or den
sv
:tabu latesi se requ ieren , p u ed en u sarse los de los d atos sin pon d er ar,
p u es la in form acin sob re la r elacin en tre variab les n o se ve tan afectad a
p or el u so o n o de pon d er acin o dem s in for m acin m u estral. E n cu alqu ier
caso, se recom ien da qu e siem pr e qu e se p u ed a se u tilicen las p on d er acion es
y la in for m acin m u estr al par a au m en tar la fiabilid ad de las estim acion es.

USR AC
14 .. a la s d e co n t in ge n c ia e n m u e st r a s co m p le ja s
Number of s t r at a
Number of PSUs

=
=

1
430

Number
Popul at
Subpop.
Subpop.
Desi gn

of obs
i on s i z e
no. of obs
si ze
df

=
=
=
=
=

5998
6020
4683
4799. 505
429

---------------------------------------------------------------------bs queda |
de ot r o
|
hor ar i o noct ur no
empl eo
|
s i empr e
a v ec es
nunc a t
Tot al
- - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - si |
15. 23
11. 06
10. 04
10. 42
|
( 3. 024)
( 1. 296)
( . 6139)
( . 5577)
| [ 10. 19, 22. 17]
[ 8. 756, 13. 87]
[ 8. 892, 11. 31]
[ 9. 378, 11. 57]
|
26
75
350
451
|
no |
84. 77
88. 94
89. 96
89. 58
|
( 3. 024)
( 1. 296)
( . 6139)
( . 5577)
| [ 77. 83, 89. 81]
[ 86. 13, 91. 24]
[ 88. 69, 91. 11]
[ 88. 43, 90. 62]
|
164
725
3343
4232
|
Tot al |
100
100
100
100
|
|
|
190
800
3693
4683
---------------------------------------------------------------------Key :
col umn per c ent ages
( l i near i z ed s t andar d er r or s of col umn per c ent ages )
[ 95% c onf i denc e i nt er val s f or c ol umn per c ent ages ]
number of obs er v at i ons
Pear s on:
Unc or r ec t ed
Des i gn- bas ed

c hi 2( 2)
=
F( 2. 00, 857. 09) =

7. 4185
2. 1268

P = 0. 1199

dem s de m ostrar los porcen tajes y el test de in depen den cia de la tabla, sv
:tabu late pu ede calcu lar otros estadsticos qu e n o se obtien en con la

ANLIS IS DE DATOS CON S TATA

in stru ccin n orm al tabu late. as opcion es se y ci acen qu e, ju n to con las


proporcion es de cada casilla, tata m u estre el error tpico de la proporcin ,
as com o el in tervalo de con fian za al de esa proporcin
ilu stracin .
.
s, se detecta claram en te por qu la relacin en tre la b squ eda de otro em pleo y el ten er u n orario n octu rn o n o es sign ificativa: los in tervalos de con fian za de las distin tas casillas se cru zan . sea, seg n los datos, pu ede afirm arse
con u n de segu ridad qu e en tre el , y el , de los qu e
trabajan siem pre por la n oce bu scan otro em pleoqu e en tre el , y el
, de los qu e trabajan a veces de n oce bu scan otro em pleo, y qu e en tre
el , y el , de los qu e n u n ca trabajan de n oce bu scan otro em pleo.
sea, qu e es perfectam en te posible qu e los tres gru pos bu squ en em pleo con
u n m ism o porcen taje. Por ejem plo, podra ser
de acu erdo con los datos ob ten idosqu e en los tres casos u biese u n de trabajadores bu scan do otro
em pleo. Por tan to, pu ede con clu irse qu e la relacin qu e se observa en la tabla
n o es sign ificativa.

... tras in stru ccion es svy


om o se a com pr obad o, las rd en es m s abitu ales d e tata tien en su
corr espon dien te in str u ccin p ara m u estras com plejas. E n gen er al, todas se
u san d el m ism o m od o qu e la or den n orm al, con algu n as liger as diferen cias derivadas del eco de qu e estn aju stad as par a su u so con datos de
m u estras com plejas
la m ayor p ar te d e las op cion es qu e aceptan las r den es
sv
:m ean , sv
:proportion y sv
:tabu late vistas asta aora tam b in se pu eden
u tilizar con las otras in str u ccion es sv

. Per o esas liger as d ifer en cias son


m s tcn icas qu e otra cosa: en trm in os pr cticos, par a acer an lisis m u ltivariab le d e d atos d e m u estr as com plejas, b asta con segu ir las p au tas qu e
se an acon sejado: p rim ero estu d iar las caractersticas de la m u estr a, lu ego
d arle la in for m acin a tata con la or den sv
set y acer el an lisis u tilizan d o la in str u ccin svqu e sea per tin en te.
E n con cr eto, d e la s tcn icas qu e se a n estu dia do en este m a n u a l,
ca be d esta ca r la r egr esin y el logit. E n a m b os ca sos eiste la in stru ccin
svesp ecfica
sv
:regress y sv
:logit
, qu e p er m ite u tilizar la p on d er a cin
y otr a in form a cin m u estra l p a ra acer a n lisis y estim a cion es com pleja s y m u ltiva riad as. a form a d e a cer lo es ea cta m en te igu al qu e la qu e
se a ep lica d o a n ter iorm en te: especifica cin de las ca ra cterstica s d e la
m u estr a con sv
set y em p leo de la in stru ccin pr ecedid a p or sv
:. i se
n ecesita r ea liza r pr ediccion es p ar a in terp reta r los r esu ltad os o a cer d ia gn sticos d e a ju ste del m od elo, se rea liza n tam bin ea cta m en te d el m ism o
m od o, u tilizan d o la in str u ccin predict tr as la estim a cin d el m odelo lin ea l
o loga rtm ico. Pa ra esta s estim a cion es poster iores n o a y u n sv
predict n i
n a da pa r ecid o, pu esto qu e la in form a cin sobr e el m u estreo ya a afectad o pr eviam en te a la estim a cin d el m odelo y a la de los pa r m etr os, y es a

E E

pa rtir de estos con lo qu e se gen er a n la s p rediccion es, r esidu os o m edid a s


sim ila res.

14 .4 .

je r cicio s

. E ste captu lo fu e origin alm en te escr ito en la versin y a sido poster iorm en te m od ificad o par a la versin de tata. as in str u ccion es
vien en en d os ficer os: capitu loy capitu lob. on la pr ecau cin d e
in d icar la ver sin an ter ior al in icio, tata es cap az de ejecu tar ficeros
con in str u ccion es ob soletas en las n u evas version es. om pr u eb a esto y
an aliza las diferen cias qu e se p rodu cen en los r esu ltad os.
. tiliza el ficer o d e p rogram a de la ver sin
cap itu lo.docam b ian do la especificacin del m odelo d e m u estreo. sa, en p rim er lu gar, la
var iable h bitat
vcom o estr ato, adem s d e las u n id ades pr im ar ias.
espu s, reem plaza el estr ato por la com u n idad au tn om a. in alm en te,
r ealzalo por el cr u ce de com u n idad au tn om a por bitat.
. on los datos
d aecvtcon los qu e se a r ealizado este captu lo, realiza u n a regresin lin eal con d atos sin p on derar y p on derados de la satisfaccin por el trabajo
vsobr e el n m er o de oras trabajadas
v
,
el or ar io n octu rn o
v
, el tr abajo en sbado
vy el tr abajo en
dom in go
v
.
. el m ism o m odo qu e en el ejer cicio an ter ior, az p on d er ada y n o p on der ad am en te u n a regresin logstica de b u scar em pleo
vsobr e las
m ism as variab les.

15
Bib lio gr a fa co m e n t a d a
Acock, A. C. (2006): A Gen tle In trodu ction to Stata, College Sta tion (TX): Sta ta Press.
In trodu ccin a Stata u a ccesile de la ersin 0.0, en su segu n da edicin,
a sada rin cialen te en u n u so de este rograa edian te en s. rien ta do
acia la sicologa la s cien cias, sociales, ersigu e el aren dia
e de u en os
itos estadsticos e in
or ticos en tre los u su arios de Stata. In clu e an lisis

actorial.
A
i
i, A. A. et a l. (200): Com pu ter-Aided Mu ltivariate An a lysis (2 ed.), u ea ork:
Caa n all.
iro de an lisis u ltiariado u sico, don de se elica n edian te e
elos
los rin ciales con cetos estadsticos. Tra a
a con P, SSTAT en su segu n da
ersin con S
PS.
Agresti, A. (2002): Ca tegorical Data An alysis, ooken (
):
on ile Son s.
Tra tado de tio edio sore el an lisis de da tos n oin ales. Ades de logit
logit contien e odelos lin eales
logarticos.
Aldric,
. . . . elson (): Lin ea r Probability, Logit, an d Probit Models, on
dres: Sa ge.
iro sico de la coleccin erde de Sage. Idea l ara in troducirse en regresin
logstica.
Allison, P. (): ven t istory An alysis. egression
or Lon gitu din al ven t Data, on
dres: Sa ge.
An dersen , . . (): In trodu ction to te Statistical An alysis oCa tegorical Da ta, er
ln
u ea ork: Srin ger.
Au nue se llae in trodu ccin es u n an u al in teredio ara el an lisis de talas
de con tin gen cia. Presta esecia l an tencin a los odelos log
lin ea les de stos
aorda los odelos logit.
Aorn , .
. . S nce
Creso (6): Mtodos y aplicacion es del m u estreo, adrid:
Alian a .
n cl sico esa ol del u estreo.
a u, C. . (2006): An In trodu ction to Modern con om etrics sin g Stata , College Sta
tion (TX): Stata Press.
iro de n atu ralea u rctica ara estu dia ntes de econ oetra u e u ieran
u sar Sta ta. In clu e series teorales, datos de an el ariales instru en ta les,
ades de los a n lisis sicos. st orien tado a gen erar sen cillos
iceros .do
a ra las tareas reetitias.
(200): An In trodu ction to Stata Progra m in g, College Station (TX): Stata Press.

CAS TICS

iro esecia liado en la rogra acin con Sta ta. Slo ara a u ellos u e u iera n
acer rograas roios.
eaton, A. . . Tuke(): Te ittin g oPoer Series, ean in g Poln oials,
Illu strated on an d
Sectroscoic a ta, ecn om etrics, 6: 6
.
Artcu lo de re
erencia a ra las regresion es rou stas.
elsle
, . A. et a l. (0): egresion Diagn osticsIden ti
yin g In
lu en tia l Data a n d Sou rces oCollin ea rity, uea ork:
on ile Son s.
ern ardi, . (2006): l An lisis de la istoria de acon tecim ien tos, adrid: Cen tro de
In estigacion es Sociolgicas.
on ogr
ico sore an lisis de la istoria de acon teciien tos con n u erosos
e
elos realia dos con Stata u licado en esta isa coleccin or un o de los
au tores de este liro.
lalock, . . (66): stadstica Socia l, ico: C.
Cl sico de la sta dstica con a u n da ntes elicacion es de la ateria ara erso
n as con oca ase a tetica.
loss
eld, . P. . oer (200): ecn iu es oven t istory Modelin g. e Approaces to Ca u sal An alysis (2ed.), aa(
): rlau .
orroa , . . (200): Logit an d Probit. rdered an d Mu ltin om ial Models, ondres:
Sage.
iro esec
ico en la con ocida serie erde de Sage ara logits roits ordin a les
u ltin oia les. Au n sien do de 200, a usa Stata coo rograa rin cial.
Cau ac, . C. ontes (200): Stata Par la Pra ctiu eStatistiu es, Grapiu es et
lm en ts de Program m ation, College Station (TX): Sta ta Press.
an u al
ra ncs ara in iciacin del rogra a. Se cen tra esecialen te en las
rden es de Stata, sin olida r de elicar con claridad los con cetos la in terre
ta cin de los resu ltados. Con tien e ta in u n a in trodu ccin a la rograacin
recu rre tain a in stru ccion es adiciona les del rogra a u e u eden oten erse
de in tern et. edica u n ca tu lo a la eorta cin de resu lta dos a otros rograas
coo rocesadores de tetos, es e inclu so aTeX.
Caeron , A. C. P. . Trieldi (200): Microecon om etrics sin g Stata, College Sta tion
(TX): Stata Press.
an u al de Sta ta esecia len te dirigido a la econ oetra. In clu e teas a a na
dos coo siu lacin , n ios cu a drados gen eraliados, ariales instru en ta
les, datos de an el, regresion es n o lineales. Todo ello con eleen tos sicos de
rograa cin a tricial.
Caroll, . . an n an (2000): e Dem ograpy oCorporations a n d Indu stries, Prin
ceton (
): Prin ceton n iersitPress.
Castro, T. (): Pau tas recien tes en la
oracin de are
a, evista In tern aciona l
de Sociologa , 2: 2
.
Cea, . . (2002): An lisis m u ltiva riable. eora y prctica en la in vestiga cin social,
adrid: Sn tesis.
Con tien e ca tu los con u cos tiles e
elos rcticos de regresin logs
tica , ero sin nin gu n a re
eren cia a Sta ta.
Clees, . et a l. (200): An In trodu ction to Su rvival An alysis sin g Stata , College Sta
tion (TX): Stata Press.
iro de an lisis de su erien cia edian te el rograa Sta ta a ra u ien es n ece
sitan a licar este tio de an lisis a su s datos. Prin cia len te orien ta do a cien t
i
cos de la salu d, ero tain u til a econ oistas, socilogos olitlogos.

AIS IS ATS C S TATA

Cocran , . . (): cn icas de Mu estreo, ico: CCSA.


n o de los an u ales clsicos de u estreo.
Cook, . . S. eiserg (): ia gn ostic
or eteroceda sticitin egression ,
iom etria, 0():
0.
Co, . (2): egression s odels an d i
e
Tales,
ou rn a l ote oyal Sta tistica l
Society, :
220.
Co, .
. (): a bCiStata Modu les
or a bu la tion an d Ci-Su are a ss, oston
College, eartent ocon oics.
u tin as de Coara el clcu lo de residu os a
u sta dos en las talas de con tin gen cia .
(200): Seakin g Stata : rain g Categorica l an d Coosition al a ta, e
Stata
ou rn al, (2): 0
2.
u tin as de Coara la oten cin de gr
icos ca tegricos. Contien e la s elicacio
n es de rogra a s irescin diles ara la reresen tacin de ariales cu alitatias.
Se recoien dan esecialen te ca tplot tabplot.
Cua dras, C. . et al. (6): u ndam en tos de estadstica. Aplicacin a la s cien cias
u m an as, arcelona : oluinosa rigu rosa in troduccin a la sta dstica ara
u ien es tengan u en a a se atetica.
ieka n n, A. (): i

usion an d Surial odels


or te Process on trin to
arriage,
ou rn a l oMa tem a tica l Sociology, :
.
(2): Te og
ogistic istriu tion a s a odel
or Social i

u sion Processes,

ou rn al oScienti
ic In du strial esearc, : 2
20.
o,
. .
. . n ders(200): u ltin oia l Proit an d u ltin oia l ogit: A
Coarison oCoise odels
or otin g esea rc, lectoral Stu dies, 2: 0
22.
eritt, . S. (): e An alysis oCon tin gency a bles. on dres: Caan an d all.
sica in trodu ccin a las talas de con tin gen cia .
scoar, . (): An lisis gr
ico
eploratorio, a drid: a u ra lla
esrides.
n a introdu ccin a la stadstica a
o la aroiacin del an lisis elora torio.
a rca erran do, . (): Socioestadsticaintrodu ccin a la estadstica en sociologa , adrid: Alian a .
In trodu ccin a la stadstica con u ltitu d de e
elos sociolgicos.
onle,
.
. (): Clases a lin eaien to electoral al
ina l del ciclo oltico, en
.
Cara a a (ed.), Desigu alda d y Clases Sociales, adrid: u n da cin Argentaria.
reen e, . . (200): con om etric An alysis (6 ed.), n gleood Cli

s (
): Pren tice
a ll.
In trodu ce a los estu dian tes en la econoetra alica da, in clu en do tcn ica s si
ca s de an lisis de regresin. Coien a con u n a serie de ca tu los in stru en tales
sore lgera atricia l, roailida des esta dstica.
u
arati, . . . C. Porter (200): asic con om etrics, u ea ork: cra
illl
du cation .
n clsico de la econ oetra. Por su s e
elos, e
ercicios
, sore todo, elica
cion es clara s es u n u en liro ara in troducirse en el estu dio de la regresin su s
roleas.
air,
. . et a l. (2006): Mu ltiva ria te Data Ana lysis. on dres: Prentice
all Intern a
tion al.
iro con u ca s tcn ica s d e a n lisis u ltia ria da s a coa a da s de a r tcu los
u e la elea n . Pr escin de d e
r u la s a te tica s se cen tr a en la cor en
sin de los con cetos en la in terreta cin d e la s ta la s los gr
icos esta ds
ticos.

CAS TICS

ailton , . C. (200): Statistics itSta ta. pdated


or ersion , elont (CA):
Toson .
ste es u n o de los e
ores an u ales de Stata . In clu e las in stru cciones la s in ter
reta cion es estadsticas. Prcticaen te con cada ersin de Stata sale u n a edicin
distin ta de este liro.
ile,
. . (200): Logistic egression Models, u ea ork: Caan all
CC.
iro on ogr
ico sore la regresin logstica su s eten sion es, in cluen do logs
tica con datos de a n el. u estra e
elos u sos con Stata .
oser, . . S. eeso (2000): Applied Logistic egression, u ea ork:
on
ile Son s.
n u en a nu a l de re
eren cia de las regresion es logstica s, ordina les u ltin o
iales con u cas re
eren cias a Stata .
u er, P.
. (6): Te ea iou r oa iu ikeliood stiates u n der on
Stan dard Con dition s, Proceedin gs ote i
tereley Sym posiu m on Ma tem atical Statistics a nd Probability, erkele(CA): niersitoCa li
orn ia Press

an n , . (200): Taulation ou ltile eson ses, e Sta ta


ou rn a l, (): 2
22.
Artcu lo don de se docu en ta el uso de la in stru ccin rtaara la elaora cin
de ta la s de resu esta ltile con Stata.

oell, A.
. (): An lisis de egresin Logstica , adrid: Cen tro de In estiga cion es
Sociolgicas.
an u al de esta coleccin sore regresin logstica. leen ta l.
is, . (2): Mu estreo de en cu estas, ico: Trillas.
tro de los clsicos del u estreo.
oler, . . reuter (200): Data An alysis sin g Stata, College Sta tion (TX): Sta ta
Press.
an u al de a n lisis eleental con Sta ta u e elea nu erosos e
elos del an el
socio
econico alen del I (In stitu to Alen de In estiga cion es con
ica s). Su riera ersin
u e escrita en ese idioa . Su traduccin al in gls es
u na se al de su carcter rctico. Su n cleo son las ta la s, los gr
icos las regre
sion es lin eales logstica s.
aal, . (200): Categorica l Data An alysis itSas a nd Spss Aplications, aa
(
): a ren ce rlau Associa tes.
Au n u e n o in clu e Sta ta , se tra ta d e u n u en lir o a r a a a n a r en el a n lisis de
da tos n oin a les: se etien de desde la s ta la s de
r ecu en cia s a sta cla si
ica cin
de ca sos du dosos, in clu en do ta in odelos log
lin ea les r egr esion es logs
tica s.
i, . (): ou st egression , en . C. oaglin , . osteller
. . Tu ke(eds.),
plorin g Data ables, ren ds, an d Sa pes, u ea ork: ile
.
on g,
. S. (200): e or
lo oData An alyis sin g Stata, College Sta tion (TX):
Sta ta Press.
an u al de co la ni
icar el tra a
o con Stata con el
in de realia r a n lisis u e
n os e
icien tes. Presta tain esecial aten cin a co escriir rograa s ti
les. len o de e
elos en Cien cias Sociales.

. reese (2006): egression Models
or Categorical Dependen t ariables sing
Stata. College Station (TX): Stata Press.
n liro u edaggico ara aren der regresion es logsticas su s deria das si
n ecesidad de ten er con ociien tos ateticos. Contien e u n rier catu lo
sore in stru ccion es de Sta ta. Tain es la a se de los rograas Spost, u e son
elicados en este liro en los catu los correson dien tes.

AIS IS ATS C S TATA

addala, . S. (200): Introduction to conom etrics ( ed.), Cicester:


on ileSons.
tro cl sico de la econ oetra.
itcell, . . (200): A isu al Gu ide to Sta ta Grapics, College Sta tion (TX): Sta ta
Press.
s ue or su s elicacion es, este liro soresale or ser u n a lio catlogo de
gr
icos acoa ados or los cdigos con los u e u ede oten erse con Sta ta.
u til ara u ien u iera asar de los gr
icos de cel o SPSS a Stata.
eter,
. et al. (): Applied Statistics, oston (A): Alln an d acon .
iro coleto de stadstica sica, en tre lo s recoen da dos en la dcada de
los 0 a ra cursos in teredios de la ateria.
oa les, A. (): conom etra , adrid: cra ill.
an u al in trodu ctorio a la econ oetra, rin cia len te destin ado a cu rsos de
grado en con oa.
lak, S. (2): e Dyn am ics otnic Com petition an d Con
lict, Stan
ord (CA):
Sta n
ord niersitPress.
Pa raio, . (2000): Cla se oto: in tereses, iden tida des re
eren cia s, evista spa ola de In vestiga cion es Sociolgicas, 0:
.
Pe a, . (a): stadstica , m odelos y m todos.
ol
u n da m en tos, adrid:
Alian a ni
.
(): sta dstica, Modelos y Mtodos.
ol.
Modelos Lin eales y Series em porales. adrid, Alian a niersidad.
(2002): egresin y dise o de eperim en tos, adrid: Alian a ditorial.
ersin reisada del segu n do olu en de la ora stadstica : odelos todos.
n rier lu gar se aorda n los odelos de dise o eerien ta l. n segu n do
lu gar, se resen tan los odelos de regresin , u e ocu an la aor arte del liro,
don de se estu dia la relacin en tre u n a ariale resu esta u n con
u n to de aria
les elicatias u e, en gen eral, n o son con troladas or el in estigador.
(200): u n dam en tos de estadstica, adrid: Alian a ditoria l.
ersin reisada del rier olu en la ora sta dstica: odelos todos. Se
estru ctu ra sigu ien do las eta a s de constru ccin de u n odelo estadstico.

. oo (200): In trodu ccin a la estadstica pa ra la s cien cias sociales, adrid:
cra
ill.
iro rigu roso u sico, ideal ara rin ciian tes.
Pree, C. (200): Mu estreo esta dstico. Con ceptos y problem as resu eltos, adrid:
Pearson du cacin.
an u al de u estreo con gran can tida d de rolea s u estrales resu eltos con
cel SPSS.
Petersen, T. (): An alsis oen t istor, . Arin ger et al. (eds.), a n dbooo
Statistical Modelin g
or te Social an d eavioral Sciences, u ea ork: Plen u
Press.
Pregion , . (): ogistic egression iagnostics, e An n als oStatistics, ():
0
2.
Artcu lo en el u e se desarrolla n edida s de diagn stico ara detectar coorta
ien tos etra os en los odelos logsticos.
a e
esket, S. . eritt (200): A a n dboooStatistica l An a lyses sin g Sta ta
( ed.). oca aton (): Caa n a ll.
s u n liro
orado or catu los in deen dien tes de in estiga cion es dicas
eideiolgica s, elean do odelos an lisis cole
os. Cada catu lo est
acoa ado de u enos e
ercicios.

CAS TICS

A. Skron dal (200): Mu ltilevel an d Lon gitu din al Modelin g sin g Stata, College
Sta tion (TX): Sta ta Press.
iro cen trado en los a n lisis ultin iel u e eriten la coin acin de e
ectos

i
os aleatorios. Pa ra u ien ten ga u n u en n iel de estadstica .
a
ter
, A. . (6): Aroia te a es a ctors a nd Accou ntin g
or odel n cer
ta in tin en era lised in ea r odels, iom etria, (2): 2
266.
ase
,
. . (6): Test
or Seci
ication rror in Cla ssical in ear ea st
Sua res
egression An alsis,
ou rn al ote oya l Statistica l SocietySeries
Statistica l
Metodology
, : 0
.
Artcu lo don de se resen ta el test de ase
odrgu esu n a,
. (): Mtodos de Mu estreo, adrid: Cen tro de In estiga cion es
Sociolgicas.
Teto sico sore tcn ica s de u estro u e in clu e ta nto cu estion es terica s coo
r cticas de dise os u estrales.
u i
aa , . (dir.) (0): Metodologa estadstica pa ra el a n lisis de da tos cu a lita tivos, adrid: Cen tro de In estigacion es Sociolgicas.
iro dedica do al a n lisis de en cu esta s. esde la tala de con tin gen cia a los
odelos log
lin eales.
et al. (): An lisis stadstico de ncu esta sDatos Cu an tita tivos, a drid: AC.
iro dedica do a l an lisis estadstico de datos n oin ales. esde la tala de con
tin gencia a los odelos log
lineales.
S n ceCarrin ,
.
. (): An lisis de tablas de con tin gen ciael u so de los porcen ta
es en la s cien cias sociales, adrid: Cen tro de In estigacion es Sociolgica s..
Tcn ica s eleen ta les ara el estu dio de ta la s de con tin gencia. Centrado en di
e
ren cia s de orcenta
es. In clu e u n catu lo sore el estu dio del caio.
Sren sen , A. . Tu a (): a or arket Stru ctu res an d
ooilit, esearc
in Social Strati
ica tion an d Mobility, : 6
.
Siegel, . . (0): stadstica, ico: cra ill.
iro de clsico de stadstica eleen tal, lleno de e
ercicios resu eltos. u til
coo au togu a a ra resoler rolea s de stadstica.
.
. Steen s (200): Scau m s u tlin e oeory an d Problem s oSta tistics (
ed.): u ea ork, cra
ill.
ltia edicin del liro de clsico de sta dstica eleen ta l, con elicacion es
sicas releto de e
ercicios resu eltos.
Stata Corora tion (20a): Stata u ice
eren ce an d In de. elease , College Sta
tion (TX): Stata Press.
s el n dice de todos los de s ol en es. Con tien e tain u na in teresan te
clasi
ica cin de los coan dos. n el a n ua l digitalia do en
orato pdse
en cu en tra al rin ciio (Con ten ts) al
in al (In deSu b
ect in de).
(20): Gettin g Started itStata . elease , College Station (TX): Stata Press.
n a uen a gu a ara uienes coienan a u sar el rograa con los a sectos
estadsticos esen ciales. atres ersion es, u n a ara cada sistea oeratio (ac,
n i, in dos).
(20c): Sta ta sers Gu ide. elease , College Station (TX): Stata Press.
olu en de la docu en ta cin de Sta ta eleen ta l. esu s de la re
eren cia sica
es lo u e dee aren derse ara doin ar los eleen tos cou n es de Stata , coo
las
u n cion es, los
oratos, la sin tais la s cuestion es sica s de rograacin .
(20d): Stata Da ta-Ma na gem ent e
eren ce Ma n u al. elease , College Sta tion
(TX): Stata Press.

AIS IS ATS C S TATA

ste liro contien e todas las in stru ccion es relaciona das con el an e
o de
iceros:
creacin , odi
ica cin , lectu ra, escritu ra ,
u sin , recorte tran s
oracion es de

orato.
(20e): Stata a se e
erence Man u a l. elea se , College Station (TX): Stata
Press.
ste liro con tres ol en es con tien e la a or a rte de in struccion es de an lisis
sicos de Sta ta: esta dsticos, ta la s regresion es sa lo las teora les, las de
a nel, la s de su erien cia e iu tacin de alores.
(20
): Stata Grapics e
eren ce Ma nu al. elease , College Station (TX): Sta ta
Press.
Todo u n olu en dedicado a las in stru ccion es gen era les de gr
icos, u es las
esec
ica s se docuen tan con su resectia tcnica. Sa lo las rieras gin as,
slo til ara u ien es no eleen el editor de gr
icos.
(20g): Sta ta Su rviva l An alysis an d pidem iologica l a bles e
eren ce Man u al.
elea se , College Station (TX): Stata Press.
olu en de la docu en tacin de Stata esecia liado en las rden es st del an lisis
istrico de a con teciien tos las talas de su erien cia.
(20): Stata Su rvey Da ta e
eren ce Man u a l. elea se , College Station (TX):
Sta ta Press.
olu en dedicado a las in stru cciones svy, a ra la on deracin .
(20i): Sta ta Program m in g e
eren ce Man u a l. elease , College Sta tion (TX):
Sta ta Press.
olu en dedicado a la rogra acin.
(20
): Stata Stru ctu ra l u a tion Modelin g e
erence Man u al. elea se , College
Sta tion (TX): Sta ta Press.
olu en dedicado a los odelos de ecu acion es estru ctu rales.
Stran g, . (): In trodu ction to en t istorAn a lsis, en T.
an oski et a l. (eds.),
e Com parative Political con om y ote el
are State, Ca ridge: Ca ridge
n iersitPress.
eru n t,
. (): Log-Lin ear Models
or ven t istories, on dres: Sage.
ite, . (2): aiu n ikeliood stiation oisseci
ied odels, con om etrica, 0():
2.
ooldridge,
. . (200): In trodu ctory con om etricsA Modern Approa c( ed.), Aus
tra lia : Toson Sou testern .
u in teresan te liro de econ oetra con u n en
ou e u odern o de niel
in teredio llen o de e
elos tiles. stos se en cu en tran desarrollados en Stata
en tt:

.c.edu
gstat
eales
ooldridge
ooldridge.tl.
orld a n k, Te (200): orld Developm en t In dica tors (en C
), a sin g
ton . C.: Te orld a nk.
aagu ci, . (): ven t istory Ana lysis, on dres: Sage.

16
n d ice
de
in st r u ccio n e s
1 .Ge n e r a le s
appen d, 79
aweight, 102
browse, 30
by, 117
bysort, 126, 222, 225
cd, 64
cm dlog close, 42
cm dlog off, 42
cm dlog on , 42
cm dlog u sin g, 42
codebook, 86
com press, 49, 65
db, 37
describe, 45
dir, 26
display, 53, 142
do, 32
doedit, 31
drop, 55, 120
edit, 29, 59
egen , 139
estim ates, 403
for, 145, 281, 306
form at, 50
fweigh t, 100
gen erate, 129
global, 143, 279
gsort, 119
h elp, 28
if, 120

in , 51, 120
in file con form ato libre, 67
in file de an ch o fijo, 69
in fix, 68
in sheet, 65
iweight, 103
join by, 80
keep, 55
label data, 46
label defin e, 46
label drop, 47
label list, 47
label save, 47
label valu es, 46
label variable, 46
labelbook, 47
list, 50
log close, 42
log off, 42
log u sin g, 41
m ark, 235
m arkou t, 235
m erge, 79
n et from , 247, 266
n et in stall, 235, 247, 266
ou tfile, 73
pweight, 102
qu ietly, 402
recode, 134
ren am e, 61
replace, 130
reshape, 127, 230

496

retu rn , 142
ru n , 32
sam ple, 231
save, 63
saveold, 74
set dp, 50
set m em ory, 44
set seed, 132
sort, 117
ssc in stall, 157, 431
stset, 451
svydes, 477
svyset, 477
sysu se, 27
sysu se dir, 19
u se, 44
varm an age, 54
view, 43

2.E st a d st ica s
an ova, 229
asm probit, 440
bran t, 432
ci, 113
cii, 112
correlate, 281
dfbeta, 348
estat classification , 397
estat effects, 481
estat ic, 399
fitstat, 394
friedm an , 235
h au sm an , 441
h ettest, 338
kwallis, 221
listcoef, 410
logit, 383
m argin s, 412
m logit, 435
m logtest, 441
m probit, 440
m rtab, 266

CUADE R NOS ME TODOLGICOS 45

ologit, 426
om odel, 431
on eway, 224
ovtest, 340
prch an ge, 412
predict, 288, 334, 390
prgen , 415
prtest, 199
prvalu e, 418
qreg, 369
ran ksu m , 219
regress, 286, 334
robvar, 224
rreg, 363
sdtest, 216
sfran cia, 336
sign ran k, 211
sign test, 203
sktest, 336
streg, 462
sts list, 456
su m m arize, 96, 120, 142
svy: proportion , 479
svy:logit, 485
svy:m ean , 480
svy:regress, 485
svy:tabu late, 483
swilk, 222, 336
tab1, 88, 238
tabch i, 247
table, 262
tabstat, 232, 259
tabu late, 88, 239
test, 295
ttest, 201
vif, 339
vwls, 360

3.Gr fica s
avplots, 342
catplot, 157
clu ster den drogram , 150

497

ANLIS IS DE DATOS CON S TATA

dotplot, 150
graph, 150
graph bar, 156
graph box, 167, 345
graph com bin e, 151
graph copy, 151
graph describe, 151
graph dir, 151
graph display, 151
graph drop, 151
graph export, 152
graph h bar, 162
graph m atrix, 174, 339
graph pie, 153
graph qu ery, 186
graph ren am e, 151
graph save, 152
graph twoway, 169
graph twoway area, 176
graph twoway bar, 173
graph twoway con n ected, 175
graph twoway dot, 173
graph twoway droplin e, 173
graph twoway fpfit, 178
graph twoway fpfitci, 181
graph twoway fu n ction , 182
graph twoway kden sity, 166
graph twoway lfit, 177
graph twoway lfitci, 181

graph twoway lin e, 175


graph twoway lowess, 178
graph twoway m ban d, 178, 373
graph twoway m splin e, 178
graph twoway qfit, 178
graph twoway qfitci, 181
graph twoway rarea, 416
graph twoway rbar, 180
graph twoway rcap, 180
graph twoway rcapsim , 180
graph twoway rcon n ected, 180
graph twoway rlin e, 180
graph twoway rspike, 180
graph twoway scatter, 170
graph twoway spike, 173
greigen , 150
histogram , 28, 163
kden sity, 337
lvr2plo
, 347
m argisn plot, 412
m logplot, 435
m logview, 439
qu ery graphics, 186
rvfplot, 150, 335
scatter, 278, 368, 391
set sch em e, 187
stem , 150
sts graph, 456

Nu m e r o s p u b lica d o s
1.

Met o d o s d e m u e st r e o
Jacin to Rod rgu ez Osu n a

2.

Me t o d o lo ga d e la e va lu a cio n d e p r o gr a m a s
Fran cisco Alvira Martn

3.

Met o d o s d e a n a lis is ca u sa l
Ju an Dez Med ran o

4.

An a lisis d e r e gr e s io n m u lt ip le
Mau r o F. Gu ille n

5.

E l m et o d o b io gr a fico : e l u so d e la s h ist o r ia s d e vid a e n


cie n cia s so cia le s
Ju an Jose Pu jadas Mu n oz

6.

Met o d o s d e m u e st r e o . Ca so s p r a ct ico s
Jacin to Rod rgu ez Osu n a

7.

Gr a fico s
An ton io Alam in os

8.

P r o gr a m a cio n d e la in ve st iga cio n so cia l


Ign asi Pon s

9.

E n cu e st a s t e le fo n ica s y p o r co r r e o
J. Llu s C. Bosch y Diego Tor ren te

1 0.

I n ve st iga cio n p a r t icip a t iva


Lu is R. Gab ar ro n y Libertad H er n a n d ez Lan da

1 1.

E n cu e st a s d e sa lu d
Mar a D. Navarr o Ru bio

1 2.

Mo d e lo s p r o b a b ilst ico s d e e le ccio n


Silvia de la Vega Go m ez

1 3.

F u e n t e s d e in fo r m a cio n d e m o gr a fica e n E sp a n a
n geles Valer o Lobo
David -Sven Reh er y A

1 4.

An a lisis d e d a t o s co n SP SS/P C+
lvar o E str am ian a y Alicia Garr ido Lu qu e
Jose Lu is A

15.

An a lisis d e r e gr e sio n lo gst ica


Albert J. Jovell

16.

An a lisis y e st r u ct u r a l y d e r e d e s
Josep A. Rod rgu ez

17.

Au t o /b io gr a fa s
Jesu s M. d e Migu el

18.

R e d e s so cia le s y cu e st io n a r io s
Fe lix Requ en a San tos

19.

E sca la s d e p r e st igio p r o fe sio n a l


Ju lio Caraban a Morales y Carm u ca Go m ez Bu en o

20.

Ob se r va cio n p a r t icip a n t e
O scar Gu asch

21.

Me t o d o lo ga d e l a n a lisis co m p a r a t ivo
Jord i Cas

22.

Me t o d o lo ga cu a lit a t iva e n E sp a n a
Ber n ab e Sarabia y Ju an Zarco

23.

E va lu a cio n d e la in ve st iga cio n


Joan Bellavista, E len a Gu ar diola, Aida Me n dez y Mar a
Bor don s

24.

B a n co s d e d a t o s
Magdalen a Cor dero Vald avia

25.

An a lisis d in a m ico
E m ilio J. Castilla

26.

Cu e st io n a r io s
Mar a Jose Azofra

27.

An a lisis d e d a t o s e le ct o r a le s
Pablo On ate y Fr an cisco A. Ocan a

28.

Me t o d o lo ga d e la Cie n cia P o lt ica


E va An du iza Perea, Ism ael Crespo y Mo n ica Me n dez Lago

29.

E le ccio n r a cio n a l
Pau Mar-Klose

30 .

E s t u d io d e ca so s
Xavier Coller

31 .

Dia r io s d e ca m p o
Ju an M. Gar ca Jorb a

32 .

E n t r e vist a s cu a lit a t iva s


Migu el S. Valles

33 .

In t r o d u ccio n a la s m a t e m a t ica s p a r a la s cie n cia s


so cia le s
Fr an cisca Blan co Moren o

34 .

Te o r a d e ju e go s
Ign acio Sa n ch ez-Cu en ca

35 .

La e n cu e st a : u n a p e r sp e ct iva ge n e r a l m e t o d o lo gica
Fr an cisco Alvira Mar tn

36 .

Ma n u a l d e t r a b a jo d e ca m p o e n la e n cu e st a
Vidal Daz de Rad a

37 .

Gr o u n d e d Th e o r y: La co n st it u cio n d e la t e o r a a
t r a ves d e l a n a lisis in t e r p r e t a cio n a l
An ton io Tr in id ad Requ en a, Virgin ia Car rero Plan es
y Rosa M. Sor ian o Mir as

38 .

An a lisis d e la H ist o r ia d e Aco n t e cim ie n t o s


Fabr izio Bern ard i

39 .

E l a n a lisis d e se gm e n t a cio n : t ecn ica s y a p lica cio n e s


d e lo s a r b o le s d e cla sifica cio n
Modesto E scobar Mer cad o

40 .

E vo lu cio n d e la Te o r a F u n d a m e n t a d a co m o t e cn ica
d e a n a lisis cu a lit a t ivo
Jaim e An dr e u Abela, An ton io Gar ca-Nieto
y An a M Perez Corb ach o

41 .

Din a m ica d e l gr u p o d e d iscu sio n


Jesu s Gu tierr ez Brito

42 .

E n cu e st a d e lib e r a t iva
Mara Cu esta, Joan Fon t, E rn esto Gan u za, Br au lio
Go m ez y Sara Pasadas

43 .

An a lisis so cio lo gico d e l sist e m a d e d iscu r so s


lam o
Fern an do Con de Gu tie r rez del A

44 .

La in ve st iga cio n so b r e e l u so d e l t ie m p o
n geles Du r a n H eras, Jesu s Rogero Garca
M A

45 .

An a lisis d e d a t o s co n St a t a
Modesto E scobar Mer cad o, E n riqu e Fer n a n d ez Macas,
Fabr icio Bern ard i

46 .

An a lisis d e d a t o s in co m p le t o s e n Cie n cia s So cia le s


Gon zalo Rivero Rodr gu ez

Enrique Fernndez Macas, es profesor en el epartamento de Sociologa y Comunicacin


de la niversidad de Salamanca, e investigador en la
undacin Europea para la Me
ora de
las Condiciones de ida y
raa
o, de uln. Es doctor en Sociologa por la niversidad de
Salamanca, y sus reas de investigacin son la sociologa del traa
o y la economa laoral,
principalmente en el mito europeo. lgunas de sus pulicaciones recientes son
oola
ri
ation in Europe

Worand cc
pations,
E lurius numCritical Survey of

ouality
ndicators
Socio
Economic Re
ie, con Muode ustillo, Esteve y ntn

ransformations of t
e Employment Str
ct
re in t
e Eand t
e S,
algrave
Macmillan, con Storrie y urley, y eas
ring ore t
an oney: t
e Social Economics of

ob
ality
Edard Elgar, con Muode ustillo, Esteve y ntn.
Fabrizio Bernardi, es profesor de Sociologa en el
nstituto niversitario Europeo,
lorencia.
octor en Sociologa por la niversidad de
rento,
a sido profesor de Estructura Social
Contempornea en la Ey en la niversidad de ielefeld y de Mtodos de
nvestigacin
en la niversidad de olonia. Sus pulicaciones ms recientes incluyennequal
ransitions
Selection ias and t
e Compensatory Effect of Social ac
ground in Educational Careers
e
searcin Social Stratification and obility,

emale Education and Marriage issolution

s it a Selection Effect

E
ropean Sociological Re
ie, con Martne

astor, y
e
ecent
ast psurge of
mmigrants in Spain and t
eir Employment atterns and ccupational
ttainment
International igration, con arrido y Miyar. Sus reas de investigacin
principales son la desigualdad social y las dinmicas familiares y laorales.

ISBN 978-84-7476-483-3

GOBIERNO
DE ESPAA

MINISTERIO
DE LA PRESIDENCIA

788474 764833

45

C
M

Anlisis de datos con Stata, Modesto Escoar, Enrique


ernndey
ari
io ernardi

Modesto Escobar Mercado, es doctor en Sociologa por la niversidad Complutense de


Madrid y catedrtico de Sociologa en el epartamento de Sociologa y Comunicacin de la

acultad de Ciencias Sociales de la niversidad de Salamanca, del que fue su primer director.
a pulicado liros como El anlisis grfico/ exploratorio
y El anlisis de segmentacin:
tcnicas y aplicaciones de los rboles de clasificacin

, aparecido tamin en esta co


leccin. Es autor adems, entre otros traa
os, de edes semnticas en te
tos periodsticos
una propuesta metodolgica para su descurimiento
Empiria,
, a presentacin del
self en el cierespacio. n anlisis de las autodefiniciones personales en logs y redes socia
les
RPS, y a calidad democrticauna propuesta para su medicin por e
pertos

REIS,
. Su rea principal de traa
o son las tcnicas de investigacin social.

2.

Anda mungkin juga menyukai