Metodolgicos
45
Anlisis de datos
con Stata
2. edicin
Cuader nos
Metodolgicos
45
Anlisis de datos
con Stata
2. edicin revisada
00_PRIMERAS PAGINAS.indd 1
06/06/12 09:06
uan
gnacio Martneastor, Universidad Nacional de Edu cacin a Distancia.
s e c r e t a r ia
M. aCristina Rodrgu eela, Directora del Departam en to de Pu blicacion es om en to de la
In vesti
acin CIS
as n oras editoriales las in stru ccion es ara los au tores ueden con su ltarse en
tt
.cis.es
u licacion es
CM
odos los derecos reservados. roiida la reroduccin total o arcial de esta ora or
cu alqu ier rocediien to
a sea gr
ico, electrn ico, tico, quico, ecn ico,
otocoia,
etc.el alacen aien to o transisin de su s con ten idos en soortes agnticos, son oros,
visu ales o de cu alquier otro tio sin eriso exreso del editor.
CE CC
CAE RS ME
CS, M.
Catlogo de u licaciones de la Adin istracin en eral del E stado
tt
ulicacion eso
iciales.oe.es
riera edicin , diciere de
Segu n da edicin , ao de
CE RE
E S
AC
E S SC
CAS
Mon taln , . Madrid
Modesto E scoar Mercado.
E n riqu e Fernn deMacas.
Fari
io ernardi.
De r e c h o s r e s e r v a Do s c o n f o r m e a l a l e y
reso eco en E sa a
Prin ted and m ade in Spain
esito legalM. .
Fotocoosicin e iresin
E
ca, S. A.
arque
n du strial as Monjas eran o,
orrejn de Ardo
Madrid
El ael utili
ado ara la iresin de este liro es reciclado totalente lire
de cloro.
00_PRIMERAS PAGINAS.indd 2
06/06/12 09:06
n d ice
P
s.
.
RCC
...........................................................................
. R
ME RS ASS C SAA ..................................................
.. a in
oracin en los ar civos de Stata ...........................
.. a in ter
ad e Stata .............................................................
.. as ven tan as d e Stata ..........................................................
.. Modos de tr aajo en Stata ..................................................
.. E l
icer o d e r esu ltad os .......................................................
.. as variales de la atr ide datos ....................................
.. E jer cicios ..............................................................................
.
RCC
E AS .......................................................
..
n tr odu ccin an u al d e d atos ............................................
.. ectu r a d e d atos con Stata ..................................................
.. Fu sin de
iceros ................................................................
.. E jer cicios ..............................................................................
. E SAS
CAS E A SA AR
AE .................................
.. Clasi
icacin de var iales ....................................................
.. a tala de distriu cin de
recu en cias ..............................
.. E stadsticos res en es de distr iu cion es ...........................
.. ten cin de las ed idas car acter sticas de u n a
d istr iu cin ...........................................................................
.. a on d eracin d e los datos ................................................
.. E l err or tico ........................................................................
.. E jer cicios ...............................................................................
. MA
AC
M
F
CAC
E AS .......................
.. Man iu lacin d e d atos .........................................................
00_PRIMERAS PAGINAS.indd 3
06/06/12 09:06
c Ua De r n o s m e t o Do l Gi c o s 45
P
s.
.. en er acin odi
icacin d e variales ...........................
.. Caractersticas e in stru ccion es eseciales .........................
.. E jer cicios..............................................................................
. RF
CS C SAA................................................................
.. Caractersticas d e los gr
icos de Stata .............................
.. r
icos u n id ien sion ales .................................................
.. r
icos idien sion ales....................................................
.. Coon en tes de los gr
icos ..............................................
.. E squ eas .............................................................................
.. E l ed itor de gr
icos ............................................................
.. E jer cicios..............................................................................
. A RE A E SAS
CA AS CMARAC
E S ............
.. r u eas de u n a sola variale ..............................................
.. Coar acin d e dos variales ...........................................
.. Coar acion es de dos u estr as
in d een d ien tes..........
.. Coar acion es de u estras in deen d ien tes .................
.. Coar acion es de u estras deen dien tes ....................
.. E jer cicios..............................................................................
. CFE CC
A
S
S E AAS C SAA..............
.. alas de con tin gen cia de dos var iales............................
.. Ms de dos var iales ...........................................................
.. tr as talas eseciales ........................................................
.. as talas d e r esu esta ltile ........................................
.. E jer cicios..............................................................................
. A RE RE S
............................................................................
.. ue de untos, varian
a correlacin entre dos variales..
.. a regresin sile .............................................................
.. on dad d el aju ste d e la r egr esin ......................................
..
n
er en cias en la regresin sile .....................................
.. Regr esin ltile ..............................................................
.. Regr esin con variales
icticias ........................................
.. Regr esion es con in ter accin ...............................................
.. tr as r elacion es
u n cion ales de la r egr esin ....................
.. E jer cicios..............................................................................
00_PRIMERAS PAGINAS.indd 4
06/06/12 09:06
a n l i s i s De Da t o s c o n s t a t a
P
s.
.
AS
C E A RE RE S
.........................................
.. Su u estos d e la r egr esin lin eal.......................................
.. An lisis de los casos en la r egr esin ................................
.. Regresion es eseciales ......................................................
.. Regresin rou sta..............................................................
.. Regresin de cu an tiles ......................................................
.. Regresin or an das .......................................................
.. E jer cicios ............................................................................
. A RE RE S
S
CA......................................................
.. E l od elo estadstico ........................................................
.. E stiacin del odelo .....................................................
.. iagn stico d el od elo.....................................................
.. Coaracin de odelos .................................................
..
n terretacin del od elo ................................................
.. E jer cicios ............................................................................
. RE RE S
S
CA ARA AR
AE R
A
M
M
A.........................................................................
.. E l od elo estadstico d el logit or din al ............................
.. E stiacin e in terretacin d el od elo .........................
.. E l su u esto d e r egr esion es ar alelas o raon es
roor cion ales ...................................................................
.. Regresin logstica ar a var iale d een d ien te
n oin al ..............................................................................
.. E stiacin e in terretacin d el od elo .........................
.. E l su u esto d e in d een den cia d e altern ativas
irr elevan tes .........................................................................
.. E jer cicios ............................................................................
. E A
S
S E A
SR
A E ACE C
M
E S
C SAA....................................................................................
.. u es co
u n cion a el AA ......................................
.. E l AA con Statain stru ccion es ara d e
in ir los d atos...
.. a
u n cin de su er viven cia .............................................
.. Modelos de la tasa de tran sicin con tieo con tin u o ...
.. E jer cicios ............................................................................
00_PRIMERAS PAGINAS.indd 5
06/06/12 09:06
c Ua De r n o s m e t o Do l Gi c o s 45
P
s.
. A
S
S E AS E E CE SA C SAA .................
.. Aju stes en el an lisis d e u estras colejas..................
.. on deracion es, estr atos con gloer ados.......................
.. n ejelo rctico con Stata. as r den es sv............
.. E jercicios ............................................................................
00_PRIMERAS PAGINAS.indd 6
06/06/12 09:06
A Mara
os E ceverra
00_PRIMERAS PAGINAS.indd 7
06/06/12 09:06
00_PRIMERAS PAGINAS.indd 8
06/06/12 09:06
1
In t r o d u cci n
E s in n egable qu e la estadstica se h a con ver tido en u n a h er ram ien ta fu n d am en tal p ar a la in vestigacin en las cien cias sociales. Au n qu e n adie n iegu e
tam poco qu e pu edan r ealizarse estu d ios sobr e el m u n do h u m an o qu e r ecojan y an alicen d atos sin n ecesidad d e op er acion es m atem ticasu n a parte
con sid er able de an lisis n ecesita ap licar con ocim ien tos de esta r am a del
sab er au n sien d o slo de m od o bsico p ara con tar ocu r ren cias o p ar a
etrapolar los resu ltados d e u n a m u estr a al con ju n to d e elem en tos qu e se
d esea in vestigar.
ace cin cu en ta a os tod os los in str u m en tos qu e se d ispon an para las
op er acion es estadsticas eran el pap elel lpiz o b olgr afo yen el m ejor de
los casosu n a calcu lad ora qu e h ab a qu e en ch u far a la r ed elctrica yslo
en los m odelos m s eclu sivoscapaz de calcu lar races cu adradas. esde
en ton cesdos d esar rollos casi p aralelos h an cam b iado las posib ilid ad es
de aplicacin de la estadstica a la in vestigacin . or u n ladoel desarrollo de
la in for m ticaqu e h a p u esto a d isposicin d el b olsillo de los p articu lares la
ad qu isicin de u n ord en ador con cap acidades d e clcu lo qu e an ta o slo
estab an a d isp osicin de m u ltin acion ales y organ ism os p b licosyp or el
otrola ap ar icin d e pr ogram as especializad os en tar eas estad sticasqu e
h an perm itid o la ejecu cin d e tar eas de en orm e com plejid ad a per son as con
escasos con ocim ien tos m atem ticos.
e acu er do con este pan oram aeste libr o pr eten d e ser u n m an u al qu e
p erm ita a qu ien lo tr ab aje u n u so aplicad o y racion al de las h err am ien tas
estad sticas u sadas en la in vestigacin social yp or eten sin a la in vestigacin biosan itaria o ep idem iolgica. Au n qu e el objetivo cen tr al d e estas pgin as es en se ar a u tilizar u n p rogram a estad stico determ in ado n o m u y
distin to de otros qu e eisten en el m ercadoesta obra tam bin eplica cu les son los requ er im ien toslos pr ocedim ien tos yan te todola in terp retacin
d e los r esu ltad os de aplicar tcn icas estad sticas a u n con ju n to d e datos. or
ellolos au tores h an p reten did o con ju n tar lo qu e sera u n a in tr od u ccin a la
estad stica aplicad a con u n m an u al d e in iciacin a tata.
tata es u n a aplicacin estad stica n acida en el a o en el en tor n o
n ie in m ediatam en te traslad ad a al sistem a oper ativo in dos y
01_introduccin.indd 9
06/06/12 09:09
AE E
p oster ior m en teal de Ap ple. E ste pr ogram a h a ten ido tres im p or tan tes
p recu r sorespor ord en d e an tig edad destacan el (Biom edical Program )el A(Statistical An alysis System ) y el (Statistical Program s for
the Social Scien ces). E stos n acieron con ceb idos en en tor n os d e gran des ord en ador esevitan do la pr ogram acin en ortran p ara la resolu cin de los
p roblem as estadsticospar a pasar a ejecu tar se tam b in en or den adores
p er son ales en los a os och en ta. E n tre estos tres y tata tam bin cabe destacar la ap ar icin de otr as aplicacion es estadsticas
Ay tatr aph ics
p or ejem p loqu e se im p lem en taron en el en torn o in d os con u n a filosofa m u ch o m s in ter activa qu e los in iciales paqu etesm s p en sados par a
p rocesos p or lotes qu e para in stru ccion es in stan tn eas p resen tes en u n
m en a d isp osicin d el u su ario.
r es son las caractersticas m s sobr esalien tes qu e h an p er m itid o qu e
tata obten ga u n a posicin d estacad a en tre las ap licacion es estadsticasen
p rim er lu garel em pleo de in str u ccion es con u n len gu aje fcil d e m odo in ter activo. ren te al p rim er acer cam ien to d e los pr ogr am as clsicos a travs
d e in str u ccion es escr itas en con ju n to en u n fich eroo al m s m odern o estilo
d e dar r den es a tr avs d e m en stata ofr eca u n m od elo en el qu e se escriba u n a in str u ccin e in m ediatam en te se vean los resu ltadossiem pr e y
cu an do fu er a bien escrita. E n segu n d o lu gartata se especializ en el an lisis de regresion es. ren te a otros pr ogr am as estadsticos qu e p rcticam en te ab arcaban u n am plio elen co d e an lisistata au n qu e n o d e m odo eclu sivo se con cen tr especialm en te en los d iver sos an lisis d e regresin
ofr ecien d o u n a am plia varied ad de pr ocedim ien tos qu e van d esd e la r egr esin sim p le h asta los m odelos d e ecu acion es estru ctu r ales. in al y p rin cip alm en ten o slo se pod an em paqu etar todas las in stru ccion es en u n fich er o
para su em pleo con trastado y repetidosin o qu e tam bin por la propia n atu raleza de las in stru ccion es an alticascom bin adas con las fu n cion es y las
rden es de flu joera posible para u n tcn ico eperto la con feccin de n u evas
u tilidadesdistin tas de las im plem en tadasper o com partibles en u n a var iedad de situ acion es por u n con ju n to de in vestigadores con el n ico requ isito
com n de dispon er de este program aabierto a n u evas program acion es.
or tan top odr an d estacarsefr en te a otr os p rogram as de estadstica
las sigu ien tes caractersticasen p rim er lu gar sob resale por su facilid ad d e
u so. E sp ecialm en te tr as su ver sin
en er o de
en la qu e se in cor pora
u n sistem a de m en qu e pr cticam en te in tegra todas las in stru ccion es disp on iblestata es u n paqu ete asequ ible al au toap ren dizajesi ad em s se
con su lta la d etallada d ocu m en tacin en for m ato p df qu e le acom p a a. am b in destaca tata p or u n a am plia gam a d e tareas. ien es cierto qu e don de
sobr esale fren te a otr os p rogram as estad sticos es en las r egr esion espero
tam b in se destaca en an lisis d e m u estras com p lejasen ser ies tem p orales
en datos de pan elen an lisis d e su cesos h istricosen im p u tacion es de casos per did os ym s recien tem en teen grficos d e con torn os y d e m ar gin alesas com o en el an lisis de m odelos de ecu acion es estr u ctu rales. am bin
01_introduccin.indd 10
06/06/12 09:09
que con tien e h erram ien tas estadsticas para el an lisis de la distribucin de la riqu eza
http
dasp.ecn .u laval.ca
in de.htm l
y las ru tinas ost de on g y reese
para regresiones de
variable depen dien te n om inalas com o la in stru ccin para la tabu lacin m ltiple m rtab de
en n
an n
01_introduccin.indd 11
06/06/12 09:09
AE E
01_introduccin.indd 12
06/06/12 09:09
er ror tpico y los in ter valos de con fian zaim p rescin dibles p ara la estim acin de los p ar m etr os d e la p oblacin .
ras este p rim er cap tu lo d e an lisisse in clu ye el tem a d el tratam ien to
y m odificacin de d atos. tata con tien e u n a ser ie de in str u ccion es qu e perm iten or den ar y seleccion ar los casos sin qu e n ada qu ed e alterad o. A este
p roceso se le d en om in a tr atam ien to y pu ed e ser til en u n a m u y am p lia
varied ad d e casoscom o cu an do se desee r ealizar u n an lisis especfico d e
jven es o d e m u jer es. or otr o lad ola m odificacin de datos in clu ye tan to
la recod ificacin d e los valor es d e las variab les del fich er o com o la gen eracin d e n u evas var iables m edian te tran sfor m acion es algebr aicas de otr as ya
eisten tesporqu e m u y a m en u d o n o in ter esa an alizar los datos tal com o
fu er on r ecogidossin o tr as aplicarles algu n os cam b ios qu e m ejor en su p resen tacin com o pu ed e ser el caso de p resen tar u n a tab la d e la edad con su s
valor es r ecod ificados.
a versin d e tata m odific radicalm en te las in str u ccion es p ar a la
con feccin de grficos ycom o n o pod a ser d e otra m an er ase dedica u n
captu lo a la r ealizacin d e estos. Au n qu e los m en s pu eden facilitar esta
tareala p eticin de u n grfico n o es tar ea fcilcu an do se desea algo distin to de lo estn dar. ebid o a esta dificu ltada partir de la ver sin apar ece
u n editor d e grficos con el qu e se sim plifica en gr an m ed id a el em p leo de
cam bios sin ten er qu e apr en der las op cion es o sin ten er qu e n avegar por u n
en m ar a ado sistem a d e m en s y solap as. E l or den de pr esen tacin de los
d istin tos tip os d e gr ficos es fu n cion a lpor su u so. r im er o se d escr ib en
los gr ficos u n id im en sion ales qu e repr esen tan u n a o varias var iables en u n a
n ica escala ya con tin u acin se en u m er an los qu e con tien en al m en os d os
escalas d istin tas. in alm en teal acabar el captu lose eplica br evem en te el
ed itor d e gr ficos.
E n el sp tim o captu lo se tr atan las pr u ebas estad sticas m s sim p les
con ten id as en tata. e com ien za con u n a in trod u ccin sobr e la p ru eb a estadstica ap licad a a u n a sola var iable. e ep lican las pr u eb as par am tricas
d e p rop or cion es y m edias y la pru eb a d e los sign os. on ellaslos in vestigad ores pu eden com p rob ar si su s h iptesis d escr iptivas son con gr u en tes con
su s datos. er o tam bin en este captu lo se eplican las p ru ebas estadsticas
qu e sir ven par a las h iptesis com p ar ativas. ay p ru ebas par a d os o m s
m u estras in depen dien tes
u n a variab le m edid a en gr u pos distin toso p ar a
d os o m s d ep en d ien tes
dos o m s variab les ob ten idas en u n n ico gru p o
.
n a d e la s op er acion es m s em p lea d a s en el a n lisis d e cu estion a r ios
son las tab la s d e con tin gen cia . A ellas se le d ed ica tod o u n cap tu lo. e
estu d ia n los d istin tos tip os d e p or cen ta jes qu e se p u ed en a p lica rlos r esid u osla s p r u eb a s esta d sticas d e sign ifica cin y los coeficien tes d e a socia cin . od o ellop r in cip alm en tep ar a estu d ia r la fu er za d e la r ela cin en tr e
d os va r ia b les. om p lem en ta r ia m en tese ter m in a el cap tu lo con u n a con sid er a cin sob r e las ta b las d e m s d e d os d im en sion es en lo qu e p u ed e
con sid er a r se u n a in tr od u ccin a l an lisis m u ltivar iab le y con la ep lica -
01_introduccin.indd 13
06/06/12 09:09
AE E
cin de u n p r ogr am a eter n o qu e p er m ite la tab u lacin d e p r egu n tas m u ltir esp u esta .
os cu atr o sigu ien tes cap tu los estn ded icad os a lo qu e son los pr ocedim ien tos m s n otab les d e tatalas r egr esion es. e com ien za en el n oven o
con la r epr esen tacin d e d os va riab les en la n u b e d e pu n tos p ar a ep licar
el con cepto d e covarian za y el d e cor relacin se ep lica el m tod o de m n im os cu adrados para la etraccin de u n a r ecta qu e pase lo m s cerca posible
d el con ju n to d e pu n tos repr esen tad os y se abor dan los tem as m s espin osos
d e la estim acin d e los par m etros poblacion ales. esp u s de ep licar en u n
p rim er m om en to la regresin sim ple
con u n a sola variable in depen dien te
.
r as las regresion es se d edica u n captu lo a u n a tcn ica en la qu e tata
p osee m u y am plios recu rsos com o es el an lisis d e la h istor ia d e acon tecim ien tosespecialm en te til para el an lisis din m ico de los fen m en os n atu r ales o sociales.
E n ltim o lu garse cier ra este m an u al in tr odu ctor io con u n captu lo
d ed icad o a las p on d eracion es de m u estr as especiales m u y tiles en el p rocesam ien to de en cu estaspu esto qu e en estas rara es la ocasin en la qu e se
r esu elven m edian te m u estr eos aleator ios sim ples.
bviam en te n o se trata gran par te de los an lisis qu e estn d isp on ibles
en tata. E n tr e otrosson de especial m en cin por su im p or tan cia las r egr e-
01_introduccin.indd 14
06/06/12 09:09
sion es m u ltin ivel y con dicion aleslas ser ies tem por alesel an lisis factor ial
o el d e con glom er ad oslos datos disp u estos en pan ella im pu tacin de casos p er didoso los recin in cor porad os m odelos d e ecu acion es estr u ctu r ales. u in clu sin im p licar a dob lar las pgin as de este m an u alcu ya pr eten sin es in tr od u ctoria. osib lem en te d eb er a escr ib irse u n segu n do volu m en
d edicado a an lisis m s com plejos para cu b rir todas estas lagu n as. E n cu alqu ier casosiem pr e estn los ecelen tes m an u ales d e tata para el qu e d esee
ir m s all.
o qu e h a p residido en la redaccin d e este lib ro es an te todo la sim plicid ad. or elloen las ep licacion es se tien d e a ir de lo sim p le a lo com plejo
y se in siste en el ap ren dizaje a tr avs d e los ejem plos. odos los r esu ltad os
d e an lisis m ostr ados estn acom pa ados p reviam en te de la in stru ccin
qu e los gen era yp osterior m en tedel com en tar io pertin en te. o se olvida
in clu ir las fr m u las de las oper acion escon el fin de qu e n o slo sea u n
m an u al d e u n p rogr am asin o tam b in u n a in trod u ccin a la estadstica y
com o com p lem en to para n avegar en el in m en so cau d al de r den esopcion es y su bop cion es de este pr ogr am ase ofr ece u n n dice d e in str u ccion es
p ara qu e el lector sepa en qu lu gar del libr o se en cu en tra su ep licacin .
am bin son im por tan tes los ejercicios in clu idos al fin al de cad a captu lo
ya qu e slo con la pr ctica se con segu ir n dom in ar las d ificu ltad es pr opias
d e su bu en u so. in em bargod ifcilm en te p od rn leer se las p gin as qu e
sigu en a con tin u acin secu en cialm en te. ar a qu ien es se in ician en E stad sticase su giere qu e com ien cen con los captu los y p ar a con tin u ar
con el el y el . u ien es qu ieran apren der slo tataen cam biodeberan
em p ezar con estos y d esp u s pr osegu ir con los captu los qu e ver sen sobr e lo
qu e realiza m s fr ecu en tem en te o con aqu ellos qu e le resu lten m s d escon ocid osseg n su d estreza sea p oca o m u ch a. in alm en tepar a los in iciad os
tan to en el p rogram a com o en el con ocim ien to estad sticop u ed e r ecom en d arse u n a lectu r a a p ar tir del d cim o o u n d cim o cap tu lodesde don de se
ab or dan las tcn icas m s com plejas.
a au tor a d e este lib ro se h a distrib u ido del sigu ien te m odoel captu lo
h a sido con feccion ad o p or abr izio er n ar dilos cap tu los y
p or E n riqu e er n n d ezqu e ad em s es el au tor pr in cipal d e los captu los
y y el r esto d e los tetospor od esto E scobarqu ien es tam b in r esp on sab le d e la actu alizacin de todos los gr ficosilu str acion es e in stru ccion es p ar a con form ar los a la ltim a versin d e tatapu es en esta segu n d a
ed icin d e la obr a se h a qu er ido actu alizar el con ten ido con algu n as de las
m ltiples n ovedades in cor por adas en la versin .
u edafin alm en teagr adecer todas aqu ellas con tribu cion es qu e h an
ayu d ado a qu e este p rod u cto h aya visto la lu z en su form a actu al. a n iversidad d e alam an ca y el
n stitu to
u an ar ch d e E stu d ios e
n vestigacion es son las in stitu cion es qu e m s h an con trib u ido a qu e los au tores h ayan
p odid o dedicar su s esfu erzos en este em pe o did ctico. E stu d ian tes de u n a
y otra in stitu cin docen te h an recibido n u estr as en se an zas en estas m ate-
01_introduccin.indd 15
06/06/12 09:09
AE E
01_introduccin.indd 16
06/06/12 09:09
2
P r im e r o s
p a so s
co n
St a t a
2 .1 .La
in fo r m a ci n
en
lo s
a r ch ivo s
de
St a t a
Cu alqu ier pr ogram a estadstico trabaja con in for m acin en m u y diver sos
form atos alm acen ada en distin tos tip os de fich ero. Por ello, en este apar tad o se van a d escr ibir los prin cipales arch ivos con los qu e tr abaja Stata. os
seis tip os qu e se vern a con tin u acin p u ed en dividir se en tr es gran des gr u p oslos qu e gu ar dan in for m acin sin procesar, los qu e con servan la in form acin p rocesad a y los qu e perm iten o ayu dan a tran sfor m ar la in for m acin . n el pr im er gru po se in clu yen los fich er os qu e con tien en los d atos
in divid u ales tal y com o son in trodu cid os en el ord en ador despu s del tr abajo de cam p oen el segu n do se con sid er an los arch ivos d on de se gu ard an los
estad sticos o gr ficos qu e se gen er an con el an lisis del pr ogr am a y, fin alm en te, se con sideran del ter cer gr u po los fich er os don de con ven ien tem en te
se alm acen an las in str u ccion es n ecesar ias p ara reali
ar las tareas.
a b ase d e tr ab ajo es la m atr id e datos, qu e con siste en u n a disposicin
or den ada d e in for m acin , poco o n ada p rocesad a. en er alm en te, el m od o
com o esta se organ ia para su tr atam ien to es de tal form a qu e los casos se
en cu en tren epu estos en filas y las variables en colu m n as. n ejem plo sim ple
p u ed e bastar para la com pren sin d e la estr u ctu ra. Su pon ien do qu e h u b iera
qu e an aliar a d os p erson as, u n a m u jer y u n h om br e d e ed ad es respectivas
d e y a os, se pu eden distin gu ir tres con cep tos pr im or diales
n p rim er lu gar, el con cep to de caso, esto es, cu alqu ier u n id ad d e la qu e
se r ecoge in for m acin . n los datos an ter iores eisten d os, las dos p er son as
d e las qu e se sab en su s caractersticas sociodem ogrficas. n segu n do lu gar,
el con cepto d e variable, es d ecir, las caractersticas su sceptibles de adqu ir ir
d istin tas m od alid ades. n el ejem plo pr esen te, las dos variab les d isp on ibles
son seo y edad. n a de ellas es d e n atu rale
a cu alitativa, m ien tr as la otra
se p resen ta com o cu an titativa. Cada u n a d e las m od alid ades, cu alitativas o
cu an titativas, de estas variab les r ecib e el n om b re de valor. n este caso, son
valor es y a os. am bin son valores m u jer y h om br e, au n qu e p or
n o ser d e n atu ralea n u m r ica, tam b in pu eden d en om in arse atribu tos, categoras o, en con ju n to, u n factor.
02_primeros pasos(nuevo).indd 17
06/06/12 09:23
CS
CS
ILUSTR ACI
2.1 .a t r i
lit e r a l
d e
d atos
om b re
u jer
sta m atrio con ju n to d e datos, p ara qu e pu eda ser tr atada in form ticam en te m s d e u n a ve, h a d e ser gu ard ad a en u n fich ero de datos. n
p rin cip io, cu alqu ier ar ch ivo qu e con ten ga in form acin or den ad a pu ede ser
ledo d irecta o in dir ectam en te p or Stata. Pero slo p u ed en ser u tili
ados
d esd e el in ter ior del pr ogram a m edia docen a d e form atosSC
o n icode,
, C, SS Py cel. Para el r esto d e casos, eisten otros pr ogram as qu e tran sfor m an los fich eros gen er ados p or ap licacion es com o h ojas d e clcu lo, bases d e d atos o in clu so otros p rogram as estadsticos en fich er os d e trab ajo ap tos p ar a Stata. n tre ellos, u n o de los m s con ocidos es
Stat-Tran sfer , cu yo u so y u tilid ad se ver en la seccin ...
Sin em b ar go, p ar a el trabajo estadstico n o basta con ten er la m atr id e
datos b ru ta. ay qu e a ad irle al m en os los n om bres de las variab les para
qu e cu an d o se solicite u n a d eter m in ad a tar ea el pr ogr am a sepa qu in form acin se d esea tr atar. o es lo m ism o solicitar u n a m ed ia del seo qu e de
la edad . Se podr a in d icar qu e se d esea slo u n a m edia de la segu n da var iablep er o es m u ch o m s cm odo solicitar la llam n d ola edad. Por ello, u n a
de las operacion es im pr escin d ib les en todo p rogram a estadstico es la de
con vertir el fich er o de datos br u tos en otr o con la m atr ide datos am pliada
con las defin icion es y tran sfor m acion es de la in form acin origin al qu e el
u su ario con sider e con ven ien te.
02_primeros pasos(nuevo).indd 18
06/06/12 09:23
stos esp ecficos fich eros con in form acin b ru ta, d efin icion es y tr an sform acion es se d en om in an fich eros de trabajo. Slo pu eden con str u ir se con
el p rogram a Stata o con otros pocos p rogram as estadsticos qu e in clu yen la
p osibilidad d e gu ar dar los datos en este for m ato. en er alm en te se les recon oce p or ten er la eten sin .dta . n ellos estn alm acen ad os los d atos d e
las var iables origin ales y de las cr eadas p osterior m en te por el u su ario, ju n to
con su s cor respon dien tes n om b res, etiqu etas y form atos.
Para qu e pu edan com prob arse los ejem p los de su m an u al, Stata p er m ite
acced er a tod os los fich eros em plead os. Se p u ed e ob ten er u n a relacin d e
los fich eros de d atos in cor por ad os en la in stalacin del progr am a m edian te
la in str u ccin sysu se dir:
ILUSTR ACI
2..ir e c t o r io
de
lo s
fich e r o s
d e
d a t o s
en
e l
sist e m a
tr os ar ch ivos de in ters en el trabajo con Stata son los ficheros de resu ltados
con eten sin sm cl o log
siem p re qu e as se le in diqu e, los r esu ltad os d e las r den es d ad as al pr ogram a son ar ch ivad os en u n fich er o par a qu e
p u edan qu ed ar d ispon ib les p erm an en tem en te, sin ten er qu e volver a procesar de n u evo los d atos m edian te las in stru ccion es p er tin en tes. Stata dispon e
d e u n for m ato especfico de gr ab acin d e los r esu ltad os en u n fich ero (form atted logal qu e in cor pora la eten sin sm cl, qu e con sta de todos los elem en tos ad icion ales n ecesarios p ar a u n a p resen tacin id n ea d e las tablas
estad sticas. Pero en ocasion es es til qu e los resu ltados se gen er en en u n
form ato tratab le u n iversalm en te, com o es el caso d e los fich er os en cd igo
SC
. Por ello, tam bin eiste la posib ilidad d e gr abar los resu ltados sin
form ato en ar ch ivos gen er ad os en Stata con la eten sin log.
n cu alqu ier caso, en n in gu n o d e estos dos tipos de fich er os se in corp or an los grficos, pu es cada u n o de estos se gu ar da en u n fich ero in depen d ien te y esp ecfico para este tip o de r ep resen tacin de datos. Com o se ver
en el captu lo , cu an do Stata gen era u n grfico, el progr am a abr e u n a ven tan a esp ecial d on d e lo u bica y caso de qu e qu iera con servarse, h a de grab arse com o u n fichero grfico. Stata d ispon e de u n form ato pr op io (gph
pero,
p ara qu e otros u su ar ios qu e n o u sen Stata lo pu ed an con tem p lar, tam b in
eterm in ados ficheros de datos creados para las fu n ciones de im pu lso
respu esta asociadas a m odelos y C se gu ardan con la eten sin irf, en lu gar de dta.
Por ejem plo, cuan do se desea trasladar los resu ltados a otro program a, com o puede ser
u n procesador de tetos, o cu ando se qu iere qu e sean ledos en alg n orden ador qu e n o dispon ga del program a Stata.
02_primeros pasos(nuevo).indd 19
06/06/12 09:23
CS
CS
St ip o
t e n sio n e s
atos
ru tos
m pliados
rabajo
.dta e .irf
etu ales
.sm cl y .log
rficos
Program a
.do y .ado
yu da
.sthlp y .h lp
esu ltados
Program as
2.2.
La
in t e r fa
d e
St a t a
l ejecu tarse Stata, se m u estra u n a p an talla com pu esta p or u n a ser ie de
elem en tos cu yos u sos y fu n cion es se dan a con tin u acin . o pr im er o qu e
h ay qu e ten er en cu en ta son las cin co fran jas h orion tales qu e p resen ta la
in ter fadel pr ogram a. od as estas division es, salvo la cu ar ta, qu e es la m ayor y est com p u esta por u n con ju n to d e ven tan as, pr esen tan u n a sola ln ea
d e eten sin ver tical
02_primeros pasos(nuevo).indd 20
06/06/12 09:23
ILUSTR ACI
2..P r im e r a
p a n t a lla
d e
St a t a
12
02_primeros pasos(nuevo).indd 21
06/06/12 09:23
CS
CS
este program a estaba asociada la im agen de los resultados con una pantalla de fondo negra en la que las instrucciones aparecan en blanco, los
resultados estadsticos en am arillo, el te
to com plem entario en verde y
los errores en rojo. odos los elem en tos de esta com bin acin pu eden
cam biarse tanto en la pantalla activa de resultados (esu lts Colorscom o
en el visor de otros ficheros (ieer Colorsde m odo independiente. n
relacin con los grficos, puede cam biarse el esquem a
vase la seccin
.
, la fuente de sus te
tos y algunos aspectos de la im presin o de su
e
portacin directa a otros program as. inalm ente, la disposicin de las
ventanas de Stata puede cam biarse si el usuario cam bia m anualm ente el
tam ao o la posicin de estas y guarda su opcin m ediante Save reference Set. partir de ese m om ento, el program a se presentar de esa form a
incluso despus de salir al arrancar de nuevo. Por su lado, hay en la versin .incorporados seis m odelos de disposicinpara obtener la configuracin m ostrada en la ilustracin .hay que optar por el idscreen
ayou t, m ientras que la disposicin clsica de otras versiones se obtiene
m ediante la opcin Com bined ayou t.
n los tres apartados sigu ien tes del m en
ata, raphics y Statistics
se despliegan las m ltiples operacion es estadsticas de la qu e es capa
Stata a travs de cu adros de dilogos. n el prim ero
atase in clu yen aqu ellas in stru ccion es qu e sirven para describir los datos,
tran sform arlos o h acer m an ipu lacion es al fich ero don de estn conten idos. n a parte su stan cial de estas rden es estn eplicadas en la
presen te obra a lo largo de los captu los y . l segu n do de los tres
apartados en cu estin (raphicsest reservado a las in stru ccion es
grficas. as m s im portan tes estn con tem pladas en el captu lo . ,
bajo el rtu lo de Statistics, se dispon e la casi totalidad de operacion es
estadsticas de la qu e es capaeste program a. ay qu e ten er en cu enta qu e esta posibilidad de obten er resu ltados estadsticos m edian te
m en s y cu adros de dilogo slo se h a in corporado a Stata a partir de
su versin . u n u su ario n ovel de Stata le resu ltar m u ch o m s cm odo el em pleo de estas gu as. Sin em bargo, u n u su ario eperim en tado preferir escribir directam en te las in stru ccion es u n a a u n a o recopilarlas en u n fich ero para ejecu tarlas en serie.
a denom inacin ser, situada en la se
ta posicin de la franja del m en,
sirve para que un program ador inserte all sus propias utilidades. Por
tanto, nada ser dicho sobre este apartado en este libro introductorio.
l ap ar tado in dos per m ite acceder a diede los on ce tipos de
ven tan as qu e com pon en la estru ctu r a in tern a d el progr am a Stata en
su d u odcim a ver sin in str u ccion es, r esu ltad os, h istor ia (revie
,
02_primeros pasos(nuevo).indd 22
06/06/12 09:23
var iables, p ropied ades, grficos, visor de fich er os, editor d e datos,
ed itor d e pr ogr am as y gestor d e var iables. Por su especial im por tan cia, se ded icar el pr im o apartad o a su descrip cin .
in alm en te, n o falta en el m en el tem correspon dien te a la ayu da
(Help
. n l se distin gu en cin co partes diferen ciadasen la prim era,
slo eiste u n a ln ea qu e rem ite al m an u al com pleto de Stata, dividido en cada u n o de su s vol m en es en la segu n da, se ofrece toda la
ayu da in tern a dispon ible del program a qu e se m u estra en las ven tan as de ayu da con u n form ato especial dotado de h ipertetu alidad,
rem itien do tan to a otros con ten idos de la m ism a ven tan a com o a seccion es con cretas del m an u al en pdfen la tercera, se ofrecen n oticias
del program a y detalles sobre el con ten ido de las actu ali
acion es desde la in stalacin in icial del softare h asta la ltim a versin in stalada
en la cu arta aparecen posibles actu ali
acion es y eten sion es del program a as com o la ayu da ofrecida en la red, qu e ser m ostrada en el
eplorador de pgin as eb por defecto qu e se dispon ga, y la qu in ta
ofrece el logotipo y direccin de la em presa, la can tidad de m em oria
fsica y la dispon ible en el orden ador, la versin de Stata y la in form acin sobre la licen cia en u so. stas cin co partes se com pon en de
on ce ln eas distin tas tal com o se m u estra en la ilu stracin .
ILUSTR ACI
2..e n
d e
a d a
n la versin se cuentan diecioch o u n idades en el n dice conju n to del fich ero con ten edor en form ato pdfCon ten idos, u a de in stalacin
desarrollo de los elem entos com un es m s im portan tes de Statasin tais, form atos, variables, fu n cion es, m acros y elem entos bsicos de program acin
, estin de datos
, rficos
,
m pu tacin m ltiple
, stadsticas m u ltivariantes
listado alfabtico de las in stru ccion es de Stata no con tem pladas en el resto de m an u ales
, odelos de ecu acion es estru ctu rales
S
, n lisis de supervivencia
S
, atos de en cu esta
S
, Series tem porales
S
, atos
lon gitudin ales
, Program acin
P
, ata
02_primeros pasos(nuevo).indd 23
06/06/12 09:23
CS
CS
a ayu da que se m u estra en la ven tan a del visor de Stata in clu ye prcticam ente toda la
docu m en tacin de los m an u ales con ecepcin de los ejem plos aislados del teto, las n otas
tcn icas y las referencias bibliogrficas.
02_primeros pasos(nuevo).indd 24
06/06/12 09:23
as tr es sigu ien tes ln eas de la ayu da son las ltim as actu ali
acion es dispon ibles
Checfor pdates
program as divu lgados en los boletin es y revistas del progr am a (San d ser-ritten rogram s
, qu e
pu eden in corporarse gratu itam en te a los in corporados en el program a, y la pgin a eb oficial de la corpor acin Stata (Stata ebsite
,
su bdividida por su parte en pgin a prin cipal, soporte al u su ario,
2 ..La s
ve n t a n a s
d e
St a t a
a se h a dich o en el apartad o an ter ior qu e Stata trab aja con on ce ven tan as
d istin tas, cin co in tern as y seis etern as. o todas son igu al d e im p or tan tes,
n i tod as estn pr esen tes al m ism o tiem po. e h ech o, al em p e
ar u n a sesin
con Stata slo apar ecen las cin co in tern as. n tr e ellas, las m s cen trales
p ara el tr abajo son las de resu ltados y las d e r den es.
a ven ta n a de rden es (Sta ta Com m a n d
, u b ica d a p or d efecto (idescreen layou ten la parte in ferior d e la cu ar ta fr an ja d el progr am a, es u n
02_primeros pasos(nuevo).indd 25
06/06/12 09:23
CS
CS
02_primeros pasos(nuevo).indd 26
06/06/12 09:23
avan
ar tod a u n a pan talla. in alm en te, si se desea in terr u m pir la salida de
r esu ltad os, en el caso de qu e n o se h aya ob ten id o lo d eseado, se p u ede pu lsar , la com b in acin de teclas Ctrl, o el ltim o icon o de la bar ra de h er r am ien tas. s se d eten d r la or den , n o ap ar ecer n m s ln eas en pan talla
y se estar en con dicion es de escr ib ir u n a n u eva in str u ccin . n a ln ea con
u n solo p u n to en la p an talla de r esu ltad os in dica qu e el sistem a est listo
p ara recibir otr a or den .
Par a ver a lg n con ten ido en la ven tan a de variables (aria bleses p r eciso cr ear o r ecu p er ar u n con ju n to d e d atos. Com o la segu n da d e estas d os
tareas es m s fcil, se p on d r com o p rim er ejem p lo la r ecu per acin de u n a
b ase d e d atos in cor por ad a en el pr ogram a y se d eja la creacin d e u n fich er o de d atos p ara u n captu lo poster ior. Con el fin de recu p erarla, en la ven tan a d e rd en es h ay qu e escr ib ir sysu se au to, sien do esta ltim a palab ra el
n om b re con el qu e es con ocida esta b ase d e d atos, qu e con siste en u n listad o de au tom viles com ercialiados en los a os seten ta en stados n idos
acom pa ado con u n a serie de variab les cu yo con ten ido son las car acter sticas de los m od elos.
sysu se au to
02_primeros pasos(nuevo).indd 27
06/06/12 09:23
CS
CS
ILUSTR ACI
2 ..e n t a n a s
de
h ist o r ia
va r ia le s
02_primeros pasos(nuevo).indd 28
06/06/12 09:23
am bin pu ed en ser con siderad os otro tipo de ven tan as d e Stata los cu adros de dilogos qu e apar ecen al solicitar cu alqu ier tar ea m edian te el m en .
as ilu str acion es .y .m u estr an u n p ar de ejem plos d e este tipo de
ven tan as, qu e tien en la p ropied ad eclu siva de gen erar in str u ccion es d e Stata qu e se acu m u lan en la ven tan a de h istor ia y, u n a veejecu tadas, m u estran
su pr odu cto en la ven tan a d e resu ltados. Casos esp eciales d e este tipo de
ven tan as, p resen tes slo a p ar tir de la ver sion es y , son el gestor d e
variab les y el m d u lo d e p ropied ades, cu yo u so se ver al fin al d e este cap tu lo.
a u tilid ad qu e en Sta ta cr ea o m od ifica la in for m acin a n aliab le,
con ocid a com o editor de da tos (a ta ditor
, o la qu e los in sp eccion a
(roser
, gen er a n el octavo tip o d e ven ta n a . Su fu n cin es m ostr a r y p erm itir h a cer m od ificacion es
esta ltim a fu n cin slo en la p r im er a op cin
d e los d a tos car ga d os en la m em or ia . Com o p u ed e ap r ecia r se en la ilu str a cin ., se tr ata d e u n a ven ta n a, sim ila r a la d e u n a h oja d e c lcu lo,
en la qu e los ca sos se r ep r esen ta n en la s ln eas y las var iab les en la s co lu m n a s. s, los tr es p r im er os casos cor r esp on d en a los m od elos Con cord,
a cer y Spirit d e la ca sa d e au tom viles C, qu e ten a n en p r ecios
02_primeros pasos(nuevo).indd 29
06/06/12 09:23
CS
CS
respectivos de ., .y .dlares. n el caso de qu e se qu iera realia r a lg n ca m b io , b a sta lleva r el cu r sor a la ca silla cor r esp on d ien te y
r eem p la a r el va lor an tigu o con u n o n u evo. r a s r ealia r los ca m b ios d esea d os, se p u ed e cer r a r la ven tan a con el b otn situ a d o en su etr em o su p er ior iqu ier d a qu e tien e u n a figu r a d e a sp a o, si se p r efier e, m a n ten er la
a b ier ta .
edit
ILUSTR ACI
2.11 .e n t a n a
d e l
e d it o r
02_primeros pasos(nuevo).indd 30
06/06/12 09:23
r arlo es con vir tien d o la h istoria de in stru ccion es en u n fich er o qu e las con ten ga. Sigu ien do con este p rim er ejem p lo, es d ecir, las cu atr o rd en es par a
ep licar las d istin tas ven tan as d e este p aqu ete estadstico, es fcil con ver tirlas a u n fich ero de pr ogr am as h acien d o clic con el b otn der ech o del ratn
en la ven tan a d e la h istoria y se alan d o la op cin Save ll o Save Selected.
ras ello, sale el m en de gr abacin d e fich er os p ropio d el sistem a operativo
con el qu e se tr ab aje y se p u ed e p on er el n om b re qu e se d esee. u tom ticam en te Stata le pon d r la eten sin do, qu e es con la qu e se recon oce a este
tipo de ar ch ivos. espu s d e gr abado, u n fich er o de p rogr am a pu ede r evisar se o ejecu tar se cu an tas veces se d esee. tr a opcin m s p rctica es m an d ar este con ten ido d e la ven tan a de la h istoria al ed itor d e fich eros de p rogr a m a s d e Stata m ed ian te la ln ea d el m en con tetu a l Sen d to o-file
editor.
l editor de estos fich er os tam b in pu ede p on er se en m ar ch a ab rien d o
su ven tan a, bien escrib ien do en la ven tan a de r den es la palabr a doedit,
b ien a travs de m en (in do
o-file ditor
, bien h acien do clic en el sp tim o icon o de la bar ra d e h er ram ien tas (o-file ditoro p u lsan do la com b in acin d e teclas Ctrl.
d oedit
ILUSTR ACI
2.1 2.e n t a n a
d e l
e d it o r
con
e l
co n t e n id o
d e l
"P r im er p r ogr a m a .d o"
02_primeros pasos(nuevo).indd 31
06/06/12 09:23
CS
CS
m ed ia n te el m en (ile
pen
el segu n d o icon o d e las h er r am ien ta s (pen
o b ien la com b in acin d e tecla s Ctr lo. esp u s se seleccion a el fich er o
con eten sin do d esead o en el d ir ector io d on d e se en cu en tr e y tod as la s
in str u ccion es d e la s qu e se com p on en ap ar ecer n en la n u eva p a n talla , d e
ta l m od o qu e a p ar ecen r em a r ca d os con d ifer en tes color es, en tr e otr os elem en tos, las in str u ccion es, la s cad en a s, los op er ad or es, la s fu n cion es y los
com en tar ios .
en tr o d e esta ven tan a, p u eden h acerse cu an tas m od ificacion es se con sid er en op ortu n as escrib ien do, bor ran d o, copian d o, cor tan do y p egan do
com o en cu alqu ier editor, y ejecu tarlas cu an tas veces se desee.
Pa r a esto ltim o h a y d os m od o sel p r im er o es do, en cu yo ca so a p a r ecen la s r d en es en la p a n ta lla d e r esu lta d os, y el segu n d o es ru n , se
ejecu ta n la s r d en es p er o su co n ten id o y r esu lta d os se o cu lta n . m b a s se
en cu en tr a n b a jo el r tu lo d el m en Tools, y so n r esp ectiva m en te el ltim o (ecu te (do
y el p en lt im o (ecu te u ietly (ru n
ico n o d e la b a r r a
d e h er r a m ien ta s p r o p ia s d el ed ito r, cu yo a sp ecto el lecto r a ten to h a b r
n ota d o d ifer en t e d el q u e a p a r ece en la p a n ta lla gen er a l d e Sta ta . a m b in es p osib le r ea lia r la m ism a o p er a ci n co n la s r esp ectiva s co m b in a cio n es d e tecla s Ctr ld o Ctr lr. m b o s m od o s fu n cio n a n co n el co n ju n to d el fich er o o co n u n a selecci n p a r cia l d e la s r d en es q u e se co n sid er en m s a p r op ia d a s p a r a u n a d eter m in a d a ta r ea . d em s, con el fin d e
q u e tod a s la s m o d ifica cio n es q u ed en gu a r d a d a s p a r a u so p oster io r, ta m b in se p er m ite en esta ven ta n a la gr a b a cin d e su co n ten id o, sea m ed ia n te m en (ile
Sa ve
, icon o
el ter cer o, Sa ve
, o tecla s
Ctr lso
02_primeros pasos(nuevo).indd 32
06/06/12 09:23
2 ..o d o s
de
t r a a
o
en
St a t a
ay tr es form as d istin tas de p ropor cion ar las in str u ccion es a la aplicacin
Stata p ar a ob ten er los r esu ltad os desead os. n este ap ar tado se con tem pla
cm o se em plea cad a u n a d e ellas. u n qu e p rcticam en te tod o p u ed a r ealiarse con estos tr es m od os de trab ajo, la eleccin de cu l u sar depen der de
la tar ea qu e se h aga y d e las pr eferen cias del u su ar io. os tr es m odos son el
d e in stru ccin , cu an do se in tr od u cen literalm en te u n a a u n a cada or den el
d e m en , cu an d o se u tili
a u n cu ad ro de d ilogo para efectu ar u n a p eticin ,
y el de program acin , en el caso de qu er er ejecu tar au tom ticam en te u n
con ju n to d e in stru ccion es.
02_primeros pasos(nuevo).indd 33
06/06/12 09:23
CS
CS
Com o fcilm en te p u ed e apr eciar se, la pr im era y la ltim a slo con stan
d e r den es, m ien tras qu e las d os cen trales tien en especificacion es. n la
segu n d a la esp ecificacin es el n om br e del fich er oen la ter cer a el n om b re
d e u n a var iable. la ter cera in stru ccin con tien e tam b in u n a op cin freu en cy, qu e h a sid o ab reviada con su s cu atro p rim er as letr as. s fu n d am en tal reten er qu e tod as las op cion es h an d e figu rar detr s de la com a, sep ar adas en tre s al m en os p or u n espacio en blan co.
d em s d e la or d en , su s esp ecifica cion es y op cion es, la m a yor p a r te
d e ella s p u ed en in cor p or a r p r ein str u ccion es, qu e m od ifica n el fu n cion a m ien to d e la in str u ccin , com o, p or ejem p lo, a p lic n d o la a d istin ta s
su b m u estr a s, y ca lifica d or es qu e r estr in gen el u so d e la in str u ccin a ca sos con u n a d eter m in a d a ca r a cter stica . od a s esta s p osib ilid a d es son ta n
im p or ta n tes qu e ser n tr a ta d a s con a lgo m s d e d eten im ien to en el ca p tu lo .
... odo m en
l segu n d o m od o de p rop orcion ar in stru ccion es al p rogram a es m ed ian te
los m en s. Cu an do se h abl de la in ter fade Stata y se m en cion la p rim era
on a h or ion tal de su ven tan a, se dijo qu e d esde el tercer al qu in to de su s
apar tados
ata, raph ics y Statisticsse p od an en con tr ar p rcticam en te la
totalid ad de las in stru ccion es p ropias d el paqu ete, m ien tr as qu e aqu ellas
as abreviatu ras en Stata pueden em plearse en la in m en sa m ayor parte de las ocasion es, siem pre que no produ can am big edad. e este m odo, pu eden abreviarse n om bres de
variables y opcion es. as rden es slo pu eden recortarse de la form a qu e se in dica en el m an u al o en la ayu da del program a. Por ejem plo, el program a entien de histpero in terpreta com o
error histo o histogra. Sin em bargo, en el fich ero au to, la variable price pu ede ser escrita com o
p, pr, pric y price, ya qu e n ingu n a otra variable com ien a por p. e la m ism a form a, la opcin
freu en cy pu ede ser abreviada, al m enos, con fre. am bin en tendera bien el program a frecu en c.
02_primeros pasos(nuevo).indd 34
06/06/12 09:23
ad icion ales qu e el u su ario con siderar a con ven ien tes p od an ser a adid as en
el sigu ien te elem en to (ser
.
ste m od o d e tr a b a jo, qu e fa cilita la p r od u ccin d e in str u ccion es a
qu ien es n o con ocen la sin ta is d el p r ogr a m a , fu e in cor p or a d o a p a r tir d e
la ver sin , p or lo qu e m u ch os u su a r ios a n ter ior es d e esta a p lica cin
p r efier en segu ir u tilia n d o el a n ter ior m od o d e tr a b a jo, p or qu e es m s
r p id o d e u sa r si se con oce b ien . a m b in tr a ta n d e evita r este m od o d e
tr a b a jo qu ien es p r ogr a m a n , ya qu e n ecesita n r ecor d a r con tin u a m en te la s
d istin ta s p a la b r a s cla ves qu e h a y qu e u tilia r en la con feccin d e los p r o gr a m a s.
Con el sistem a d e los m en s se h an tr aslad ad o todas las posibilid ad es de
u n a ord en a u n cu adr o de dilogo, tan to m s com plejo cu an to m s lo es la
in stru ccin , qu e se obtien e b ien p resion an do la ln ea corr espon dien te del
m en , b ien escrib ien do u n a or den qu e lo p on ga en fu n cion am ien to.
Por ejem p lo, si se desea u n h istogr am a de la variab le price, h ab r qu e
op tar por especificar raph ics
Histogram tr asladan do el cu r sor m ed ian te el
r atn a los cor r esp on d ien tes elem en tos qu e lo com p on en
p rim er o a raphics, a con tin u acin a Histogram y h acien d o clic, u n a veobten ido este
ltim o. l resu ltado es u n cu adro de d ilogo u bicado en u n a n u eva ven tan a
ILUSTR ACI
2.1 .Ca d r o
de
d i lo o
d e
la
or d en
h isto gr a m
n la ilu str acin .ap ar ece el cu adr o de dilogo en el qu e se h a in ser tado el n om b re de la var iable en el corr esp on dien te recu adro (ariabley
se h a cam biado la opcin -ais, m arcan do reu en cy, en lu gar d e en sity,
qu e es con la qu e oper a p or om isin . a or den histogram posee m s p osib ilid ades qu e las qu e se m u estr an en el cu adr o d e d ilogo pr in cipal (m ain
.
Por ello en la ln ea su p er ior h ay otras p esta as refer en tes de otros con ju n tos
de opcion es. Slo a m odo de ejem plo se m u estr a a con tin u acin el cu adro de
d ilogo de la p esta a en sity lots
02_primeros pasos(nuevo).indd 35
06/06/12 09:23
CS
CS
ILUSTR ACI
2 .1 .Ca d r o
de
d i lo o
de
la
p e st a a
Den sity P lots
02_primeros pasos(nuevo).indd 36
06/06/12 09:23
o m s com n es u tiliar los cu ad ros de dilogos com o se acab a d e ep licar, es d ecir, bu scn dolos a travs d el m en . Sin em bargo, u su arios eper im en tad os de Stata podr an h acer lo d e otro m od o, em pe
n dolos desd e la
ln ea de in stru ccion es, sobr e todo, en el caso en el qu e las rd en es sean m u y
com p lejas y n o se recu er den todas su s m od alidades y op cion es. Para ello
h ay qu e escrib ir db segu id o de la ord en , cu yo cu adr o de d ilogo se desea
ob ten er. e esta form a, si se qu ier e qu e apareca el cu adr o de d ilogo d e la
in stru ccin sysu se, se escr ib ir u n a ln ea com o sigu e
db sysuse
Stata n o perm ite trabajar con dos fich eros al m ism o tiem po. n su lugar, se puede ejecu tar el program a varias veces con archivos de datos distin tos. bviam en te, no h abra interferen cias n i in tercam bios en el trabajo en tre ellos.
02_primeros pasos(nuevo).indd 37
06/06/12 09:23
CS
CS
**********************************
* M. Escobar, E. Fernndez, F. Bernardi
* Anlisis de datos con Stata
* Madrid. CIS. 2009
* Ejemplo de primer programa (listauto.do)
***********************************
set more off //Esta instruccin sirve para que no se pare la pantalla.
sysuse auto, clear /* Lee uno de los ficheros ejemplos de Stata* /
list make /// Con tres barras entiende que la orden contina en la siguiente lnea.
price
set more on //Vuelve a parar la pantalla de resultados cuando se llene.
02_primeros pasos(nuevo).indd 38
06/06/12 09:23
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
66.
67.
68.
69.
70.
71.
72.
73.
74.
+- - - - - - - - - - - - - - - - - - - - - - - - - - - - +
| make
pr i c e |
| ----------------------------|
| AMC Conc or d
4, 099 |
| AMC Pacer
4, 749 |
| AMC Spi r i t
3, 799 |
| Bui c k Cent ur y
4, 816 |
| Bui c k El ect r a
7, 827 |
| ----------------------------|
| Bui c k LeSabr e
5, 788 |
| Bui c k Opel
4, 453 |
| Bui c k Regal
5, 189 |
| Bui c k Ri v i er a
10, 372 |
| Bui c k Sk y l ar k
4, 082 |
| ----------------------------|
| Cad. Dev i l l e
11, 385 |
| ----------------------------|
| Subar u
3, 798 |
| Toyot a Cel i c a
5, 899 |
| Toyot a Cor ol l a
3, 748 |
| Toyot a Cor ona
5, 719 |
| VW Das her
7, 140 |
| ----------------------------|
| VW Di esel
5, 397 |
| VW Rabbi t
4, 697 |
| VW Sc i r oc co
6, 850 |
| Vol v o 260
11, 995 |
+- - - - - - - - - - - - - - - - - - - - - - - - - - - - +
u ien es estn in teresados en este tipo de procesos pu eden con sultar los captu los -
de la gua del u su ario
Stata Corporation , cy el volum en del m an u al de Stata dedicado a
la program acin
Stata Corporation , i
.
02_primeros pasos(nuevo).indd 39
06/06/12 09:23
CS
CS
2..l
fich e r o
de
r e slt a d o s
u ien h aya trabajado u n a larga sesin con Stata y h aya qu er ido volver a
m irar los resu ltados de los p rim eros an lisis h ab r ad ver tid o qu e la pan talla
d e resu ltados tien e u n a capacidad lim itad a, p u es n o es capad e alm acen ar
m s all d e u n a determ in ada can tid ad de caracteres
.por defecto en
la ver sin de Stata
, au n qu e p u ed e ser am pliada en dit
referen ces
en eral referen ces
in doin g h asta m illon es. n tr abajos lar gos esto es u n
en orm e in con ven ien te. dem s, cu alqu iera qu e sea la lon gitu d de los resu ltad os, Stata n o es cap ad e grab ar la m edian te u n a in str u ccin . Si se desea
gu ard ar total o parcialm en te su con ten ido, es pr eciso m arcar el b loqu e deseado, y op tar m ed ian te m en de cab ecer a (dit
Copy Teto m en con tetu al (Copy Tetsu tr aslado a otr o pr ogr am a, u n pr ocesador d e teto, p or
ejem p lo .
Sin em bar go, el m odo en qu e Stata h a p revisto qu e n o se ten ga qu e r ealiar esta tarea d e cor tar y pegar, cada vequ e se gen era u n resu ltado qu e se
qu iera gu ar dar, es m edian te la gr abacin d e la pan talla de resu ltados en u n
fich er o. sta operacin n o es au tom tica y h a d e ser el u su ario qu ien in icie
el p roceso, lo deten ga, lo con tin e o lo cierr e.
ILUSTR ACI
2 .1.P a n t a lla
d e
in icio
d e
fich e r o s
de
r e slt a d o s
02_primeros pasos(nuevo).indd 40
06/06/12 09:23
partir de este m om en to, todo lo qu e ap arece en la ven tan a d e r esu ltad os, salvo la ayu d a, ser grab ad o en el fich ero, directorio y disco del or den ad or esp ecificad o. a gr abacin p u ed e ser revisad a, su sp en d id a o fin aliad a. Si se in ten ta h acer cu alqu iera de estas op er acion es m edian te m en (ile
og
m edian te icon o d e la b ar ra d e h er r am ien tas (Close
Su spen d
o con el
teclado
Ctr l
, aparece u n cu ad ro d e dilogo para qu e el u su ar io op te por
la frm u la desead a.
Caso de que el fichero con ten ga espacios en blan cos, es obligatorio qu e su n om bre sea
escrito entre com illas.
esde la versin se pu ede a adir com o opcin u n n om bre interno al fich ero de resu ltados
, nam e
n om bre
in tern o
02_primeros pasos(nuevo).indd 41
06/06/12 09:23
CS
CS
ILUSTRACI
2.2.Cad ro
d e
d iloo
p a ra
n
fich er o
d e
reslta d os
a
aierto
02_primeros pasos(nuevo).indd 42
06/06/12 09:23
2 ..La s
va r ia le s
de
la
m a t r i
de
d atos
Com o la m ayora de pr ogram as in for m ticos, Stata es bsicam en te u n a h er ram ien ta par a m an ip u lar datosd atos estadsticos en este caso. l fu n cion am ien to d e Stata con siste en m an ip u lar, m odificar y realiar op eracion es
m atem ticas sobr e u n a m atr id e datos qu e se alm acen a en la m em or ia d el
or den ador. Par a qu e Stata p u ed a trabajar con estos datos, tien en qu e estar
en el for m ato ad ecu ado, en el for m ato d e Stata. n el p rim o cap tu lo, se
ver cm o con str u ir o tr adu cir los fich eros p rop ios d e este pr ogr am a, bien
a de ten erse en cu en ta qu e se perm ite la visin de varios ficheros al m ism o tiem po,
tanto en n uevas ven tan as com o en n u evas pesta as (Tab
.
02_primeros pasos(nuevo).indd 43
06/06/12 09:23
CS
CS
sea in trodu cien do los datos m an u alm en te o tradu cin dolos d esd e fich eros
con stru idos p or otros p rogram as
com o SPSS o celal for m ato de Stata.
Per o, p rim er o, es con ven ien te eplicar operacion es m s fciles com o su u so,
el form ato y la d isp osicin d e d atos qu e en ellos se con tien e.
l igu a l qu e la m a yor p a r te d e p r ogr a m a s esta d sticos, Sta ta tr a b a ja
con u n fich er o d e d a tos estr u ctu r a d o p o r ca sos y va r ia b les. ste fich er o
h a d e r esid ir en u n d eter m in a d o d ir ector io d e u n a u n id a d d el or d en a d or.
Pa r a h a cer u so d e l y a p lica r le cu a n ta s o p er a cio n es esta d stica s se d esee,
h a d e ca r ga r se en la m em or ia cen tr a l d e la m qu in a . llo se con sigu e
a b r ien d o el fich er o m ed ia n te el m en ile
pen , el p r im er icon o d e la
b a r r a d e h er r a m ien ta s (pen
la com b in a cin d e tecla s Ctr lo, o la in str u ccin u se n om b r efich er o. n ter io r m en te se h a u tilia d o la in str u ccin
sysu se, p er o esta slo sir ve p a r a fich er o s su m in istr a d os p or el p r ogr a m a
p a r a m ostr a r ejem p los in cor p or a d os en el m a n u a l. Si se qu ier e, en con secu en cia , a b r ir u n fich er o p r evia m en te cr ea d o p or el u su a r io, com o p u ed e
ser el fich er o con in for m a cin d e p a ses, a l q u e se titu l con el n om b r e
m u n d o, la in str u ccin d eb er a in clu ir la o p cin clea r, si se d esea d esca rta r p osib les m od ifica cio n es r ea lia d a s en u n con ju n to d e d a tos ca r ga d os
en m em or ia .
u se m u n do, clear
Si se u sa un a versin de Stata an terior a la , podra ocu rrir qu e el fich ero fu era dem asiado grande para qu e cupiera en la m em oria qu e Stata reserva por defecto
egabytesal
in iciarse el program a. Con la orden set m em , el u su ario pu ede cam biar la capacidad reservada. partir de dich a versin , el usu ario n o tiene qu e preocu parse de la am pliacin de la
gestin de la m em oria, pu esto qu e el program a la gestiona au tom ticam en te.
02_primeros pasos(nuevo).indd 44
06/06/12 09:23
d e var iab les. sta or d en es describe. sa d a sin a r gu m en to n i op cin , p r op or cio n a d e ca d a va r ia b le in for m a cin sob r e el tip o d e a lm a cen a m ien to,
el for m ato d e p r esen ta cin y las etiqu eta s. p licad a sob r e el fich er o m u n do d el p r esen te ejem p lo, m u estr a el r esu lta d o p r esen ta d o en la ilu str a cin ..
Se ad vier te en pr im er lu gar qu e el fich er o con sta d e observacion es,
cada u n a d e ellas corr esp on de a u n pas. am bin se in dica qu e est com p u esto p or variab les y qu e el tam a o qu e ocu p a en d isco
y actu alm en te
en m em oriaes de .b ytes.
n la ilu str acin .se lista el con ju n to d e variab les disp on ibles en el
fich er o, ah ora cargadas en la m em or ia d el p rogram a. Cad a u n a d e ellas
ap ar ece, ju n to con su n om br e, con su tipo d e alm acen am ien to, su form ato
d e pr esen tacin y su s etiqu etas, con cep tos todos ellos qu e se ep lican en los
tres pr im os ap artad os. e estas pr opiedad es d e las variab les, la m s sen cilla, til, n ecesar ia y em p leada es el etiqu etaje. Por ello, se ab ord a en p r im er lu gar. as otras d os, el tip o y el form ato, son m s com plejas y n o tan
n ecesar ias, por lo qu e si n o se en tien d en en u n pr im er m om en to, el lector
p u ed e con tin u ar con los sigu ien tes cap tu los de este libr o sin tem or a
p erder se algo im prescin d ible.
ILUSTR ACI
2.22 .e sc r ip ci n
de
va r ia le s
Cont ai ns dat a f r om mundo. dt a
obs :
213
02_primeros pasos(nuevo).indd 45
06/06/12 09:23
CS
CS
as etiqu etas de las var iables se p on en con la in str u ccin com pu esta
label variable
la bel va ria ble pib
Produ cto in terior b ru to
Com o p u ed e dedu cir se, la etiqu eta debe ir en tr ecom illad a, obligator iam en te si tien e esp acios en blan co.
n poco m s com plejo es pon er etiqu etas a los valor es. as etiqu etas de
valor es se defin en p or listas, y lu ego se asign an a las var iables deseadas.
sto p erm ite qu e se asign e u n a m ism a lista de etiqu etas de valores a var ias
variab les con igu ales r espu estas. Por ejem plo, es posib le asign ar al m ism o
tiem po etiqu etas a los valores de u n con ju n to d e p regu n tas qu e ten gan las
m ism as posib ilidad es de r esp u esta, com o m u y d e acu erd o, d e acu erd o, en
d esacu er do y m u y en desacu erd o.
o prim ero que debe hacerse es definir una lista de etiquetas de valores, al
que se denom inar conti
por continente
. sto ha de hacerse del siguiente m odo
la bel defin e con ti
u ropa
sia
frica
m rica
cea n a
02_primeros pasos(nuevo).indd 46
06/06/12 09:23
ste p roced im ien to tien e im por tan tes ven tajas cu an do h ay varias var iab les con el m ism o tip o d e etiqu etas, com o su cede con las variab les ocde y
u e, am bas relacion adas con la p er ten en cia o n o a estos organ ism os. Par a
etiqu etar su s valores, p rim er o se d efin en las etiqu etas y d espu s se asign an
a cad a u n a de las variab les de este m od o
label d efin e perte
o
S
label valu es ocd e perte
label valu es u e p erte
ILUSTR ACI
2.2 .List a
de
e t ie t a s
tr as in str u ccion es tiles p ar a trabajar con etiqu etas son label drop
qu e
elim in a las listas de etiqu etas qu e se d eclaren ep resam en tey label save
ed ian te la an ter ior in str u ccin , la etiqu eta perte dejar d e estar asign ad a a la variab le ocd e. a lista de etiqu etas perte n o se bor ra d e la base d e
d atos, slo deja d e estar asign ada a ocde
segu ir asign ada a la otra var iable
asign ada, a u e
. m en os qu e se escrib a la ord en especfica para h acer lo
02_primeros pasos(nuevo).indd 47
06/06/12 09:23
CS
CS
Tip o
va r ia le
a lo r
m n im o
a lo r
m im o
a lor
m s
ce r ca n o
a
sin
ser
t e s
long
...
...
float
dou ble
byte
int
u enteStata Corporation
c
.
02_primeros pasos(nuevo).indd 48
06/06/12 09:23
, au tom ticam en te Stata cam b ia el for m ato d e la variab le y la con vier te en in t, qu e s pu ede alm acen ar
u n valor m ayor qu e la cen ten a. Per o, au n qu e n o sea n ecesar io asign ar d ir ectam en te el for m ato a las var iables, p orqu e Stata ya lo h ace au tom ticam en te, pu ede ocu r rir qu e los form atos sean d em asiad o gr an des par a los d atos,
p or lo qu e estos ocu pen dem asiada m em oria. Por ejem plo, en el su p u esto d e
qu e a u n a var iable de ed ad , p ara la qu e en p rin cip io el for m ato byte
qu e
p u ed e alm acen ar d e a es m s qu e su ficien te, p or u n er ror en la
in trod u ccin de d atos, se in trod u jera el valor au tom ticam en te, Stata
cam biara el tip o d e la var iable a in t. Si lu ego se ad vier te el er ror y se corr ige
cam bian d o el valor a
, el tipo de la variab le segu ir sien do in t, au n qu e los datos qu e alm acen a la var iable edad n o su peren en n in g n caso la
cen ten a
y p or tan to el tip o byte es su ficien te
. sto es as porqu e Stata m od ifica el form ato al ala per o n o a la b ajacu an do se in tr odu ce u n valor
su p er ior al m im o p er m itido por el tip o d e var iable, cam bia el form ato
p ara qu e se pu eda alm acen ar el valor corr ectam en te, p er o a m en os qu e se
esp ecifiqu e n u n ca cam bia el for m ato, si se redu ce el valor m im o. sto es
im por tan te p or qu e el form ato de la variable determ in a cu n ta m em oria
ocu pan los d atos. Si los for m atos de los datos son m ayores de lo n ecesar io,
p u ed e qu e la m atriocu p e tan to qu e n o qu epa en la m em oria de trabajo y,
en con secu en cia, su p roceso se ralen tia por la n ecesidad de u sar el disco
d u ro com o m em or ia virtu al.
a in str u ccin com press est esp ecficam en te dise ada par a este p roblem a. Cu an d o se in tr odu ce esta ord en , Stata com pr u eb a u n o a u n o los form atos de todas las var iables de la m atr iy asign a a cada u n a de ellas el for m ato m s p equ e o posible. s u n a in str u ccin qu e n u n ca m odifica los con ten idos d e la m atr i, slo el tipo de las variab les. Caso d e qu e este ya sea tan
p equ e o com o p osible, n o m odificar n ada. Pero, en m u ch os casos, este
com an do pu ede h acer m ejorar osten siblem en te el fu n cion am ien to d e Stata,
al redu cir el tam a o qu e ocu p an los datos en m em or ia.
in alm en te h ay qu e con ocer el pecu liar m odo con qu e Stata tr ata las
fech as. stas pu eden ser u n a variab le d e tetoar , u n con ju n to
d e tr es var iables n u m r icas, p ar a el da, par a el m es y par a el a o,
o u n a sola var iable n u m rica, en cu yo caso se n ecesita u n a refer en cia, u n a
fech a d e p artida qu e repr esen te el valor , qu e en Stata es el de en ero de
. n cu alqu ier caso, para qu e este pr ogr am a las tr ate com o var iable d e
fech a, esp ecialm en te en los an lisis de ser ies tem por ales, slo es vlid a la
ltim a form a de alm acen am ien to.
esu lta evid en te qu e el u su ar io n o va a in trodu cir la variable d e fech a
seg n los d as qu e h ayan tran scu rr ido desde com ien os d el a o . Par a
la con ver sin se dispon e de m u ch as fu n cion es qu e per m iten tan to pasar del
form ato u su al al m odo de trab ajo com o a la in versa.
n a de las op er acion es m s em plead as en este sen tido es la de prop orcion ar u n deter m in ado for m ato d e pr esen tacin a u n a variab le. e este
02_primeros pasos(nuevo).indd 49
06/06/12 09:23
CS
CS
m od o, u n a var iable con el valor n u m rico tem por al de pu ede aparecer liter alm en te com o jan u ary , si se le in d ica d ich o for m ato tal com o se
se ala en el p rim o ap artad o.
on de aparece listavariab les, h a d e figu rar u n a o varias variab les m ed ian te las con ven cion es pr opias d el p rogram a y don de apar ece for m ato se
especifica m edian te claves el aspecto con el qu e se desean m ostrar las variab les. esd e el p u n to de vista d el form ato tam bin es til distin gu ir los tres
tipos de var iableslas n u m ricas, las tetu ales y las de fech a.
as variables n u m ricas pu ed en p resen tarse a su vede acu erd o a
u n a de las sigu ien tes m odalidad es
p.d g, para m ostrar tod o tipo d e for m atos.
p.d f, p ar a m ostr ar for m atos de u n n m ero deter m in ado d e d ecim ales.
p.d e, para m ostr ar los n m er os en n otacin cien tfica.
d on d e p sign ifica el n m er o de posicion es qu e se d esean obten er d e u n d eter m in ado n m ero y d epr esa el n m er o d e d ecim ales qu e se qu ieren m ostr ar. tod as ellas se le pu ede a ad ir u n a c, si se desea qu e se a ad a u n a
com a cada tres dgitos par a m ejorar la legib ilid ad de las cifras lar gas. Por
d efecto, Stata em p lea los p u n tos par a epr esar los decim ales y las com as
p ar a los m illar es. sto pu ede cam b iarse con la in str u ccin set dp com m a.
n r ealidad , slo eisten d os tip os de for m atos para los n m eros, el decim al (fy el cien tfico (e
. l form ato (gh ace qu e sea el m ism o p rogram a
qu ien se en car gu e de seleccion ar la p restacin m s ad ecu ada seg n las car acter sticas del n m er o m ostrado.
02_primeros pasos(nuevo).indd 50
06/06/12 09:23
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
+- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - +
|
pai s
s uper f i ~e
pi b
t mi
t asc r ec |
| -------------------------------------------------------------|
|
Af gani s t n
652, 090
4, 100
163
2. 60 |
|
Al bani a
27, 400
4, 114
20
0. 40 |
|
Al emani a
349, 300
1, 873, 854
4
0. 30 |
|
Andor r a
500
950
.
. |
|
Angol a
1, 246, 700
9, 471
128
3. 10 |
| -------------------------------------------------------------|
|
Ant i gua y Bar buda
400
640
16
1. 40 |
| Ant i l l as Hol andesas
800
2, 360
13
0. 86 |
|
Ar abi a Saud
2, 149, 690
173, 287
18
2. 80 |
|
Ar gel i a
2, 381, 700
53, 009
33
1. 90 |
|
Ar gent i na
2, 736, 700
268, 773
17
1. 30 |
+- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - +
n cam bio, si an tes de realiar ese m ism o listado se le h u b iera cam b iad o el form ato d e u n m od o sim ilar a este
form a t .g su perficie p ib tm i tascrec
el resu ltado h u b iera sid o d ifer en te en las var iables su perficiepib y tascrec.
02_primeros pasos(nuevo).indd 51
06/06/12 09:23
CS
CS
ILUSTR ACI
2.2 .List a d o
fo r m a t e a d o
d e
ca s o s
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
+- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - +
|
pai s
super f ~e
pi b
t mi
t as c r ec |
|----------------------------------------------------------|
|
Af gani st n
652090
4100
163
2. 6 |
|
Al bani a
27400
4114
20
.4 |
|
Al emani a
349300
1. 9e+06
4
.3 |
|
Andor r a
500
950
.
. |
|
Angol a
1. 2e+06
9471
128
3. 1 |
|----------------------------------------------------------|
|
Ant i gua y Bar buda
400
640
16
1. 4 |
| Ant i l l as Hol andes as
800
2360
13
. 86 |
|
Ar abi a Saud
2. 1e+06
173287
18
2. 8 |
|
Ar gel i a
2. 4e+06
53009
33
1. 9 |
|
Ar gent i na
2. 7e+06
268773
17
1. 3 |
+- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - +
Por defecto Stata asign a el form ato .g a todas las variables alm acen adas com o byte
o integer, con .g a las variables float, .g a las dou ble y .g a las long.
02_primeros pasos(nuevo).indd 52
06/06/12 09:23
II
1.
2.
3.
4.
5.
pai s
Af gani s t n
Al bani a
Al emani a
Andor r a
Angol a
t mi
163
20
4
.
128
se m ostrar en la pan talla d e resu ltados tres fech as con secu tivas corr espon d ien tes a los pr im eros das d e los a os , y .
ILUSTR ACI
2.2 .p o s ici n
d e
fe ch a s
I
01j an1959 01j an1960 01j an1961
Com o p u ed e a p r ecia r se, la s fech a s se m u estr an en in gls con d os d gitos p ar a el d a, segu id os p or tr es ca r a cter es p a r a el m es y cu atr o d gitos
p ar a el a o. sto ta m b in p u ed e ser ca m b ia d o a l esp ecifica r el for m ato
d segu id o con u n a lista for m ad a p or u n a com b in a cin d e la s sigu ien tes
con ven cion es.
02_primeros pasos(nuevo).indd 53
06/06/12 09:23
CS
CS
CUAR
2..o r m a t o s
de
fe ch a
c C
u estra el da del ao
sin
con ceros a la i
qu ierda
u estra la sem an a
del a o sin
con ceros a la iqu ierda
.,
-
a m ism a in stru ccin an terior pu ede ser em plead a con otr os for m atos
p ar a qu e la pr esen tacin d e cad a u n a d e las fech as sea totalm en te difer en te.
l p rim o ejem p lo m u estra tr es for m atos d istin tos en los qu e p u ed en pr esen tarse los segu n dos das de los a os , y .
d ispla y d d
c , d
d
, d d-n -C
ILUSTR ACI
2 .2 .p o sic i n
de
fe ch a s
II
2 Januar y 1959
J anuar y / 2/ 60
2- 1- 1961
s preciso aadir qu e Stata tam bin pu ede con siderar las fech as sem an al, m en su al,
trim estral, sem estralm en te e incluso fechas con h ora in clu ida. n cualqu ier caso, siem pre el
pun to de referen cia es el de en ero de y la variable qu eda gu ardada com o n um ricapero
en estos casos el n m ero, en lu gar de das, significa sem anas, m eses, trim estres, sem estres o
m ilisegu n dos. Sin em bargo, com o este libro n o trata de series tem porales, se con sidera que n o
es til eplicar su u so. Se su giere pedir ayu da en Stata m edian te la in stru ccin help dates.
02_primeros pasos(nuevo).indd 54
06/06/12 09:23
ILUSTR ACI
2 .2.e n t a n a
d e l
e st o r
d e
va r ia le s
02_primeros pasos(nuevo).indd 55
06/06/12 09:23
CS
CS
l gestor d e variab les perm ite tam bin in tr odu cir y editar las car acter sticas d e las variab les. n la p arte d er ech a, se en cu en tr a u n a ven tan a in ter n a
qu e con tien e n om br e, etiqu eta, tip o, for m ato, etiqu eta de valor es y n otas d e
la variab le seleccion ad a. odas estas car acter sticas p u ed en ser m od ificad as
p or el u su ar io, del m ism o m od o qu e tam b in pu eden efectu arse cam bios
d esd e la ven tan a in ter n a d e las pr opied ad es de las variab les, qu e aparece en
la p ar te in ferior i
qu ier da d e la p an talla p or defecto d e la ver sin de Stata
vase la ilu str acin .
, sin n ecesid ad de en tr ar en el gestor de variab les,
siem p re y cu an d o apar eca abier to el can d ado situ ado d eb ajo del ttu lo
(ropertiesd e la ven tan a.
ILUSTR ACI
2..e n t a n a
in t e r n a
d e
la s
p r o p ie d a d e s
d e
la s
va r ia le s
2..
e r cicio s
am iliar
ate con los fich er os d e ejem p lo con los qu e cu en ta Stata
m ed ian te la in str u ccin sysu se. ir a qu variab les con tien e, el m odo
en qu e estn gr abadas, su for m ato d e pr esen tacin y las etiqu etas
qu e con tien e. in alm en te h au n listado de los diep rim eros casos.
02_primeros pasos(nuevo).indd 56
06/06/12 09:23
plo, todos los fich eros d el pr im er ejer cicio tien en etiqu etas en in gls,
coge u n o de ellos y reem pl
alas p or otr o id iom a. Si qu ier es con servar los cam b ios, n o olvides term in ar con la in str u ccin savereplace,
qu e se eplica en el cap tu lo .
02_primeros pasos(nuevo).indd 57
06/06/12 09:23
02_primeros pasos(nuevo).indd 58
06/06/12 09:23
3
In t r o d u cci n
d e
d atos
3 .1 .In t r o d u cci n
m a n u a l
d e
d atos
Ra r a vez se in tr od u ce in for m acin m a n u a lm en te en Sta ta. H a b itu a lm en te
se u tiliza n d atos p r eviam en te p r ep ar ad os en otr os p r ogr am a s, p or lo qu e
es im p or tan te sab er p asa r a l for m a to d e Sta ta los d a tos gr ab ad os en otr os
for m atos (en for m ato SPSS, E xcel, o S
, p or e
em p lo
. E so se con tem
p la r en el sigu ien te ap ar tad o. con tin u a cin , slo d e m od o som er o, se
in d ica cm o se in tr od u cen los d atos m an u a lm en te, u n o a u n o, en Sta ta .
ILUSTR ACIN
3 .1.Ve n t a n a
de
in t r o d u c ci n
m a n u a l
d e
d atos
03_Introduccion de datos(nuevo).indd 59
06/06/12 09:19
E R S E
S
E xcel, por e
em plo, o la vista de datos de SPSS
, con el qu e pu ede in trodu cir
se m odificarse la m atriz de datos (vase la ilu stracin .
. E n Data Editor,
cada fila es u n caso cada colu m n a u n a variable.
n trodu cir datos es tan
sim ple com o teclear en la casilla correspon dien te el valor qu e sea presion ar
la tecla In tro. Stata crea au tom ticam en te n om bres para las variables, qu e
aparecen en la parte de arriba de cada colu m n avar1, var2, etc. bviam en te,
pu eden cam biarse estos n om bres para darles m s sen tido. Para ello, a de
pu lsarse el n oven o icon o (Properties) de la barra de erram ien tas del editor, o
acceder a la ven tan a de propiedades a travs del m en del editor (View/Properties), o directam en te acien do clic en el recu adro situ ado a la dereca de
Nam e en el apartado de Variables de la ven tan a llam ada Properties, situ ada
por defecto en la parte in ferior dereca de la ven tan a de edicin . tra opcin
es acer los cam bios con el gestor de variables, qu e aparece m edian te el m en
Tools/Variables an a
erE n esta n u eva ven tan a, se en cu en tra a la dereca u n
cu adro de dilogo (vase la ilu stracin .en el qu e se pu ede cam biar el
n om bre de cu alqu ier variable, pon erle u n a etiqu eta, cam biar su tipo, m odifi
car el form ato de visu alizacin de los datos o a adirle n otas.
ILUSTR ACIN
3.2 .Cu a d r o s
de
d i lo o s
en
Va r ia b le P r o p er ties
d e l
e st o r
d e
a r ia le s
d e
St a t a
03_Introduccion de datos(nuevo).indd 60
06/06/12 09:19
Pese a su conven ien cia, en este libro se em plearn nom bres cortos en las variables para
sim plificar la lectu ra tan to en los e
em plos de rden es qu e aparecen en el texto com o en los
prrafos qu e la explican .
03_Introduccion de datos(nuevo).indd 61
06/06/12 09:19
E R S E
S
. E n este e
em p lo, a l ten er el for m ato
, si
u n ca so tu vier a el va lor ,, p od r a a p ar ecer en p an ta lla com o ,
(Sta ta r ed on d ea u n d eter m in a d o n m er o d e d ecim ales en fu n cin d el lu
gar qu e d isp on ga p a r a m ostr a r la ca n tid ad en cu estin
. Per o lo qu e se
a lm a cen a r ealm en te es ,, lo qu e a ce qu e los c lcu los estad sticos
sea n m u co m s p r ecisos.
E n la parte su perior de la ven tan a del editor de Stata se en cu en tra tan to
u n m en com o u n a barr a de erram ien tas diferen tes a la de la ven tan a prin
cipal. o m s caracterstico en el prim ero es el tem Tools, en este com o en
la barra de erram ien tas destacan dos operacion es pecu liares del editorel
filtro de observacion es, m edian te el cu al se pu eden seleccion ar las filas de la
m atriz qu e cu m plan con determ in adas car actersticas, el gestor de varia
bles, descrito al fin al del captu lo an terior. E n el ltim o icon o de la barra de
erram ien tas se en cu en tra el creador de in stan tn eas (n apsots), qu e per
m ite acer grabacion es tem porales de los datos, por si u biera qu e recu perar
datos en u n determ in ado m om en to por aber com etido alg n error en la
edicin o m od ificacin de variables, o por traba
ar in distin tam en te con dis
tin tos con
u n tos de datos . n a vez estn in trodu cidos los datos, o si se a
E n el captu lo anterior se detall cm o poner las etiqu etas m edian te la in stru ccin label
variable.
Pueden acerse tan tas grabaciones parciales de datos com o se qu iera, inclu en do los
proceden tes de distin tos ficeros, n um erndose autom ticam en te a m edida qu e se producen .
E stas instan tn eas se m an ten drn en tanto qu e no se salga de Stata o se elim in en in ten cional
m en te por el u su ario. Si se qu iere preservar perm an entem en te alg n cam bio realizado, es pre
ciso realizarlo m edian te la orden save, repla
e. Para recuperar las in stantneas, basta con acer
03_Introduccion de datos(nuevo).indd 62
06/06/12 09:19
r ep la ce
d ocu m en tos
datos Stata, al com ien zo d e la sesin d eb er a verificar qu e se
u n doble clic en la in stan tn ea deseada en tre las presen tes en el listado qu e se obtien e al apre
tar el m ism o icon o qu e sirve para generarlas. as in struccion es, caso de qu e se deseen realizar
en la con sola de Stata, son snapsot save sn apsot restore, respectivam en te.
03_Introduccion de datos(nuevo).indd 63
06/06/12 09:19
E R S E
S
en cu en tr a en ese d ir ector io
, caso de n o estarlo, cam biarlo m edian te la si
gu ien te or den
cd
d
d ocu m en to
datos Stata
3.2.Le ct u r a
de
d atos
co n
St a t a
E n la m aor par te d e las ocasion es, los d atos con los qu e se tr aba
a n o son
in trodu cid os d irectam en te p or el an alista, sin o qu e pr ovien en d e in stitu tos
u or gan ism os d edicados a la r ealizacin de en cu estas. E n estos casos, los
d atos p u ed en estar en dos for m atos
. orm ato S
eso dire
to
puede in dicarse la ru ta de com ien zo del program a en la casilla Ini
iar en .
E sta orden es cru cial, sobre todo, cu an do pasan los datos de un orden ador a otro, por
qu e n o siem pre la estru ctu ra de las carpetas de los ficeros es idn tica en u no u otro, o porque
las opciones por defecto de Stata sean diferen tes. Para qu e los e
ercicios in cluidos fu n cion en
bien , el u su ario ten dr qu e especificar en qu directorio a colocado los ficeros de traba
o.
E sto slo lo ten dr qu e acer u na vez en cada ficero, pu esto qu e se em plea el recu rso de los
m acros globales, para evitar tener que realizarlo repetidam en te.
03_Introduccion de datos(nuevo).indd 64
06/06/12 09:19
2
1 eer datos en
orm ato II
on tata
ep en d ien d o d e cm o estn alm a cen a d os los d atos en el ar civo d el qu e
se d ispon ga, abr qu e u tilizar u n a u otr a in str u ccin d e Stata. E n el cu a
d ro .pu eden verse u n as in d icacion es fu n dam en tales p ara sab er qu ord en
a de u tilizarse en fu n cin del form ato de la b ase de datos dispon ib le. H a
cu atr o p osibilidades pr in cipales, de crecien te com ple
idad versatilidad
d esde la in str u ccin in seet (relativam en te sen cilla d e u sar asta in
ile con
d iccion ar io (bastan te com p licad a p er o m u co m s poten te
.
CUAR
3.1.i
e r e n t e s
in st r u ccio n e s
a r a
la
le ct u r a
d e
d a t o s
en
St a t a
Reu ier e
Reu ier e
Reu ie r e
el
Ne ce sita
un
Sea r a cin
com illa s
en
u e
ca d a
ila
n om r e
de
d iccion a r io
d e
a r ia les
a r ia les
de
r e r esen te
la s
a r ia les
.ct
teto
un
ca so
n seet
n file
form ato libre
n fix
n file
an co fi
o
abu ladores o
com as
E spacios o
com as
ingu n a
(an co fi
o
ingu n a
(an co fi
o
o (opcion al S
o (opcion al o
clea r
ta
com m a
d elim iter
carcter
03_Introduccion de datos(nuevo).indd 65
06/06/12 09:19
E R S E
S
a op cin
lear perm ite car gar en m em or ia u n n u evo ficer o, sin
per
u icio d e qu e est car gad o alg n otr o. E n in seet, pu ede especifi
carse tam b in los n om b res de las variab les qu e an de leer se, p ero
n o es n ecesar io. E n el caso de qu e la pr im era ln ea del ar civo re
p resen te los n om br es de las var iables separad as por tabu lad ores o
com as, in seet as lo en ten d er dar esos n om b res a las var iables.
Por e
em plo, las tr es ln eas del ar civo ficer o.dat, qu e in clu e la
m atriz de datos d e la ilu stracin ., an de ser las sigu ien tes
ILUSTR ACIN
3.3 .ic e r o
d e
d a t o s
co n
orm ato
de
o
a
de
c lcu lo
(fich er o.d a t)
sexo, ed ad
,
,
on lo cu al Stata leer las var iables del arcivo asign n d ole los
n om br es qu e se esp ecifican en la in stru ccin . ora b ien , si se expli
cita el n om b re d e las variab les, aqu e n om b rar todas las qu e aa
en el ar civo, por qu e si n o, Stata dar u n m en sa
e d e err or.
on vien e recordar la distin cin en tre ficeros bru tos de datos (con exten sin dat o tt
los ficeros de datos defin icion es grabados por Stata (con extensin dta
.
03_Introduccion de datos(nuevo).indd 66
06/06/12 09:19
b In
ile
on
orm ato libre
orm ato
i
o
a r ia le
ca d e n a
(fich er ob .d a t)
1 21 J uan
2 20 " Mar a J os "
om o pu ede ver se, los valores estn sep arados p or espacios. Sta
ta, al leer los d atos con in
ile, p on d r el pr im er valor en la pr im era
var iable, el qu e est tras el pr im er espacio en la segu n da, etc. E n
cam bio, la ln ea d e la m u
er de a os tien e u n esp acio en tre a
ra
os, p or lo qu e tod o el n om br e d eb e estar en trecom illado.
s Stata sab e qu e tod o lo qu e est en tr e las com illas, in depen dien
tem en te de los espacios, va en la tercera var iable.
Por tanto, si en el arcivo de datos avariables alfanum ricas, la
orden cam bia ligeram en te. En este caso, abr qu e especificar antes
E ste com an do tam bin se puede u tilizar si los valores estn separados por com as, pero
en ese caso es m s sen cillo u sar in seet en la m aor parte de los casos.
03_Introduccion de datos(nuevo).indd 67
06/06/12 09:19
E R S E
S
orm ato
i
o
una
so la
ln e a
o r
ca so
(fich er o c.d a t)
121J uan
220Mar a J os
om o en la orden in
ile de form ato libre, tam bin aqu e especi
ficar el form ato de las variables de texto, au nqu e aqu no aga falta
poner su tam a o porqu e est im plcito en el anco de la variable. E n
este caso, se a pu esto an tes de la variable n om bre la palabra str, para
qu e Stata la iden tifique correctam en te com o variable de texto. E sto no
es n ecesario para las variables nu m ricas. ras el nom bre de cada va
riable, a de especificarse su an co, indicando de qu colu m n a a qu
03_Introduccion de datos(nuevo).indd 68
06/06/12 09:19
colum n a van los datos qu e le correspon den . E n este caso, los n om bres
de los su
etos estn alm acen ados desde la colu m na a la colu m na .
anto en in
icom o en in
ile con anco fi
o pueden leerse m enos va
riables que las que realm ente aen el arcivo si as se desea. Sim ple
m ente, saltando unas determ inadas colum nas del arcivo en la secuencia
de la instruccin, esas colum nas no sern ledas ni incluidas en ninguna
variable. Por e
em plo, si en el ltim o e
em plo que se a citado se quitara
edad 2-, el arcivo se leera perfectam ente, pero sin esta variable.
ILUSTR ACIN
3 ..ice r o
de
d a t o s
co n
or m a to
i
o
m s
de
una
ila
o r
ca so
(fich er od .d a t)
121
J uan
220
Mar a Jos
r as el com an d o in
i, se especifica el n m er o de ln eas (lin es
lu ego se pr ecede cad a n u eva ln ea por su n m er o d os pu n tos (
.
Realm en te, par a ar civos com plicados con m u cas m s var ia
b les es m s con ven ien te u tilizar u n d iccion ar io en lu gar d e dar r de
n es de lectu ra en el prop io com an do. In
ip u ed e u tilizarse con u n
d iccion ar io, p er o su verd ad er a u tilidad es com o u n m odo sen cillo d e
leer ar civos con for m ato de an co fi
o. Para leer arcivos verd ad e
r am en te com p licad os, el com an do m s poten te es in
ile con u n d ic
cion ario, cu o for m ato se explica a con tin u acin .
d In
ile de an
o
i
o (
on di
03_Introduccion de datos(nuevo).indd 69
06/06/12 09:19
E R S E
S
ice r o
d iccio n a r io
d e
la
in st r u cci n
in file (d iccion a r io .d ct)
olm n (
, tipo (b
te, str
,
n om br e (seo, edad n om bre
, for m ato (f o s
, etiqu eta (eo,
Edad Nom bre de pila
, ados in stru ccion es im prescin dibles para
la lectu ra d e ficer os con m s d e u n a ln ea p or casoon lin es(
,
se ord en a la lectu r a de ln eas p or in divid u o, en este caso. con
lin e(se in d ica qu e las colu m n as poster iores corr espon den o estn
situ ad as en la ln ea in d icad a en el n m ero .
n a vez con stru id o grabad o el ficero d iccion ar io, es im pr es
cin dible u tilizarlo m edian te la or den in
ile sin segu ida d el n om bre
qu e se le a asign ado al ficer o, di
ion ario
d
t, en este caso
in file u sin g
d iccion ario
, clear
03_Introduccion de datos(nuevo).indd 70
06/06/12 09:19
E n el segu n do e
em p lo se tr ata de leer en Stata las d os pr im eras
p regu n tas del cu estion ario d el
S , la en cu esta postelectoral
d e m ar zo de .
E l arcivo de datos se en cu en tra en form ato de an co fi
o, en el
cu estion ario se especifican los an cos las posicion es de cada varia
ble en el arcivo. Se dispon e, por con sigu ien te, de u n a prim era pre
gu n ta con u n a sola variable, qu e ocu pa la posicin de la prim era
fila de u n a segu n da pregu n ta con cu atro variables, qu e ocu pan res
pectivam en te u n a posicin desde la asta la . E l m ism o cu estio
n ario qu e proporcion a el
S da in form acin acerca de cm o fu eron
ecas las pregu n tas, cm o estn codificados los valores de las varia
bles tam bin in dica en qu posicin fu e grabada cada variable, a
travs de u n n m ero en tr e parn tesis qu e represen ta en qu colu m n a
de la ln ea del arcivo de d atos est la variable. s, se sabe qu e la
pregu n ta est en la colu m n a , las cu atro sigu ien tes variables de
la segu n da pregu n ta en las , , . on esa in form acin , pu e
den leerse los datos en Stata con la orden in
ile u n diccion ario.
ILUSTR ACIN
3..o s
r im e r a s
r e u n t a s
d e l
e st u d io
d e l
CIS
23
2
P. 1 Par a empez ar , podr a Ud. dec i r me s i r ec uer da, c uando er a ni o o adol es c ent e,
c on qu f r ec uenc i a s ol a habl ar se de pol t i c a en su c as a: c on mucha f r ecuenc i a, de
v ez en c uando, pocas vec es o pr c t i cament e nunca?
-
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
1
2
3
4
8
9
( 28)
P. 2 I nd queme, por f av or , has t a qu punt o es t Ud. muy de ac uer do, de ac uer do,
en des ac uer do o muy en des ac uer do c on cada una de l as s i gui ent es f r as es ?
Muy
de ac .
De
ac .
( 29)
- A t r av s del v ot o, l a gent e
c omo y o puede i nf l ui r en l a
pol t i ca . . . . . . . . . . .
( 30)
( 31)
( 32)
En
desac .
Muy en
des ac . NS
NC
.cis.es.
03_Introduccion de datos(nuevo).indd 71
06/06/12 09:19
E R S E
S
ice r o
d iccio n a r io
d e
la
in st r u cci n
in file (cis23 84 .d ct)
Se u tiliza elp in
ile1 para la orden de lectu ra con datos con form ato libre o con varia
bles separadas por com as. Se en cu en tra un a detallada explicacin con n u m erosos e
em plos en
el m an u al de gestin de datos en las entradas in
ile, in
ie in seet (Stata d
03_Introduccion de datos(nuevo).indd 72
06/06/12 09:19
t
ileStata tam b in in cor por a la ord en ot
ile para el caso de qu e
se d esee acer lo con tr ar io a lo qu e se a explican d o an teriorm en te
gu ard ar d atos qu e se en cu en tr en abier tos en Stata en form ato S
,
d e tal m od o qu e pu edan lu ego ser ledos p or cu alqu ier p rogr am a d e
estadstica o b ase de datos. on la sigu ien te in str u ccin
ou t
ile
u sin
n om b reficero
co m m a
2
2 e
tra es
ritra de datos en
orm ato E
el
esd e su s ltim as version es, Stata es capaz de leer tradu cir ficer os qu e
n o estn escr itos en form ato S
Se en tiende por form ato de m atriz aqu el en el qu e los casos son colocados en las filas
las variables, con sus correspon dien tes nom bres en la prim era fila, en las colu m n as.
03_Introduccion de datos(nuevo).indd 73
06/06/12 09:19
E R S E
S
Para llevar a cabo este com etido basta con escribir la siguien te instruccin
im ort ecelnom breficero
, seet
nom breo
a
ir stro
cellra n e
rango
ice r o s
ce l
a
St a t a
2
i
eros pro
eden tes de P
Stata n o es ca p az d e leer ficer os b in ar ios d e SPSS. Sin em b ar go, SPSS
p u ed e leer sin d ificu lta d los ficer os d e Stata , siem p r e cu an d o se a an
gu a r d ad o en for m ato an tigu o (saveold), p u es los ficer os d e la s ltim a s
ver sion es tien en u n for m ato d istin to n o in cor p or a d o en las r u tin a s d e lec
03_Introduccion de datos(nuevo).indd 74
06/06/12 09:19
esde la versin de Stata existen dos tipos de version es que gen eran ficeros ligera
m ente distin tos. os de la versin especial (SE tien en un a m aor capacidad en el alm acen a
m iento de variables. sim ism o, n o acom patibilidad en tre los ficeros de la versin , ni de
la versin de Stata, con los program as de version es an teriores. Para solven tar este ltim o
problem a, desde u n a versin reciente pu eden grabarse los ficeros para que puedan ser ledos
en version es anteriores m edian te la orden saveold n om breficero.
E sta operacin tam bin pu ede acerse m edian te sintaxis, em plean do la instru ccin de
SPSS
et stata
ile nom breficero.
03_Introduccion de datos(nuevo).indd 75
06/06/12 09:19
E R S E
S
2
e
tra de datos en
orm ato bin ariotat/Tran s
er
Si u n a deter m in ada b ase d e datos est en u n for m ato n ativo d e otro p rogra
m a estadstico, o ap licacin , su in for m acin n o p od r ser leda a n o ser qu e
se em plee u n a u tilidad esp ecializada en con versin d e datos estad sticos,
com o es Stat
r an sfer, d el qu e se explicar a con tin u acin m u som er am en
te su u so. lter n ativam en te, si se d isp on e d e este pr ogr am a, pu eden gu ar
d ar se los d atos en for m ato S
, en for m a to fi
o, p ar a p od er r ecu p er ar los d esp u s en Sta ta con in seet, in
io in
ile, seg n se a explicado en el apar tado an ter ior. for tu n a
d am en te, desd e la ver sin del SPSS, a es p osible gu ard ar los ficer os
con la estru ctu r a d e Stata.
Per o si n o se disp on e del p rogram a m en cion ado
, en cam bio, se cu en ta
con u n ficer o gr abado en form ato sav, ab r qu e u tilizar Stat
r an sfer,
p ar a tr an sform ar lo en dta p oderlo u tilizar en Stata. asta u n e
em p lo para
obten er u n a id ea de cm o se u tiliza este pr ogram a.
ILUSTR ACIN
3.1 2.Cu a d r o
d e
d i lo o
r in cia l
de
St a t
Tr a n s
er
03_Introduccion de datos(nuevo).indd 76
06/06/12 09:19
Supngase que se tiene un arcivo, guardado en form ato SPSS, tal com o lo
ofrece el entro de
nvestigaciones Sociolgicas, que contiene los datos de la
encuesta postelectoral de m arzo de (cis.sav
, se desea pasar al for
m ato de Stata para traba
ar con este otro program a. En la ilustracin .pue
de observarse el aspecto de la ventana principal de Stat
ransfer. Esta se divide
en dos partes, la de arriba para el arcivo de origen (el que a de convertirse a
Statala de aba
o para el arcivo de destino (el nom bre que se quiera dar al
nuevo arcivo convertido
. Se elige, en prim er lugar, el arcivo de datos de ori
gen, el que se desea convertir. Stat
ransfer es capaz de determ inar autom tica
m ente su tipo, no ace falta ponrselo. E n este caso, el arcivo de origen es
cis.sav, que se a seleccionado a travs del cuadro de dilogo ele
ionar
arcivo que aparece al pulsar rowse. na vez elegido el arcivo de origen, a
que seleccionar el tipo de arcivo en el que quiere convertirse, donde pone
tpt ile T
pe. En este caso, se a elegido Stata version . utom ticam en
te Stat
ransfer pone al arcivo de destino el m ism o nom bre que al de origen,
aunque con diferente extensinla extensin del form ato que lleve, en este caso
dta, la extensin de los arcivos de Stata. na vez especificados el ficero de
entrada el tipo de ficero de salida, se puede pulsar el botn Trans
er que est
en la esquina izquierda inferior para que Stat
ransfer cree un nuevo arcivo
con toda la inform acin del arcivo de origen pero en el form ato propio de Sta
ta, de m odo que
a pueda traba
arse con el nuevo ficero sin problem as.
ILUSTR ACIN
3 .1 3.Cu a d r o
de
d i lo o
de
a r ia le s
en
St a t
Tr a n s
er
03_Introduccion de datos(nuevo).indd 77
06/06/12 09:19
E R S E
S
E ste pr ogram a de con ver sin tien e m u cas d iferen tes opcion es con las
qu e pu ede con trolarse cm o se con vierten los arcivos de u n tip o a otro.
as opcion es m s com u n es son las qu e se en cu en tran en la p esta a Variables d e la ven tan a d e Stat
r an sfer (vase la ilu stracin .
. E n la p ar te d e
la izqu ierd a, pu eden seleccion arse las var iables qu e se qu ieran tradu cir las
qu e n o (por om isin , estn tod as seleccion ad asespecificar su s tip os en
Tar
et T
pe. E n la p ar te dereca, ar riba, se en cu en tran las opcion es de i
Variable ele
tor, qu e perm ite seleccion ar (m an ten er o elim in ar var iables en
fu n cin de deter m in adas con dicion es . Pero lo qu e es esp ecialm en te til es
el b otn qu e est
u sto d eb a
o, en el recu ad ro de Tar
et T
pe ptim i
er. Stat
r an sfer, en pr in cipio, asign a a casi tod as las var iables el tipo float, esto
ocu pa m u ca m em or ia. Si se seleccion a el botn ptim i
e, se an alizan los
d atos del ar civo d e or igen se d eter m in a p ar a cad a variab le el tip o m s
p equ e o p osible . E sto es m u im por tan te p u es p er m ite crear arcivos p e
qu e os con m s posib ilid ad de qu e qu epan en m em oria
, en con secu en cia,
con los qu e Stata tr ab a
a con m u ca m s r ap id ez.
3.3.u si n
de
ice r o s
n a vez qu e se disp on e de u n ficer o, se le pu ede a adir in form acin sim i
lar de otros ficeros, tan to de casos, operacin a la qu e se den om in ar n in ,
com o de variables en este su p u esto se ablar d e
om bin a
in .
1 n in de
i
eros
E n la pr im era d e las opcion es, es pr eciso qu e las var iables (todas o par te
sean igu alesm ien tras qu e en la segu n da, es n ecesar io qu e los casos (todos
o u n su b con
u n tosean id n ticos.
u n qu e esto par ezca com ple
o, con u n p ar d e e
em p los, se com p ren der
con facilid ad . Par a ello, se tien e, por u n lad o, la m atr iz d e datos qu e figu ra
en la ilu str acin .gr ab ada en u n ficer o de datos Stata con el n om br e de
ficer o.dta. Por el otro, se d ispon e de otr a m atriz alm acen ada en ficer o
.
d ta, qu e con tien e dos casos m su n om b re d e a os u n a m u
er de .
Par a p on er u n o a con tin u acin de otro son p recisas d os oper acion es. a
prim era es cargar en m em oria el pr im er ficerola segu n da, a adir los casos
n ecesarios, en tan to qu e am b os ficer os ten gan algu n a variab le en com n
seo edad, en este e
em p lo.
03_Introduccion de datos(nuevo).indd 78
06/06/12 09:19
ice r o s
u n id o s
1.
2.
3.
4.
s exo
1
2
1
2
edad
21
20
20
19
2 om bin a
in de
i
eros
Si, en lu gar d e a adir casos, se desea ad
u n tar variab les, se ablar d e com
b in acin d e ficeros
, en lu gar de em p lear la in stru ccin appen d, ten dr
qu e u tilizarse m er
e, cu a sin taxis m s elem en tal es la sigu ien te
m e r e 1
1
n u sin n om breficero
, opcion es
Par a e
em plificar esta op er acin , se u tilizar com o b ase el ficer o an te
r ior de cu atr o casos dos var iables. este se le com b in ar el ar civo den o
m in ado ficerox.d ta, qu e con tien e en el m ism o or den los m ism os cu atro
casos d el otro ar civo, con u n a var iable de texto d en om in ada n om b re .
03_Introduccion de datos(nuevo).indd 79
06/06/12 09:19
E R S E
S
ice r o s
c o m in a d o s
1.
2.
3.
4.
s ex o
1
2
1
2
edad
21
20
20
19
nombr e
J uan
Mar a J os
Al f r edo
I s abel
_mer ge
3
3
3
3
oin
varlistu sin
nom breficero
, u n m a tced
n on e
ot
m a ste r
u sin
m e r e (n om b revaru d a t e
E l e
em p lo d e esta in str u ccin u sa co m o b a se el ficer o lista d o en la
ilu str a cin ., a l qu e se le com b in a en fu n ci n d e d os va r ia b les la si
gu ien te m a tr iz d e d a tos gu a r d a d a en el a r civo ficer ou .d ta , d on d e a d e
m s d el n o m b r e ( n ico
, se en cu en tr a u n a ter cer a va r ia b le d en o m in a d a
r egio n . a m a tr iz d e d a tos d e este n u evo ficer o p r esen ta esta d isp o si
ci n
Para u n correcto fu n cionam ien to de la com bin acin de ficeros el con
u nto de valores
de las variables que siguen al
oinba de ser n ico con el fin de que se produ zca u n a com bi
n acin de caso por caso. E l caso m s frecu en te para ello es u n a variable de iden tificacin pero
tam bin puede utilizarse u n par de variables com o en el e
em plo, o en el caso de qu e dispon ga
de dos bases de datos tem porales por pases. E n este ltim o supu esto, la u tilizacin de las va
riables pais a o pu eden gen erar iden tificaciones n icas qu e perm itan un correcto aparea
m ien to de los datos de u n o otro ficero.
03_Introduccion de datos(nuevo).indd 80
06/06/12 09:19
ILUSTR ACIN
3 .1 .a t r i
de
d a t o s
d e l
a r cio
fich er o u .d ta
nombr e
J uan
Al f r edo
Mar a J os
I sabel
Car men
J os
Ter es a
Pedr o
r egi on
Sur
Nor t e
Sur
Nor t e
Sur
Nor t e
Nor t e
Sur
Se le a a ad ido la op cin m er
e, par a qu e n o se su p er pon ga la var ia
b le m er
e gen er ada en el an terior e
em p lo. e este m od o, tras u n a ord en d e
listad o se obtien e el r esu ltad o p lasm ad o en la ilu str acin ..
ILUSTR ACIN
3 .1.List a d o
de
c a so s
de
la
co n
u n ci n
de
d o s
ice r o s
o c i n
o r
de
e ct o
1.
2.
3.
4.
sex o
Hombr e
Muj er
Hombr e
Muj er
edad
21
20
20
19
nombr e
J uan
Mar a J os
Al f r edo
I sabel
_mer ge
3
3
3
3
bot
bot
bot
bot
h
h
h
h
i
i
i
i
n
n
n
n
mas t
mas t
mas t
mas t
er
er
er
er
and
and
and
and
us i
us i
us i
us i
c ombi
ng dat
ng dat
ng dat
ng dat
na
a
a
a
a
r egi on
Sur
Sur
Nor t e
Nor t e
03_Introduccion de datos(nuevo).indd 81
06/06/12 09:19
E R S E
S
ice r o s
o ci n
bo th
1.
2.
3.
4.
5.
6.
7.
8.
nombr e
J uan
Mar a J os
Al f r edo
I sabel
Car men
Pedr o
J os
Ter es a
s exo
Hombr e
Muj er
Hombr e
Muj er
Muj er
Hombr e
Hombr e
Muj er
edad
21
20
20
19
22
.
23
24
r egi on
Sur
Sur
Nor t e
Nor t e
Sur
Sur
Nor t e
Nor t e
i
i
i
i
n
n
n
n
bot
bot
bot
bot
h,
h,
h,
h,
mast
mast
mast
mast
er
er
er
er
agr ees
agr ees
agr ees
agr ees
onl
onl
onl
onl
wi
wi
wi
wi
y
y
y
y
t
t
t
t
i
i
i
i
h
h
h
h
n
n
n
n
combi na2
us i ng dat a
us i ng dat a
us i ng dat a
us i ng dat a
us i ng dat a
us i ng dat a
us i ng dat a
us i ng dat a
3..
e r cicio s
rea con Stata u n a b ase d e d atos sen cilla con los d atos de sexo, ed ad
n om br e d e p ila de su fam ilia o de u n gr u p o de am igos.
E n tr a en la pgin a del
E (.in e.es
, con su lta el cen so del
(bu sca, p or e
em plo, las cifras d e los abitan tes de las capitales
de pr ovin cia. escrgalas com o u n ficer o
sv
, a con tin u acin , lelo
con Stata. ota qu e el
E pon e en cab ezados pie a los d atos
, an tes
de ser ledos con el com an do d el pr ogram a estadstico, deber a ed itar se
el ficero ba
ad o con u n ed itor d e textos (n otepad, p or e
em ploa fin de
elim in ar las pr im er as las ltim as ln eas. tr a cu estin a ten er en
cu en ta es qu e el
E ter m in a los r egistr os con u n a com a, com o si u
bier a u n a ltim a var iable sin d ato. Por ello, en el caso d e qu e se lea con
n om br es d e variab les, abr a qu e a adir u n a, qu e poster iorm en te p u ed e
elim in ar se.
H az lo m ism o con la pob lacin p or pr ovin cias. espu s in ten ta com bi
n ar (m er geam bos ficer os.
escar ga u n barm etr o de la pgin a d el
S, por e
em plo el estu dio
de m ar zo de . en er alm en te los estu dios del
S se com p o
n en d e siete ficer os
la fica tcn ica (t
, el cu estion ario (cu es
,
el libr o d e cdigos (cod igo
, las tar
etas (tar
etas
, el p rogram a
en SPSS (E S
, en SS (Saslos datos en form ato S
(
. Para los e
er cicios de los sigu ien tes cap tu los, se va a u tilizar
el b arm etr o de m ar zo. on str u e u n ficer o do con in
ile. ptativa
03_Introduccion de datos(nuevo).indd 82
06/06/12 09:19
m en te tam b in coloca las etiqu etas d e var iables valor es con las in s
tr u ccion es apr en d idas en el cap tu lo an ter ior. om o su ger en cia, u tiliza
com o gu as el pr ogram a d e SPSS (p ar a in
ile label de
in eel d e SS
(par a label variable
.
Realiza la m ism a op eracin qu e en el e
er cicio an terior con otr o b ar
m etr o, com o el de ab ril de (estu dio
. n e los d os estu dios
m edian te la in str u ccin appen d, m an ten ien do slo las variab les qu e
sean com u n es a am bos.
03_Introduccion de datos(nuevo).indd 83
06/06/12 09:19
03_Introduccion de datos(nuevo).indd 84
06/06/12 09:19
4
E st a d st ica s
de
una
so la
va r ia b le 1
4 .1 .Cla s ifica ci n
d e
va r ia b le s
Au n qu e in form ticam en te las variab les se d istin gan por su lon gitu d y su cod ificacin textu al o n u m rica (vase seccin 2.6.2
desde u n p u n to de vista
estad sticola m e
or clasificacin se fi
a en las car acter sticas in tr n secas
qu e ten gan los valor espor m s qu e estos su elan codificar se n u m ricam en tein depen d ien tem en te d e su s pr opiedad es. n el p rim er e
em p lo d e m atri
d e datos (ilu str acin .ap arecier on dos variab les con cdigos n u m ricos
qu e en el fon do son difer en tes. n la pr im er asu s cdigos ( y 2
au n d e
n atu r alea cu an titativar ep resen taban cu alidadesarn y u
er. a segu n da pr esen taba valores con sign ificad o pr opiam en te n u m r ico2
y 2. o cab e la m en or d u d a de qu e el tr atam ien to qu e se p u ed e aplicar a
u n a y otr a variab le a d e ser m u y d istin to. n a p rim er a clasificacin sim ple
es la qu e se acab a de m en cion ar en tre las var iables cu yos valor es son cu alid ades o categor astam bin llam adas atribu tosy aqu ellas cu yos valores son
n m er os con pr opiedad es ar itm ticas. l sexo y la ed ad son e
em plos clar os
y r espectivos d e am bos tipos de variab le. er o tam bin lo son la clase social
(con su s d istin tas categor asy los in gr esos (exp resados en dlaresp esetas
o eu rosp er oen tod o casocan tidades
.
n tre las variables cu alitativas se d istin gu en las n om in alescu yos valores
slo p oseen la p rop ied ad d e la iden tid ad (cu alqu ier valor es igu al a s m ism o
y diferen te d el resto
y las ordin alesen las qu e p u ed e establecerse u n a
erarqu a com pleta en tre valoresd e m an era qu esi u n valor llam ado a est situ a-
o son cen ten aressin o m ileslos libros y m anu ales de estadstica bsica qu e se an
escrito desde la segunda m itad del siglo x x . n este contexto se recom ienda a quienes em pie
an
a aproxim arse a la estadstica qu e com plem enten este captulo y el de grficos (6con u n bu en
m an ual de la m ateria. n tre ellosse sugieren com o clsicos laloc(66y piegel (
.
am bin son bu en as in troduccion es arca errando (
e a y om o (2
as com o
u adras (6
. n un a ln ea m u y sim ilar a estos captu loscon program a distintose en cu en tra scobar (
. tiles tam bin son eter et al. (
as com o am ilton (2
. ste
ltim o con tien eadem scom o este librolas rden es de tata.
04_Estadsticas.indd 85
06/06/12 09:20
(.
r opied ad or din al de los valor es
(.2
or su ladolas variables cu an titativas pu eden clasificarse en variables de
in tervalo o de razn , seg n carecan o ten gan u n valor qu e represen te la
au sen cia total de la calidad qu e estn represen tan do. l cocien te in telectu al
slo pu ede ser clasificado de variable de in tervalopu es el valor es arbitrario
y n o equ ivale a la caren cia absolu ta de in teligen ciaen cam biopu ede catalogarse com o variable de ran a los in gresos m edidospor e
em ploen eu rosya
qu e en este caso el in dica la au sen cia total de lo qu e expresa la variable. o
se tratacom o a veces su ele con fu n dirsede qu e la variable ten ga o n o el valor
para catalogarla de u n a u otra form asin o del sign ificado qu e tien e este valor.
tra clasificacin til para variables cu an titativas es la qu e sep ara a las
variables discretas d e las variables con tin u as. ericam en telas prim eras son
aqu ellas con lim itad o n m ero de valoresde m od o qu e en tre dos valores con tigu os es im p osible en con trar em pricam en te u n tercero con u n valor in term edio. n a p erson a p u ed e ten er d os o tres erm an ospero n o dos erm an os
y m ed io. n cam bioen las variables con tin u as siem p re ser posib le im agin ar
valores in term ediosp u es el n m ero de ellos es in fin ito. Asen tre u n a p erson a qu e p esa 6g y otra qu e pesa 6ges posible en con trar otra con 6
g
la n ica lim itacin estara en la precisin d e los in stru m en tos de m edid a.
tata con tien e u n a ord en en la qu e se m u estr a u n resu m en de los valores
qu e p resen tan todas las variables d e u n a m atr i(o ficer oo u n con
u n to de
variab les esp ecificadas. e tr ata d e la in str u ccin codebook.
u se ficeroa
codeboosexo edad
04_Estadsticas.indd 86
06/06/12 09:20
ILUSTR ACI
4.1 .Lib r o
de
c d io s
d e
la s
va r ia b le s
s exo
ed a d
-----------------------------------------------------------------------------s exo
( unl abel ed)
-----------------------------------------------------------------------------t y pe:
numer i c ( by t e)
r ange:
uni que v al ues:
[ 1, 2]
2
t abul at i on:
Fr eq.
2
2
uni t s :
mi s si ng . :
Numer i c
1
2
1
0/ 4
Label
Hombr e
Muj er
-----------------------------------------------------------------------------edad
( unl abel ed)
-----------------------------------------------------------------------------t y pe:
numer i c ( by t e)
r ange:
uni que v al ues:
t abul at i on:
[ 19, 21]
3
Fr eq.
1
2
1
uni t s :
mi s si ng . :
1
0/ 4
Val ue
19
20
21
s preciso in sistir en qu e la variable sexoau n qu e sea cu alitativatien e su s valores gu ardados en form ato n u m rico (y 2
. or ellose recu rre
a etiqu etarlosel prim ero con om bre y el segu n do con u
er. Am bos
valores tien en u n a frecu en cia de dos casos. or otro ladoa las variables literalm en te cu an titativas n o procede pon erles etiqu etas a los valores. am poco
se les a pu esto en este e
em plo a las variablespu esto qu e su n om bre (sexo
y edadson lo su ficien tem en te aclaratorios com o para qu e n o requ ieran u n
ttu lo m s explcito.
4 ..La
t a b la
de
d ist r ib u ci n
d e
fr e cu e n cia s
a fo r m a m s elem en ta l d e r esu m ir la in for m a cin d e u n con
u n to d e
d a tos es la ta b la d e d istr ib u cin d e fr ecu en cia sq u e con siste en p r esen ta r p a r a ca d a va lor d e u n a y slo u n a va r ia b le el n m er o (fr ecu en cia d e ca sos qu e lo co m p a r te. igu ien d o el e
em p lo d e la ilu str a ci n .
d e lo s cu a tr o ca sos p r esen tes en la m a tr id e d a to sd o s so n va r o n es y
dos m u
er es. e igu a l m od o en la va r ia b le eda d existen d os ca sos con el
m ism o va lor (2a o s
p er o a y o tr o s d os con va lor es n ico s (y 2
.
a d isposicin tpica d e u n a tabla de distr ibu cin d e frecu en cias con siste en
a xpon er com o en cab eam ien to el n om b re de la var iable.
b istar en la pr im er a colu m n a el reper torio d e los d istin tos valor es
qu e p resen ta la var iable en tr e los su
etos en estu d io.
04_Estadsticas.indd 87
06/06/12 09:20
(.
s til a n es tran sfor m arlas en p orcen ta
esp u es de esta form a son de m s fcil in ter pr etacin y la com u n icacin con el lector
u oyen te resu lta favor ecid a (ilu str acin .2
.
e Ad em sp ar a variab les or din ales o cu an titativastam b in r esu lta
til a ad ir u n a colu m n a con los p or cen ta
es acu m u lados (P i)qu e
con sisten en la su m a pr ogr esiva de los por cen ta
es sim ples d e la an terior colu m n a.
(.
a r a qu e ta ta ela b or e la ta b la d e d istr ib u cin d e fr ecu en cia de u n a
sola va r ia b le a y qu e u tili
a r la in str u ccin ta bu la te n om b r e
d eva r ia ble.
i d e d esea con u n a sola in str u ccin solicita r m s de u n a va r ia blea y
qu e u tili
a r la or d en ta b1 n om b r es
d e
va r ia b lesen lu ga r d e la or igin a l
ta bu la te. Asp a r a obten er la s fr ecu en cia s a b solu ta sr ela tiva s y a cu m u la da s d e la s va r ia b les sexo y eda dd el a ctu a l e
em p loa b r qu e escr ib ir la
or d en
tabsexo ed ad
04_Estadsticas.indd 88
06/06/12 09:20
ILUSTR ACI
4 ..Ta b la s
d e
d ist r ib u ci n
d e
fr e cu e n cia s
d e
se o
edad
- > t abul at i on of s exo
s exo |
Fr eq.
Per c ent
Cum.
- - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - Hombr e |
2
50. 00
50. 00
Muj er |
2
50. 00
100. 00
- - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - Tot al |
4
100. 00
- > t abul at i on of edad
edad |
Fr eq.
Per c ent
Cum.
- - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - 19 |
1
25. 00
25. 00
20 |
2
50. 00
75. 00
21 |
1
25. 00
100. 00
- - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - Tot al |
4
100. 00
a ilu str acin .2 con tien e las d os variab les. e los cu atr o su
etos en
estu d ioel son om bres y el m u
eres. n r elacin con la ed ad
u n 2 tien en otr o 22y u n an cu m p lido 2a os. am bin
p u ed e decirse qu e el de los su
etos tien en 2a os o m en ossi d e in terp retar u n p or cen ta
e acu m u lado se trata.
n este tip o de tab las la n otacin qu e se em plea para d esign ar a los
valor es es xicon fi se d en om in an las frecu en cias absolu taslas frecu en cias
r elativas se recon ocen p or p i y el n m ero d e casos se exp resa bien con n si
los datos corr espon den a u n a m u estrao con N si se trab a
a con los datos
d e u n a pob lacin . or ltim oI den ota el n m ero d e valores d istin tos qu e
p osee la variab le. u an do los valores de u n a tab la son exau stivos y m u tu am en te exclu yen tesson eviden tes las sigu ien tes igu aldades
(.
oco frecu en tem en te se realia u n estu dio estadstico con tan slo cu atro
casos. A vecesla estadstica a sido defin ida com o la cien cia de los gran des
n m erosporqu e gen eralm en te trata de describir gran des con
u n tosau n qu e
para ello n o n ecesite dispon er de los datos de todos y cada u n o de su s elem en tos. e den om in a poblacin a ese gran con
u n to del qu e se desea obten er u n a
in form acin m ien tras qu e recibe el n om bre de m u estra u n su bcon
u n to de esa
poblacin extrado con u n as determ in adas con dicion es qu e asegu ren qu e el
an lisis qu e se efect e con su s datos n o difiera excesivam en te del qu e se u biese realiado ten ien do la in form acin de toda la poblacin . l tam a o qu e an
de ten er las m u estras depen de prin cipalm en te de cu n om ogn ea u eterogn ea sea la poblacin yen m en or m edidadel tam a o de esta ltim a.
04_Estadsticas.indd 89
06/06/12 09:20
a m atr ide d atosa p artir d e la qu e se ob tien en las tablas de distr ib u cin de fr ecu en ciascon tien e tan tas filas com o casos ten ga la m u estr a y
tan tas colu m n as com o variab les aya en la in vestigacin . am poco es u su al
organ iar u n a in vestigacin con slo d os variab lesa m en os qu e sean m u y
d ifciles de m edir. or regla gen er alu n estu d io com pr en d e u n m n im o de
d ievar iables y u n m xim oen ocasion es escasasd e varios m iles.
4..E st a d st ico s
r e s e n e s
de
d ist r ib u cio n e s
as distribu cion es son u n resu m en de los datos dispon ibles de las m u estras gen eralm en tepu es pocas veces se cu en ta con los datos de la poblacin . e pu ede
con den sar a n m s la in form acin con la ayu da de los estadsticosdatos calcu lables en la distribu cin qu e dan cu en ta de algu n a caracterstica n otable. in co
son las prin cipales caractersticas qu e pu eden resu m irse en u n a distribu cin
la ten den cia cen tralla posicin la dispersin la sim etra y el apu n tam ien to.
..1.
04_Estadsticas.indd 90
06/06/12 09:20
dian a cu an do u n determ in ad o valor posea u n a fr ecu en cia acu m u lad a igu al al es p reciso calcu lar la sem isu m a con el sigu ien te
valor de la tab la. n el caso d e var iables n om in ales es im p roced en te
tan to el clcu lo d e la m ed ian a com o el de la m edia ar itm tica.
c a tercera m edida de ten den cia cen tral es la m edia aritm ticaqu e es
u n prom edio de los valores de la distribu cin obten ido m edian te la
divisin de la su m a de todos los valores por el n m ero de casos. a
can tidad ofrecida por la m edia esu tilian do u n aforism oel valor qu e
ten dran todos los valores en el su pu esto de qu e todos los valores tu vieran el m ism o valor. i en u n gru po u m an o u n a person a tien e u n
erm an ootra dos y la tercera tresposeen en total seis erm an osqu e
si se distribu yeran equ itativam en te correspon deran a dos por person a. a obten cin de este estadstico respon de a la sigu ien te frm u la
(.6
Asla m ed ia de edad en el gru p o del e
em p lo con sider ad o sera
de 2a osqu e es el cocien te en tre la su m a d e las edad es (d e las
cu atro person as y el n m ero de m iem b ros qu e la com p on en (
.
04_Estadsticas.indd 91
06/06/12 09:20
(.
n a veobten idas las posicion esse bu scan los valores qu e las ocu pan . n
el caso de qu e (xd u n valor decim alse obtien e la sem isu m a de los valores
qu e ocu pan la parte en tera de la posicin y el qu e ocu pa la sigu ien te. Asen el
e
em plo de la edad en la ilu stracin .2dado qu e son cu atro casosal prim er
cu artil le correspon dera la posicin
2y al tercero la
. n con secu en cia
los valores del prim er y tercer cu artil seran respectivam en tede
y 2
.
e la m ism a fam ilia son los deciles y p er cen tiles. n el p rim er casoson
n u eve los valor es qu e dividen la distr ibu cin en d iep artes igu ales yen el
segu n d olos qu e par ten los datos en su b con
u n tos d el m ism o tam a o. ar a allar lo n -tiles se pr ocede de m odo sim ilar a cu an d o se obtien en
los cu ar tiles. e b u sca la p osicin corr esp on dien te al n -n til y si esta es d ecim alse su m an los d os valor es con tigu os y se divid en en tre 2. n gen eralla
p osicin d e u n n -n til (xse a
u sta a la sigu ien te frm u la
(.
e este m odoel qu in to sextil de u n a d istr ibu cin con casos ocu par a
la p osicin trigsim a(
6.
04_Estadsticas.indd 92
06/06/12 09:20
b l ran
o es la difer en cia en tr e los valores extr em os de u n a variable.
n el caso de la var iable edad en el gr u po de cu atro m iem br os qu e
sir ve d e e
em ploel ran go tom a el valor de 2 a ospu es es la diferen cia en tre la ed ad (2d el m ayor y la del m en or (
.
(.
sta m edid a pu ede estar m u y con d icion ada p or u n solo valor extrem o p oco represen tativo d e lo qu e se estu dia.
m agn ese u n gru p o
de 2person as de ed ades com p ren didas en tre y a ossalvo
u n a qu e tien e 6. n este caso d ecir qu e el ran go es d e a os dara
u n a im agen sesgad a de este agregad o. or ello se u tilia frecu en tem en te el llam ad o ran go in tercu artlicoqu e es la diferen cia en tre los
valores corresp on dien tes al tercer y p rim er cu artil. Asen el caso del
gru p o pequ e o d el e
em plosera de a oy en el d e los d os cen ten ares de person as el ran go in tercu artlico sera tam bin de a o.
(.
c a desviacin m edia es u n prom edio de los valores absolu tos de las
desviacion es de los valores con respecto a la m edia aritm tica. a de
advertirse qu e se trata de prom edio de valores absolu tospu es si n o
se prescin diese del sign o de las desviacion espor u n a im portan te propiedad de la m edia aritm ticasiem pre arro
ara el valor de . n la
distribu cin de la edad de los m iem bros del gru po ay dos desviacion es sobre la m edia (2a os
el m s
oven se desva m en os a o de
la m ediael m ayor m s a om ien tras qu e los otros dos tien en la
m ism a edad qu e la m ediapor lo qu e n o se desvan n ada. a su m a de
estas cu atro desviacion es es a m en os qu e se a adan los valores sin
con siderar el sign o qu e les precedeen cu yo caso la su m a es de 2 a os.
e a se obtien e el prom edio con la divisin de esta can tidad en tre las
cu atro person as qu e com pon en las observacion es realiadas
qu e
represen ta lo qu e se desva en prom edio cada caso de la m edia aritm tica. llo es obviopu es dos casos se ale
an de la m edia en a o y otros
dos en n in gu n o. a frm u la para su clcu lo en valores agregados es
(.2
d a varian za es u n a m ed ia aritm tica d e las desviacion es al cu ad rado
de los valores con resp ecto a la m edia. n lu gar de prom ediar los valores absolu tos de las d esviacion esestas se elevan al cu ad rado para
04_Estadsticas.indd 93
06/06/12 09:20
(.
e a desviacin tpica es la racu adrada de la varian a. e u tilia para
devolver el valor de la varian a a su s u n idades origin ales. om o acaba
de versela varian a de
est referida en a os cu adrados. ara poder
ablar en trm in os de a osay qu e allar la racu adrada de este valorresu ltan do ser de
. u clcu lo se obtien e m edian te la expresin
(.
f l coeficien te de variacin es u n a m edida d e disp ersin relativa. s
el cocien te en tre la d esviacin tpica y el valor absolu to d e su corr esp on dien te m edia ar itm tica. Al ser u n a r an o cocien tecar ece de
u n idades yen con secu en ciase u tili
a para com p arar la dispersin
en tr e variab les qu e ten gan d istin tas u n id ades d e m edida. om o la
varian a y la d esviacin tpica son siem pre p ositivaseste coeficien te
tam poco tien e sen tido qu e sea n egativoau n qu e la m ed ia lo sea. u
valor es com o el de las tr es m ed idas de dispersin p reced en tesen
el caso d e qu e todos los valores de la variab le sean idn ticos ysalvo
d istrib u cion es m u y d isper sassu valor su ele ser in fer ior a .
04_Estadsticas.indd 94
06/06/12 09:20
(.
(.6
a fr m u la del m om en to es d e tal n atu ralea qu e si ay pr ed om in io d e
valor es p or deba
o (a la i
qu ier dad e la m ediasale n egativoy si ay p red om in io de valor es por en cim ar esu lta p ositivo. ar a ob ten er u n coeficien te
d e sim etr a estn dar con el qu e poder acer com paracion es en tre variab les
se d ivid e este m om en to de or den cu yas u n id ades son c bicaspor la d esviacin tp ica al cu b o
(.
04_Estadsticas.indd 95
06/06/12 09:20
(.
an to la m edida an terior (asim etracom o estala cu rtosisson tiles porqu e
proporcion an claros in dicios de cu ndo la distribucin de u na variable cu antitativa es n orm al. ara qu e lo seala asim etra debe ser y el apu ntam ien to igual
a . i algu n a de estas m edidas en u na determ in ada variable n o se a
u sta a este
patrn n um ricono cabr du da de qu e n o est distribuida norm alm ente.
4.4.
b t e n ci n
de
la s
e d id a s
ca r a ct e r st ica s
d e
una
d ist r ib u ci n
as m edidas m s im por tan tes en tre las qu e se acaban de en u m erar en el
apar tado pr eceden te p u ed en ser ob ten idas m ed ian te la ord en su m m arize.
u sin taxis elem en tal con siste en acom pa arla de las var iables de las qu e
se d esea ob ten er los estadsticos en cu estin peroen el caso d e qu e n o se
especifiqu e n in gu n a d e ellasse sob reen tien de qu e se p id e los de todas.
su a r ie lista va riab les
opcion es
04_Estadsticas.indd 96
06/06/12 09:20
l con
u n to de los qu in ce pases tien e los sigu ien tes valores en las tr es
variab les solicitadas
ILUSTR ACI
4..List a d o
de
tres
va r ia b le s
en
u in ce
a se s
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
+- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - +
|
pai s
s uper f ~e
pobl ac~n
evn |
| -----------------------------------------|
|
Al emani a
349, 300
82. 200
77 |
|
Aust r i a
82, 700
8. 100
78 |
|
Bl gi ca
33, 200
10. 300
78 |
|
Di namar ca
42, 400
5. 400
76 |
|
ESPAA
499, 400
39. 500
78 |
| -----------------------------------------|
|
Fi nl andi a
304, 600
5. 200
77 |
|
Fr anc i a
550, 100
59. 200
79 |
|
Gr ec i a
128, 900
10. 600
78 |
|
Hol anda
33, 900
16. 000
78 |
|
I r l anda
70, 283
3. 800
76 |
| -----------------------------------------|
|
I t al i a
294, 100
57. 700
79 |
|
Lux embur go
2, 586
0. 438
77 |
|
Por t ugal
92, 082
10. 200
76 |
| Rei no Uni do
241, 600
59. 900
77 |
|
Suec i a
449, 964
8. 900
80 |
+- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - +
a solicitu d de los pr in cipales estad sticos se logra con la ya m en cion ad a in str u ccin su m m arize
su m m arie su perficie p oblacion evn
os p rin cip ales estadsticos qu e ap ar ecen par a cada variab le son la m ed ia y la desviacin tp icapero tam bin se m u estra el n m er o de obser vacion es de las qu e se dispon eel valor m n im o y el valor m xim o.
04_Estadsticas.indd 97
06/06/12 09:20
10. 3
57.
59.
82.
82.
7
9
2
2
Lar gest
57. 7
59. 2
59. 9
82. 2
Mean
St d. Dev .
25. 16253
26. 77402
Var i anc e
Skewnes s
Kur t osi s
716. 8482
. 9399792
2. 344765
04_Estadsticas.indd 98
06/06/12 09:20
por en cim a de ellay platic rtica (la cu rtosis est por deba
o de
pu es n o
existe abu n dan cia de pases con poblacin en torn o a la m edia.
4 ..La
o n d e r a ci n
de
lo s
datos
or ponderacin estadstica se en tiende la m odificacin del peso igualitario que
origin alm en te poseen las observaciones en el con
unto de datos. on un e
em plo
sen cillo se pu ede entender este procedim iento. ea un exam en que consta de cin co pregu ntas cortas y dos preguntas largas. ada un a de ellas est puntuada de
a . i a todas estas preguntas se les da el m ism o pesola sum a de las preguntas
nos dar puntos. ara que el resultado se encu entre en u n rango de a
pueden en contrarse m ltiples solu cion es. as m s sim ples sonponderar igu al
cada respuestapara ello abra qu e m u ltiplicar la puntuacin de cada un a por la
constante
. tro sistem a sera que se diera m s peso a las pregun tas largas.
or e
em plola m itad de la nota para las dos preguntas largas y la otra m itad
para las pregun tas cortas. i se opta por esta solucin desigual para preguntas
cortas y largaslas cinco prim eras preguntas cortas tendran cada una u n peso
de pun tom ientras qu e a las dos pregun tas largas abra que otorgarles un
peso de 2
pun tos. e este m odocada observacin en este caso cada pregun ta
abra que transform arla m ultiplicndola por su peso del siguiente m odo
(.
ien do i el p eso de cad a ob ser vacin la n ota fin al obten id a en el exam en con las siete p regu n tas se obten d ra con la sigu ien te frm u la
(.2
n este e
em plo los cin co prim eros pesos (desde 1 a ten dran u n valor
u n itariom ien tras qu e los dos ltim os ( y seran igu al a 2
. a su m a de
todas las pon deracion es es igu al a por lo qu e en el su pu esto de qu e u n su
eto pu n t e con las siete pregu n tasel resu ltado P tam bin sera igu al a .
on la m ism a lgicaes de fr ecu en te aplicacin estadstica la den om in ad a m ed ia p on derad aqu e con siste en ob ten er los pr om edios m u ltip lican d o
cada valoradem s de p or su frecu en ciap or su pon der acin . Apar te de ello
tam bin ay qu e in clu ir en el d en om in ad or de este pr om edio las pon der acion es a fin de equ ilib rar las frecu en cias
(.2
04_Estadsticas.indd 99
06/06/12 09:20
not a
3
4
5
6
7
8
9
10
f r ec ue~a
5
10
28
19
15
10
2
1
lo consta de oco casosque se corresponden con las oco distin tas calificacion es otorgadas (desde el asta el
y estas estn acom
a ra
n de redu cirlos a tres es porque dos de elloslos an alticos y los m u estralesson
tan parecidos que explicar su s diferen cias est por encim a del n ivel de esta in trodu ccin . Adem spara las rden es asta aora anali
adas en este m an ual no se perm ite el uso de pei
t y
ay qu e u tiliarpor tan tocom o recu rso el otro m edio de pon deracin qu e es aei
t.
or e
em plotabu late slo perm ite las ponderacion es de frecu en ciade im portan cia y
an alticaen cam biola orden re
ress perm ite adem s la ponderacin probabilstica.
04_Estadsticas.indd 100
06/06/12 09:20
a m ayor p arte d e las rd en es qu e pr odu cen resu ltad os estadsticos perm iten u tiliar la p on deracin fei
t. igu ien do con el e
em p lo an terior para solicitar los estad sticos de la distribu cin con todo
d etallela in str u ccin deber a escribir se com o sigu e
su m m arie n ota
feigtfrecu en cia
d etail
04_Estadsticas.indd 101
6
7
8
8
10
Lar ges t
7
8
9
10
Mean
St d. Dev .
5. 8
1. 493055
Var i ance
Sk ewness
Kur t os i s
2. 229213
. 3047134
2. 766698
06/06/12 09:20
2.
(.22
n la ilu str acin sigu ien te se p resen ta el listado de estos die
casos con su s corr esp on dien tes elevacion es.
ILUSTR ACI
4..List a d o
d e
e le va cio n e s
o r
ca so
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
s exo
Hombr e
Hombr e
Hombr e
Hombr e
Muj er
Muj er
Muj er
Muj er
Muj er
Muj er
el ev ac~n
12. 5
12. 5
12. 5
12. 5
8. 333
8. 333
8. 333
8. 333
8. 333
8. 333
as cor respon d ien tes a los om b res son el r esu ltado de d ividir
el n m ero d e om b res en la poblacin (en tre los cu atr o de la
m u estram ien tras qu e la elevacin de las m u
er es es el cocien te en tr e las del u n iver so y las seis seleccion adas.
i se d em an d an fr ecu en cias y m edia d e la variab le sexocon la
pon der acin an altica se obtien en las frecu en cias de la m u estr a y la
m edia pon d er ada por este coeficien te de pon d er acin
u se ficerobclear
tabu la te sexo
a eigtelevacion
su m m a rie sexo
aeigteleva cion
04_Estadsticas.indd 102
06/06/12 09:20
e st a d st ic o s
o n d e r a d o s
a n a lt ic a e n t e
s exo |
Fr eq.
Per c ent
Cum.
- - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - Muj er |
4. 9999999
50. 00
50. 00
Hombr e |
5. 0000001
50. 00
100. 00
- - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - Tot al |
10
100. 00
Var i abl e |
Obs
Wei ght
Mean
St d. Dev .
Mi n
Max
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - s ex o |
10 99. 9999981
. 50001
. 5270463
0
1
n realidadel e
em plo que se acaba de expon er debera aberse reali
ado con la opcin
pei
tporqu e se a em pleado com o variable de pon deracin el coeficien te de elevacin . tata recom ienda el u so de aei
t en aqu ellos casos en los qu e los datos de los que se dispone
son m edias o sum as de u n con
u nto de observacion escom o su cede si se dispon e de in form acin agregada de pasesen cu yo caso el n m ero de casos de cada m edida es el qu e a de
em plearse com o criterio de pon deracin.
04_Estadsticas.indd 103
06/06/12 09:20
roba bilstica
recu en cial
e it
a e it
. en teras
in n orm aliar
orm a li
adas
CUAR
4.1.r o c e d iie n t o s
sile s
de
o n d e r a ci n
en
St a t a
fe it
ie it
04_Estadsticas.indd 104
06/06/12 09:20
4 ..E l
error
t ico
n tod o este cap tu lo se a tom ad o com o r efer en cia el an lisis d escr iptivo
d e las var iables en las m u estras. in em bargoen la casi totalidad de las
veces en qu e se tr aba
a con m u estraslos d atos qu e in teresan n o son los de
estassin o los d e la poblacin d e la qu e pr oced en .
en eralm en telos clcu los qu e se extraen d e la p ob lacin reciben el n om b re d e parm etros y se les su ele represen tar con u n a letra griega. e este
m od ou n a m edia calcu lada con los d atos de toda la pob lacin ser con sid erad a com o u n parm etro y se la n otar com o ( ). el m ism o m od oes tam bin
u n p arm etro la d esviacin tpica ( )siem pre y cu an do se obtu viera con
tod os los su
etos d e u n a p oblacin . or el con trariosicom o su ele ser u su al
estas m edid as se calcu lan con datos m u estralesreciben el n om bre d e estads
ticos y se les recon ocer con los sm bolos x y srespectivam en te.
s lgico qu e el resu ltado de u n estadstico n o coin cid a exactam en te
con el valor cor recto del parm etr o. A la d iferen cia en tre u n o y otr o se le
d en om in a error m u estral. odo estadstico tien e su cor respon dien te er ror
qu e se den om in ar eacom p a ad o del su b n dice corr esp on dien te. A m od o
d e e
em ploa con tin u acin se expon en las frm u las de los err or es em p ricos
d e la m ed iad e u n a pr op orcin y de la desviacin tp icasin d u dalos tres
estad sticos m s em plead os en el an lisis estad stico u n ivar iable
(.2
aso de qu e se realicen m u estreos aleatorios sim plesseleccion an do los
elem en tos de las m u estras u n o a u n o del con
u n to de la poblacin p u ed e p roced erse d e dos m od oscon rep osicin y sin rep osicin . n el p rim er m tod o
los su
etos d e la p ob lacin qu e an sid o seleccion ad os p ara form ar p arte de la
m u estra pu eden volver a ser elegidosform n d ose d e este m odo su bcon
u n tos
04_Estadsticas.indd 105
06/06/12 09:20
con elem en tos repetidos. n cam bioen los m u estreos sin reposicin u n a
veseleccion ado u n cason o pu ede volverse a escoger yen con secu en cialos
elem en tos d e la m u estra son n icos e irrepetib les. an to por el sen tido com o
p or el m en or error m u estral qu e gen eran son m u co m s tiles y em p leadas
las m u estras sin reposicin qu e las qu e se realian con rep osicin . Aqu p or
elloslo se ar u n an lisis de los errores de las m u estras sin reposicin .
n con cepto im pr escin d ible para abor dar el p rob lem a del er ror m u estr al d esd e u n pu n to de vista p rob ab ilsticoen lu gar de em p r icoes el de
distribu cin m u estral. on siste en el com por tam ien to de u n determ in ado estad stico en el con
u n to de m u estr as d e u n d eterm in ad o tam a o qu e pu ede
extr aer se d e u n a pob lacin dada. e com p ren de m u co m e
or a travs d e
u n pequ e o e
em p lo.
e su pon e u n a p oblacin de slo cu atr o su
etos y se desea a p ar tir de
ella ob ten er u n a m u estr a de d os per son as. l n m ero p osible d e m u estras
vien e d eter m in ado p or el n m ero com bin ator io sigu ien te
(.2
n con secu en ciad e u n a p ob lacin de cu atro elem en tos p u ed en extraerse
seis m u estras diferen tes. s con cretam en tea con tin u acin se con sidera el
con
u n to d e cu atro su
etos presen tados en la m atride la ilu stracin .2
ILUSTR ACI
4 .1.a t r i
d e
una
o b la ci n
co n
cu a t r o
e le e n t o s
1.
2.
3.
4.
s ex o
1
2
1
2
edad
21
20
20
19
i este con
u n to es con sid er ado u n a poblacin y u bier a qu e r ealiar
tod as las m u estr as posibles de tam a o dos sin reposicin las seis p osibilid ad es seran las sigu ien tes
ILUSTR ACI
4 .1.ist r ib u ci n
u e st r a l
s in
r e o sici n
de
la
o b la c i n
a n t e r io r
Hombr e
Hombr e
Hombr e
Muj er
Muj er
Hombr e
de
de
de
de
de
de
21
21
21
20
20
20
c on
c on
c on
c on
c on
c on
Muj er
Hombr e
Muj er
Hombr e
Muj er
Muj er
de
de
de
de
de
de
20
20
19
20
19
19
n cada u n a de estas m u estras p u ed en calcu larse u n a serie d e estadsticos. ara m ayor con crecin a p artir de la variable sexo p u ede ob ten erse p ara
cada m u estra la p rop orcin d e om b res (o m u
erespresen tes en ellas
04_Estadsticas.indd 106
06/06/12 09:20
ILUSTR ACI
4 .14 .ist r ib u ci n
u e st r a l
d e l
e st a d st ic o
p
.
1.
.
.
.
.
5
0
5
5
0
5
l r esu ltado p ropor cion a las frecu en cias de m u estr as en las qu e sale u n
y d e om br es. b viam en tecon m u estr as de tam a o dosn o
p u ed e salir otro resu ltado.
ILUSTR ACI
4 .1.ist r ib u ci n
d e
r o b a b ilid a d
d e l
e s t a d st ico
p
phombr es |
Fr eq.
Per c ent
Cum.
- - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - 0 |
1
16. 67
16. 67
.5 |
4
66. 67
83. 33
1 |
1
16. 67
100. 00
- - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - Tot al |
6
100. 00
in alm en tetam b in es tilad em s de con tem plar su distr ibu cin calcu lar su s car acter sticas
ILUSTRACI
4.1.Ca r a cter stica s
d el
esta d stico
p
en
la
d istr ib u cin
u estr a l
phombr es
------------------------------------------------------------Per cent i l es
Smal l es t
1%
0
0
5%
0
.5
10%
0
.5
Obs
6
25%
.5
.5
Sum of Wgt .
6
50%
75%
90%
95%
99%
.5
.5
1
1
1
Lar ges t
.5
.5
.5
1
Mean
St d. Dev .
Var i ance
Sk ewness
Kur t os i s
.5
. 3162278
.1
0
3
6
o ay que confu ndir la distribucin m uestral con la distribucin de un a m uestra. sta ltim a es la distribucin de una variable em prica en la m uestram ientras que la distribucin m uestral es una distribucin probabilstica de una variable aleatoria de los estadsticos calculables en
el con
unto de m u estras de un determ inado tam ao que se puede extraer de una poblacin dada.
04_Estadsticas.indd 107
06/06/12 09:20
(.26
r ecisam en tela r acu adr ad a de la frm u la an terior es la d esviacin
tpica de la distribu cin m u estral d el estadstico pqu e tam bin recibe el
n om b re de error tpico.
ste er ror tp ico tien e u n a im por tan cia cen tr al en la estadstica in fer en cialp u esto qu e es la err am ien ta im pr escin d ib le p ara el clcu lo d e los
err ores m u estr ales p robab ilsticos p ara las estim acion es por in ter valo de los
p ar m etros y p ar a la reali
acin de pr u eb as estadsticas.
ar a in cid ir en su com pr en sin se expon e a con tin u acin u n n u evo
e
em p lo con la m ism a poblacin p er o en esta ocasin en lu gar d e con u n a
variab le n om in al (cu alitativa
con u n a var iable de ran com o la edad.
ab ien do qu e los valores en la p ob lacin d e cu atr o su
etos son de 2
2y 2la distribu cin m u estral de las m u estr as d e tam a o dos p resen ta la
sigu ien te disp osicin
ILUSTR ACI
4.1.ist r ib u c i n
de
r o b a b ilid a d
de
la
e d ia
medad |
Fr eq.
Per cent
Cum.
- - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - 19. 5 |
2
33. 33
33. 33
20 |
2
33. 33
66. 67
20. 5 |
2
33. 33
100. 00
- - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - Tot al |
6
100. 00
04_Estadsticas.indd 108
06/06/12 09:20
(.2
A estas car acter sticas se su m a qu ede acu erd o con el teorem a del lm ite cen tralp ara casi todas las pob lacion esla d istr ib u cin m u estr al de u n a
m ed ia (y las pr op orcion es o por cen ta
es tam bin pu eden con sid erarse com o
m ed iases ap roxim ad am en te n orm al cu an do el tam a o de la m u estra aleatoria sim p le es lo su ficien tem en te gran de.
eb ido a esta distribu cin m u estral qu e p resen tan la casi totalid ad de
las m u estras aleator ias pr acticadas en la in vestigacin p u ed e averigu ar se
con el n ico con ocim ien to de la varian a o d esviacin tpica d e la p oblacin
el m ar gen d e er r or qu e pr esen ta u n a poten cial m u estr a con u n determ in ado
n ivel d e con fian a. sto es as porqu e se con oce qu e en u n a d istr ib u cin
n or m al existe u n deter m in ado por cen ta
e de casos con valor es com pr en d id os en tr e u n deter m in ado ran go de desviacion es tp icas. l e
em plo m s
em p leado es el corr espon dien te a 2 d esviacion es tpicaspu esto qu e el
N n
ara la varian
ala frm ula de este coeficien te corrector es N 1
04_Estadsticas.indd 109
06/06/12 09:20
r ep resen tara las m u estras cu yos estad sticos coin ciden totalm en te con el
p ar m etro de la pob lacin los valor es positivos in dican u n estad stico m ayor qu e el par m etrou n ad os o tres d esviacion es tp icas (o valor es in term edios e in clu so su perior esp or en cim a de l. or el con tr ariolos valor es
n egativos se r efieren a m u estr as con estadstico m s ba
o qu e el par m etro
d e la pob lacin . om o se tr ata de u n a distribu cin n orm ales m u y p oco
p robab le qu e se en cu en tr e u n a m u estr a con tres desviacion es tpicas (er ror es tpicospor d eb a
o del valor cor recto del p arm etr o.
R IC
4 .1.o n a
ce n t r a l
d e
la
d ist r ib u c i n
n o r a l
4 s
3 s
2 s
1 s
media
1s
2s
3s
4s
(.2
n las poblacion es in fin itas (con m s de .su
etos en la prcticael coeficiente
corrector com en tado en la nota an terior se convierte en u n n m ero m u y prxim o a la u n idad
con lo qu e no tien e n in gun a in ciden cia en el error tpico.
04_Estadsticas.indd 110
06/06/12 09:20
..1.
n el apar tado an terior se a exp licado el err or m u estral y el de su corr esp on dien te n ivel d e con fian
a partien do d esde la p ob lacin . in em bar goen
el traba
o de an lisis de d atosgen er alm en ten o se d ispon e d e la in for m acin del u n iver sosin o d e la m u estra. A p artir de estase p u ed en p redecir
los ver daderos p ar m etros de la pob lacin . sta oper acin recibe el n om br e
d e estim acin qu e a su vepu ede r ealiarse d e dos m odospu n tu alm en te y
p or in ter valos.
a a estim acin pu n tu al con siste en prop orcion ar u n solo valor par a
el par m etro en cu estin . n los estad sticos m s sim p lesla estim acin pu n tu al m s certer a es el estad stico con la m ism a den om in acin qu e el parm etr o d e la p ob lacin . e este m odoel m e
or
estim ad or d e P (la pr oporcin en la pob lacin es p (la pr opor cin
en la m u estra
y el m e
or estim ad or de la m ed ia en la poblacin ()
. in em b ar goesto n o es as en el caso
es la m edia de la m u estra ( x
d e la var ian an i en el d e la desviacin tp icaporqu e las ecu acion es
(.2y (.2n o se aplican a estos estadsticos. n cam b iocon
u n a ad ecu ada dem ostr acin (e aa2pu ede com p rob ar se
qu e
(.
e este m odoen las m u estrasen lu gar de s 2se calcu la el estad stico
cu ya fr m u lasim ilar a la de la var ian
a (.
vien e d ad a p or
(.
n este casose cu m ple efectivam en te la igu ald ad sigu ien telo qu e im p lica por defin icin qu e es u n estim ador n o sesgad o d e s 2.
(.2
Adicion alm en tela estim acin por in tervalos con siste en pr oporcion ar
u n r an go de valores en el qu e con u n a determ in ada pr ob abilid ad (el n ivel
d e con fian ase en con trar el valor d e la p oblacin . a ob ten cin d e estos
in tervalos se reali
a su m an d o y restan do al estadstico d e la m u estr a su cor resp on d ien te er ror m u estral
04_Estadsticas.indd 111
06/06/12 09:20
(.
tata p erm ite con str u ir los in tervalos de con fian
a par a p ropor cion es y
m edias a p ar tir de u n a or den de em pleo in m ed iato. e trata d e la or den ci
con opcion es bin om ialpar a aplicarla a pr op orcion esy level(
para expr esar el n ivel d e con fian a con el qu e se desea con tar.
Algunos e
em plos pueden aclarar el em pleo y la in terpretacin de esta orden. os dos prim eros em plearn la frm ula inm ediata de la orden ci. sta
con siste en un m odo de proporcionar datos sin necesidad de que estos estn en
un ficero. na parte considerable de las instru ccion es de tata perm iten esta
posibilidad. ntre ellas est la orden que obtien e los intervalos de confian
a.
n tr e las rd en es in m ediatas d e in ter valos de con fian
ala m s sim ple
es la qu e se r efiere a los in tervalos cor respon d ien tes a u n a variable bin om ial. an slo ay qu e pr oporcion ar el n m er o de casos y el de favor ables
es d eciraqu ellos qu e cu m plen u n a deter m in ada car acter stica. l caso m s
com n de aplicacin ser a el de u n sim ple
u ego de a
arcom o el lan am ien to de u n a m on ed a. ea qu e de lan am ien tos se obten gan carasen la
ord en an d e figu rar en p rim er lu gar las veces qu e se reali
a el experim en to
(el n m ero de casosen el su pu esto de u n a m u estr ay p oster ior m en te el
n m ero de r esu ltados favorablesn m ero de car as en este con texto.
cii
04_Estadsticas.indd 112
06/06/12 09:20
6
cii .sqrt(.
.6
n el in ter valo in fer ior las difer en cias son de m ilsim am ien tras qu e
en el su per ior apen as llegan a las m ilsim as.
er ocon d atos de u n ficerod ebe u sarse la ord en pr in cipalqu e es ci
en lu gar d e la del clcu lo in m ed iato (cii).
om o e
em plo se u tili
a en esta ocasin la m u estr a postelectoral del
d e la qu e se disp on e d e m s de .su
etos. n pr im er lu garse ace
la estim acin por in tervalos de u n a var iable cu an titativala edad. n este
casob asta con segu ir la in stru ccin ci d el n om br e de la var iable d e la qu e
se desean ob ten er los in ter valos.
ci ed ad
con los p rop ios datos m u estrales se calcu la el err or tpico y los cor resp on dien tes in ter valos d e con fian a
ILUSTR ACI
4 ..C lc u lo
de
lo s
in t e r va lo s
d e
co n fia n a
d e
una
e d ia
Var i abl e |
Obs
Mean
St d. Er r .
[ 95% Conf . I nt er v al ]
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - Edad |
5283
45. 96498
. 2529001
45. 46919
46. 46077
y 6
a os.
04_Estadsticas.indd 113
06/06/12 09:20
ste resu ltado im plica qu e en la pob lacin con u n a con fian a del
el por cen ta
e d e om br es estar com pr en d ido en tre el 6 y el m ien tr as qu e el de m u
eres lo estar en tre el y el . om o pu ede fcilm en te apr eciarselos u n os son com p lem en tar ios de los otr os.
4..E
e r cicio s
. on e
em plos de variables que puedan considerarse nom inalesordinales o de
ra
n del cuestionario del barm etro de m ar
o de 2del
(cis2
.
2. btn del con
u n to d e datos an terior la d istr ib u cin de fr ecu en cias de la
com u n idad au tn om a y del tam a o del m u n icipio. n qu com u n id ades ay m ayor n m er o de en trevistadosn qu estrato se con cen tra la
m ayor p arte de los en tr evistadosu l sera la m ed ian a d el bitat
. n el b arm etr o de m ar o de 2d edicado a los trm ites adm in istr ativos d e los ciu dadan oscom o en la m ayor par te de las en cu estasexiste
u n a m n im a p resen cia de variab les cu an titativas. e este tip oen con cretoen el cu estion ar io del m en cion ado estu d io slo existen estrictam en te cu atr o var iablesu b icadas en d os p regu n tasla .2y la .. as
m o acer esta operacin se explica en el prxim o captulodedicado a la tran sform acin de variables.
04_Estadsticas.indd 114
06/06/12 09:20
tres var iables de la pr egu n ta 2son oras y m in u tos diar ios ded icad os
al tiem po libr e y su alter n ativa or as de ocio a la sem an a. a variab le
d e la p regu n ta (edad) se en cu en tr a p rcticam en te en todos los cu estion ar ios d irigidos a per son as. alcu la e in ter pr eta todos los estadsticos
con ven ien tes a las m en cion ad as var iables qu e an sid o abord ados en
este cap tu lo.
. n ese ficero tam b in existe u n a variab leden om in ada pesocu ya fu n cin es equ ilib rar (pon derar la m u estr a por sexo y ed ad . on str u ye u n a
tab la d e frecu en cias par a el sexo y u n su m ario de estad sticas p ara la
edad con y sin pon d er acin observan do las diferen cias. alo tam bin
p ara otra variab le n om in alotra or din al y otra d e in ter valo. aon a la
seleccin del tipo de pon d er acin .
. n ese m ism o bar m etro d e m aro de 2(ficer ocis2.
calcu la
los in tervalos d e con fian a p ar a la var iable edad (
.2
.
6. el m ism o ficer o obtn los in tervalos d e con fian
a bin om iales par a
la posesin de cad a u n o de los ap aratos dom sticos con ten idos en la
p regu n ta 2.
04_Estadsticas.indd 115
06/06/12 09:20
04_Estadsticas.indd 116
06/06/12 09:20
5
Ma n ip u la ci n
y
m o d ifica ci n
de
d atos
Este captu lo explica las transform aciones que pueden realizarse con Stata sobre la m atriz de datos. Se distin gu irn dos grandes tipos de transform aciones:
1.
5 .1 .Ma n ip u la ci n
d e
d atos
E n n u m er osas ocasion es es pr eciso r eor den arr eagru p ar o seleccion ar los
d atos para realizar d eter m in ad as operacion es con ellos. Stata in corpor a ar ias in str u ccion es esp ecficas p ara estas op er acion es.
5.1.1.Orden acin
de
casos
a instruccin especfica de Stata para ordenar los casos es sort. Segn se
io
en un captulo anteriorla m atriz de datos se puede representar por una re
illa
en la que los casos son filas las
ariablescolum nas. eneralm enteel orden de
los casos no im porta: es igual que un caso aparezca el prim ero en la m atriz o el
ltim olo im portante son los
alores de las
ariables en todos cada uno de los
casos. eropara algunos procedim ientos estadsticoses necesario que los casos
estn dispuestos de una determ inada m anera. or e
em ploes necesario ordenar
los casossegn sus
alores en una determ inada
ariablepara realizar anlisis
paralelos de distintos segm entos de la m uestra con la preinstruccin by,
cuo
funcionam iento se
er m s adelanteen la seccin .1..
ar a or den ar los casos de m en or a m aor seg n los alores de u n a
ar iab leslo aqu e teclear sort
segu id o del n om b re d e la
ar iable en cu estin .
or e
em p losi se dispon e d e la ltim a m atriz d e d atos d el cap tu lo :
05_Manipulacin.indd 117
06/06/12 09:25
E S ME
S
11
ILUSTR ACIN
5 .1 .Ma t
i
d e
d a t o s
con
o co
ca so s
1.
2.
3.
4.
5.
6.
7.
8.
s exo
1
1
1
1
2
2
2
2
edad
20
21
23
.
19
20
22
24
si se desea ordenar por edadaque introducir las sigu ien tes rdenes:
u se ficeroclear
sort ed ad
list sexo ed adclean
edad
1.
2.
3.
4.
5.
6.
7.
8.
sex o
Muj er
Muj er
Hombr e
Hombr e
Muj er
Hombr e
Muj er
Hombr e
edad
19
20
20
21
22
23
24
.
1
a in stru ccin sort
es irre
ersible. n a
ez orden ados por un criterio n o se pu ede
ol
er
al anterior. Si se n ecesitaraabra qu e abrir de n u e
o el con
u n to de datos m ediante u se
u
05_Manipulacin.indd 118
06/06/12 09:25
11
d o s
a
ia le s
1.
2.
3.
4.
5.
6.
7.
8.
s exo
Hombr e
Hombr e
Hombr e
Hombr e
Muj er
Muj er
Muj er
Muj er
edad
20
21
23
.
19
20
22
24
d e m en or a m aor
. Si se r equ ier e or den ar los casos de m aor a m en ora
d e r ecu r rirse a la in str u ccin gsort, qu e es u n a exten sin de sort
con m s
op cion es. Sigu ien d o con el e
em p lo an terior
gsort ed ad
orden ar de n ue
o por la ariable con la que estu
ieran clasificados an teriorm en tesiem pre
cuan do esta existieracom o el n m ero de casopor e
em plo. Ms adelan te se expon e cm o
realizar esta operacin . tra posibilidad es la de crear u n a instan tn ea de los datos an tes de
orden arlos. ase seccin .1.
05_Manipulacin.indd 119
06/06/12 09:25
E S ME
S
s ex o
Muj er
Muj er
Hombr e
Hombr e
Muj er
Hombr e
Muj er
Hombr e
edad
19
20
20
21
22
23
24
.
or den_~d
1
2
2
3
4
5
6
7
5.1.2.Seleccin
de
casos
ar a este fin Stata in cor pora dos su bin stru ccion esin e if. eciben este
n om b re p orqu e n o p u ed en apar ecer aislad assin o siem pre en con
u n cin
con algu n a otr a ord en . e este m odolas clu su las in o if acen qu e la in str u ccin a la qu e acom p a en slo se realice p ar a aqu ellos casos qu e se esp ecifiqu en en ella. ien en p u esefectos tem porales porqu e slo seleccion an
casos p ar a la in str u ccin don d e se in tr odu cen .
a su b in str u ccin in se u tiliza d el sigu ien te m odo:
in stru ccin in ra n go
05_Manipulacin.indd 120
06/06/12 09:25
11
ILUSTR ACIN
5.5 .Su m a
io
d e
una
a
ia le
con
se le c ci n
n um e
ada
d e
c a so s
Var i abl e |
Obs
Mean
St d. Dev.
Mi n
Max
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - edad |
5
20. 4
1. 140175
19
22
del n m er o m aor
p or e
em p lopar a seleccion ar los cin co pr im eros casos1
. as letr as f l se p u eden
u tilizar p ara acer referen cia a los casos pr im ero (f ltim o (l
. os alor es
con sign os n egati
os ser n in ter pr etados p or Stata com o d istan cias d esd e el
fin al d e la m atriz. or e
em p losi se escr ibe
list sexo ed ad in
lclean
se ob tien e u n listad o de los ltim os cin co casos con su s corr esp on d ien tes
alores de sexo edad .
ILUSTR ACIN
5 ..List a d o
d e
ca so s
con
se le cc i n
nu m e
ada
fin a l
4.
5.
6.
7.
8.
sex o
Hombr e
Muj er
Hombr e
Muj er
Hombr e
edad
21
22
23
24
.
or otr o lad ola su bin str u ccin if perm ite especificar los casos qu e se
an a u tilizar para e
ecu tar u n a or den en fu n cin d e si cu m plen u n a d eterm in ada con dicin lgica. a for m a gen er al d e u so es:
in stru ccin if expresin
05_Manipulacin.indd 121
06/06/12 09:25
E S ME
S
as expresion es con ten id as en la clu su la if p u ed en ser n u m r icas o lgicas. as exp resion es n u m r icas pu eden ser tan sim ples com o u n a con stan te o tan com ple
as com o u n en tram ado su cesio d e
ar iables o con stan tes
con ectad as con fu n cion es. E n el extrem o m s sen cillou n a exp resin n u m r ica es en r ealid ad u n n m er o qu e si adop ta el
alor d e exclu e del an lisis
e in clu e en el r esto de los su pu estos. E llo im p lica qu e si se escribe if la
in stru ccin n o se e
ecu ta con n in g n casom ien tr as qu e si se especifica if
-1 o if 1la or den se cu m p le para todos los casos. E n con secu en ciala
exp resin m s elem en tal detr s d el if con sta d e u n a con stan te o u n a ariab le n u m ricaexclu e d el an lisis a todos los casos con el alor en la
exp resin e in clu e a todos los qu e ten gan d istin ta circu n stan ciatam bin
situ acion es en las qu e la exp resin n u m rica esp ecificad a ten ga u n alor
p er did o.
a expr esin sigu ien te en trm in os d e sim p licida d es a qu ella repr esen ta da m ed ia n te u n a exp resin a r itm ticaqu e se com pon e d e
a r ia bles o
a lores con ecta dos m edian te oper ad ores o fu n cion es m a tem tica s qu e d an
lu ga r a u n solo alor n u m r ico. e este m odosi se escribier a la expr esin
list
if ar ia ble-
a r ia bleel r esu ltad o es qu e slo se m ostra r a n a qu ellos ca sos con a lor p er dido en la a riab le esp ecifica da a qu e a l r estar su con ten ido de s m ism ael resu lta do es siem pr e a m en os qu e con ten ga u n
a lor p er did o.
E n cu alqu ier casolo m s com n es qu e la expresin qu e siga a if sea
lgicaen lu gar de n u m rica. Se con sidera expresin lgica aqu ella qu e pu ede m ostrar dos
aloresfalso o ciertocom o resu ltado de em plear u n operador de relacin . as m s sim ples expresion es lgicas propiam en te dicas
son aqu ellas qu e se com pon en de dos expresion es aritm ticas u n idas por u n
operador de relacin .
os operador es d e r elacin p osibles son los sigu ien tes:
gu al qu e
Ma or qu e
Men or qu e
Ma or o igu al qu e
Men or o igu al qu e
o es igu a l qu e
tese que se a pu esto el sign o igu al dos eces segu idas. om o puede com probarse
m s adelanteesto no es u n error. ara Stata n o es lo m ism o el sign o igu alem pleado en operacion es m atem ticases igu al a por e
em ploqu e los dos sign os igu al segu idosu tilizados com o operador lgico. Si se quiere produ cir u n resu ltadoaqu e em plear u n sign osi
se desea acer u na com paracin se em plean los dos sign os segu idos. om o reglaen caso de
dudase puede pen sar si el sign o igu al pu ede ser reem plazado por el sm bolo en cuo caso
se deben in clu ir los dos sign os igu ales.
05_Manipulacin.indd 122
06/06/12 09:25
qu e tien en p or m isin con ectar otras exp resion esu n ter cero
E l or den de e
ecu cin d e los distin tos operador es es el sigu ien te: en pr im er lu garla n egacin lgicaexpr esad a sea con
sea con d esp u slas
fu n cion esa con tin u acin la n egacin ar itm tica
-
segu idam en telas oper acion es aritm ticas
di
isin
m u ltiplicacin
d espu s la -
resta
su m a
lu egolos op er adores r elacion ales
. Sip or e
em plola con dicin se expr esa d el
sigu ien te m od o
tab u late sexo if region 1 region edad
05_Manipulacin.indd 123
06/06/12 09:25
E S ME
S
.
a ra qu e p u ed a efectu a r la opera cin a decu ad a m en te se deben u tiliza r
pa rn tesis qu e fu er cen a rea liza r con a n terior ida d la s opera cion es en ellos
in clu id os.
ta bu la te sexo if
region 1 region eda d
ta bu la te sexo if ed ad
.
5.1..gru pacin
de
casos
E xiste u n a p r ein str u cci n esp ecia l (by
qu e p er m ite a gr u p a r lo s ca so s
seg n su s a lo r es en u n a o m s a r ia b les a cer qu e la in str u cci n
a la qu e a co m p a a n se e
ecu t e p o r sep a r a d o en ca d a u n o d e los gr u p os. a r a ello by
se esp ecifica a l p r in cip iosegu id o p or el n o m b r e d e
la a r ia b le p o r la cu a l se d esea segm en ta r el a n lisis d os p u n to s
:
.
r a s esa exp r esin se escr ib e la in str u cci n p er tin en te. E s n ecesa r io
05_Manipulacin.indd 124
06/06/12 09:25
u pos
- > s ex o = Hombr e
Var i abl e |
Obs
Mean
St d. Dev.
Mi n
Max
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - edad |
3
21. 33333
1. 527525
20
23
---------------------------------------------------------------------------------- > s ex o = Muj er
Var i abl e |
Obs
Mean
St d. Dev.
Mi n
Max
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - edad |
4
21. 25
2. 217356
19
24
ar iable
se pu ede u sar con casi cu alqu ier in stru ccin siem pr e r ealiza in depen d ien tem en te la ord en solicitad a sob re cad a u n o d e los gru p os defin idos por
la
ar iable especificada. or otr o ladotam b in con
ien e saber qu e p u ed e
esp ecificar se m s de u n a ariab le p ara obten er los cor respon d ien tes an lisis
cr u zados.
sort sexo region
b sexo region : su m m arize edad
05_Manipulacin.indd 125
06/06/12 09:25
E S ME
S
E l r esu ltado obten id o pr esen ta tan tos an lisis com o el pr odu cto d el n m ero d e alor es d e cada u n a de las ariab les im p licad as.
ILUSTR ACIN
5.1.Su m a
io
de
una
a
ia le
p o
u p o s
c o n fo
m a d o s
p o
d os
a
ia le s
---------------------------------------------------------------------------------- > s exo = Hombr e, r egi on = Nor t e
Var i abl e |
Obs
Mean
St d. Dev .
Mi n
Max
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - edad |
2
21. 5
2. 12132
20
23
---------------------------------------------------------------------------------- > s exo = Hombr e, r egi on = Sur
Var i abl e |
Obs
Mean
St d. Dev .
Mi n
Max
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - edad |
1
21
.
21
21
---------------------------------------------------------------------------------- > s exo = Muj er , r egi on = Nor t e
Var i abl e |
Obs
Mean
St d. Dev .
Mi n
Max
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - edad |
2
21. 5
3. 535534
19
24
---------------------------------------------------------------------------------- > s exo = Muj er , r egi on = Sur
Var i abl e |
Obs
Mean
St d. Dev .
Mi n
Max
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - edad |
2
21
1. 414214
20
22
5.1..iceros
an cos
y
alargados
asta el m om en to slo se a tr atado con ficeros an cos. Son llam ados as
aqu ellos en los qu e todas las ariab les per ten ecien tes a u n su
eto se en cu en tr an en el m ism o r egistro o ln ea. E l e
em plo qu iz m s fr ecu en te fcil d e
com pr en d er par a su tr an sform acin a u n ficer o largo es el de u n con
u n to
d e p ases de los qu e se dispon e de la in for m acin de u n a serie d e a os. E n
el form ato an co cad a u n o de los a os se exp resa en diferen tes colu m n as.
05_Manipulacin.indd 126
06/06/12 09:25
Sean tres pases con in form acin en u n a ariable a lo largo de tres a os. E n
el sen cillo e
em plo qu e se em plea se u tilizan com o pases Espa aran cia e
talialos a os u n a
ariable com o el n m ero de estu dian tes.
u se p aisesan cosclear
listclean a bb reiate
1
pai s
Espaa
Fr anc i a
I t al i a
e sa p e
lo n n u eaari
ob ser
acin
su b obseracin
a o
listclean
05_Manipulacin.indd 127
06/06/12 09:25
E S ME
S
a o
on
er tir a el ficero lar go a otro an co. E n este caso con cretoel r esu ltad o d e la in str u ccin ser a la u elta al ficer o in icial.
5..e n e
a ci n
y
m o d ifica ci n
d e
a
ia le s
E n m u cas ocasion es an d e tr an sform ar se los d atos porqu e el an lisis requ iere qu e se traba
e con ellos de for m a distin ta a com o se en cu en tr an registr ados en el or den ador. as razon es pu eden ser m u di
er sas. aste aqu
con citar slo algu n as de las m s fr ecu en tes.
E n pr im er lu gares u n caso com n qu e los d atos estn m al grabados
qu e se en cu en tre u n cdigo qu e n o existe. or e
em plosi al solicitar u n a
tab la d e distribu cin d e fr ecu en cias de la ar iable seoap ar ecen casos
com o om b res1com o m u
eres u n caso con u n alor n o etiqu etad o
igu al a es ob io qu e se tr ata de u n er ror de grabacin d eb e ser depu r ad o. E n otr as ocasion eses p reciso cam biar la escala de u n a ar iablecom o
05_Manipulacin.indd 128
06/06/12 09:25
es el caso d e qu e se ten ga el de u n a serie d e p ases exp resados en d lares se p refier a qu e apar ezcan en eu r os. am bin pu ede su ceder qu e se
d esee trab a
ar con u n a escala logartm icaen lu gar de la ar itm tica origin al
p or lo qu e deb e tran sfor m arse esta ltim a. tr o caso d e tr an sform acin es
cu an do se desea traba
ar con
ar iables estan d arizadasen lu gar d e las ar iables origin aleso cu an d o se qu ieren pr esen tar los datos d e u n a ariab le
cu an titatia r ecodificados en in ter
alos. p ar a p rosegu ir con u n a lista in ter m in ab le de razon es par a la tran sfor m acin d e ar iablespu ede tam bin
citar se el caso en qu e se d esee con str u ir u n a ar iable con u n a com b in acin
d e ariascom o cu an do se gen er a la clase social en fu n cin de la relacin
con la acti
idadla p rofesin los estu d ioso cu an d o d ebe ob ten er se la
p u n tu acin de u n a escala m ed ian te la su m a de la ser ie de tem s d e los qu e
se com pon e.
esd e u n pu n to de ista in stru m en tal p u ed en clasificar se las tran sform acion es de las ariab les en algeb raicasde equ i
alen cias lgicas. E n las
p rim er as se obtien en los n u eos alor es d e las ar iables m ed ian te la ap licacin de u n a o arias fu n cion es m atem ticas o estadsticasen las segu n das
las r eglas del cam b io se pr odu cen m edian te u n a serie d e igu aldad es en tre
los
alores an tigu os los alores n u eosen las lgicaslos cam b ios de
alor es
sean tran sfor m ados por u n a operacin algeb raica o p or u n a r ecodificacin se p rodu cen si slo si se cu m p len d eterm in ad as con d icion es. n
e
em plo fcil de las pr im er as ser a cu an d o se posee in for m acin del a o de
n acim ien to de u n a ser ie d e per son as se desea tr an sform ar en edad es. E n
tales circu n stan cias b asta con restarle al a o en qu e se tom ar on los datos
el d e la feca de n acim ien to. Si u n estu dio se izo en el a o es obio
qu e las per son as qu e n acieron en 1cu m plieron a os a lo lar go d e d ico a o. Si faltara la ariab le edadp odr a disp on er se d e u n a aproxim acin
m ed ian te esta op eracin . tr o e
em plo d e cam b ioesta ez de tran sfor m acin lgicasera en el caso d e qu e la ariab le estu iera grabad a en la
m on ed a d e cada pas se d eseara pasar a u n a n ica m on eda. E n esas circu n stan ciasab ra qu e m u ltiplicar pr cticam en te cada p as por u n n m er o d istin topor elloan tes de la op er acin aritm tica r equ eridaaqu e
exp on er la con dicin qu e a d e aplicarse. or e
em p loen el caso d e qu e el
p as ten ga com o m on eda el eu r oaqu e m u ltiplicar su alor del por
5.2.1.
ran sform acion es
algebraicas
os com an dos m s im por tan tes de Stata par a gen erar m od ificar
ariables
m ed ian te op er acion es algebr aicas son gen erate replace. E l fu n cion am ien to
d e am bos es bsicam en te el m ism oslo qu e el pr im ero cr ea u n a n u ea ar iable le asign a
aloresel segu n do r eem p laza los alor es de u n a ar iable
existen te.
05_Manipulacin.indd 129
06/06/12 09:25
E S ME
S
ar a crear u n a n u ea
ar iable a de u tilizar se gen erated el sigu ien te
m od o:
e n e
a t e n u eaar exp resin
n o dos
com o
en las com p ar acion es lgicasp orqu e en esta ocasin se trata de asign aren
lu gar de com pararu n alor a u n a ar iable. E n Statau n sign o d e igu al se
u tiliza p ar a asign ar
alores a u n a
ar iabled os sign os de igu al sign ifican
es igu al qu e.
la or a d e escr ib ir la in str u cci n en lu ga r d e exp r esin a qu e
in tr od u cir cu a lqu ier fr m u la m a tem tica d esd e u n a co n sta n te
un nm er o qu e ser igu a l p a r a tod os los ca sosa sta u n a fu n cin o a r ia s
fu n cion esp a sa n d o p or la s op er a cion es a r itm tica s b sica scom o son
la su m a
la r esta
-
la m u ltip lica cin
la d i
isin
. a n se
a lgu n os e
em p los:
u se pa n elclear
gen era te tota l 1
r ea u n a ariab le om e
or dicou n a con stan te asign ada a todos los
casos con el
alor 1. E n cam b iola sigu ien te in str u ccin
gen era te ed ad- a on a cim ien to
gen era u n a ariab le llam ada edadqu e expr esa la diferen cia en tre
el a o en el qu e se recoge la in for m acin el a o de n acim ien to d e cada
in d iidu ocon lo qu e se ob tien en los a os qu e se cu m p len en algu n o d e los
d oce m eses de .
a in stru ccin replace fu n cion a exactam en te igu al qu e gen eratepero
d eb e em plear se con
ariables a existen tes. om o a est defin ida la ariab le edadp ara tr an sform ar la a fin d e exp resar el a o adecu ad o in clu so para
los qu e n o celeb rar on a n su cu m plea os en el m es de la en cu estaabr a
qu e em p lear la or den replaceen lu gar d e gen erate
repla ce ed ad -a on a cim ien to-1 if m esn acim ien to
list m esn acim ien to a on a cim ien to ed ad in 1
clean
E n este ltim o e
em plo con ien e adertir qu e tan to gen erate com om s
fr ecu en tem en tereplace pu eden ir acom p a ad as p or la clu su la ifr ealizn -
05_Manipulacin.indd 130
06/06/12 09:25
11
mesnac ~o
12
5
5
2
2
aonac~o
1965
1962
1980
1940
1973
edad
34
37
19
60
27
tr os e
em p los tiles son las tr an sform acion es de p oten cia de las ariab les cu an titatias con el fin de d ar cu en ta de r elacion es n o lin eales en tre los
d atos. as m s frecu en tes en este sen tid o son el cu adr ad o el logaritm o. E n
Statatran sfor m ar d e estos m odos u n a ariab le es tan fcil com o escr ib ir las
sigu ien tes in stru ccion es.
gen erate ed ad ceda d
gen erate ln ed ad ln
ed ad
list edad ed ad c ln eda d in -
lclean
edad
46
28
58
edadc
2116
784
3364
l nedad
3. 828641
3. 332205
4. 060443
05_Manipulacin.indd 131
06/06/12 09:25
E S ME
S
d esp u s la s fu n cion es ln
p or e
em p lolu ego m u ltip lica cion es o
d i
ision es
fin a lm en tela s su m a s o r esta s. en ca so d e qu e a a op er a cion es en el m ism o n i
else r ea liza n p r im er o la s qu e se en cu en tr en a
la izqu ier d a .
E s ob io q u e ta n to gen era te com o replace
p er m iten el u so d e fu n cion es m a tem tica s esp ecia les in co r p o r a d a s p o r Sta ta . a r a u n a lista
co m p leta d e ca d a u n a d e ella sse r eco m ien d a a cer u so d e la a u d a d e
fu n ction s.
elp fu n ction s
d e feca (da te
a n d
tim e
d e ser ies tem p or a les (tim e-seriesm a tr icia les
(m a tri
.
or e
em p lou n a fu n cin m u til es ru n iform
1
1
a or den set
seed
n se u sa par a cam biar la sem illa d e aleator izacin
qu e gen era la ser ie de n m er os aleator ios. Slo es acon se
able in trodu cir la
cu an d o se desee gen erar el m ism o con
u n to de n m eros aleatorios en m ltiples repeticion es d e u n pr ogr am aa qu ecaso d e qu e n o se exp licitela
fu n cin de gen eracin aleatoria pr odu ce con
u n tos d ifer en tes de n m eros
aleator ios.
05_Manipulacin.indd 132
un qu e esta fu ncin n o u tilice parm etrossiem pre a de ir segu ida de los parn tesis.
06/06/12 09:25
E xisten m u cas otr as p osibilid ades de gen eracin d e ariab les aleator ias. om o e
em p los m s u su ales pu eden citarse la gen er acin de n m eros
b in om iales d iscretos m ed ian te rbin om ial
n
p
o la p rodu ccin de u n a ar iable aleator ia con tin u a con d istr ib u cin n or m al rn orm al
m ed iadesiacin
tiles p ara la sim u lacin o la ad icin a datos em p r icos d e er ror es
aleatorios con u n a determ in ada distrib u cin .
gen erate aleatoriobin om ial in t
rb in om ia l
.
gen erate aleatorion orm alrn orm al
on la pr im era expr esin se creara u n a n u ea ar iable con alor es d iscr etos com p ren didos en tr e el el con m ed ia
n pdesiacin tp ica
1
n p
1-p
sort ord en
list sexo ed ad in 1
05_Manipulacin.indd 133
06/06/12 09:25
E S ME
S
5.2.2.
ran sform acion es
de
eu ivalen cia
as m od ificacion es de equ ialen cia son aqu ellas en las qu e a difer en tes con
u n tos de
alores an tigu os d e u n a ariab le se les ace cor respon der d istin tos
alor es n u e
os. E n el fon dose trata d e lo m ism o qu e r ealiza la in str u ccin
replacepero en lu gar de ap licar los cam bios con u n a fu n cin lo ace con
u n a ser ie de equ i
alen cias en tre los
alores an tigu os
aalos alores
n u e
os
n u eo
alor
. a or den n ecesar ia p ar a acer esto en Stata es recode
cu a sin taxis gen er al es la sigu ien te:
e co d e listaariables
aanu eoalor
aanu eoalor
in t o
n ueaariable
a partir d e los
alores de la an tigu a.
n e
em plo m u ab itu al de u tilizacin de esta in str u ccin es cu an do se
a detectado u n a m ala grab acin d e datos. aeces qu e se en cu en tr an u n
p ar d e casos con cdigos qu e n o cor respon d en a n in gu n a de las op cion es
d e r esp u esta p osiblescom o cu an do en la ariab le seo
codificada con
los alor es 1 se en cu en tr en alor es com o el el . E sta es bu en a
ocasin p ar a tran sfor m ar los er rores en casos p erdidos de m odo sim ilar al
sigu ien te:
u se pa n elbclea r
recod e sexo
..
a de n otarse qu e al tratarse de u na tran sform acin linealesta operacin tam bin podra acerse con la in stru ccin replace. oncretam en tem edian te la expresin item 1-item 1
pero recode
ofrece la
enta
a de poderlo aplicar en la m ism a ln ea a u n con
u n to de
ariables.
05_Manipulacin.indd 134
06/06/12 09:25
recod e p1 p p
1
m a x
else.
in to
ed ad r
dem ssi se deseap u ed en pon erse etiqu etas d e alor es a la n u ea ar iable en la m ism a or den de recodificacin . ara realizar lola in stru ccin
an ter ior deb er a con ertirse en esta otra:
recod e ed ad
m in
1
asta
1
1-
m ax
Mas de
else.
in to
ed ad r
tab u late ed ad r
e co d ific a d a
RECODE of |
edadr 2|
Fr eq.
Per c ent
Cum.
- - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - Has t a 35 |
1, 902
36. 00
36. 00
36- 50 |
1, 264
23. 93
59. 93
51- 65 |
1, 096
20. 75
80. 67
Mas de 65 |
1, 021
19. 33
100. 00
- - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - Tot al |
5, 283
100. 00
05_Manipulacin.indd 135
06/06/12 09:25
E S ME
S
5.2..
ran sform acion es
lgicas
E n otr a s oca sion espa r a obten er u n a d eter m in a da tr an sform a cin d e los
a lores d e u n a o
a r ia s
a ria b lesson n ecesar ia s u n a o
a r ia s opera cion es
lgica s ap licad a s a la s in stru ccion es qu e se aca ba n d e a n a lizar. or ello
E s con
en ien te adertir de qu e con la in str u ccin an ter ior se cr ea u n a
n u e
a ariab le llam ada
oven qu e tien e el alor 1 en tod os aqu ellos casos
en los qu e el alor d e la ed ad sea igu al o m en or qu e a osen tan to qu e
ten dr el
alor p erd ido
.en el resto de los casosa qu e n o an sido d efin id os an ter ior m en te. r u eba de ello es el r esu ltad o de aplicarle la in str u ccin
su m m arize
a la ariab le
oven .
ILUSTR ACIN
5.1 .Su m a
io
d e
la
a
ia le
jo ven t
a s
su
c
e a c i n
Var i abl e |
Obs
Mean
St d. Dev .
Mi n
Max
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - j ov en |
1356
1
0
1
1
en es.
or ellola
a ria b le
oven tien e 1.ca sos con m edia n ico
a lor igu a l
a 1. Sia con tin u a cin se p recisa otor gar el
a lor a los qu e tien en m s
de a ospu ede segu irse u tiliza n do la clu su la ifp ero com o a est
cr ead a la
a riab lea or a a qu e a p lica r la in stru ccin repla ceen lu ga r de
gen era te. M s con cr eta m en tela in str u ccin d eb er a ser escr ita d el sigu ien te m odo:
1
E n lu ga r d e u n a cl u su la con d icion a lse p u ed e ta m b in a cer u so d e u n con d icion a n te en fu n cin d el n m er o d e ca sos
in 1
1
. om o qu ier a qu e este ta m b in p u ed e
exp r esa r se com o u n con d icion a l
if n 1p or e
em p lo
slo se a r m en cin a la s d el
pr im er tip o.
05_Manipulacin.indd 136
06/06/12 09:25
replace
oen if edad eda d.
erd adero1
falso
edaden este casoescr ita en tr e p ar n tesis para m aor clar id ad au n qu e p odr an elim in arse. E s m u con en ien te tam b in a adir a la
in stru ccin la clu su la if
p ar a eitar qu e pon ga el alor a los casos perd id os 11.
gen erate
oen
eda dif ed ad.
en esm u
er es
en esom b r es m a or es
m u
er es m a or es. a r a gen er a r u n a a r ia b le con estos cu a tr o a lor es
ta b u la r la con la s cor r esp on d ien tes etiqu eta sser a n n ecesa r ia s esta s siete
ln ea s:
11
tra m anera de realizar la m ism a operacin es m ediante la in struccin recode
con tres
cam bios: uno para los alores otro para los alores 1
finalm enteun tercero para alores
perdidos:
05_Manipulacin.indd 137
06/06/12 09:25
E S ME
S
oen om bre
oen m u
er
om b re m aor
Mu
er m aor
la bel
a lu e sexedad sexed ad
ta bu la te sexeda d
Sin em bar gocon algo de p rctica e im agin acin las p rim er as cu atro
ln eas p od ran aber se r ed u cido a d os d e este m odo:
gen era te sexeda dsexoif ed ad.
repla ce sexeda dsexo if ed ad
05_Manipulacin.indd 138
06/06/12 09:25
5.2..
ran sform acion es
eten didas
u n qu e en las pgin as an ter iores se aan d escr ito explicado las m s elem en tales in stru ccion es tran sfor m adorasel r epertor io d e Stata n o se agota
con estas. E n este apartad o se apor tan u n os pocos e
em p los u su alesseleccion ados en tre otras m u cas otr as tr an sform acion es factibles m edian te la
in stru ccin egen aried ad d e gen eratep re
iam en te explicada en ..1qu e
p erm ite el em pleo d e fu n cion es m s com ple
as de lo qu e perm ita aqu ella
en con tr apartid aslo pu ed e u tilizarse u n a slo u n a de estas fu n cion es sob re u n a ar iable o sobr e u n a lista de ariab les existen tes. Su sin taxis gen eral
es la sigu ien te:
e e n n u e
a
ariab lefu n c
lista
a r
if expresin
in ran go
opcion es
05_Manipulacin.indd 139
06/06/12 09:25
E S ME
S
tr a fu n cin p resen te en egen es stdqu e per m ite estan d arizar u n a ar iable cu an titatia olo qu e es lo m ism or ealizar le u n a tr an sform acin lin eal p ar a qu e ten ga la m edia la desiacin tpica deseadasien dor esp ecti
am en te1 los
alores m s com u n es los establecidos por defecto. Su
for m a es:
e e n n u eaarst d
exp resion
m e a n
s t d
e este m odosi se d esea estan dar izar la ariab le edadla in str u ccin
qu e d ebera escr ib irse sera algo sim ilar a:
egen E d ad Sta n dard std
ed ad
su m m arize E d ad Sta n d ard
:
ILUSTR ACIN
5 ..Su m a
io
de
la
e st a n d a
ia ci n
d e
una
a
ia le
Var i abl e |
Obs
Mean
St d. Dev .
Mi n
Max
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - EdadSt andar d |
5283
- 3. 06e- 09
1 - 1. 521336
2. 667577
in alm en teson tam b in tiles las fu n cion es ro. E stas calcu lan estad sticos or izon talm en te
en tre ariab les
m s qu e er ticalm en tecom o lo
acen las in str u ccion es tp icasp or e
em p lola qu e se acaba de em p lear
su m m arize.
u n to con rop u eden em p lear se las sigu ien tes op er acion es:
first,
last,
m in ,
m a,
total,
m ean ,
sd,
m iss n on m iss.
a ra
er su u tilid a d se m u estr a u n e
em plo a pa rtir de la s cu a tro
a ria bles escala sob re la pa rticipa cin poltica
p 1-p
pr e
iam en te con
er tid as p a ra qu e en tod as ellas los
alores se en cu en tr en en la m ism a
dir eccin
p or e
em ploa m aor ap a ta p oltica m a or p u n tu a cin p a ra
qu e los
alor es
o sa be
o con testa figu r en com o
a lor es perd idos 1.
1
esde la
ersin Stata adm ite asta
alores perdidos. dem s del pu n to
.
er los
alores per didos en u n a tabu lacinse debe a adir la opcin m issin g
a la in stru ccin
tabu late.
05_Manipulacin.indd 140
06/06/12 09:25
11
recod e p1 p p
1
1
recod e p1-p
.a
.b
egen totalrototal
p1-p
m issin g
egen prom ed iorom ean
p 1-p
egen perdidosrom iss
p1-p
su m m arize tota l prom ed io perdidos
d iidid a p or .
in alm en tela ariab le perdidos
n m ero de n o con testacion es por in d iid u otien e com o lm ites el el . E l pr im ero es asign ad o a toda person a
en tr e
istada qu e con test a las cu atro afir m acion esel alor m xim o cor resp on d e a qu ien es n o respon d ieron a n in gu n a.
ILUSTR ACIN
5.1 .Su m a
io
de
a
ia le s
o t e n id a s
co n
m o d a lid a d e s
r ow
d e
egen
Var i abl e |
Obs
Mean
St d. Dev.
Mi n
Max
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - t ot al |
5167
9. 680085
2. 270354
1
16
pr omedi o |
5167
2. 575882
. 5283285
1
4
per di dos |
5283
. 3043725
. 7732964
0
4
5 ..Ca
a ct e
st ica s
e
in st
u ccio n e s
e sp e cia le s
Se acab ar este cap tu lo exp lican d o escu etam en te algu n as d e las car acter sticas especiales d e Stataqu e sern tiles para an lisis estadsticos qu e
ser n abor dados m s adelan te.
a p rim er a de ellas es la capacidad qu e tien en algu n as in str u ccion es
d e gu ar dar parte de su s r esu ltad os. E stos se alm acen an en listas de alor es
d en om in ad os en tres tipos de r esu ltad os: sen cillosa los qu e se les recon oce con r
n om b re
estim adoresden om in ados com o e
n om b re
los apen as
em p leados especialesqu e gen er an n om b res an tecedidos por la letr a s.
E n tre las in str u ccion es qu e se an
isto asta el m om en tolas n icas
qu e gu ar dan resu ltado son tabu late,
su m m arize ci. as tr es lo acen en
el form ato sen cillo r. om o e
em p lo de su u sose er su u tilidad slo con
el segu n do. E n tre las
ar iables gen er adas en las r den es d e m od ificacin
05_Manipulacin.indd 141
06/06/12 09:25
E S ME
S
ase p gin a 11
. Su s p rin cip ales estad sticos p u ed en ob ten er se m ed ian te la or den su m m arized e la qu e p u ede erse
los r esu ltad os qu e gu ar dam edian te la in stru ccin retu rn
list 1.
su m m a rize acu erd os
retu rn list
e su lta d os
a a d os
en
la
in st
u ccin
su m m a r ize
Var i abl e |
Obs
Mean
St d. Dev.
Mi n
Max
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - ac uer dos |
5283
2. 459209
1. 094543
0
4
s cal ar s :
r ( N)
r ( s um_w)
r ( mean)
r ( Var )
r ( s d)
r ( mi n)
r ( max )
r ( sum)
=
=
=
=
=
=
=
=
5283
5283
2. 45920878288851
1. 198023379915273
1. 094542543675335
0
4
12992
05_Manipulacin.indd 142
06/06/12 09:25
d ispla
a m edia esr
m ean
la d es
iacin tp icar
sd
r
m ean
ora b ien siem p re qu e se qu ier a oler a recor dar el con ten ido d e esta
m acr oaqu e p reced er su n om br e con el car cter . on sigu ien tem en te
si se desea obten er u n a n u ea ariab le qu e reco
a las diferen cias de los alo1
ados tipos de m acros: globales locales. E n este libro slo se trataran las prim eras
pu es son de u so m s sen cillo su ficien tessiem pre cu ando no se en tre en tem as de program acin. os resu ltados tam bin pu eden gu ardarse en
ariables con las rdenes generate o
replace o en otros receptcu los de con stan tes llam ados escalares (scalarsm atrices con las
in struccion es scalar m atri. n a explicacin de la diferen cia en tre un a m acro un escalar se
encu en tra en Stata
e: -
.
05_Manipulacin.indd 143
06/06/12 09:25
E S ME
S
e su lt a d o s
m a c
o s
e
in st
u cci n
d isp la y
Var i abl e |
Obs
Mean
St d. Dev .
Mi n
Max
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - ac uer dos 0 |
5283
2. 01e- 08
1. 094543 - 2. 459209
1. 540791
s cal ar s :
r ( N)
r ( s um_w)
r ( mean)
r ( Var )
r ( s d)
r ( mi n)
r ( max )
r ( sum)
=
=
=
=
=
=
=
=
5283
5283
2. 01164265823e- 08
1. 198023372394011
1. 094542540239534
- 2. 459208726882935
1. 540791273117065
. 0001062750816345
p1-p
globa l con d i1
if sexo1 ed ad eda d
list sexo ed ad con d i1 in 1
clean
05_Manipulacin.indd 144
06/06/12 09:25
tres
alorestr es operad ores d e r elacin d os sign os lgicos
qu e los
in cu lan . a ltim a or den pid e u n listad o d e dos
ar iablesm s las cu atro
con ten id as en la pr im er a m acrocon la con d icin expr esada en la segu n d a
lim itada a los cu ar en ta p rim er os casos
in 1
.
ILUSTR ACIN
5 ..List a d o
de
ca so s
e m p le a n d o
m a c
os
7.
14.
22.
36.
37.
s ex o
Hombr e
Hombr e
Hombr e
Hombr e
Hombr e
edad
40
48
36
36
44
en
de
de
de
de
p201
desac u
ac uer d
ac uer d
ac uer d
ac uer d
de
de
de
de
de
p202
ac uer d
ac uer d
ac uer d
ac uer d
ac uer d
p203
de ac uer d
de ac uer d
de ac uer d
de ac uer d
muy de ac
p204
.a
de ac uer d
de ac uer d
de ac uer d
muy de ac
05_Manipulacin.indd 145
06/06/12 09:25
E S ME
S
gu asu n a lista d e
alores u otra lista d e cu alqu ier otra cosa
n u eas ar iab lescaden as o fu n cion esp or e
em p lo
segu id a del listado cor respon d ien te. n a ez ter m in ada la listase in ser tan los d os pu n tos a con tin u acin
la su p lan tar los elem en tos de la lista en la in stru ccin sigu ien te siem p re
cu an d o apar ezca. E n el e
em p lo an terior ap ar eca dos eces: u n aal fin al
en tr e par n tesis p ar a exp resar la
ar iable existen tela otr ad elan te del sign o
igu alsegu id a d e e p ara distin gu ir las n u eas
ar iablesin dican do qu e se
tr ata de estan d arizacion es.
tr a fu n cin til d e esta in stru ccin es cr ear ar iables d icotm icas o
in d icad ores a par tir d e ariab les categricas. E n p rim er lu garse p on e u n
e
em p lo m u fcil. Se
a a con er tir en u n a sola ln ea la ariab le seo en
d os: om b re m u
er.
for n u m list 1
: gen erate sexo
sexoif sexo.
de
a
ia le s
ca t e
ica s
s exo
Muj er
Hombr e
Hombr e
Hombr e
Hombr e
05_Manipulacin.indd 146
s exo1
0
1
1
1
1
s ex o2
1
0
0
0
0
edad
37
19
60
27
66
edadr
36- 50
Hast a 35
51- 65
Hast a 35
Mas de 65
j oven
0
1
0
1
0
adul t o
1
0
0
0
0
madur o
0
0
1
0
0
may or
0
0
0
0
1
06/06/12 09:25
5 ..
e
cicio s
1.
.
.
.
.
.
.
.
.
con tan do
la p rim er a el doble de la segu n da. az lo m ism o con la situ acin econ m ica
pr egu n tas
gu ard an do en m acr os la m edia des
iacin
tpica de am bas.
on u n a sola ln ea d e cd igo con
ier te los n d ices del e
er cicio an terior
en ar iables estan darizadas con m edia desiacin tpica 1
. ista
d esp u s los casos qu e estn fu era del ran go de a 1en u n a u otr a
ariab le.
05_Manipulacin.indd 147
06/06/12 09:25
05_Manipulacin.indd 148
06/06/12 09:25
6
Gr fico s co n St a t a
Un a d e la s ca p a cid a d es b sica s qu e h a d e ten er cu a lqu ier a p lica cin
esta d stica es la d e ser ca p a z d e gen er a r gr ficos. Ta n im p o r ta n te es la
ca p a cid a d d e tr a ta m ien to d e va r ia b les y la d e gen er a ci n d e esta d sticos
co m o la d e h a cer q u e se m u estr en lo s d a to s r ep r esen ta d o s m ed ia n te
u n a im a gen , qu e en m u ch a s o ca sio n es d ice b a sta n te m s q u e m il n
m er o s.
a y m u y d iver so s tip os d e gr ficos en la r ep r esen ta cin esta d sti
ca , p er o, con ob
eto d e sim p lifica r la a m p lia va r ied a d eisten te, estos
p u ed en u b ica r se en d os cla sifica cio n esp or u n la d o, la d el n m er o d e
d im en sion es qu e r ep r esen ta n y, p o r el otr o, el tip o d e va r ia b les r ep r esen
ta d o. n el p r im er ca so se p u ed en en con tr a r gr ficos u n id im en sion a les,
qu e r ep r esen ta n los va lor es y fr ecu en cia s d e ca d a va r ia b le in d ep en d ien
tem en te d e la s d em s, si la s h u b ier egr ficos b id im en sio n a les, en los qu e
se m u estr a n d istr ib u cio n es con
u n ta s d e d os va r ia b les, y r ep r esen ta cio
n es m u ltid im en sion a les, d o n d e se m u estr a n d istr ib u cion es m u ltiva r ia n
tes. s n ecesa r io p r ecisa r qu e n o siem p r e co in cid e el con cep to d e d i
m en si n con el d e va r ia b le. s, en u n gr fico u n id im en sion a l p u ed en
r ep r esen ta r se d os o m s va r ia b les, en cu yo ca so, seg n se con str u ya el
gr fico, se p od r estu d ia r la a socia cin eisten te en tr e ella s o com p a
r a r su s ca r a cter stica s r ep r esen ta d a s. o r otr o la d o , los gr ficos ta m b in
p u ed en cla sifica r se seg n el tip o d e va r ia b le qu e qu ier en r ep r esen ta r.
s, h a y gr ficos qu e se a d ecu a n esp ecia lm en te a va r ia b les cu a lita tiva s,
com o son el gr fico d e sector es o el d e b a r r a s, m ien tr a s qu e otr os, co m o
la s n u b es d e p u n to s o el h istogr a m a , est n in d ica d os p r in cip a lm en te
p a r a va r ia b les cu a n tita tiva s.
a ap licacin tata es capaz de p rod u cir gr ficos de tres m odos distin
tos
ara estu diar la asociacin en grficos u n idim en sion ales es preciso a adir a su repre
sen tacin de n ica en trada otra dim ensin . sto se logra, com o se ver m s adelante, m edian te
dos m odoscon over la operacin se realiza en los m ism os e
es del grfico, con by se constru ye
otro grfico paralelo.
06/06/12 09:28
UT
6.1.
Ca r a ct e r st ica s d e lo s gr fico s d e St a t a
partir de la versin , tata im plem ent u na sin tais bastan te diferen te de las an terio
res. in em bargo, a n se perm ite qu e los vie
os program as pu edan e
ecu tarse. ara ello, h a de
cam biarse la in struccin graph por graph7, o bien , en el in terior de u n program a, advertir al
com ien zo de qu e se est traba
an do con u na versin an terior a la , con la in stru ccin version .
06/06/12 09:28
T TT
List a d o d e gr fico s e n m e m o r ia
Gr aph Hi s t _Mpg
d escribe rap h
ren am e ra ph ist
rice, repla ce
d ispla y ist
p g
copy istp g p g, rep lace
d rop istp g
com b in e ist
rice p g, n am e
, repla ce
06/06/12 09:28
UT
Co m in a ci n d e gr fico s
Density
0
.02
1.0e04
.04
Density
.06
2.0e04
.08
.1
3.0e04
GR IC 6 .1.
5,000
10,000
Price
15,000
10
20
30
Mileage (mpg)
40
e m f
n g
t if
ict
d f
06/06/12 09:28
T TT
6 .. Gr fico s n id im e n sio n a le s
6... Grficos de sectores
os gr ficos d e sector es son rep resen tacion es de los d atos en u n cr cu lo cu
yos segm en tos r epr esen tan pr op orcion alm en te la fr ecu en cia d e los valor es
con ten id os d e u n a o varias variab les.
a in stru ccin m n im a p ara realizar grficos d e sectores es la sigu ien te
gr a ie listad evariab les
06/06/12 09:28
UT
p artir de los d atos con tem p lad os en la ilu str acin ., b astara con
in d icar la in stru ccin
u se e
em ploa, clear
gra ph p ie om bre u
er, n am e
, repla ce
Hombre
Mujer
06/06/12 09:28
T TT
hombre
mujer
06/06/12 09:28
UT
GR IC 6.. Gr fico s d e se c t o r e s se g n n a se gn d a a r ia le
PP
PSOE
IU
Otros
Blanco
NC
hombre
mujer
06/06/12 09:28
T TT
20
40
60
GR IC 6 .. Gr fic o d e a r r a s
Hombre
Mujer
grap h b ar
cou n tcasos, over
seon am e
, repla ce
06/06/12 09:28
UT
Gr fic o d e a r r a s co n la a r ia n t e over
1,000
count of casos
2,000
3,000
GR IC 6 .6.
hombre
mujer
200
count of casos
400
600
800
1,000
GR IC 6.. Gr fico d e a r r a s c o n a r ia le d e co n t r o l
PP
PSOE
IU
Otros Blanco
hombre
PP
PSOE
IU
Otros Blanco N
mujer
06/06/12 09:28
T TT
ay otr o m odo de qu e se pr odu zca u n resu ltado sim ilar al an ter ior. e
trata de m ostrar tan tos grficos com o valor es ten ga la variab le qu e se espe
cifiqu e detr s d e la opcin by(variable).
n clu so, si se d esea, pu ede ob ten er se
al m ism o tiem po el grfico cor respon dien te al con
u n to de la m u estra, si se
a ade despu s de la variab le la opcin total
grap h b ar
cou n tcasos, over
otoby
seo, tota l n am e
, rep lace
GR IC 6 .. Gr fico s d e a r r a s co n la o ci n b y
500 1,0001,5002,000
mujer
PP PSOE
IU
Otros Blanco NC
PP PSOE
IU
Otros Blanco NC
500 1,0001,5002,000
Total
count of casos
hombre
PP PSOE
IU
Otros Blanco NC
rahs bseo
06/06/12 09:28
UT
10
sum of casos
20
30
40
GR IC 6 .. Gr fic o d e a r r a s co n fr e ce n cia s
PP
PSOE
IU
Otros
Blanco
NC
acar porcen ta
es o frecu en cias seg n se h aya constru ido la variable ficticia con la qu e
se constru yen los grficos de barras
casos, en este e
em plo
. om o m s arriba se constru y di
vidien do por el tam a o de la m u estra
06/06/12 09:28
T TT
2,000
1,000
0
count of casos
3,000
hombre
PP
IU
Blanco
PSOE
Otros
NC
Grahs bse
o
n am e
, replace
GR IC 6.11 .
80
60
40
0
20
100
hombre
PP
IU
Blanco
PSOE
Otros
NC
raphs bse
o
06/06/12 09:28
UT
in a lm en te, h a y q u e se a la r q u e t o d o s lo s gr ficos d e b a r r a a q u
ep u esto s p u ed en d ib u
a r se h o r izo n t a lm en te. a r a ello , slo es p r eci
so ca m b ia r la segu n d a p a la b r a d e la in str u cci n p o r h ba r en lu ga r d e
ba r.
or e
em plo, si se desea, dib u
ar la in ten cin de voto en b ar ras h orizon
tales, se deb er a escr ibir la sigu ien te ln ea
gra ph h ba r
su m ca sos, over
oto
asyva r n a m e
, repla ce
e este m odo, se obtien e el sigu ien te gr fico con b ar ras d e d istin to color
p or h ab er especificado la opcin asyvar
GR IC 6.1. Gr fico d e a r r a s o r io n t a le s
10
20
sum of casos
PP
IU
Blanco
30
40
PSOE
Otros
NC
6... istogram as
os h istogr a m a s son gr ficos qu e se em p lea n p a r a la r ep r esen ta cin d e
va r ia b les cu a n tita tiva s con tin u a s. on sisten en d ivid ir los va lor es en u n a
ser ie d e in ter va los y r ep r esen ta r ca d a u n o d e estos con u n r ea p r op or
cion a l a su ta m a o. en er a lm en te, los va lor es se ep r esa n en el e
e de
a b scisa s d e u n gr fico d e coor d en a d a s, m ien tr a s qu e, en el ca so d e qu e
tod os los in ter va los ten ga n a m p litu d con sta n te, en la s or d en a d a s se e
p r esa n la s fr ecu en cia s a b solu ta s o r ela tiva s cor r esp on d ien tes a ca d a gr u
p o d e va lor es.
06/06/12 09:28
T TT
n tata b asta con d os palab ras p ar a gen erar u n grfico de este tipoel
com an do histogram segu id o d el n om br e d e la var iable qu e se qu iere rep re
sen tar
h istogram ed ad , n a m e
, repla ce
.01
Density
.02
.03
20
40
60
edad
80
100
06/06/12 09:28
UT
.005
Density
.01
.015
.02
GR IC 6 .1. ist o gr a m a c o n o co in t e r a lo s
20
40
60
edad
80
100
. ob vio es qu e am b as se pu eden
com bin ar para obten er u n h istogr am a a gu sto d el u su ario
h istogram eda d, start
idth
n a m e
.005
Density
.01
.015
.02
GR IC 6 .1. ist o gr a m a c o n in t e r a lo s co n st a n t e s
20
40
60
80
100
edad
06/06/12 09:28
T TT
500
Frequency
1000
1500
GR IC 6 .16 .
20
40
60
80
100
edad
l algoritm o u tilizado por defecto es el de pan echn iov, pero tam bin em plea, siem pre
que se especifique en las opcion es, los sigu ien tesbiweight, cosine, gau ssian , par
en, rectan gu lar
y trian gu lar.
06/06/12 09:28
UT
, el m todo
vase n ota
, la com par acin con u n a distr ibu cin n or m al (n orm al) o d e
tu den t (stu den t) e in clu so la gen er acin d e d os n u evas var iables, gen erate
var iable
con valores, var iable
con fr ecu en cias
, p ar a ver el r esu ltado n o
slo gr ficam en te, sin o tam b in n u m r icam en te.
tra m an era de realizarlo es a travs de la in stru ccin graph twoway, m e
dian te la cu al se pu eden com bin ar en los m ism os e
es u n h istogram a y u n gr
fico de den sidad, con ob
eto de qu e se aprecie el pap el su avizador qu e tien e la
estim acin de las frecu en cias con el sistem a proporcion ado por el segu n do.
gra ph toay
h istogram tm i
d en sity tm i
, n a m e
.01
.02
.03
20
40
60
Density
80
100
kdensity edad
6... Grficos de ca
a
os grficos de ca
a poseen u na pecu liar im portan cia en el anlisis eploratorio
de datos. on sisten en la represen tacin de los datos en u n rectn gu lo de an
chu ra arbitraria y lon gitu d igu al al rango in tercu artlico. sto se logra dibu
an
do u n o de los lm ites del rectn gu lo en el prim er cuartil y el otro en el tercero.
n tre el u n o y el otro tam bin se dibu
a en el rectn gulo otra ln ea qu e repre
sen ta la m edian a. e cada etrem o del rectn gulo h a de salir tam bin u n a lnea
con longitu d n u nca su perior a vez y m edia el ran go intercu artlico, que llegu e
06/06/12 09:28
T TT
h asta el caso qu e cu m pla esa con dicin . inalm ente, siem pre que h aya al m enos
u n caso fu era de esos rangos
casos etrem os
, se epresa en form a de pu ntos.
a form a de obten er estos gr ficos con tata es sim ilar a la de los otros
gr ficos ya con tem p lad os. am b ia, en este caso, la palabr a clave qu e sigu e
a la in stru ccin graph
gr a o lista devariab les
s, para ob ten er la repr esen tacin d e la variab le edad, b asta con escr i
b ir la sigu ien te in stru ccin .
grap h b oed ad , n a m e
, repla ce
20
40
edad
60
80
100
GR IC 6.1 . Gr fic o d e ca
a
06/06/12 09:28
UT
10
GR IC 6.1. Gr fico d e c a
a s co n a r ia s a r ia le s
pp
iu
psoe
, m s vez y m edia el r an
go in ter cu ar tlico
,
. n cam bio, h ay cu estion arios n o se sab e cu n tos
p or m ed io del grfico qu e h an r ecogid o p ar a esta var iable valor es desde
el h asta el .
l r ect n gu lo d el m ed io, el cor r esp on d ien te a l (ideopp), tien e u n
r a n go in ter cu a r tlico d e d os p u n tos
en tr e el y el con m ed ia n a en
el . or eso la ln ea d e a b a
o a lca n za h a sta el , esto es, m en os vez y
m ed ia el r a n go, qu e tien e en este ca so el va lor d e . la d e a r r ib a llega
h a sta el m im o va lor p osib le, es d ecir, el , p or qu e p a r te d esd e el ter
cer cu a r til.
n el sigu ien te e
em plo, en lu gar d e r ep resen tar d istin tas var iables, se
d ibu
a u n a sola
la u b icacin en la escala id eolgica del , ideopp
, pero en
tan tos gru p os com o valor es ten ga u n a var iable d e con trol
el p ar tido p olti
co al qu e se vot, oto
06/06/12 09:28
T TT
pp
10
GR IC 6.. Gr fico d e ca
a s co n a r ia le d e co n t r o l
PP
PSOE
IU
Otros
Blanco
NC
10
GR IC 6.1 .
PP PSOE IU
OtrosBlanco NC
PP PSOE IU
hombre
OtrosBlanco NC
mujer
pp
psoe
6 .. Gr fico s id im e n sio n a le s
a versin de tata agrupa ba
o la orden graph twoway m odalidades dife
rentes de grficos. lgunas poseen caractersticas m uy sim ilares, pero otras son
etrem adam ente diferentes e incluso difciles de considerar com o bidim ensiona
les. l program a considera bidim ensional todo aquel grfico en el que los dos
e
es o escalas
la , o e
e horizontal, y la , o e
e verticalson num ricos. egn
06/06/12 09:28
UT
in ra n go
,
op cion es
com u n es
opcion es especficas
pesar de eso, en este captulo la m odalidad del histogram a ha sido considerada entre
los grficos unidim ensionales. a orden que se eplic fue histogram . ero, de ahora en adelante,
es conveniente saber que esta es una abreviatura de graph twoway histogram . sto es im portante
porque este tipo de grficos puede m ezclarse con otros de naturaleza propiam ente bidim ensional.
06/06/12 09:28
T TT
40
80
GR IC 6 .. Ne d e n t o s
10000
20000
30000
PNB por unidad de compra
40000
06/06/12 09:28
UT
altura en el e
e vertical en la que estn situados los pases qu e tienen esperanza
de vida m en or. n esta situacin tam bin eiste un a asociacin lineal, pero nega
tiva. in alm ente, el grfico inferior derecho m uestra una asociacin particu lar en
la m edida en qu e fcilm en te se aprecia que n o es lineal, sino cu rvilnea. Tam bin
ocu rre que las altas esperanzas de vida al n acer se en cuentran en pases con alta
renta y las ba
as en los de ba
o , pero se aprecia que entre los de ba
o nivel
econ m ico u n ligero ascenso del producto produce un considerable aum ento de
la esperan za de vida, m ientras que, entre los pases de alto n ivel econm ico, el
enriquecim iento en sim ilares cuantas conlleva m u chos m enores progresos en el
n m ero de a os que la gente vive.
10000
20000
30000
PNB por unidad de compra
40000
50
100
150
200
Tasa de mortalidad infantil /1000 1998
10000
20000
30000
PNB poniae cop
a
40000
10000
20000
30000
Ppor nidad de compra
40000
n este apar tado se con sideran tam bin cu atro gr ficos sim ilar es a las
n u bes de p u n tos, de los qu e se diferen cian en qu e p oseen u n a gu a qu e u n e
el pu n to
repr esen tad o o n ocon el e
e d e abscisas. or tan to, au n qu e algu
n os d e ellos se h ayan visto en el apartado d e gr ficos u n idim en sion ales, en
el fon d o son m u y distin tos, p u es en lu gar de r epr esen tar u n a variable cu ali
tativa con su fr ecu en cia o con otro estadstico de otr a var iable, se estn r e
p resen tan d o los valores de dos variab les cu an titativas, la m ayor parte d e las
veces sien do la in d ep en d ien te
ep resada en el e
e h or izon talel tiem p o.
06/06/12 09:28
T TT
toa y bar p ob su pm , n am e
a, rep lacetitle
a rra s
la vos
toa y spie p ob su pm , n am e
b, rep lacetitle
n eas cada s
u n tos
com b in e a b c d, n am e
GR IC 6 .. t r o s gr fic o s id im e n sio n a le s
Grficos e cla
os (spike)
Grficos e pun
os
Grfico e barras
06/06/12 09:28
UT
u stralia y la
n dia. ste ltim o tien e u n a poblacin aproim ada de .m i
llon es de h ab itan tes, slo su perados por los .de h in a. os cin co restan
tes pases de gran eten sin tien en u n a poblacin m u ch o m s redu cida, por
deba
o d e los m illon es de h abitan tes. , en tre los pases pequ e os, destaca
GR IC 6 .. Gr fico s d e m a t r i
Esperanza
de vida
al nacer
1998
200
Tasa de
mortalidad
infantil
/1000 1998
100
0
40000
PNB por
unidad
de
compra
20000
0
40
60
80 0
100
200
arad
icam en te, au n qu e represen te relacion es bivariadas entre variables, este grfico
n o es tratado com o bidim en sional por tata. a razn es sen cilla, por su propia naturaleza de
in clu sin de m ltiples grficos bivariados n o pu ede in crustarse con otros grficos sen cillos.
perativam en te, la in stru ccin graph twoway slo es aplicable a grficos qu e pu edan in tegrarse
en tre ellos. in em bargo, este tipo de grfico se in clu ye en este apartado por su alta sim ilitu d
de con ten ido y u so con los grficos de dispersin .
06/06/12 09:28
T TT
om o pu ede apr eciar se, las d ifer en cias en tre am bos grficos estn en la
p resen cia o au sen cia de los pu n tos qu e repr esen tan a los casos
80
Esperanza de vida al nacer 1998
50
60
70
0
Gr fic o s d e ln e a
40
40
80
GR IC 6.6.
50
100
150
200
Tasa de mortalidad infantil /1000 1998
50
100
150
200
Tasa de mortalidad infantil /1000 1998
06/06/12 09:28
UT
40
80
GR IC 6.. Gr fic o d e r e a
50
100
150
Tasa de mortalidad infantil /1000 1998
200
6... Grficos de a
u ste
n lu ga r d e d ib u
a r ln ea s qu eb r a d a s qu e u n a n tod os los p u n tos d e u n a
d istr ib u cin b iva r ia d a , se p u ed e op ta r p or tr a za r u n a ln ea r ecta o cu r
va qu e tr a te d e p a sa r lo m s cer ca p osib le d e los p u n tos con el fin
06/06/12 09:28
T TT
en lu gar de d ib u
arse los p u n tos em p ricos, se tr aza la ln ea qu e m e
or
a
u sta la distan cia cu adr tica de estos a la recta. s p reciso n otar qu e en el
e
e vertical ap ar ecen los valores a
u stados d e la esper an za de vid a al n acer,
en lu gar d e la var iable p ropiam en te d ich a.
30
40
Fitted values
50
60
70
80
GR IC 6.. Gr fico d e a
st e lin e a l
50
100
150
Tasa de mortalidad infantil /1000 1998
200
u ch o m s til qu e d ib u
a r slo la r ecta a
u sta d a es r ep r esen ta r
un
to con ella los p u n tos qu e r ep r esen ta n los va lor es m ed id os d e a m b a s
va r ia b les. om o se h a d ich o a l in icio d e los gr ficos b id im en sion a les, la
l m todo de a
u ste de ln eas es con tem plado con m s detenim iento en el captu lo
destin ado a la regresin .
06/06/12 09:28
UT
30
40
50
60
70
80
GR IC 6.. Ne d e n t o s a
s t e lin e a l
50
100
150
Tasa de mortalidad infantil /1000 1998
Fitted values
200
Esperanza de vida al na
er 1998
d em s d el a
u ste lin eal, la opcin gr fica d e tata p er m ite otr os a
u stes
in m ed iatos. l cu ad rtico (fit) y el p olin m ico (fpfit) , por u n lado, son
a
u stes en ltim a in stan cia lin eales. l a
u ste lowess es u n su avizad o basado
en regr esion es p on d eradas localm en te d e los valor es yi. os a
u stes m ban d
y m splin e d ivid en la d istr ibu cin d e la variab le in depen dien te en distin tos
sectores
ban dasy, a travs d e la m ed ian a, en cada u n a de ellas con stru ye
u n a
u ste n o su avizad o, com o en el pr im er caso, o su avizado, com o en el
segu n d o.
ste a
u ste im plica la realizacin de u n a regresin fraccional polinm ica en la qu e
el program a bu sca las m e
ores potencias sobre la variable in depen diente para qu e a
uste los
valores de la variable depen diente. ase para m s detalle la instru ccin fracpoly en el m an u al
de tata
f
.
06/06/12 09:28
T TT
ed ian te las cu atro in str u ccion es sigu ien tes p osterior m en te com bi
n ad as se ob tien en los cu atro grficos de la p rim a figu ra, don de pu eden
com p robar se las diferen tes caractersticas d e los a
u stes epu estos en su s
r espectivos ttu los
toay
qfit evn pnbppa
scatter evn pnbppa
, nam e
atitle
uste qfit
toay
fpfit evn pnbppa
scatter evn pnbppa
, nam e
btitle
uste fpfit
toay
loess evn pnbppa
scatter evn pnbppa
, nam e
ctitle
uste loess
toay
m spline evn pnbppa
scatter evn pnbppa
, nam e
dtitle
uste m spline
GR IC 6 .. Gr fico s d e ca t r o a
st e s d ist in t o s
uste
p
it
40 50 60 70 80
40 50 60 70 80
uste
it
10000
20000
30000
PNB por unidad de compra
Fitted values
40000
Esp.vida
1
10000
20000
30000
PNB por unidad de compra
predicted evn
Esp.vida
1
40 50 60 70 80
us
e mspline
40 50 60 70 80
us
e lowess
40000
10000
20000
30000
PNB por unidad de compra
lowess evn pnbppa
6..6.
40000
Esp.vida
1
10000
20000
30000
PNB por unidad de compra
Median spline
40000
Esp.vida(1
Grficos de ran go
06/06/12 09:28
UT
sen das variab les depen dien tes. ay var ias for m as d e pr esen tacin , pero to
d as ellas se caracterizan por lo qu e se acaba de defin ir.
or u n lado, las d os var iables r ep resen tadas pu eden estar u n id as en tr e
ellas, sea por b ar ras (rbar), p or ln eas ver ticales (rspie), p or ln eas r em a
tad as
rcap o rcapsim o por reas (rarea). tra p osibilidad es qu e se r e
p resen ten las dos series con dos ln eas con ectadas, pero paralelas en tr e s,
in ser tan do o n o los p u n tos qu e r ep resen tan los d iver sos casos
rcon n ected
y rlin e
.
a sin tais de este tipo de gr ficos com ien za con la or den gra ph
twowa y, d esp u s con tin a con la m od a lid a d d e gr fico d esea d a y segu i
d a m en te h a n d e p on er se en p r im er lu ga r la s d os va r ia b les r ep r esen ta d a s
en el e
e ver tica l y, a con tin u a cin , la va r ia b le in d ep en d ien te, es d ecir, la
d el e
e h or izon ta l. l or d en d e la s d os p r im er a s es ir r eleva n te, p u esto qu e
m ed ia n te la b a r r a o el r ea se r ep r esen ta la d ista n cia a b solu ta en tr e los
d os va lor es.
con tin u acin se pr esen tan , para m ostrar las d istin tas m odalidades d e
r ep resen tacin de los gr ficos de r an go, cu atr o m odelos distin tos ob ten idos
con las sigu ien tes in stru ccion es
gra ph
gra ph
gra ph
gra ph
gra ph
rb ar
rca p
ra rea
rlin e
com b in e a b c d , n am e
, replace
a com bin acin de estas cu atr o in stru ccion es da lu gar a los sigu ien tes
grficos
06/06/12 09:28
T TT
GR IC 6.1.
Gr fico s d e r a n go s
Pcs/Tfnos
200 400 600 800
rcap
Pcs/Tfnos
200 400 600 800
rbar
10000
20000
30000
PNB por unidad de compra
40000
40000
Pcs/Tfnos
200 400 600 800
rline
Pcs/Tfnos
200 400 600 800
rarea
10000
20000
30000
PNB por unidad de compra
10000
20000
30000
PNB por unidad de compra
40000
10000
20000
30000
PNB por unidad de compra
40000
, don de se
in dica el por cen ta
e de con fian za desead o para la r ep resen tacin , y stdf, en
el caso d e qu e se d esee con tar con el er ror tpico d el pr on stico, en lu gar del
de la pr ed iccin , o la opcin stdr, si se desea u tilizar p ara el clcu lo de los
in tervalos el err or tpico de los r esidu ales.
06/06/12 09:28
UT
Un p ar d e e
em plos con las op cion es p or om isin m u estran d os grficos
con los in tervalos b asad os en el er ror tpico de la pr ed iccin y u n de
con fian za, salvo en el caso d e qu e se m odifiqu e este parm etr o con la in s
tr u ccin set level.
gra ph toay
qfitci evn pn bp pa
scatter evn pn b pp a
, n a m e
a, replace
gra ph toay
fp fitci evn p n bp pa
scatter evn pn bp pa
, n am e
b , replace
gra ph com b in e a b, n am e
, rep lace
30
40
40
50
50
60
60
70
70
80
80
GR IC 6.. Gr fic o s d e a
st e s co n in t e r a lo s d e co n fia n a
10000
20000
30000
PNB por unidad de compra
95% CI
p
vida
1999
6..7.
40000
Fitted va
ue
10000
20000
30000
PNB por unidad de compra
95% CI
40000
predicted evn
p
vida
1999
Grficos de fu n cin
, op cion es
n este caso, x represen ta la variable que va a flu ctu ar u n n m ero determ in ado de ve
ces
por om isin en u n ran go dado
en tre y , si n ada se especifica
.
06/06/12 09:28
T TT
2.1
2.2
2.3
2.4
2.5
GR IC 6 .. Gr fico d e fn ci n
.2
.4
.6
.8
, ran ge
..n
, n am e
, replace
06/06/12 09:28
UT
.1
y
.2
.3
.4
GR IC 6 .. Gr fico d e la fn ci n n o r m a l
0
x
6.. Co m o n e n t e s d e lo s gr fico s
Un a vez visto cm o pr oced er para obten er lo b sico d e los d istin tos gr
ficos qu e tata gen er a con su in str u ccin graph , se van a con sid erar otros
elem en tos qu e, au n qu e au iliar es, son m u y im p or tan tes para la defin icin
fin al de los grficos. ara cu alqu ier tip o d e gr ficos, in depen dien tem en te
d e la in stru ccin qu e lo gen ere o de las car acter sticas pr op ias d e su for m a,
p u ed en d istin gu irse u n a ser ie de elem en tos com plem en tarios, a veces con si
d er ados secu n dar ios, pero m u y im por tan tes para la p resen tacin adecu ada.
in pr eten sin d e ser eh au stivos, aqu se pr esen ta u n a lista de ellos
tu losu m p len u n a d ob le fu n cin por u n lado, aclaran al lector qu
es lo qu e se est r ep resen tan do y, por el otro, el ttu lo p rin cip al de u n grfi
co es u n elem en to esen cial para epon er lo en u n n d ice de u n a p u blicacin
d on d e el n m er o de gr ficos sea con siderable. n m u ch as ocasion es, estos
ttu los deben acom pa arse d e u n su bttu lo, con sisten te en u n a ln ea ad icio
n al qu e com p lem en ta la in form acin del p rim er o.
o es ob
eto de u n m an u al in trodu ctorio eplicar la com ple
a estru ctu ra de rden es
y opciones a travs de las cu ales se pueden in trodu cir o m odificar estos elem en tos. ara rea
lizar cam bios en u n grfico se su giere el u so del editor de program as, eplicado al fin al de
este captu lo. e recom ien da, asim ism o, tan to el libro de itch ell
, dedicado eclusiva
m en te a los grficos, com o la pgin a eb de la U, http
www.ats.u cla.edu
stat
stata
library
Graphxam ples
defau lt.htm , don de se eponen u na serie de m odelos, con las rden es qu e h ay
qu e escribir para obten erlos.
06/06/12 09:28
T TT
eson escalas don de se u bican los valores o las frecu en cias de las varia
bles represen tadas. n teora pu ede h aber grficos sin e
es, com o los de secto
res, y los pu ede h aber h asta con seis
tres dim en sion es con dos e
es cada u n a
de ellas
, siem pre y cu an do n o se com bin en u n a serie de grficos, pero lo m s
frecu en te es qu e u n grfico slo ten ga u n o o dos. en tro de los e
es pu eden
con siderarse las m arcas y las cu adrcu las. as prim eras son pequ e os sign os,
gen eralm en te perpen dicu lares al e
e, qu e especifican dn de se en cu en tra u n
determ in ado valor. as cu adrcu las, en cam bio, son ln eas qu e tien en su origen
en u n determ in ado e
e y llegan h asta el otro etrem o del grfico con el fin de
poder u bicar la posicin de u n determ in ado elem en to den tro del con
u n to.
lem en toson cad a u n o d e los com p on en tes esen ciales de u n gr fico
p rop iam en te d ich o, qu e r ep resen tan bien u n caso o u n gr u po de casos, b ien
u n valor o con
u n to de valor es. on elem en tos, p or e
em p lo, los sector es de
u n gr fico circu lar, los r ectn gu los qu e for m an u n diagr am a de bar ras, los
p u n tos de u n a n u b e d e pu n tos o las ln eas qu e r epr esen tan u n a regresin .
n gen er al, au n ten ien do en cu en ta las ecep cion es de las d istin tas var ie
d ades, los elem en tos pu eden d ifer en ciar se de cu atro m an er as d istin tas. n
p rim er lu gar, la form a. e este m od o, par a distin gu ir distin tos tipos de ca
sos, pu ede u tilizar se u n cr cu lo, u n cu adr ado o cu alqu ier otr a for m a sim ilar,
seg n se qu ier an epr esar los de u n tip o u otro. n segu n do lu gar, el tam a o
tam bin pu ede d iferen ciar u n os elem en tos de otr os, au n qu e en la m ayor
p arte de los gr ficos el tam a o su ele em plear se par a d istin gu ir la frecu en cia
d e u n os determ in ados casos o valor es. n tercer lu gar, la posicin , pu es en
m u ch as ocasion es u n valor n o est r ep resen tado por el tam a o d el elem en
to, sin o por lo cercan o o ale
ado qu e est del pu n to de origen de u n a escala.
n cu arto lu gar, los grficos pu ed en u tilizar el color p ara diferen ciar los ele
m en tos. s, u n valor p u ed e qu ed ar r ep resen tado con u n color y el resto d e
los valor es con otr os. , fin alm en te, d e m odo altern ativo o com plem en tario
al color, se pu eden u tilizar d istin tas tram as al dibu
ar cu alqu ier elem en to,
com o p or e
em plo ln eas con tin u as, d iscon tin u as o pu n teadas, o bar ras con
su p er ficies lisas, rayadas o pu n teadas.
eyen dason el r ep ertor io de sm bolos qu e se u tilizan en u n grfico,
06/06/12 09:28
UT
6.. se m a s
ad a la com p le
id ad d e las opcion es y su b opcion es d e los gr ficos en tata,
esta h err am ien ta estadstica h a qu er id o sim p lificar al u su ario la p rod u ccin
d e gr ficos a travs de los esqu em as. os esqu em as son con
u n tos d e opcio
n es con los qu e los gr ficos son r ep resen tados en la p an talla.
em plo d e
las esp ecificacion es qu e pu ede con ten er u n esqu em a son el tipo y tam a o
d e letr a, los colores de fon d o y d e los cu adr os, los su cesivos color es qu e in
corp or an los elem en tos
sector es, b ar ras, ln easde los distin tos tipos de
grficos, el grosor y la tetu ra de las ln eas, la presen cia y en su caso la
for m a o au sen cia de m ar cas, e
es, r e
illas, etc. or om isin , tata tr aba
a
con u n o d e la docen a d e esqu em as qu e tien e dispon ib les . ar a saber los
n om b res dispon ib les y cu l est activo en u n d eter m in ad o m om en to se em
p lean , respectivam en te, las sigu ien tes d os in str u ccion es
gra ph qu ery, sch em es
qu ery grap h ics
l r esu ltado de ella p u ed e var iar de or den ad or a orden ador, seg n los es
qu em as en l in corp or ados a travs de
n ter n et o d e la pr op ia con str u ccin .
Un e
em p lo d e listad o es el sigu ien te
ILUSTR ACIN 6 .. List a d o d e e se m a s gr fic o s
Avai l abl e s c hemes ar e
economi s t
see
s 1c ol or
see
s 1manual
see
s 1mono
see
s 1r c ol or
see
s 2c ol or
see
s 2c ol or g
see
s 2manual
see
s 2mono
see
sj
see
Gr aphi c s s et t i ngs
set gr aphi c s
set sc heme
set pr i nt c ol or
set copyc ol or
hel
hel
hel
hel
hel
hel
hel
hel
hel
hel
p
p
p
p
p
p
p
p
p
p
s cheme_economi s t
s cheme_s 1c ol or
s cheme_s 1manual
s cheme_s 1mono
s cheme_s 1r c ol or
s cheme_s 2c ol or
s cheme_s 2c ol or g
s cheme_s 2manual
s cheme_s 2mono
s cheme_s j
on
sj
aut omat i c
aut omat i c
06/06/12 09:28
T TT
sm an u al y sm an u al
.
ara cam biar el esqu em a del p rim o grfico h ay qu e in tr odu cir la in s
tru ccin set sch em e n om b redel estilo. acin dolo as, el grfico .se
con vierte en este otr o con el esqu em a de he con om ist
u se e
em plo, clear
set sch em e econ om ist
grap h b oideopp
id eoiu , title
artid os
, position
n am e
, rep lace
GR IC 6 .. Gr fico d e ca
a co n e se m a e r so n a lia d o
Partidos
pp
psoe
iu
10
06/06/12 09:28
UT
d b gra ph b ar
06/06/12 09:28
T TT
06/06/12 09:28
UT
l e d it o r d e gr fico s
6.6.
Lineas telefnicas
200 400 600 800
0
40000
10000
20000
30000
PNB por unidad de compra
40000
10000
20000
30000
PNB por unidad de compra
40000
10000
20000
30000
PNB por unidad de compra
50
100
150
200
Tasa de mortalidad infantil /1000 1998
06/06/12 09:28
T TT
r e
a p a r a ed ita r la s seccion es. l m od o m s fr ecu en te p a r a la ed icin es el
p r im er o, p u esto qu e es el qu e n os p er m ite seleccion a r ob
etos d el gr fico
qu e se d esea n tr a n sfor m a r. os p osib les ob
etos d e seleccin son ttu los,
m a r cos, leyen d a s, e
es, m a r ca s, etiqu eta s, p u n tos, ln ea s, b a r r a s, ca
a s
l se a la r cu a lqu ier a d e estos, a p a r ece d eb a
o d e los icon os h or izon ta les
u n n u evo m en qu e in d ica los a sp ectos m s tr a n sfor m a b les d e los ob
e
tos seleccion a d os. s, d e este m od o, si se se a la el ttu lo d e u n gr fico,
a p a r ecer el color d e la letr a , el ta m a o, el m a r gen y el con ten id o d el
teto. er o ta m b in a l fin a l d e la b a r r a a p a r ece la p a la b r a ore p a r a
qu e p u ed a n ca m b ia r se otr os elem en tos n o ta n cen tr a les d e a qu ello qu e
se qu ier e tr a n sfor m a r. u lsa r sob r e ellos, a b r e el m en d e p r op ied a d es d e
u n ob
eto, d on d e se d isp on e en d istin ta s p esta a s, tod o a qu ello m od ifi
ca b le. a s ca r a cter stica s d e tod a ca
a d e teto, ttu los in clu id os, con tie
n en la s p esta a s d e teto (text), ca
a (box), for m a to (form a t) y a va n za d o
(a dva n ced), d e ta l for m a qu e p u ed en ca m b ia r se u n a vein ten a d e a sp ectos
d ifer en tes d e los ttu los.
ILUSTRACIN 6.6. a n ta lla d e l ed itor d e gr ficos con el elor a d or d e o
etos
a estrategia a segu ir p ara editar u n gr fico d ebe ser la sigu ien tebu scar
el elem en to qu e se desea cam b iar, se alar lo con el cu r sor, a p ar tir d e lo cu al
se m arca au tom ticam en te en ro
o, averigu ar si lo qu e se d esea cam b iar
est con ten id o en el n u evo m en h orizon tal qu e su rge deba
o de la bar ra
d e icon os y, si n o lo est, p u lsar el botn derech o d el ratn , p orqu e gen e
06/06/12 09:28
UT
06/06/12 09:28
T TT
, el m im o
y el in cr em en to (elta),
en este caso. ara p oder com par ar m e
or, con vien e qu e esta op er acin se
r ealice de m odo igu al en los dos grficos in fer iores.
in alm en te, se va a cam b iar la form a de los pu n tos qu e repr esen tan los
casos. stos se en cu en tran en el n cleo d el grfico
lot
. a operacin es
sim ilarse seleccion an , se accede a su s prop iedades y se tr an sform a lo d e
seado. n este caso, el sm bolo (Sym bol), p u din d ose elegir, en tre otros, el
p u n to, el cu adrad o, el crcu lo, el tr in gu lo, etc.
u n to con la for m a, tam bin
p u ed en alter arse en el m ism o m en el tam a o (Si
e) y el color de los p u n
tos, as com o el an ch o (u tlin e width) y el color de los b ord es o p er m etr o
d el sm bolo.
Un a vez realizadas todas las op eracion es de tr an sform acin , se sale d el
ed itor m edian te el m en (ile
Stop Graph ditor), el icon o de la bar ra d e
h er ram ien tas o el m en con tetu al obten id o en cu alqu ier zon a del grfico.
iem pr e qu e se opta por in terr u m pir la edicin , p regu n ta qu e si se qu ier e
gr ab ar
en discoel gr fico. in em bargo, caso de qu e se diga qu e n o, los
cam bios sigu en pr esen tes en la m em oria d el ord en ad or. ara volver a ob te
06/06/12 09:28
UT
6..
e r cicio s
. Utiliza el fich ero cisd el barm etro d e m ar zo de d el
y
r ep resen ta en tr es gr ficos difer en tes el seo, la edad y los estu d ios al
can zados por el en trevistado.
on el m ism o fich ero cish az u n diagr am a d e b ar ras con los u sos
qu e la gen te h ace d e
n tern et
.
. in alm en te, con el edi
tor, m e
or a el grfico p ara u n a corr ecta p resen tacin .
u ger en ciacam
bia las etiqu etas de la leyen da en legen d
ey regin
label()).
m p lea ah or a la b ase de datos m u n dial
m u n d o
. az sen d os gr
ficos d e ca
as con las variab les esperan
a de vida al n acer y tasa bru ta de
n atalidad y com b n alos en u n solo grfico. om en ta la difer en te d istr ibu
cin de am b as. or qu n o ap ar ece n in g n p u n to en las etr em idad es
de am bos grficosm b iales el aspecto ap licn d ole u n esqu em a d istin
to del qu e ten gas por defecto.
Utilizan do la m ism a base de datos de pases repr esen ta u n a n u be de
pu n tos con las var iables telfon os por m il habitan tes y ren ta n acion al bru
ta per cpita en u n id ades de poder ad qu isitivo. ibu
a sob re la m ism a
repr esen tacin u n a
u ste lin eal y otro cu ad rtico. u l de ellos p ar ece
a
u star se m e
or a los datos
06/06/12 09:28
7
La p r u e b a e st a d st ica y la s co m p a r a cio n e s
Gen eralm en te, en estad stica se tr abaja con m u estr as, y gran p ar te del pr op sito d e los clcu los d e estad sticos es com prob ar si con los d atos dispon ibles d e u n a fraccin de la pob lacin pu ede d edu cirse algu n a con clu sin
vlida. E n otras palab ras, los in vestigadores su elen em itir h ip tesis r elacion ad as con los d atos de la pob lacin y la m u estra aporta p ru ebas d e si las
m ism as son o n o sosten ibles.
E n este cap tu lo se van a ab ordar las p ru ebas estadsticas d e h iptesis
m s sim p les y u tilizadas en la in vestigacin . on au ellas relacion adas b ien
con la distribu cin , la pr opor cin o la m edia d e u n a o dos variab les. a
form u lacin d e h ip tesis h a d e p lan tearse por p ar esen pr im er lu gar, es
p reciso em itir u n a llam ad a h iptesis n u la, en tr m in os d e igu aldad , a par tir
d e la cu al se gen er a la distrib u cin m u estr al u e se d er ivara en el caso de
u e fu er a cierta, p ara p oder obten er la p robab ilidad de u e el dato obten id o
en la m u estra p roceda d e esa su posicin , por u e, en el caso de u e sea im p rob ab le, la d ecisin m s lgica sera el r ech azo d e tal igu ald ad .
E l caso m s sim p le se da cu an do se dispon e d e u n a sola var iable cu an titativa y se em ite u n a h iptesis sob re el valor u e h a de ten er en la p oblacin . E n este caso, se dice u e el valor de u n par m etro
de la poblacin ,
la m edia, en este ejem p lo, h a de asu m ir el valor
.
s con cr etam en te, pu ede en u n ciar se u n a h iptesis n u la con u n en u n ciad o con sisten te en d ecir u e la evalu acin de u n d eterm in ad o lder p oltico en la p oblacin alcan za el valor d e en u n a escala con valores en tre el
y el .
od a h iptesis n u la h a de estar acom p a ada p or su corr espon dien te
h iptesis alter n ativa, au ella u e se aceptar a en el caso d e u e n o pu eda
m an ten erse la igu ald ad in icial. E isten d istin tas m od alidades alter n ativas.
E n p rim er lu gar, p u ed e form u larse u n idireccion alm en te
slo se r ech aza la
n u la, si los d atos m u estr ales son m ayor es o m en or es u e el valor
. , si as
E E G
.
o
.
bviam en te, au la altern ativa al ejem p lo p u esto ser a u e el m en cion ado lder alcan za u n a pu n tu acin in ferior
o su p er ior al valor cen tral d el
r an go de la escala u tilizad a.
tra m an era de plan tear la h iptesis altern ativa es h acin dola bidireccion al,
de tal su erte u e se rech ace la n u la, tan to si el dato m u estral se aleja sign ificativam en te por en cim a com o si lo h ace por debajo del valor h ipotetizado.
.
igu ien d o el ejem p lo d el ld er, se dir a u e la m ed ia u e le otorga la p ob lacin n o es igu al a cin co .
a h iptesis n u la pu ed e rech azarse, en cu yo caso h a de adoptarse la altern ativa, o p u ed e aceptarse. i se rech aza en el caso d e u e fu era cierta, se com etera u n error d en om in ad o de tipo
. i, en cam b io, se acep ta sien do falsa,
se com etera el llam ado error d e tipo
o n o se llegaal valor en cu estin , en tonces se opta por la un idireccion al. E n u n caso electoral,
por ejem plo, si in teresa ver si la inten cin de voto va a ser del , en ton ces se form u lara bidireccion alm en te, pero si lo ue se desea es averigu ar si se va a superar esa can tidad, en ton ces
es preferible la altern ativa u nidireccional.
E n realidad, el caso de las proporcion es o porcen tajes es u n a eten sin del de las m edias, puesto ue el prom edio de un a variable con valores y coin cide con la proporcin de
casos u e poseen el valor . s, en u n a m u estra con cu atro casos, tres de ellos casados
y
u n o soltero
, la m edia sera
de cu atro personas tres casadas
, esto es, ,, u e m u ltipli
cado por , m uestra ue el del con ju n to es casado.
p aram tr icos, con dicion ados a u e los datos cu m plan d eterm in ad os r eu isitoscom o con los llam ados n o p aram tr icos, en los u e las con dicion es de
las distribu cion es im plicad as p u ed en ser m en os rigu r osas.
e em p ezar con la h ip tesis de u n a sola variab le em plead a con p rop orcion es, m edias y m edian as. egu id am en te, se ab ord an tesis con d os var iab les, tiles p ara la com p ar acin de estad sticos, pr oceden tes de la m ism a
p oblacin
m u estr as d ep en d ien teso de pob lacion es d ifer en tes
m u estr as
in depen dien tes
.
7 .1 .
P r u e b a s d e u n a so la va r ia b le
7.1.1.Pru eba
param trica
de
proporcion es
u pn gase u e se desea pr ed ecir el voto de u n as eleccion es y se sostien e u e
u n p ar tid o con m s del d e los votos sobr e el con ju n to de la pob lacin
ob tien e en u n sistem a n o p rop or cion al y m u ltipar tid ista com o el espa ol la
m ayor a p arlam en taria. or tan to, in teresa p robar u e en la poblacin u n
p orcen taje m ayor d el se alad o optar por u n a d eter m in ada op cin poltica
el , en las ya celebr ad as de
. om o u ier a u e, par a pod er con stru ir
la distribu cin m u estral del estadstico, la h ip tesis n u la siem p re h a d e form u larse en tr m in os d e igu aldad, en este caso h a de ser la sigu ien te
.
a h iptesis alter n ativa en este caso h a de ser u n id ireccion al, por u e el
in ters est cen tr ad o slo en u n lado d e la distrib u cin . lo in teresa saber
si el m en cion ado partido obtien e m s de la can tidad an tes en u n ciad a. or
tan to, la h ip tesis altern ativa h a de ser epresada de este m odo
.
n tes de pr oceder a la ejecu cin d el p rogram a pr opio de la p ru eba de
h iptesis, es n ecesar io r ealizar ciertos aju stes a la var iable con la u e se est
trabajan do. u es, in icialm en te, en el cu estion ar io se tr ata de u n a var iable
n om in al con m u ch os valor es, algu n os de los cu ales n o deben ser ten id os en
cu en ta.
E E G
P r e u n t a so b r e in t e n ci n d e vo t o e n e l e st u d io d e l CIS
n m e r o
ar a com pr obar el resu ltado de las in str u ccion es an ter iores es til u n a
tab la u e cru ce la an tigu a con la n u eva var iable
tabu la te in tvoto in tpp , m issin g
E l r esu lta d o m u estr a , a d em s d el test p r op ia m en te d ich o , lo s sigu ien tes esta d sticos d e la m u estr a n m er o d e ca sos, m ed ia , d esvia cin
tp ica , er r o r tp ico e in ter va lo s con u n n ivel d e co n fia n za d el , p or
d efecto .
E E G
ILUSTR ACI 7 .. P r u e b a d e u n a p r o p o r c i n e n u n a m u e st r a
One- sampl e t est of pr opor t i on
i nt pp: Number of obs =
19424
-----------------------------------------------------------------------------Var i abl e |
Mean
St d. Er r .
[ 95% Conf . I nt er v al ]
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - i nt pp |
. 3783979
. 0034799
. 3715775
. 3852183
-----------------------------------------------------------------------------p = pr opor t i on( i nt pp)
z =
8. 2978
Ho: p = 0. 35
Ha: p < 0. 35
Pr ( Z < z ) = 1. 0000
Ha: p ! = 0. 35
Pr ( | Z| > | z | ) = 0. 0000
Ha: p > 0. 35
Pr ( Z > z ) = 0. 0000
.
E se err or tp ico (Std.
E rr.),
en este caso m u y b ajo
,p or el alto
n m ero d e en trevistados, r epr esen ta la desviacin tpica d e la distr ibu cin
m u estr al del estadstico y, p or tan to, se u tiliza en la con str u ccin de los
in ter valos d e con fian za. E n la salid a del ejem plo, con el , de los en trevistad os u e tien en in ten cin d e d ar su voto al en la m u estr a, se pu ede
pr on osticar u e en la poblacin ese valor debe estar en tr e el , y el
,, u e se ob tien e su m an do y r estan d o al valor d e la m ed ia ,veces el
err or tpico, ya u e se est an te u n a distribu cin n or m al y en esta el de
los casos se en cu en tr a en tr e ,y -,d esviacion es tp icas.
ecapitu lan d o, en la pr im er a par te de la ilu stracin .se en cu en tra
el n m ero d e casos y m s ab ajo la m edia en este caso pr oporcin y el
err or tpico ju n to con el in tervalo d e con fian za d e la m ed ia.
a segu n da p ar te es la corr esp on dien te al test de h ip tesis pr opiam en te
dich o. p ar ece tan to la h iptesis n u la, en u n ciada en la in str u ccin , com o
las tr es posib les alter n ativas. E l valor de z
la m ed ia r eal m en os la m edia
de la h iptesis dividid a por el err or tp icoes idn tico en los tres su pu estos,
esto es ,.
E n la salida del program a, al pon er el valor a los u e m uestran su in ten cin de voto al
, los resu ltados aparecen en proporcion es y n o en porcen tajes. asta con m ultiplicar por
para consegu ir los datos epresados en porcen tajes.
in em b argo, lo u e var a es la sign ificacin . om o en este caso la alter n ativa es u n id ir eccion al se h a estab lecido u e fu er a m ayor u e se h a
d e pr estar aten cin a la colu m n a de la der ech a. e obtien e u e, en el caso
d e u e la h iptesis n u la fu era cierta, la p robab ilidad d e en con tr ar en u n a
m u estra ese valor es n fim a
m en or u e ,
, por tan to, se p u ed e r ech azar con bajo r iesgo de eu ivocacin .
7.1.2.Pru eba
param trica
de
m edias
E sta m ism a h iptesis con u n a sola variable tam b in pod ra fu n cion ar con
m ed ias en lu gar de pr op orcion es, pero, en lu gar d e oper ar con p ropor cion es, se trabaja con p rom ed ios y, com o n o su ele d ispon erse d e la varian za
d e la pob lacin , se r ecu r re a la cu asivarian za obten ida con los d atos de la
m u estra. or ello, la fr m u la del er ror tpico p resen ta n otables d iferen cias
con el de las p ropor cion es.
.
om o a par tir d el er ror tpico el proceso es sim ilar, slo se pr oceder a
form u lar las h iptesis y a an alizar los r esu ltados. E n este caso, en lu gar d e
la var iable estim acin
de
voto, se va a tom ar la de probabilidad
su bjetiva
de
voto. se p lan tea com o h ip tesis u e la p rob ab ilid ad del m ism o partido es
d e , en u n a escala d e a .
E n con secu en cia, la form u lacin d e las h iptesis n u la y altern ativa ser a
com o sigu e
.
on secu en tem en te, a estas h ip tesis se debe in trodu cir la sigu ien te in stru ccin , a la u e se le a ad e la opcin level, para u e aparezcan los in tervalos con u n n ivel de con fian za d el , en lu gar del u e aparece p or
d efecto
ttest pvotop p, level
E E G
Ha: mean ! = 5
Pr ( | T| > | t | ) = 0. 0000
7.1..E l
test
de
los
si
n os
i se desea u tilizar en el caso de u n a m u estr a u n test n o p ar am trico, es d ecir, u e n o p ar ta de la su p osicin d e u e la var iable or igin al en la p oblacin
tien e d istr ib u cin n or m al, p u ed e u tilizarse el test de los sign os, u e est
su sten tad o en la pr obabilidad bin om ial.
E n este caso, la h iptesis n o se r efiere a la m ed ia, sin o a la m edian a. e
este m odo, la for m u lacin d e la h iptesis n u la sera com o sigu e
.
i la m en cion ad a h iptesis fu er a cier ta, en ton ces la m itad d e los casos
d e la m u estra caeran por d eb ajo del valor y la otra m itad por en cim a.
ar a ver la d istrib u cin h a de em plear se la in str u ccin tabu late.
tabu la te pvotop p
on sid er an d o el ejem plo an terior y par tien do d e la d istr ib u cin de fr ecu en cias d e la variab le pvotopp
pr obabilidad otor gada de voto al
, se ve
.o n egativas
.con u n n m er o d e casos igu al al d e los u e n o
sigu en la m edian a
.., en el ejem plo u e se con sider ay u n a
p rob ab ilidad de ,. or su lad o, la p ru eba bidir eccion al se ob tien e m u ltip lican d o p or el valor d e la prob abilid ad m en or de las an ter iores
,, en
este caso, u e se con vier te en ,
.
a in terp retacin es sim ple y sigu e la n or m a d e tod os los test de h ip tesis. iem pr e y cu an d o la pr obab ilidad obten id a sea m en or de ,, se pu ede
r ech azar la h iptesis n u la con u n a segu rid ad m ayor del . E n el ejem plo
con tem p lado se ve u e n o pu ede ser r ech azad a la h ip tesis de u e la m ed ian a en la pob lacin h aya sido igu al a , en n in g n caso, sea cu al fu er e la
altern ativa pr opu esta.
ar a ob ten er d el ord en ador este test, deb e escr ibirse la or den si
n test
segu id a del n om br e de la variab le, el sign o igu al y el valor d e la h iptesis
E E G
n u la. iem p re la salid a en pan talla m u estra el r esu ltad o del test en los tr es
su pu estos d e h ip tesis alter n ativa.
sign test pvotop p
pv ot opp - 5
pv ot opp - 5
i ve >= 8748)
al ( n = 17662,
= 0 vs.
> 0
=
x >= 8914, p = 0. 5) =
0. 1072
= 0 vs.
< 0
=
x >= 8748, p = 0. 5) =
0. 8956
pv ot opp - 5 = 0 v s .
pv ot opp - 5 ! = 0
i ve >= 8914 or #negat i ve >= 8914) =
2* Bi nomi al ( n = 17662, x >= 8914, p = 0. 5) ) =
0. 2144
7.. Co m p a r a ci n d e d o s va r ia b le s
u an do se desea com par ar dos variab les pr oced en tes d e la m ism a pob lacin se est an te el caso d e p ru ebas en m u estr as d epen dien tes. ecib en este
n om b re por u e cada caso posee u n par de valores con ectad os de cad a u n a
d e las variab les en cu estin .
e m odo p ar alelo al de los test an ter ior es, se van a pr esen tar estos an lisis en tr es apar tadosen el pr im ero se com p aran pr op orcion es, en el segu n d o se eu ipar an m edias y en el tercer o se con tem p la el test n o param tr ico
d e ilcoon o p ru eba de los r an gos con sign o.
7.2.1.
om paracin
de
dos
proporcion es
en
m u estras
.
u pn gase u e se desea con tr astar con los datos d e la m u estra si la in ten cin de voto a d os p ar tidos es igu al o si sigu e h abien do d iferen cia a favor
d el u e en tiem p o p asad o era su per ior
d e este m od o la altern ativa es u n idir eccion al
. a var iable u e r ep resen ta la pr op orcin d el p ar tido pr eviam en te
su p er ior ser llam ad a y la d el in fer ior com o
. or tan to, la alter n ativa
d eb e ap ar ecer com o
.
m bas pu eden con vertirse en igu ald ades o desigu ald ades en las u e en
u n o de los d os tr m in os aparezca el valor n u lo.
.
ar a efectu ar con tata el cor respon d ien te test estadstico es p reciso u tilizar la in str u ccin ttest, segu ida de las d os variab les-pr opor cin separad as
p or el sign o igu al.
gen erate in tpsoe
in tvotoif
in tvotoin tvoto
p rtest in tpp in tp soe
E E G
P r u e b a d e co m p a r a c i n d e d o s p r o p o r c io n e s
m u e st r a s d e p e n d ie n t e s
Ha: di f f ! = 0
Pr ( | Z| < | z | ) = 0. 0000
Ha: di f f > 0
Pr ( Z > z ) = 0. 0000
.
E l tien e u n a in ten cin de voto d el ,, m ien tras u e la d el E
es d el ,, la diferen cia es cercan a al . ir an d o los in tervalos de con fian za par a la d iferen cia se ap recia u e estn situ ados en tre el , y el
,. b viam en te, es in asu m ib le la h ip tesis n u la d e u e la pr op orcin de
in ten cin de voto d e am b os p artidos pu d iera ser idn tica.
esta m ism a con clu sin se llega con el eam en aten to d el estadstico
z calcu lado y d e su sign ificacin . om o la h iptesis altern ativa era del tipo
m ayor u e, se h a d e p restar aten cin a la colu m n a de la derech a, don de
apar ece u n a sign ificacin su stan cialm en te in fer ior al con ven cion al lm ite
d el ,. or tan to, estos datos d icen u e en la pob lacin , en el m om en to
E l cam bio se debe a su pon er de partida u e las dos m edias son igu ales, en lu gar de asum ir en contra de la hiptesis u e cada variable tien e u na m edia distin ta, tal com o ocu rre en la
m u estra. ara satisfacer esta su posicin, se obtien e p com o prom edio de las proporcion es de
u n a y otra variable. E n este ejem plo tendra el valor de ,.
d e r ealizacin d el estu dio, h aba u n a difer en cia sign ificativa en la in ten cin
d eclarada de voto a favor del .
7.2.2.om paracin
de
dos
m edias
en
m u estras
depen dien tes
E l test de com paracin de m edias sigu e eactam en te las m ism as p au tas u e
el d e pr op orcion es, p u esto u e en realidad este es u n a ad aptacin d e au el,
u e se con sigu e con virtien do u n o de los valor es d e u n a var iable cu alitativa
en otr a d icotm ica con valores y . ara m edias, h iptesis n u la y altern ativa
b idireccion al, en el ejem plo, pero tam b in p u ed e form u larse u n idireccion alm en tese epr esan del sigu ien te m od o
.
e trata, p or tan to, en este tipo de p ru ebas de com par ar las m ed ias de
d os var iables distin tas, d en om in ad as e
au n u e, en el fon d o, lo u e se
r ealiza es con str u ir u n a n u eva variab le, den om in ada , u e es la su straccin en cad a caso de los r espectivos valor es de e y verificar la h iptesis
d e u e el valor d e la n u eva m edia sea igu al a . E l er ror tpico de esta variab le se ob tien e m ed ian te la epr esin
.
i se tom an las pr obabilidades d e a u e cad a p er son a se atribu ye de
votar a d os p ar tid os d istin tos en u n as pr im as eleccion es, con tin u an do con
el ejem plo an ter ior, y E , se pu ede ad optar u n a h ip tesis claram en te
u n idir eccion al u e d ep en d er d el m om en to poltico en el u e se plan teen
los com icios. E n el a o , el u e se est u tilizan do, es obvio u e la altern ativa h aba u e asu m ir la en dir eccin favor able al .
ar a ob ten er los r esu ltados estadsticos, se h a de r ecu r rir a la m ism a in stru ccin u e en el ejem plo an ter ior, u tilizan do la in str u ccin ttest
par a com p arar d os variab les cu an titativas
pvotopp
y pvotopsoe, en esta ocasin
.
ttest pvotop pp votopsoe
E E G
ILUSTR ACI 7 .. P r u e b a d e co m p a r a ci n d e d o s m e d ia s
m u e s t r a s d e p e n d ie n t e s
Pai r ed t t es t
-----------------------------------------------------------------------------Var i abl e |
Obs
Mean
St d. Er r .
St d. Dev .
[ 95% Conf . I nt er v al ]
- - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - pv ot opp |
20310
4. 693156
. 0258863
3. 689135
4. 642417
4. 743895
pvot op~e |
20310
4. 345987
. 0229813
3. 275143
4. 300942
4. 391032
- - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - di f f |
20310
. 3471689
. 0394482
5. 62189
. 2698472
. 4244906
-----------------------------------------------------------------------------mean( di f f ) = mean( pvot opp - pv ot opsoe)
t =
8. 8006
Ho: mean( di f f ) = 0
degr ees of f r eedom =
20309
Ha: mean( di f f ) < 0
Pr ( T < t ) = 1. 0000
Ha: mean( di f f ) ! = 0
Pr ( | T| > | t | ) = 0. 0000
7.2..om paracion es
n o
param tricas
de
dos
variables
ar a estas cir cu n stan cias, el p rogram a tata ofrece u n par de altern ativas.
om o en el caso de u n a sola var iable, p u ed e u tilizar se la pr u eb a d e los sign os y pu ede tam b in em p learse u n a p ru eba de ran gos.
E n el p rim er caso, el p rocedim ien to es sim ilar al u e ya se estu d i en la
p ru eba param tr ica d e u n a sola var iable. ero en lu gar de com p ararse los
d atos con u n solo valor el d e la h ip tesis com o pu n to de referen cia, se
com par a con el de la otra variab le en el m ism o caso. om o r esu ltad o de la
com par acin p u ed e ob ten erse u n em pate, caso de u e am bos valor es sean
id n ticos, u e la pr im er a variab le ten ga el valor m s alto o p or el con tr ar io u e sea la segu n d a la d e m ayor valor.
i se sigu e con el ejem p lo con tem p la d o en la com p a r a cin p a r a m tr ica d e m ed ia s con la s va r ia b les r ela tiva s a la p r ob a b ilid a d p er son a l en
E l r esu ltado
ilu str acin .clasifica d e la form a se alad a los casos y
estab lece las prob abilid ad es bin om in ales corr espon dien tes a las tres h iptesis alter n ativas p osibles.
o m o p u ed e a p r ecia r se, h a y .ca sos, d e los .u e com p on en la m u estr a , u e com p a r ten el m ism o va lor en la s va r ia b les cor r esp on d ien tes a los p a r tid os im p lica d os. er o h a y .u e a sign a n m s
p r ob a b ilid a d es d e voto a l p r im er o
u e a l segu n d o
E y slo
.u e a l con tr a r io d a n m s a l segu n d o. E n con secu en cia , se p u ed e d esca r ta r d e en tr a d a la h ip tesis a lter n a tiva d e u e la p r ob a b ilid a d
d e u e se vote a l p a r tid o d e izu ier d a sea m a yor u e a l p a r tid o d e la d er ech a , com o se p on e d e m a n ifiesto en el r esu lta d o p r ctica m en te igu a l
a la u n id a d d e la p r ob a b ilid a d d e ob ten er u n va lor igu a l o su p er ior a
.. E n ca m b io, si se o b ser va la p r im er a d e la s p r u eb a s r ea liza d a s,
la d e u e a l se le d a m a yor p r ob a b ilid a d d e ser vota d o , en ton ces la
sign ifica cin , ob ten id a a p a r tir d e los .ca sos u e d a n m a yo r va lor
a este p a r tid o, sa le in fer ior a l p u n to cr tico d el . sim ism o, sa le esta d stica m en te sign ifica tiva la p r u eb a si se op ta p or u n a h ip tesis a lter n a tiva b id ir eccion a l.
E E G
0. 0000
1. 0000
0. 0000
E n defin itiva, a la vista d e los resu ltados m ostr ados, pu ed e con clu ir se
con tr an u ilidad u e en la p oblacin el n m er o d e votan tes u e dan m ayor
p robab ilidad al artid o op u lar es su p er ior al n m er o d e votan tes u e se la
otor gan al ar tido ocialista.
tr o test par a el m ism o tipo d e d atos u e in cor pora m s in form acin en
la m ed ida en u e tam b in tien e en cu en ta el ran go de las diferen cias en tr e
las d os var iables es el test del sign o d e los ran gos. on ob jeto d e estu d iar
este pr oced im ien to, ad ecu ado en el su pu esto d e u e am bas d istr ib u cion es
sean sim tricas, se va a con siderar u n a seleccin de los diez p rim eros casos
d e la m u estra.
a sigu ien te tabla m u estra los valores de probabilidad en la escala del al
atribu idos al artido opu lar
y al artido ocialista
de los diez
prim eros casos n u m erados. En la colu m n a sigu ien te (di
)
aparecen las diferen cias en tre los valores de am bas variables. ara calcu lar el ran go h ay u e con siderar el valor absolu to de estas diferen cias. Es obvio u e los casos en los u e
am bos valores de las variables son idn ticos son los u e poseen la diferen cia
absolu ta m en or, por tan to todos aparecen en la colu m n a (an
o)
con el valor
en cu r siva . om o son cin co, se les su stitu ye por el ran go pr om ed io
, ,
, , esto es, el
. dem s, se en cu en tr an tr es difer en cias positivas
,
cu yos ran gos su m an
, y y dos n egativas con u n total d e ran gos
y
.
.
sien do el n m er o de ran gos positivos, n el n m er o de casos y
la su m a d e los r an gos
es decir, n
n
.
E s d ecir, la su m a total de los ran gos de n
casos
es igu al a la su m a d e
los ran gos em p atados, la d e los p ositivos y la d e los n egativos.
E l test se ejecu ta en tata m edian te la in str u ccin si
n ran , segu ida por
las variab les pareadas sep aradas por el sign o igu al. ara com pr obar la n atu -
E E G
r aleza de esta p ru eba, se va a r ealizar en p rim er lu gar la in str u ccin con los
d iez pr im er os casos ap ar ecidos en la an ter ior tab la
sign ra n p votopp pvotop soe in
p ar tir de lo cu al apar ecen los sigu ien tes resu ltados ap licad os a los casos de la m u estr a n u m er ad os d el al .
ILUSTR ACI 7.1 1.
P r u e b a d e ilc o o n p a r a m u e st r a s d e p e n d ie n t e s
d ie ca so s
96. 25
0. 00
- 13. 75
---------82. 50
con
u n to
Wi l c ox on si gned- r ank t es t
s i gn |
obs
s um r ank s
expec t ed
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - pos i t i v e |
8717
1. 067e+08
97988680
negat i v e |
7059
89260195
97988680
z er o |
4534
10280845
10280845
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - al l |
20310
2. 063e+08
2. 063e+08
unadj us t ed v ar i ance
6. 982e+11
adj ust ment f or t i es - 1. 491e+09
adj ust ment f or z er os - 7. 770e+09
---------adj ust ed var i anc e
6. 889e+11
Ho: pv ot opp = pv ot ops oe
z = 10. 516
Pr ob > | z| =
0. 0000
7 .. Co m p a r a cio n e s d e d o s m u e st r a s
in d e p e n d ie n t e s
caban de eplicarse las pru ebas con m u estras depen dien tes o paralelas, u e
com paran dos variables proceden tes de la m ism a poblacin en don de cada
valor de u n a variable est ligado al de la otra por perten ecer al m ism o caso de
estu dio. as situ acion es en las u e se h a de com parar u n a m edida de los m ism os su jetos en dos m om en tos tem porales son las m s tpicas de este tipo de
pru ebas, au n u e n o las n icas, com o se h a visto en los ejem plos epu estos. En
cam bio, si se preten de efectu ar la com paracin con el m ism o estadstico en
dos m u estras distin tas para ver si proceden de poblacion es sim ilares, se est
an te las pru ebas con m u estras in depen dien tes, com o, por ejem plo, pu ede ser
la com paracin de la in ten cin de voto en tre m u jeres y h om bres.
l igu al u e se h icier a en el apar tado an terior, se va a su bd ivid ir este
ap ar tado en d istin tas seccion es. E n p rim er lu gar, se pr oceder a la com par acin d e pr oporcion essegu idam en te, se pasar a la com paracin d e varian zas, ya u e es paso p revio p ara op tar por u n a u otr a fr m u la de com p ar acin
d e m edias, u e ser ab ord ad a en la ter cer a par te, y fin alm en te se abord ar
la con feccin d e p ru ebas par am tricas con m u estr as in d epen dien tes.
7..1.
om paracin
de
dos
proporcion es
(en
m u estras
in depen dien tes)
E n el fon d o, n o eiste u n pr oced im ien to especfico d e com p ar acin de pr op orcion es, p or lo u e pu ed en u sar se in distin tam en te prtest
y ttest, con la
p recau cin d e epr esar el por cen taje d esead o com o el valor u n o de u n a
variab le d icotm ica. l igu al u e en el ejem plo an terior, se va a tom ar com o
E E G
.
ar a realizar esta pr u eba estadstica h a de em p learse tam bin la ord en
ttest
o prtest
, pu esto u e la difer en cia d e p rop orcion es se aju sta a esta d istr ib u cin de tu d en t, asim ilab le a la n orm al, si los gr ad os d e liber tad son
su ficien tes, apr oim ad am en te cu an d o n .
ttest in tp p, b y
seo
m u e st r a s in d e p e n d ie n t e s
Two- sampl e t t es t wi t h equal v ar i anc es
-----------------------------------------------------------------------------Gr oup |
Obs
Mean
St d. Er r .
St d. Dev .
[ 95% Conf . I nt er v al ]
- - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - hombr e |
9388
. 3857052
. 005024
. 4867874
. 375857
. 3955534
muj er |
10033
. 3715738
. 0048245
. 4832494
. 3621167
. 3810309
- - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - c ombi ned |
19421
. 3784048
. 0034802
. 4850018
. 3715833
. 3852264
- - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - di f f |
. 0141313
. 0069637
. 0004818
. 0277809
-----------------------------------------------------------------------------di f f = mean( hombr e) - mean( muj er )
t =
2. 0293
Ho: di f f = 0
degr ees of f r eedom =
19419
Ha: di f f < 0
Pr ( T < t ) = 0. 9788
Ha: di f f ! = 0
Pr ( | T| > | t | ) = 0. 0424
Ha: di f f > 0
Pr ( T > t ) = 0. 0212
),
don de apar ecen cu atr o cifr asla pr im era es la
d ifer en cia de las p rop or cion es corr espon dien tes a los d os gr u pos
h om br es
y m u jeres
, la segu n da el er r or tp ico, o desviacin tp ica d e la distribu cin m u estr al d e la d ifer en cia de p ropor cion es, m ien tras u e la tercer a y la
cu arta son los lm ites in ferior y su p erior cor resp on d ien tes al in tervalo d e
con fian za
p or defecto con u n de segu r idad en m u estras aleator iasd e
la diferen cia de pr oporcion es. om o en este caso, estos lm ites n o in clu yen
el valor , p u es am bos son positivos, p u ed e ser r ech azad a la h iptesis n u la
con u n a segu rid ad m ayor d el .
E sto m ism o se dedu ce al ob servar las pru eb as d e h iptesis efectu ad as
con el estadstico t d e tu den t. i se observa la colu m n a corresp on dien te a la
h iptesis altern ativa b id ireccion al
ha
7..2.om paracin
de
varian zas
(m u estras
in depen dien tes)
el igu al m odo u e se com p ar an pr oporcion es o m edias, tam bin eisten
p ru ebas estadsticas para d eter m in ar si las diferen cias en con tr ad as en los
valor es d e la varian za d e d os m u estr as h an podido ser d ebid as o n o a er ror es d e m u estr eo. er o, si en los pr im eros casos se u tiliza la d istrib u cin de
la t de stu den t, pr cticam en te n orm al a par tir d e gr ad os d e liber tad, par a
la com p ar acin de la h om ogen eidad de d os m u estr as, h ay u e u tilizar la
d istr ib u cin d e n edecor.
u esto u e se tr ab aja con dos gru p os, las varian zas o d esviacion es tp icas d e cada u n o de ellos se r econ oce m edian te la in clu sin en u n su bn d ice
d el n m ero o d el n m ero , cor respon dien tes a las d os m u estras u e se
estn com paran do. or tan to, en h ip tesis alter n ativas b idireccion ales, la
n otacin de esta p ru eba es com o sigu e
E E G
.
a in stru ccin vlida p ara esta operacin en tata es sdtest, u e tien e u n a
sin tais com p letam en te sim ilar a la de ttest,
salvo en las op cion es. or tan to,
p ara ver si la probabilidad asign ad a al voto al tien e u n a h om ogen eidad
sim ilar en tre h om bres y m u jeres, se debe escribir la sigu ien te ln ea
sd test pvotop p, b y
seo
edian te esta in stru ccin se realiza u n a pr u eb a d e com paracin de var ian zas o desviacion es tpicas m edian te la pr u eb a . E l r esu ltad o ser sim ilar al u e ap ar ece a con tin u acin
ILUSTR ACI 7 .1. P r u e b a d e co m p a r a ci n d e va r ia n a s
m u e st r a s in d e p e n d ie n t e s
Var i anc e r at i o t est
-----------------------------------------------------------------------------Gr oup |
Obs
Mean
St d. Er r .
St d. Dev .
[ 95% Conf . I nt er v al ]
- - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - hombr e |
10302
4. 593671
. 0365807
3. 712892
4. 521966
4. 665376
muj er |
10228
4. 824892
. 0362677
3. 66788
4. 753801
4. 895984
- - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - c ombi ned |
20530
4. 708865
. 025769
3. 692256
4. 658356
4. 759374
-----------------------------------------------------------------------------r at i o = s d( hombr e) / s d( muj er )
f =
1. 0247
Ho: r at i o = 1
degr ees of f r eedom = 10301, 10227
Ha: r at i o < 1
Pr ( F < f ) = 0. 8917
Ha: r at i o ! = 1
2* Pr ( F > f ) = 0. 2166
Ha: r at i o > 1
Pr ( F > f ) = 0. 1083
as tres prim eras ln eas n u m ricas coin ciden con las pru ebas de com paracin de m edias. lo se en cu en tran diferen cias a partir del en u n ciado de la
h iptesis n u la con sisten te en u e la desviacin tpica en el prim er gru po, el de
h om bres en este caso, es igu al u e la propia del segu n do gru po, m u jeres en este
ejem plo. E n la m u estra se ve u e los prim eros tien en u n a desviacin tpica algo
m ayor de ,, m ien tras u e las m u jeres tien en algo m en os de dich a can tidad.
a diferen cia es slo de cen tsim as. ero com o las m u estras son m u y gran des, el test de la in dica u e podra h aberse debido a errores m u estrales.
a salida del program a calcu la tres probabilidades distintas del valor de ,
seg n la h iptesis altern ativa sea un idireccion al
en los etrem oso bidireccion al
en el cen tro
. El prim ero
el situ ado a la izuierdaen el caso de u e la prim era desviacin tpica sea m enor ue la segu n dael segun do
en el cen tropara
la h iptesis alternativa bilateral, y el tercero
a la derech a
, cu an do la alternativa
sea u e el prim er gru po tien e u n a heterogen eidad m ayor u e el segu n do.
i se u tiliza este p rogr am a com o p aso an ter ior par a la com p ar acin de
m ed ias
u e eige com pr obar p reviam en te si las var ian zas son o n o igu ales
en tr e los gr u pos
, el valor m s in d icad o es el bilateral. or tan to, en este
ejem plo, au n sien do la m u estra b astan te gran de, n o pu ede r ech azar se la
h iptesis n u la d e la h om ocedasticid ad en los dos gr u pos.
7...om paracin
de
m edias
en
m u estras
in depen dien tes
n a vez ue se h a realizado la com probacin de si las varian zas en la variable
ue se va a com parar son igu ales o diferen tes en los dos gru pos, se pu ede proceder a form u lar el test de com paracin de m edias de m u estras in depen dientes.
ado ue ah ora se trata de m edias, la form u lacin h a de ser com o sigu e
.
eg n se h aya o n o r ech azad o la h ip tesis n u la de igu aldad de var ian zas,
eisten dos frm u las par a solicitar el an lisis pertin en te. i se h a adm itid o
la h ip tesis alter n ativa, es decir, caso de u e las varian zas sean sign ificativam en te difer en tes, se deb er in clu ir la opcin u n eu al
t t e st va ria ble
d ep en d ien te, b y
va ria ble
gru p alu n e u a l
om ocedasticidad sign ifica igu aldad de varian za o sim ilar h om ogen eidad. u an tn im o
es eterocedasticidad.
E E G
va r ia n a s iu a le s
Two- s ampl e t t est wi t h equal var i anc es
-----------------------------------------------------------------------------Gr oup |
Obs
Mean
St d. Er r .
St d. Dev .
[ 95% Conf . I nt er v al ]
- - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - hombr e |
10302
4. 593671
. 0365807
3. 712892
4. 521966
4. 665376
muj er |
10228
4. 824892
. 0362677
3. 66788
4. 753801
4. 895984
- - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - c ombi ned |
20530
4. 708865
. 025769
3. 692256
4. 658356
4. 759374
- - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - di f f |
- . 2312213
. 0515143
- . 3321934
- . 1302492
-----------------------------------------------------------------------------di f f = mean( hombr e) - mean( muj er )
t = - 4. 4885
Ho: di f f = 0
degr ees of f r eedom =
20528
Ha: di f f < 0
Pr ( T < t ) = 0. 0000
Ha: di f f ! = 0
Pr ( | T| > | t | ) = 0. 0000
Ha: di f f > 0
Pr ( T > t ) = 1. 0000
7...Pru ebas
n o
param tricas
para
m u estras
in depen dien tes
a pru eba estadstica n o param trica m s in dicada para m u estras in depen dien tes es la de an n -h itn ey, tam bin con ocida com o la pru eba de las
su m a de ran gos de ilcoon . pera de m odo sim ilar a la ya epu esta del sign o
de los ran gosse agru pan los datos de las dos m u estras en u n solo gru po, se les
asign a el ran go correspon dien te al valor de cada caso y se in ten ta com probar si
la su m a de los ran gos de u n gru po es igu al o n o a la del otro gru po.
E n este caso la su m a esperad a de los ran gos del gr u po j se aju sta a la
sigu ien te epr esin
el valor z, con d istr ib u cin n or m al, es el resu ltado d e dividir la difer en cia en tre esta su m a de r an gos en con tr ada y la esper ad a p or la desviacin
tp ica aju stada.
ara ue tata produzca esta pru eba se debe utilizar la instruccin ran su m
con el m ism o form ato ue la instruccin ttest. e este m odo, si a los datos an teriores se les u iere aplicar una prueba no param trica, el m odo adecuado de
solicitarlo es m ediante la insercin del sigu iente com ando
ra n su m pvotop p, b y
seo
1. 803e+11
- 5. 315e+09
---------1. 750e+11
om o p u ed e apreciarse au , la d iferen cia en la su m a d e ran gos es sign ificativa al pr oporcion ar u n valor n orm alizado su p er ior a . or tan to, se
p u ed e afirm ar u e la p au ta ord in al d e la var iable voto
al
PP
es d istin ta en tr e
h om b res y m u jer esdich o d e m od o m s sim plificado, las m ed ian as de estas
d os variables son distin tas.
7 .. Co m p a r a cio n e s d e k m u e st r a s in d e p e n d ie n t e s
as pr u eb as u e se h an visto h asta ah ora slo podan aplicar se a la com p aracin de dos en tid ad es. as u e se ab or dan a con tin u acin p er m iten
com p ar ar m s de d os objetos. E n u n p rim er m om en to, se estu diar n las
p ru ebas u e perm iten aver igu ar si son igu ales o n o m ed ias, p rop orcion es o
varian zas calcu lad as en d istin tas m u estras y, posteriorm en te en el p rim o
ap ar tado, se an alizar n las u e im p lican la com p ar acin de m s d e dos var iables. , com o en los an lisis pr eceden tes, tam b in cabe au la aplicacin
E E G
7..1.om paracion es
n o
param tricas
de
m u estras
ar a la com p ar acin de m s d e m u estras eiste u n a am pliacin de la
p ru eba d e an n -h itn ey, llam ada d e ru sal-allis, u e u tiliza la distrib u cin de c. E st b asad a, com o la tcn ica pr eceden te, en com par ar en cad a
gru p o la su m a d e r an gos.
n tes d e proceder a las p ru ebas u e com p ar an m s de dos gru p os, es
con ven ien te solicitar u n a tabla u e describ a n m er o d e casos, m edia y d esviacin tp ica d e cada gru p o. om o ejem plo, se va a tom ar la m ism a var iab le d ep en d ien te, es d ecir, la pr ob abilid ad d e voto u e cada en tr evistado se
atr ibu ye al ar tid o op u lar, pero, en lu gar de em plear com o var iable gr u pal
el seo, se u tilizar la edad r ecodificada en siete categor as. ecu rd ese u e
esta op eracin d e agru p am ien to d e valor es h a d e h acer se m ed ian te la sigu ien te in str u ccin
recod e eda d
.
, gen
ed adr
a solicitu d de los estad sticos para cad a gru po pu ede r ealizarse m ed ian te la sigu ien te m od alid ad de la or den tabu late
tabu la te ed adr, su m m arize
pvotop p
edian te ella se ob tien e m edia, d esviacin tpica y n m er o de casos tan to p ar a cada u n o d e los gru pos com o para el con ju n to de la m u estra
ILUSTR ACI 7 .1 7.
|
Summar y of pp
edadr |
Mean
St d. Dev.
Fr eq.
- - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - 18- 25 |
4. 2746458
3. 5555559
3317
26- 35 |
4. 396222
3. 6012627
4235
36- 45 |
4. 2245061
3. 6288486
3746
46- 55 |
4. 7932773
3. 6942614
2975
56- 65 |
5. 5415361
3. 7011868
2552
66- 75 |
5. 3428237
3. 7629557
2564
75+ |
5. 2223199
3. 84858
1138
- - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - Tot al |
4. 7092123
3. 6924366
20527
_Obs
3317
4235
3746
2975
2552
2564
1138
_RankSum
31742682. 00
41328124. 00
35568528. 00
30939640. 00
29588968. 00
28905476. 00
12615706. 00
365. 915 wi t h 6 d. f .
0. 0001
c hi - s quar ed wi t h t i es =
pr obabi l i t y =
0. 0001
377. 031 wi t h 6 d. f .
E n los r esu ltad os se ofrecen dos can tidad es de cla or igin al y la corr egid a p or la pr esen cia de em p ates en el ran go d e las p u n tu acion es. m bas
con fir m an u e p u ed e rech azarse con u n n ivel d e segu r id ad su p er ior al
la h iptesis n u la de u e el ran go m ed io en cada gru p o d e edad es sim ilar.
, lo u e es lo m ism o, pu ede asegu r arse u e eisten diferen cias sign ificativas p or edad en la p rob ab ilidad de voto al ar tid o op u lar. E ste, com o se h a
visto en la tab la de m ed ias, es pr ob ablem en te m s votado en tre las p erson as
m ayor es.
7..2.om paracion es
param tricas
de
m edias
e u n a p ob lacin d ividida en gr u pos con
m edias
, , ,, , se
,
etraen m u estras aleator ias con m edias , , , ,..., . a pr u eb a del
E E G
an lisis de varian za tr ata de ver ificar si con las m edias m aestr ales obten idas
p u ed e sosten erse la h ip tesis de igu aldad d e m ed ias en la p oblacin
.
os su p u estos p ar a r ealizar com p ar acion es param tr icas de m edias
son los sigu ien tes
. as m u estr as se h an seleccion ado aleator ia e in d epen dien tem en te de
las poblacion es.
. as distribu cion es en la pob lacin d e la variab le cu ya m edia se com par a son n orm ales en cad a u n o de los gru p os.
. as d esviacion es tpicas d e la var iable en cada u n a de las p oblacion es son igu ales en tre s.
a p rim er a con dicin se cu m p le siem pr e y cu an do se h ayan etrad o
m u estr as in depen dien tes y aleatorias d e los d atos. E s p resu m ib le u e al
aplicar u n cu estion ar io a p erson as seleccion adas al azar se cu m p la este su p u esto del an lisis de var ian za, siem pr e y cu an do los valores de la var iable
gru p al sean m u tu am en te eclu yen tes.
ar a el segu n do su pu esto, eisten d istin tas pr u eb as p ar a com p rob ar la
n orm alid ad de u n os d atos m aestrales. E n tata son u tilizables d iver sos pr oced im ien tos para com p robar si u n a d istr ibu cin es o n o n orm al. E n tre ellos
estn sil,
s
ran cia,
sm irn ov y stest.
E n tr e estos son m s recom en d ables en este con teto los d os pr im eros,
pu es son los n icos u e perm iten r ealizarse con la opcin bpara obten er
u n a pr u eba de n or m alidad de la var iable en cu estin para cada u n a d e las
m u estr as in depen dien tes etr adas.
om o u n ejem plo de an lisis de varian za, se con sidera com o variable depen dien te la probabilidad de voto al artido opu lar (pvotopp) por n iveles de
estu dio. n tes de ejecu tar el an lisis de varian za, se com bin an las variables es
cu ela
y estu dios, para aplicarles con ju n tam en te la pru eba de n orm alidad para
cada gru po de la m u estra m edian te la in stru ccin silprecedida por b
sort
repla ce estu diosif
escu elaescu ela
recod e estu d ios .
la bel defin e estu d ios
in estu dios
, ad d
b ysort estu d iossilp votop p
m ien tras u e los dos ltim os gru pos, los m en ores en tam a o, podran proven ir
de poblacion es en las u e la distribu cin de la variable fu era n orm al. in em bargo, a pesar de u e en los gru pos im portan tes n o se cu m pla el su pu esto de
n orm alidad, cu an do los tam a os gru pales son gran des, el reu isito n o es tan
su stan cial. irve m s bien para determ in ar u pru eba de h om ocedasticidad es
m s adecu ada aplicar, pu es el su pu esto de igu aldad de varian zas es m u ch o m s
im portan te u e el de la n orm alidad de las poblacion es.
ILUSTR ACI 7 .1. P r u e b a d e Sa p ir o
ild e n o r m a lid a d e n lo s d a t o s
_______________________________________________________________________________
- > es t udi os = Si n es t udi os
Shapi r o- Wi l k W t es t f or nor mal dat a
Var i abl e |
Obs
W
V
z
Pr ob>z
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - pvot opp |
1603
0. 98572
13. 849
6. 631 0. 00000
_______________________________________________________________________________
- > es t udi os = pr i mar i os
Shapi r o- Wi l k W t es t f or nor mal dat a
Var i abl e |
Obs
W
V
z
Pr ob>z
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - pvot opp |
9534
0. 98257
83. 289
11. 824 0. 00000
_______________________________________________________________________________
- > es t udi os = s ecundar i os
Shapi r o- Wi l k W t es t f or nor mal dat a
Var i abl e |
Obs
W
V
z
Pr ob>z
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - pvot opp |
3482
0. 98361
32. 118
8. 998 0. 00000
_______________________________________________________________________________
- > es t udi os = f or mac i n pr of es i onal
Shapi r o- Wi l k W t es t f or nor mal dat a
Var i abl e |
Obs
W
V
z
Pr ob>z
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - pvot opp |
2533
0. 98383
23. 761
8. 127 0. 00000
_______________________________________________________________________________
- > es t udi os = uni v er si t ar i os de gr ado medi o
Shapi r o- Wi l k W t es t f or nor mal dat a
Var i abl e |
Obs
W
V
z
Pr ob>z
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - pvot opp |
1795
0. 98323
18. 028
7. 327 0. 00000
_______________________________________________________________________________
- > es t udi os = uni v er si t ar i os de gr ado s uper i or
Shapi r o- Wi l k W t es t f or nor mal dat a
Var i abl e |
Obs
W
V
z
Pr ob>z
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - pvot opp |
1500
0. 98038
17. 906
7. 260 0. 00000
_______________________________________________________________________________
- > es t udi os = ot r os es t udi os no r egl ados
Shapi r o- Wi l k W t es t f or nor mal dat a
Var i abl e |
Obs
W
V
z
Pr ob>z
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - pvot opp |
50
0. 96225
1. 775
1. 224 0. 11045
_______________________________________________________________________________
- > es t udi os = n. c.
Shapi r o- Wi l k W t es t f or nor mal dat a
Var i abl e |
Obs
W
V
z
Pr ob>z
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - pvot opp |
36
0. 95404
1. 676
1. 080 0. 14009
E E G
= 3. 5717968
W50 = 2. 677433
W10 = 3. 5717968
df ( 7, 20525)
df ( 7, 20525)
df ( 7, 20525)
Pr > F = . 00076178
Pr > F = . 00905666
Pr > F = . 00076178
An lisis d e va r ia n a p a r a m u e st r a s in d e p e n d ie n t e s
c hi 2( 7) =
6. 6295
Pr ob>c hi 2 = 0. 468
a su m a cu adrtica total
otal
SS
o repr esen ta la su m a d e las
d esviacion es al cu adr ad o d e todos los valores con respecto a la m ed ia global
d e la m u estra.
.
E n la frm u la se su m an en cad a u n o de los gru p os, las n j diferen cias
cu adr ticas en tr e los valores (ij) y las m ed ias (
). o es esto otr a cosa u e el
n u m er ad or de la var ian zap or lo u e al d ividirla p or los grados de libertad
(d
) d e la m u estr a, se ob tien e la cu asivar ian za, con ocid a en este con teto
com o la m edia cu adr tica total
otal
S o
.
.
u r az cu adr ada eu ivale a la cu asid esviacin tp ica d e la variab le cu yas m edias se estn com paran d o en d istin tas su b m u estr as, en este caso, d e
la var iable u e m ide la p robab ilidad su b jetiva de voto al .
E E G
. a pr im era d e estas
r ecoge las d esviacion es al cu adr ado d e cada u n a d e las m ed ias d e los gr u pos
con r especto a la m edia global, es decir, r efleja las d ifer en cias eisten tes
en tr e los d istin tos gr u pos.
.
E n ca m b io, la su m a cu ad r tica in ter n a rep r esen ta la s d esvia cion es eisten tes d e los va lores con r esp ecto a la m ed ia d e su gru p o, es d ecir, la var ia cin u e eiste en el in terior d e ca d a u n a d e la s su b m u estra s ob ten id as.
.
e las su m as cu adrticas se obtien en las m edias cu adrticas, dividien do las
prim eras por su s grados de libertad. E n el caso de la su m a cu adrtica etern a
(beteen ), los grados de libertad son igu ales al n m ero de gru pos m en os u n o
y en el de la su m a cu adrtica in tern a (itin ) al n m ero de casos del con ju n to
m en os el n m ero de gru pos.
.
om o la hiptesis nula u e se est com probando es la igualdad de m edias de
los distintos grupos, es obvio ue cu anto m ayor sea la sum a cuadrtica intergrupal, m enores sern las garantas de ue auella sea cierta. e sabe ue, en caso
de ue se cum plan los supuestos m encionados, el cociente de la m edia cu adrtica intergrupal entre la m edia cuadrtica intragrupal sigue la distribu cin .
.
E n el ejem plo an terior m en te epu esto, la da u n valor etr em ad am en te
gran d e
,
, cu ya p robab ilidad de ocu rr en cia, en el caso d e u e la h ip-
p,
.
ist r ib u ci n co n 7 y r a d o s d e lib e r t a d
.2
F(x,7,2525)
.4
.6
.8
R IC 7 .1.
.5
1.5
2.5
3.5
E n este ejem p lo se im pon e volver a l tem a d el su pu esto d e h om oceda sticida d, pu esto u e ofr ece ciertas con tr a ried ad es u e deben ser ten ida s
en cu en ta . on el a n lisis on ea
, ta ta ob tien e la p ru eba de a rtlett d e
igu a lda d de va ria n zas. E n el ejem plo de la ilu stra cin .n o pa r ece h a ber
in d icios de h eteroced a sticid ad , ya u e la pr oba bilida d d e la m edida es su p er ior a ,. E sto se con tra dice con el a n terior test d e even e, con el u e
se r ech a z la h ip tesis n u la de h om oced a sticid ad . u l de estos a rtilu gios, el d e a rtlett o el d e even e, es m s fia b leE n pr in cip io, el segu n d o,
p u es el pr im er o es m s sen sible a l su p u esto de u e la s su b pobla cion es ten ga n u n a distribu cin n orm a l, con d icin u e se com p rob con la pr u eb a d e
h ap ir o-ils u e n o era cier ta . or ta n to, a p esa r d e la p ru eba de a rtlett, el ejem p lo n o ofr ece gr a ra n ta s de h om oceda sticida d. o obsta n te,
com o la sign ifica cin d el va lor en la pr u eba de com p ar a cin de m edia s
es ta n n fim a , a p esa r de n o cu m plir se los su p u estos, segu ira pu din d ose
r ech a za r la h iptesis n u la con gra n tr an u ilid a d de n o eu ivoca r se.
edian te la opcin tabu late del program a on ease ob tien e u n a tabla
sim ilar a la u e p rod u cen otras in stru ccion es, com o tabu late, table o robvar,
E E G
con m edias, d esviacion es tpicas y frecu en cias por gru p o, pero, adem s, tam bin es posib le realizar pru eb as de com paracion es m ltiples con las opcion es sce
e,
bon
erron i o sida. E stas tres respon den con diferen tes criterios
a corregir el prob lem a u e su p on e realizar m u ch as pru eb as de sign ificacin
al m ism o tiem po. i de cada cien com paracion es, cin co salen sign ificativas
aleatoriam en te de cad a diez com p aracion es, m ed ia ten dra u e salir sign ificativa. ara evitar rech azar aleatoriam en te, diferen cias u e n o lo son , se
ap lican criterios m s estrictos u e la sign ificacin otorgada por la t
d e tu den t para com parar slo dos m u estras.
E n el ejem p lo actu al, u tilizan d o el criterio de ch eff, u e con siste en
d ividir el cu ad rad o d e la distrib u cin t de tu den t p or el n m ero de gru p os
m en os , se ob tien e u n a d istrib u cin con -grados d e libertad en el n u m erad or y n -grad os en el den om in ador. E stas operacion es se obten d ran con la
sigu ien te in stru ccin , cu yos resu ltados se presen tan en la ilu stracin .
on ea y pvotop p estu d ios, n oan ova sch effe
ILUSTR ACI 7 .. Co m p a r a ci n d e m e d ia s c o n co r r e cc io n e s d e Sce
Compar i s on of pp by es t udi os
( Sc hef f e)
Row Mean- |
Col Mean | Si n es t u
Pr i mar i o
Sec undar
F. P
Medi os
Super i or
Ot r os
- - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - Pr i mar i o |
. 335981
|
0. 121
|
Sec undar |
. 033124
- . 302857
|
1. 000
0. 016
|
F. P | - . 449041
- . 785023
- . 482166
|
0. 042
0. 000
0. 001
|
Medi os |
. 003111
- . 33287
- . 030014
. 452152
|
1. 000
0. 090
1. 000
0. 027
|
Super i or | - . 277292
- . 613273
- . 310417
. 171749
- . 280403
|
0. 733
0. 000
0. 384
0. 957
0. 692
|
Ot r os |
. 938041
. 60206
. 904917
1. 38708
. 93493
1. 21533
|
0. 871
0. 988
0. 887
0. 433
0. 872
0. 627
|
N. c | - . 871959
- 1. 20794
- . 905083
- . 422917
- . 87507
- . 594667
- 1. 81
|
0. 961
0. 796
0. 951
1. 000
0. 960
0. 996
0. 653
e esta m atriz d e com paracion es d on de aparecen en cad a celda d os cifrasla diferen cia de m ed ias
de la correspon d ien te al gru po d e fila m en os d e
la correspon d ien te al de la colu m n ay la sign ificacin corregida se dedu ce
u e a pesar de u e los u e n o con testan al n ivel de estu dios son los u e con
m en or probabilid ad dan su voto al
tod as las restas d e su fila son n egativasy u e los u e poseen otros estu d ios son los u e otorgan m ayor prob ab ilidad
tod as las restas d e su fila son positivas
, n in gu n a de las d os resu ltan
sign ificativas, poru e son categoras con u n a peu e a can tidad d e casos.
7 .. Co m p a r a cio n e s d e k m u e st r a s d e p e n d ie n t e s
lgo m s com plejo es el em p leo d e pr u eb as de m u estr as dep en d ien tes con
el pr ogram a tata. E n p rim er lu gar, n o se pu ede em p lear la m s sim ple in stru ccin on ea
, sin o u e h a d e u tilizarse la m s com p leja an ova. eso n o
es todo, por u e ad em s h an d e dispon er se los d atos en el for m ato alargado,
tal com o se eplic en la seccin ...
ILUSTR ACI 7.. st r u ct u r a a n c a d e la m a t r id e d a t o s
Gen er alm en te, el for m ato d e los fich er os de datos se aju sta al m odelo
an ch o, d e form a u e en las ln eas se en cu en tran los casos y en las colu m n as,
las variab les. ara m u estras d ep en d ien tes esto im plicara u e cada variable
ap ar ece en u n a colu m n a d istin ta. in em bar go, el tratam ien to d e la in stru ccin an ova reu iere u e la in for m acin est disp u esta en otro form ato, el
alargado. e n ecesita u e h aya u n a var iable n ica con tod o lo u e se d esea
com p ar ar
var dep , ideo
en el ejem ploy al m en os otr as dos variab lesu n a
u e sea la fu en te d e la com paracin
varr ep, partido
, o el n m er o de repeticin d e la m edida, y otra u e in diu e al su jeto de com p aracin
varid, id
.
E sto, u e par ece tan com p lejo, p u ed e en ten der se m ejor visu alm en te com p ar an do los m ism os d atos epr esad os a lo an ch o
ilu str acin .y a lo lar go
E E G
on el fich er o en form ato alar gad o, se pu ede ap licar la in stru ccin id n ea p ar a efectu ar u n an lisis de varian za d e m edidas r epetid as, u e p osee
esta frm u la gen eral
a n o va va rdep varid varrep , r e p e a t e d
varrep
u se p an el, clea r
gen erate pa rtidoideopp
gen erate pa rtidoideopn v
gen erate pa rtidoideoea
a y u e ten er en cu en ta u e el p r ogr a m a a n ova d e m ed id a s r ep etid a s tien e cier ta s lim ita cion es d e c lcu lo. o p u ed e tr a b a ja r con m s d e
ca so s, p u es p or la s ca r a cter stica s d el p r ogr a m a estos son tr a ta d os
com o si fu er a n va lor es d istin tos d e u n a va r ia b le. or eso, es con ven ien te
elim in a r d el fich er o tod os a u ellos ca sos con va lor es p er d id os en la s
va r ia b les tr a ta d a s y, com o a n eso n o es su ficien te, d a d a la gr a n m u estr a d isp on ib le, h a b r u e con str u ir u n a su b m u estr a con la in str u ccin
sa m ple, en este ca so b a sta con h a cer u n a u e com p r en d a el d e
los su jeto s d isp on ib les. in a lm en te, ta m b in es con ven ien te r ed u cir el
ta m a o d el fich er o d e tr a b a jo p a r a u e el tr a n sfor m a d o n o con ten ga
va r ia b les in tiles y p a r a u e se a m in or e el esfu er zo d e con ver sin . E sta s
tr es op er a cion es d e seleccin h a n d e r ea liza r se m ed ia n te la s sigu ien tes
in str u ccion es
recode partid o-partid o.
d rop if partid o. p artid o. pa rtido.
sam ple
eep id pa rtido-p artido
bviam en te, con las dos pr im er as, al elim in ar los casos con valor es perd id os en estas variab les, se seleccion an los casos u e h an con testado a la
evalu acin d e la posicin id eolgica de los tres par tid os con sid er ad oscon
la ter cer a, se seleccion an la m itad de los casos y, fin alm en te au n u e p od ra h ab er sido tam bin u b icad a en pr im er lu gar, slo se m an tien en las
cu atr o var iables con las u e se obten d r la n u eva disposicin de los datos. n a vez r ealizad as estas oper acion es, pr ocede la tr an sform acin de la
m atriz d e d atos, m edian te la in str u ccin , u e en este ejem plo ad optar a la
sigu ien te for m a
resh ap e lon g pa rtido, i
id j
p ar
n a vez in trodu cid a esta in stru ccin , el fich ero se pr epara au tom ticam en te p ar a u e sea posib le realizar el an lisis de varian za con el dise o
d e m edid as repetidas. on secu en cia d el p roceso, en pan talla se m u estra lo
sigu ien te
E E G
ILUSTR ACI 7 .. P a r m e t r o s d e la t r a n s
o r m a ci n d e m a t r ic e s
( not e: j = 1 2 3)
Dat a
wi de
->
Number of obs.
Number of v ar i abl es
j v ar i abl e ( 3 v al ues)
x i j v ar i abl es:
par t i do1
par t i do2
l ong
670
4
->
->
par t i do3
2010
3
->
par
->
par t i do
E
la bel va lu es par p artid os
tabstat pa rtido, b y
p arstatistics
n m ean sd
or todo ello, con vien e cerrar el fichero de trabajo despus de estos anlisis, ya ue los
casos se m u ltiplican por tan tas veces com o m edidas repetidas se disponga.
ras estos p asos p revios con los d atos, h ay u e in clu ir la or den an ova
p ara obten er el an lisis
a n ova partid o id p ar, repeated
p ar
Number of obs =
2010
Root MSE
= 1. 53364
R- s quar ed
=
Adj R- squar ed =
0. 7137
0. 5701
Sour c e |
Par t i al SS
df
MS
F
Pr ob > F
- - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - Model |
7844. 54378
671 11. 6908253
4. 97
0. 0000
|
id |
3073. 60249
669
4. 5943236
1. 95
0. 0000
par |
4770. 94129
2 2385. 47065
1014. 20
0. 0000
|
Res i dual |
3147. 05871 1338 2. 35206181
- - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - Tot al |
10991. 6025 2009 5. 47118093
id
670
id
( 669 df )
0. 8979
0. 8956
0. 5000
- - - - - - - - - - - - Pr ob > F - - - - - - - - - - - Sour c e |
df
F
Regul ar
H- F
G- G
Box
- - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - par |
2 1014. 20
0. 0000
0. 0000
0. 0000
0. 0000
Res i dual |
1338
- - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -
la
r esidu al, a la in tern a (itin ),
y la total es, com o en el caso an ter ior, la su m a
d e todas las diferen cias al cu ad rado de los valor es d e las tr es variab les con
r especto a la m ed ia global d e todas.
a var iacin total, com o pu ede com pr obarse fcilm en te, es la su m a de
la u e ep lica el m odelo y de la r esidu al. su vez, la variacin del m odelo se
E E G
7..1.
P ru ebas
n o
param tricas
de
com paracin
de
m u estras
depen dien tes
am b in el an lisis de varian za d e m u estras d epen dien tes r eu ier e u e se
cu m plan los r eu isitos d e n orm alid ad d e los datos poblacion ales y, sobr e
tod o, de h om oced asticidad . ero, para el su p u esto de u e estas asu n cion es
n o se cu m p lan , eisten otras p ru ebas estadsticas u e n o reu ieren con dicion es tan estrictas. E n el caso d e u e se d eseen com par ar m s de dos var iables de u n a m ism a m u estr a a d ifer en cia d el caso en el u e se tr ate de
cotejar u n a sola var iable en varias m u estr as n o se pu ede u tilizar la pr u eb a
d e ru sall-allis, sin o la de r iedm an .
E l pr ogr am a tata
n o in corp or a or igin alm en te n in g n p roced im ien to
capaz de obten er este estad sticosin em bar go, en tr e su s libr eras d isp on ib les y adu ir ibles a travs de
n ter n et, se en cu en tra u n pr ocedim ien to capaz
d e pr oporcion ar los clcu los n ecesar ios. e trata d el pr ogr am a sn p2. or
tan to, si n o se tien e a n in stalad o, es pr eciso escr ibir la sigu ien te in str u ccin , con ectado a
n tern et.
n et in stall sn p .p g
r ie d m a n lista
d evariab les
in ra n go
iep
E E G
7..
e r cicio s
. on los d atos d el b arm etr o de m arzo de
cis
, p ru eba la h ip tesis de u e m s del d e los ciu dadan os p refier en ir per son alm en te a
la ficin a de dm in istr acin cu an do n ecesitan in for m acin relacion ada
con la gestin d e tr m ites adm in istr ativos
.
. om p ru eba asim ism o
u e m s d el de la p oblacin espa ola h a accedid o a
n tern et en los
ltim os m eses.
. er ifica u e la m ayor a de los ciu dadan os u e h an h ech o gestion es adm in istr ativas h an u edad o satisfech os con la aten cin
.
. E sto podr a h acer se tan to con m edias com o con por cen tajes. r esta especial
aten cin a eclu ir a u ien es n o h an em itid o op in in por n o h ab er realizad o estos trm ites.
. E m p lean do cu alu ier bar m etro poltico d el
-
. pr ovech a par a record ar la in stru ccin recode
vista en el u in to
cap tu lo. ealiza otra agr u pacin de los valor es de las d os ltim as var iables
edad e ideolo
apar a com p ar ar m s d e d os gr u pos d e edad e
id eologa al m ism o tiem p o.
. gru pa las categoras conservadora
dem crata cristian a
liberal, por u n lado,
y socialdem crata
socialista
com un ista, por el otro. ay diferen cias sign ificativas en la m u estra de abril de de la sociedad espa ola en tre ideologas clsicas de derech as e izuierdason los jven es m s de izu ierda
on las m u jeres m s proclives a las ideologas de derech as
ara facilitar
el ejercicio, cu en ta slo con la prim era opcin de respu esta de la
.del
barm etro de abril de , cis
.
. ru eba la h iptesis de u e todas las valoracion es de los lderes n acion alistas
u igcercs, u in tan a, ivero y ar osson igu ales.
8
Co n fe cci n y a n lisis d e t a b la s co n St a t a 1
Pr ob a b lem en te, el m tod o esta d stico m s a m p lia m en te u tiliza d o (a l m en os en sociologa ) sea la ta b la d e con tin gen cia . Un a ta b la qu e m u estr a
u n cr u ce en tr e d os o m s va r ia b les es u n a m a n er a f cil e in tu itiva d e
estu d ia r la r ela cin en tr e d os o m s va r ia b les. Per o esta fa cilid a d d e u so
e in ter p r eta cin , p ese a ser u n a d e la s p r in cip a les ven ta
a s d el a n lisis
d e ta b la s d e con tin gen cia , ta m b in su p on e en m u ca s oca sion es u n p r ob lem a . m en u d o el a n lisis esta d stico con ta b la s se r ea liza d e m a n er a
m en os cu id a d osa slid a qu e con otr os m tod os, sin p r esta r a ten cin
a p r ob lem a s d e sign ifica cin esta d stica o a in ter r ela cion es com p le
as
en tr e va r ia b les. in em b a r go, eisten er r a m ien ta s esta d stica s qu e p erm iten a cer u n a n lisis cu id a d oso d e ta b la s d e con tin gen cia , esta d stica m en te r igu r oso. n este ca p tu lo se a b or d a n en p r im er lu ga r la s ta b la s d e
con tin gen cia p r op ia m en te d ica ssegu id a m en te, se tr a ta n otr os tip os d e
ta b la s qu e p er m iten com p a r a r esta d sticos d istin tos d e los p or cen ta
es,
cu o tr a ta m ien to in fer en cia l se vio con m s p r ofu n d id a d en el ca p tu lo
a n ter ior, se fin a liza con la s ta b la s p r op ia s d e va r ia b les con va lor es qu e
n o son m u tu a m en te eclu en tes.
l a n lisis d e ta bla s d e con tin gen cia est in dica do p a ra el estu dio de
la r ela cin o a sociacin en tre var ia bles cu a lita tiva s (n om in a les u or din a les), a u n qu e el m odelo b sico es p a ra dos va r ia bles, se pu ede eten d er
f cilm en te a m s d e d os. n cu a lqu ier ca so, en el a n lisis d e ta b la s de
con tin gen cia se d eben esp ecifica r al m en os d os va ria b les en or den in difer en te, si b ien en m u ca s oca sion es en el ter ren o terico pu ede pen sa rse
qu e estas d os p u eden ten er u n esta tu s d ifer en teu n a va ria b le depen dien te
(cu o com porta m ien to se in ten ta eplicar ), u n a o m s va ria b les in d epen d ien tes (qu e se com p roba r si cor rela cion a n en qu m edid a con el
com por ta m ien to d e la var ia ble depen dien te). s, por ta n to, u n a tcn ica
Para am pliar con ocim ien tos de este tem a se recom ien da el libro bsico de n cez arrin () o los de uiz aa (). n in gls, en tre otros, son recom en dables
veritt (), n dersen () com o in troductorios
, entre los avan zados, gresti ()
aal ().
06/06/12 09:34
8.1.
Ta b la s d e co n t in ge n cia d e d o s va r ia b le s
stu dio
. u estra de .casos, representativa de la poblacin espa ola de
am bos seos, de m s a os, realizada m edian te entrevista person al en m arzo de .
ase, por e
em plo, on zlez ()tam bin Param io ().
06/06/12 09:34
- > t abul at i on of r v ot o
Rec uer do de |
v ot o |
r ecodi f i c ado |
Fr eq.
Per c ent
Cum.
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - PP |
1, 773
33. 57
33. 57
PSOE |
1, 054
19. 96
53. 53
IU |
226
4. 28
57. 81
Naci onal i st a |
350
6. 63
64. 44
Ot r os |
95
1. 80
66. 24
Bl anc o |
108
2. 05
68. 28
No v ot o |
890
16. 85
85. 14
NC |
785
14. 86
100. 00
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - Tot al |
5, 281
100. 00
- > t abul at i on of i ngr esos
I ngr esos |
f ami l i ar es |
mensual es |
ent r ev i s t ado |
Fr eq.
Per cent
Cum.
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - <150 |
1, 846
34. 94
34. 94
150- 300 |
1, 449
27. 43
62. 37
>300 |
452
8. 56
70. 93
Ns / Nc |
1, 536
29. 07
100. 00
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - Tot al |
5, 283
100. 00
s el m ism o com an do qu e para tablas de frecu en cias. i se escribe tabu late el n om bre
de u na variable, tata en ten der que se desea m ostrar su tabla de frecu en cias as lo ar. i
se epresa la in struccin tabu late segu ida por los n om bres de dos variables, tata m ostrar u na
tabla de con tin gen cia.
06/06/12 09:34
, opcion es
el m ism o m odo que se perm ita la in struccin tab1 listavar, tam bin eiste tab2 listavar. sta ace cru zar todas las variables qu e se in clu an en la lista de variables. i se escribe
con la opcin firston ly, slo se cru za la prim era con todas las dem s.
06/06/12 09:34
o t a c i n d e la s t a b la s d e co n t in ge n cia
a r ia b le in d e e n d ie n t e
a r ia b le
d e e n d ie n t e
c o ln a 1 c o ln a co ln a
To t a l
ila
f.
ila
f.
otal
f.
f.
f.
n f..
(.)
Par a qu e los m u estr e tata se esp ecifica la op cin col tras la com a
tab u late rvoto in gresos, col
06/06/12 09:34
(.)
n tata se obtien e m edian te la opcin row d e la in stru ccin tabu late. om o tam bin pu ede acerse con los porcen ta
es verticales,
si se d esea qu e n o aparezcan las frecu en cias absolu tas de las casillas,
es preciso a adir la op cin n ofreq, com o se p on e de m an ifiesto en el
sigu ien te e
em p lo.
06/06/12 09:34
(.)
u ob ten cin es an loga a las an teriores con la opcin cell. Por ello en el
e
em plo actu al la in str u ccin deber a ser
tab u late rvoto in gresos, cell n ofreq
06/06/12 09:34
ILUSTR ACI 8 .. Ta b la d e c o n t in ge n c ia c o n o r ce n t a
e s t o t a le s
Rec uer do de |
vot o | I ngr es os f ami l i ar es mens ual es ent r evi s t ado
r ec odi f i cado |
<150
150- 300
>300
Ns / Nc |
Tot al
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - +- - - - - - - - - PP |
11. 61
10. 45
3. 47
8. 05 |
33. 57
PSOE |
9. 03
5. 55
1. 50
3. 88 |
19. 96
IU |
1. 31
1. 70
0. 49
0. 78 |
4. 28
Nac i onal i s t a |
1. 63
2. 05
0. 70
2. 25 |
6. 63
Ot r os |
0. 30
0. 57
0. 44
0. 49 |
1. 80
Bl anc o |
0. 59
0. 57
0. 30
0. 59 |
2. 05
No vot o |
5. 42
4. 36
1. 16
5. 93 |
16. 85
NC |
5. 07
2. 16
0. 51
7. 12 |
14. 86
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - +- - - - - - - - - Tot al |
34. 96
27. 40
8. 56
29. 09 |
100. 00
06/06/12 09:34
in gr esos, el voto a
U es algo m aor en los in gr esos m ed ios. Par ece, p or
tan to, qu e s eiste r elacin en tr e situ acin econ m ica voto.
ILUSTR ACI 8.. Ta b la d e fr e c e n cia s co n o r c e n t a
e s ve r t ic a le s
sin va lo r e s e r d id o s
Recuer do de |
I ngr esos f ami l i ar es mens ual es
v ot o |
ent r evi s t ado
r ecodi f i c ado |
<150
150- 300
>300 |
Tot al
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - +- - - - - - - - - PP |
38. 85
41. 41
43. 06 |
40. 41
PSOE |
30. 23
21. 98
18. 59 |
25. 45
IU |
4. 37
6. 75
6. 12 |
5. 55
Naci onal i st a |
5. 45
8. 10
8. 71 |
6. 92
Ot r os |
1. 01
2. 25
5. 41 |
2. 07
Bl anc o |
1. 96
2. 25
3. 76 |
2. 31
No v ot o |
18. 12
17. 25
14. 35 |
17. 30
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - +- - - - - - - - - Tot al |
100. 00
100. 00
100. 00 |
100. 00
(.)
n la ilu str acin ., la fr ecu en cia esper ad a de la pr im era casilla -
(ot PP e in gresos m en or es a .ptas.) sera
06/06/12 09:34
(.)
s decir, si n o u b iera r elacin en tr e voto e in gr esos, el n m er o d e person as qu e vot al PP con in gresos in feriores a .ptas. d ebera ser
,. om o el valor obser vad o es d istin to (), ain dicios de cier ta r elacin en tre las var iables. a d iferen cia en tre el valor ob ser vad o el esperado
se llam a residu o, qu e m an ifiesta d ep en d en cia en tr e p ares de valor es d e las
variab les resp ectivas, siem p re cu an do su valor d ifier a de . l r esidu o de
la casilla -sera-,-,, qu e in d ica qu e la frecu en cia d e la casilla es m en or en ,casos a la esperab le en caso d e in depen den cia.
a sigu ien te in str u ccin con str u e u n a tabla de con tin gen cia (ilu str acin .) con las fr ecu en cias obser vad as esper ad as
tabu la te rvoto in gresos if rvoto
in gresos
, epected
ILUSTR ACI 8 .. Ta b la d e c o n t in ge n c ia c o n fr e c e n cia s o b se r va d a s
y e s e r a d a s
+- - - - - - - - - - - - - - - - - - - - +
| Key
|
| --------------------|
|
f r equenc y
|
| ex pec t ed f r equenc y |
+- - - - - - - - - - - - - - - - - - - - +
|
I ngr esos f ami l i ar es mensual es
|
ent r ev i st ado
RECODE of p34 |
<150
150- 300
>300 |
Tot al
- - - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - +- - - - - - - - - PP |
613
552
183 |
1, 348
|
637. 6
538. 6
171. 7 |
1, 348. 0
- - - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - +- - - - - - - - - PSOE |
477
293
79 |
849
|
401. 6
339. 2
108. 2 |
849. 0
- - - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - +- - - - - - - - - IU |
69
90
26 |
185
|
87. 5
73. 9
23. 6 |
185. 0
- - - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - +- - - - - - - - - Naci onal i st as |
86
108
37 |
231
|
109. 3
92. 3
29. 4 |
231. 0
- - - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - +- - - - - - - - - Ot r os |
16
30
23 |
69
|
32. 6
27. 6
8. 8 |
69. 0
- - - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - +- - - - - - - - - Bl anc o |
31
30
16 |
77
|
36. 4
30. 8
9. 8 |
77. 0
- - - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - +- - - - - - - - - No vot |
286
230
61 |
577
|
272. 9
230. 6
73. 5 |
577. 0
- - - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - +- - - - - - - - - Tot al |
1, 578
1, 333
425 |
3, 336
|
1, 578. 0
1, 333. 0
425. 0 |
3, 336. 0
om o p u ed e ap reciarse, el segu n d o valor de cada casilla es el valor esp er ad o (el d e la p rim er a casilla es el m ism o qu e se a calcu lado m an u alm en te
m s arr iba). a d iferen cia en tr e la frecu en cia observada la esp er ada in dica, com o a se a se alad o, la relacin en tr e las var iables. s, el n m ero
06/06/12 09:34
.stata.com
u sers
n
c
n et in stall tabci
(.)
ase aora u n a tabla con estas opcion es, a adin dole tam bin n oo n oe,
para elim in ar las frecu en cias observadas esperadas qu e a se an obten ido en
la ilu stracin .. a in stru ccin se com pon dra de las sigu ien tes opcion es
tab ci rvoto in gresos if rvoto
in gresos
, n oo n oe ra p earson ad
u st
n cad a casilla d e la ilu str acin .apar ecen tod os los estad sticos ped id os. l pr im ero es el r esidu o, qu e sim plem en te epr esa la d istan cia en tr e
el valor observado el esperado de la casilla. l segu n do es el r esidu o d e
Pear son , qu e n o tien e m u co in ters en este caso. , por ltim o, ap arece el
06/06/12 09:34
r esidu o a
u stado, qu e es el m s in ter esan te p ar a la in terp retacin . st estan d ar izado p ara poder estu d iar la sign ificacin estad stica de la frecu en cia
d e cad a casilla. l valor qu e tom a sigu e u n a d istr ibu cin n or m al con m edia
desviacin tpica (
,
), por lo qu e p u ede u tilizarse para com pr obar
en la tab la de pr ob abilid ades d e la n orm al si el valor d el resid u o es sign ificativo o se p u ed e d eber a err ores d e m u estr eo. n gen er al, si su pera ,
en tr m in os absolu tos (n egativo o positivo), p u ed e d ecir se qu e la d ifer en cia
en tr e el valor ob ser vad o el esp er ado en caso d e n o ab er relacin en tre las
variab les n o es d eb ido a err ores de m u estreo, con u n d e con fian za. n
este caso, las casillas de voto al PP n o son sign ificativas (n o llegan al valor
crtico de ,), p or lo qu e las d ifer en cias obser vad as en voto al PP p or in gresos p u ed en ser d eb id as a err or es de m u estreo n o deben ser tom ad as en
con sideracin . as difer en cias en voto al P, en cam b io, s qu e son sign ificativas, as com o las de
U n acion alistas p ara in gresos m edios b a
os.
ILUSTR ACI 8.8 . Ta b la d e c o n t in ge n c ia c o n r e sid o s b r t o s
e st a n d a r ia d o s y a
st a d o s
r aw r es i dual
Pear s on r es i dual
adj us t ed r es i dual
------------------------------------------------------------------------------Rec uer do de |
v ot o
|
I ngr es os f ami l i ar es mens ual es ent r ev i s t ado
r ec odi f i cado |
<150
150- 300
>300
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - PP |
- 24. 633
13. 366
11. 267
|
- 0. 976
0. 576
0. 860
|
- 1. 741
0. 963
1. 192
|
PSOE |
75. 405
- 46. 244
- 29. 161
|
3. 763
- 2. 511
- 2. 804
|
6. 003
- 3. 753
- 3. 476
|
IU |
- 18. 509
16. 078
2. 431
|
- 1. 979
1. 870
0. 501
|
- 2. 804
2. 483
0. 552
|
Nac i onal i s t a |
- 23. 268
15. 697
7. 571
|
- 2. 226
1. 634
1. 396
|
- 3. 178
2. 186
1. 549
|
Ot r os |
- 16. 638
2. 429
14. 210
|
- 2. 912
0. 463
4. 793
|
- 4. 054
0. 603
5. 184
|
Bl anc o |
- 5. 423
- 0. 768
6. 190
|
- 0. 899
- 0. 138
1. 976
|
- 1. 252
- 0. 181
2. 141
|
No vot o |
13. 067
- 0. 558
- 12. 509
|
0. 791
- 0. 037
- 1. 459
|
1. 198
- 0. 052
- 1. 717
------------------------------------------------------------------------------Pear s on c hi 2( 12) =
l i k el i hood- r at i o c hi 2( 12) =
86. 7344
81. 5902
Pr = 0. 000
Pr = 0. 000
06/06/12 09:34
(.)
l va lor d e c ser cu a n d o n o a a r ela cin a lgu n a en tr e la s d os
va r ia b les, a u m en ta r cu a n to m a or sea la r ela cin . o ob sta n te, n o se
su ele u tiliza r com o in d ica d or d e la fu er za d e la a socia cin , p or qu e n o
va r a en tr e (m s a d ela n te se estu d ia n esta d sticos qu e s lo a cen
son p or ello m s a d ecu a d os p a r a estu d ia r la fu er za d e la a socia cin ).
e m a or in ter s qu e el va lor d el c es su sign ifica cin . l va lor d e c d e
u n a ta b la tien e u n a d istr ib u cin d e p r ob a b ilid a d con ocid a en fu n cin
d e su s gr a d os d e lib er ta d , d e m od o qu e con ocien d o a m b os va lor es (c
gr a d os d e lib er ta d ) p u ed e com p r ob a r se la sign ifica cin esta d stica d e la
d ifer en cia glob a l en tr e fr ecu en cia s ob ser va d a s esp er a d a s en u n a ta b la
d e con tin gen cia , p or ta n to com p r ob a r si efectiva m en te eiste r ela cin
en tr e la s va r ia b les.
os gr a dos de lib erta d se ca lcu la n sigu ien d o la frm u la gl (n m ero
de fila s - )
(n m ero de colu m n as - ). n el e
em plo a ctu a lgl (-)
(-) . l va lor d e c , qu e a pa r ece deba
o d e la tab la gen er ad a con la
ord en ta bch i, es de ,. Un c de ,con gra d os d e lib er ta d tien e
u n a sign ifica cin esta dstica a ltsim a, con p rob ab ilida d d e qu e se d eb a a
err ores d e m u estr eo in fer ior a ,(este va lor a pa r ece en la p en ltim a
fila d e la ilu stra cin ., a la der eca del va lor de c ). e pu ed e, por ta n to,
d esca rtar la iptesis n u la d e qu e la s diferen cias ob serva da s se deba n a
err ores de m u estreo. a r ela cin en tr e voto e in gr esos es estad stica m en te
sign ificativa.
eba
o de la p ru eba d e c a pa rece la r azn de ver osim ilitu d (lielihood
ratio c ), qu e es u n a cor reccin d el c qu e se u sa pa ra m odelos log-lin ea les.
n m u estra s pequ e as difiere del valor de c, per o seg n a u m en ta el tam a o d e la m u estra a m b os valores tien den a con ver ger. u frm u la es la
sigu ien te
(.)
06/06/12 09:34
Por otro lad o, al in clu ir la op cin n ofreq, n o se m u estra la tab la de con tin gen cia, slo aparecen los estad sticos epr esam en te solicitados, com o se
p u ed e com pr obar en la ilu str acin ..
ILUSTR ACI 8.. r e b a d e c y d e Cr a e r d e n a t a b la d e c o n t in ge n c ia
Pear s on c hi 2( 12) =
Cr amer ' s V =
86. 7344
0. 1140
Pr = 0. 000
(.)
a d e r a m er lo qu e a ce es con ver tir el c en u n in d ica dor d e a socia cin d ivid in d olo p or el va lor m im o qu e p u ed e tom a r (el ta m a o
de la m u estr a m u ltip lica d o p or el m n im o n m er o d e fila s o colu m n a s
m en os ).
Un a asociacin perfecta sign ifica que todos los valores de la tabla se en cu en tran en u n a
diagonalcada valor en la variable in depen dien te se correspon de con u n valor nico en la in depen diente (el resto de las casillas ser ). n este caso, el valor de la variable in depen dien te
determ in a de m anera absolu ta el valor de la variable dependien te.
06/06/12 09:34
n este e
em p lo, tom a el valor ,, lo qu e cor r esp on d e a u n n ivel d e
asociacin b astan te b a
o. n la pr ctica, casi cu alqu ier estad stico de asociacin p ara d atos d e en cu esta se p u ed e con siderar b a
o si es m en or qu e
,m od er ado si est en tr e ,,, alto si es su per ior a ,. Por
tan to, seg n la de ram er, la asociacin en tr e n ivel de in gr esos voto es
b a
a, au n qu e sign ificativa.
an to g com o t b son estad sticos de asociacin par a var iables ord in ales.
o slo m iden la fu er za de la asociacin en tre dos var iables, sin o tam bin
su dir eccin . n este caso n o se p u ed en u sar p orqu e voto n o es u n a var iab le ord in al, sin o n om in al. Per o a qu e la asociacin en tr e voto e in gr esos
n o p ar ece ser dem asiad o im por tan te, sera con ven ien te relevan te pon er
com o segu n do e
em p lo la relacin en tre ideologa e in gresos. n este con teto , ideologa es u n a var iable or din al si slo se tom an los valores vlidos
(izqu ierd a-cen tr o-d er eca), por tan to servir de e
em p lo p ara eplicar g
t b . Para obten er la tabla, se in trod u ce la sigu ien te in str u ccin
tab u late ideologia in gresos if ideologia
in gresos
, col all
el p rogram a ofr ece tan to la tabla com o todos los estad sticos im plem en tad os.
ILUSTR ACI 8.1 . st a d st ico s d e la t a b la d e c o n t in ge n c ia
I deol og a |
I ngr es os f ami l i ar es mens ual es
ent r ev i st a |
ent r ev i st ado
do | Menos de
De 150. 00 Ms de 30 |
Tot al
- - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - +- - - - - - - - - I z qui er da |
525
514
178 |
1217
|
38. 29
39. 75
41. 40 |
39. 33
- - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - +- - - - - - - - - Cent r o |
607
574
194 |
1375
|
44. 27
44. 39
45. 12 |
44. 44
- - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - +- - - - - - - - - Der echa |
239
205
58 |
502
|
17. 43
15. 85
13. 49 |
16. 22
- - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - +- - - - - - - - - Tot al |
1371
1293
430 |
3094
|
100. 00
100. 00
100. 00 |
100. 00
Pear son c hi 2( 4)
l i k el i hood- r at i o c hi 2( 4)
Cr amer ' s V
gamma
Kendal l ' s t au- b
=
=
=
=
=
4.
4.
0.
- 0.
- 0.
2793
3678
0263
0462
0284
Pr = 0. 370
Pr = 0. 359
ASE = 0. 027
ASE = 0. 016
06/06/12 09:34
a n to g com o t b va r a n en tr e . in d ica qu e n o eiste a socia cin , qu e eiste u n a a socia cin p er fecta p ositiva (cu a n d o a u m en ta el
va lor de u n a va r ia b le ta m b in lo a ce el d e la otr a ), , u n a a socia cin
per fecta n ega tiva (cu a n d o a u m en ta el va lor d e u n a d ism in u e el d e la
otr a ). s cu r ioso cm o en este ca so la a socia cin es m u d ifer en te a la
qu e a p a r eca en tr e in gr esos voto (los por cen ta
es p a r ece qu e in dica n qu e
a m s in gr esos, m s id eologa de izqu ier d a s). e tod os m od os, a qu e
fi
a r se en la p r u eb a d e c , qu e m u estr a qu e la a socia cin qu e a p a r ece en
la ta b la n o es sign ifica tiva . o ob sta n te, se ep lica r a con tin u a cin qu
in d ica cm o se ca lcu la g p a r a en ten d er lo m e
or. l sign o n ega tivo de g
ep r esa qu e la r ela cin es in ver sa cu a n d o se su b e en la esca la d e in gr esos, la id eologa tien d e m s a cia la izqu ier d a (va lor es a ltos en in gr esos
se cor r esp on d en con va lor es b a
os en id eologa , qu e son los d e izqu ier d a ).
e todos m od os, la r ela cin es b a
sim a (,en ga m m a )
, com o a se a
se a la d o, n o sign ifica tiva . l coeficien te t b m u estr a esen cia lm en te lo m ism o, con va lor es m s ba
os, p u es a ce u n a m ed icin m s con ser va d or a d e
la a socia cin , com o se p u ed e d ed u cir a con tin u a cin d e la com pa r a cin
de su s fr m u la s.
m bos coeficien tes ord in ales pr oced en del clcu lo de los pares posibles
d e valores. Par a en ten der esto, se va a su p on er u n a tab la de con tin gen cia
ordin al com o la esqu em atizad a en el cu ad ro .
CUAR 8 .. Cr o is d e t a b la d e co n t in ge n cia o r d in a l
a r ia b le in d e e n d ie n t e
a r ia b le
d e e n d ie n t e
y
06/06/12 09:34
(.)
sien d o P c los p a res con cor d a n tes, qu e se ob tien en su m a n d o tod os
los pr od u ctos d e la s fr ecu en cia s d e ca d a ca silla p or la su m a d e tod a s la s
fr ecu en cia s d e ca silla s qu e se en cu en tr en a l m ism o tiem p o d eb a
o a la
d er eca . igu ien d o el cu a dr o ., a qu e su m a r a (efi), b (fi), d (i)
ei. Por otr o la d o, P d son los p a r es d iscor d a n tes, qu e se ca lcu la n su m a n d o tod os los p r od u ctos d e la s fr ecu en cia s d e ca da ca silla p or la su m a d e
tod a s la s frecu en cia s d e ca silla s qu e se en cu en tr en a l m ism o tiem p o a r r ib a a la der eca . s decir, en este ca so a qu e su m a r g(b cef), (cf),
d (b c) ec.
l den om in a d or (P c P d) es el n m er o tota l de p ar es de casos en
los qu e p u ed e eistir relacin or din al en tre la s va ria b les el n u m er ad or
(P c P d) es el n m ero de pa res en los qu e eiste r ela cin p ositiva m en os el
n m ero de p ar es en los qu e eiste relacin n ega tiva . Por ta n to, el sign o de
g in dica el tip o d e pa r es qu e pr edom in a en la ta b la , su va lor ep resa qu
por cen ta
e r ep resen ta este pr edom in io en el tota l d e pa r es estricta m en te
ord in a les. n este ca so, pred om in a n liger a m en te los pa r es de va lor es con
u n a rela cin n ega tiva (en los qu e la va ria b le in gresos tom a u n valor a lto
e ideologa u n o ba
o, vicever sa), p or lo qu e el n u m er ad or es n ega tivo,
por ta n to ta m b in lo es g. Por otr a p ar te, el va lor de g es m u b a
o por qu e
el n m er o de pa res con cor da n tes d iscor da n tes es casi igu al, p or lo qu e
el n u m era d or es ca si al con tr a rr esta rse u n os a otros. n efecto, si en
u n a ta b la n o u bier a relacin algu n a en tre va ria bles, el n m ero d e pa r es
con cor da n tes sera igu a l qu e el n m er o de pa res d iscor da n tes, p or lo qu e
a l r esta rse el resu lta do sera . Pa ra m a or cla rid a d, a con tin u acin se d a n
tr es e
em plos d istin tos de rela cion es en ta bla ord in a l qu e m u estr a n resu lta d os m u difer en tes
strictam en te ablan do, el n m ero total de pares que se pu eden form ar en u n a tabla
de n casos es n (n -)
, cifra esta siem pre m aor, salvo en casos ecepcionales, que la su m a
de pares concordan tes discordan tes. sta ltim a, pares estrictam en te ordinales, slo tien e
en cu en ta las pare
as de casos qu e n o tien en u n valor idn tico en tre s en u na u otra variable.
06/06/12 09:34
Gamma
Nc N d
Nc Nd
16 16
16 16
Gamma
Nc Nd
Nc Nd
16 0 16
1
16 0 16
Gamma
Nc Nd
Nc Nd
0 16
0 16
Ta b la s a r a d is t in t o s va lo r e s d e g
0
0
32
16
16
(.)
u va lo r es siem p r e m en o r qu e el d e g a l in cor p or a r m s p a r es en
el d en o m in a d o r. o s q u e in co r p or a so n los p a r es em p a ta d o s en (P ),
qu e so n in d ivid u o s q u e, ten ien d o d istin to va lo r en la va r ia b le d ep en d ien te, sin em b a r go tien en el m ism o en la in d ep en d ien tem ien tr a s qu e
los em p a ta d o s en y (P y) so n lo s qu e p o seen va lo r es d esigu a les en la in d ep en d ien te p er o igu a les en la d ep en d ien te. s d ecir, ta n to u n o s com o
otr o s p o d r a n a b er sid o co n gr u en tes o in con gr u en tes, p er o se qu ed a r o n en m ita d d el ca m in o p o r q u e en u n a va r ia b le p r esen ta n va lor es
id n ticos .
ico con otras palabras, son pares em patados en un a variable aquellos qu e tien en un
m ism o valor en esa variable u n valor superior o in ferior en la otra. Por e
em plo, volvien do al
cu adro ., el par form ado por u n caso que estu viera en la casilla (a) otro que estu viera en
la casilla (d) sera u n par em patado en la variable in depen dien te (). sea, qu e am bos casos
valen en , pero (a) es in ferior en y qu e (d).
06/06/12 09:34
8 .. s d e d o s va r ia b le s
n m u ca s oca sion es, los r esu lta d os d e u n a ta b la d e con tin gen cia d e d os
va r ia b les est n m ed ia d os p or el efecto d e u n a ter cer a va r ia b le, o d e va r ia s
m s, d esd ib u
n d ose o m ostr n d ose a s d e for m a in cor r ecta la r ela cin
en tr e la s va r ia b les d e in ter s. n estos ca sos se d eb e tr a ta r d e en con tr a r
esta s ter cer a s va r ia b les e in clu ir la s en la s ta b la s, con tr ola n d o a s su efecto. n este ca so, se a b la r d e ta b la s m u ltiva r ia b les d e con tin gen cia . n
el e
em p lo a n ter ior se a visto qu e el efecto d e los in gr esos fa m ilia r es sob r e el voto es d b il, a u n qu e eiste. a d o qu e la va r ia b le d e in gr esos est
r efer id a a l con
u n to d e los ob ten id os en u n oga r, d os p er son a s con u n
m ism o n ivel d e in gr esos fa m ilia r es p u ed en va r ia r en su situ a cin econ m ica seg n su ed a d , p u esto qu e los in gr esos n o se d istr ib u en d e m a n er a
a b solu ta m en te equ ita tiva d en tr o d e la s fa m ilia s. a m b in d os p er son a s
con u n m ism o n ivel d e in gr esos p er o d istin ta ed a d p u ed en ten er d istin ta
a ctitu d p oltica p or qu e el ciclo d e vid a p u ed e d eter m in a r la p er cep cin
d e r esp on sa b ilid a d , p or e
em p lo. n cu a lqu ier ca so, el p osib le efecto d e
la ed a d sob r e la r ela cin en tr e cla se voto es u n a ip tesis qu e se d eb er a con tr a sta r a cien d o a n lisis d e ta b la s m u ltiva r ia b les d e con tin gen cia
con ta ta .
a m a n er a d e a cer lo es u tiliza n d o la p r ein str u ccin bysort segu id a
p or la (s) va r ia b le(s) d e con tr ol, d os p u n tos la or d en esp ecfica d e la
ta b la . om o a se vio en ca p tu lo a n ter ior, bysort p er m ite e
ecu ta r u n a
m ism a or d en p a r a d ifer en tes ca tegor a s d e u n a o m s va r ia b les esp ecifica d a s a l tiem p o qu e or d en a los d a tos p a r a p od er lo r ea liza r. om o p u ed e
a p r ecia r se en el e
em p lo m s a d ela n te, el com a n d o en s qu e se em p lea
p a r a gen er a r la ta b la es ta bu la te, el m ism o qu e se em p lea p a r a ta b la s
d e d os va r ia b les, p er o p r eced id o p or bysort, el n om b r e d e la va r ia b le d e
con tr ol los d os p u n tos. ta ta m u estr a a s u n a ta b la d e con tin gen cia d e
voto p or in gr esos sep a r a d a a ra ca da u n a de la s ca tegora s de eda d. Por
ta n to, com o la ed a d a sid o r ecod ifica d a p or sim p lifica r el e
em p lo en
d os ca tegor a s, ta ta m u estr a slo d os ta b la s, con su s cor r esp on d ien tes
esta d sticos.
recode ed ad (
) (
), in to(ed adr)
label variable edad r
d ad
bsort edadrtabu late rvoto in gresos if rvoto
ingresos
, col n ofreq all
06/06/12 09:34
51. 8490
0. 1152
Pr = 0. 000
50. 2101
0. 1347
Pr = 0. 000
e qu m od o se in ter pr etan estas tab las m u ltivar iablesPara in ter pr etar este tipo d e tab las, se deb e com par ar cad a u n a de las tablas m u ltivar iab les con la tab la bivar iable origin al (en n u estr o caso, con la ilu str acin .),
las tablas m u ltivar iables en tre s. n esta com par acin se pu eden pr odu cir
las sigu ien tes cu atro situ acion es d ifer en tes
a)
a rela cin observa da en tre va ria ble in deen dien te y deen dien te se
debilita o desa a rece a l in trodu cir la va ria ble de con trol: en este ca so,
toda o pa r te de la rela cin en tr e la var ia ble in dep en d ien te dep en d ien te se deba a l efecto ocu lto de la va r ia ble de con trol, por lo qu e
a l in tr odu cir esta , la rela cin desa pa r ece. l e
em p lo cl sico es el
d e la rela cin en tre el n m ero de cig e a s la ta sa d e n a ta lida d .
i se cr u za ta sa de n a talid ad p or n m er o d e cig e a s en el m u n icipio, es pr oba ble qu e la r ela cin sea sign ifica tiva la n a ta lida d
es m a or en los m u n icipios en los qu e a m s cig e a s. u ier e
esto d ecir qu e la ca u sa d e la m a or n a ta lida d son las cig e as
06/06/12 09:34
06/06/12 09:34
eres
ven es para m u
eres m aores. l anlisis de estas tablas sera
igu al al que se a con siderado para el caso de u na sola variable de con trol, slo qu e ligeram en te m s com plicado.
8.. t r a s t a b la s e se cia le s
dem s de las in stru ccion es su m m ari
e tabu late, a partir de la versin ,
tata in clu e otras tres qu e perm iten represen tar en tablas u n a serie de estadsticos. i la prim era de las m en cion adas pu ede m ostrar los estadsticos propios
de u n a n ica variable cu an titativa la segu n da pon e en relacin las frecu en cias (absolu tas, relativas con dicion ales) de dos o m s variables cu alitativas,
las in stru ccion es qu e se m u estran en el sigu ien te apartado tien en por com etido cru zar in form acin de variables cu an titativas con variables cu alitativas. Un
e
em plo sim ple de ellos con sistira en m ostrar las distin tas m edias de ideologa
seg n la edad, el seo o am bas caractersticas de las person as en trevistadas.
a pr im era d e ellas n o es r ealidad u n a n u eva in str u ccin , sin o la m ism a
ord en tabu late aplicad a con la opcin su m m ari
e(variab le). i se opta p or
in clu ir esta ltim a, en lu gar de frecu en cias (ad em s d e p osibles p orcen ta
es
residu os) d e las variab les d e la tab la, ap arecen los pr in cipales estadsticos
d e la variab le cu an titativa epr esad a en tr e p ar n tesis.
l u so m s sim ple de esta opcin con siste en pon er u n a variable cu alitativa tras la in stru ccin u n a cu an titativa en la opcin del su m ario. i se d esean
ver las diferen tes atribu cion es ideolgicas qu e atribu en al PP los en cu estados
de distin tas edades, abra qu e redactar la in stru ccin del sigu ien te m odo
tabu la te ed adr, su m m arize(id eopp )
n realidad, m s qu e u n a n u eva in stru ccin , se tr ata d e la ord en an alizada en el apar tado an terior con u n a opcin qu e p er m ite r ep resen tar en las
casillas, los estadsticos de la variab le ep resada, en este caso, la id eologa
qu e los en trevistados atr ibu en al PP.
ILUSTR ACI 8 .1 . Ta b la d e e st a d st ico s se g n va lo r e s d e n a va r ia b le
| Summar y of At r i buci n de i deol og a
|
al PP
Edad |
Mean
St d. Dev.
Fr eq.
- - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - 18/ 49 |
7. 4254574
1. 5351508
2569
50/ 98 |
7. 4261548
1. 5507619
1537
- - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - Tot al |
7. 4257185
1. 5408244
4106
06/06/12 09:34
i p arece dem asiada in for m acin qu e aparezcan tan tos estad sticos, es
p osible om itir algu n os de ellos con las sigu ien tes opcion es, cu o n om br e ep lica p or s solo qu e es lo qu e se de
a d e r epr esen tar, n om ean sn ostan dard
n oobsn ofreq .
a segu n da in stru ccin , tabstat, se p u ed e con siderar en cam bio u n a am p liacin de la in str u ccin su m m ari
e. esto es as en u n doble aspecto. Por
u n lado, p orqu e in clu e la p osibilidad d e m ostrar m s estadsticos d e lo
bservacion es coin cide con el n m ero de casos, las frecuen cias son los casos u na vez
efectu ada la pon deracin, si la ubiere.
06/06/12 09:34
06/06/12 09:34
, sob re tod o,
U poseen u n a con cen tr acin d e va lor a cion es en tor n o a la
m edia (distr ibu cin lep toc r tica ).
a in stru ccin tabstat p er m ite adem s de m ostrar al m ism o tiem p o
las estadsticas de d iver sas var iables cr u zar estos datos por los valores d e
u n a var iable n om in al o gru p al. l m ism o e
em plo an ter ior, con slo tres estad sticos, se ofr ece p ar a cad a u n o de los d os gru p os de ed ad para el total,
si se a ade la opcin by(var iable).
tab sta t id eop p ideopsoe id eoiu , statistics(n m ean sd s) col(statistics) b (eda dr)
06/06/12 09:34
om par an d o las m ed ias p u ed e ver se qu e en el caso del PP la ed ad ap en as in flu e los otr os d os p artidos son valorados u n as d cim as m s a la
d er eca p or los
ven es qu e por los m aores. n la disp ersin d e las difer en cias en la valor acin ideolgica d e los par tid os se ve clar am en te qu e al
igu al qu e en las m edias, per o n o de for m a tan eagerada am aor es
d iferen cias en tr e p artidos qu e en tr e edad es.
in alm en te, est la in str u ccin table, qu e per m ite u n a con stru ccin verstil de tablas m u ltidim en sion ales, con la n ica lim itacin de n o ser capaz
d e gen er ar p or cen ta
es con d icion ales, es decir, p or cen ta
es ver ticales u orizon tales.
a versatib ilid ad d e esta in stru ccin resid e en el n m ero d e dim en sion es qu e p u eden ser con
u gadas en u n a m ism a tab la. n prim er lu gar, com o
en el caso de tabu latesu m m ary(var iable) o el de tabstat var iable pu ed en
u tilizar se las casillas par a repr esen tar los estad sticos d e u n a variab le cu an titativa. n segu n do lu gar, tras la in str u ccin p u ed en ep licitarse asta tr es
variab lesla pr im er a ser repr esen tad a en las filas, la segu n da en las colu m n as, la tercer a aqu r eside la d ifer en cia fu n d am en tal de esta in stru ccin
fren te al r esto an idar los valor es d e la segu n d a. u ier e ello d ecir qu e, si
en la tercera dim en sin se epon e la edad recodificad a en la segu n da los
in gr esos, se r ep resen tarn en pr im er lu gar todos los in gresos cor resp on d ien tes a los
ven es, a con tin u acin todos los cor r esp on d ien tes a los m aor es.
, p or si m s d im en sion es se pu d ieran n ecesitar, la in stru ccin table p er m ite
in trod u cir asta cu atr o variab les m s en la opcin by(listavar) para an idar
a la var iable deen dien tes ep u esta en las filas d e la tab la. dem s, com o en
tan tas otr as rd en es, tam b in p u ed e em plearse la p rein stru ccin bysort, qu e
p u ed e a adir cu an tas dim en sion es sean n ecesarias en la p resen tacin de
frecu en cias o estadsticos.
u n qu e pocas veces se n ecesiten tan tas dim en sion es, el e
em plo sigu ien te m u estr a d n d e son epu estas cada u n a d e las variab les en la tab la resu ltan te.
recod e cca a .. else, in to(com u n id ad )
la bel defin e m ad rid
ad rid
esto
la bel va l com u n id ad m ad rid
b sort com u n id adtab le rvoto in gresos edad r if in gresos , b(seo)
cellidt()
06/06/12 09:34
06/06/12 09:34
table rvoto edad r, con ten t(m ean ideopp m ean ideopsoe) form at(.f) col ro
ILUSTR ACI 8 .1 8.
Ta b la d e e st a d st ico s co n la in s t r cc i n ta b le
---------------------------------Rec uer do de |
Rec odi f i c aci on de
v ot o
|
edad
r ec odi f i cado | 18- 49
>=50 Tot al
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - PP |
6. 9
7. 1
7. 0
|
4. 2
3. 9
4. 0
|
PSOE |
7. 8
8. 0
7. 9
|
4. 0
3. 8
3. 9
|
IU |
7. 9
8. 2
8. 0
|
5. 2
5. 0
5. 1
|
Nac i onal i s t a |
7. 7
7. 8
7. 7
|
4. 7
4. 3
4. 6
|
Ot r os |
7. 8
7. 8
7. 8
|
5. 0
4. 9
5. 0
|
Bl anc o |
7. 6
7. 7
7. 6
|
4. 7
5. 0
4. 8
|
No vot o |
7. 6
7. 3
7. 5
|
4. 8
4. 5
4. 7
|
NC |
7. 3
7. 3
7. 3
|
4. 4
4. 4
4. 4
|
Tot al |
7. 4
7. 4
7. 4
|
4. 4
4. 1
4. 3
----------------------------------
06/06/12 09:34
8 .. La s t a b la s d e r e se st a lt ile
s frecu en te, sob re tod o en cu estion ar ios, ten er qu e an alizar pr egu n tas a las
qu e con vien e o a las qu e sim plem en te es posib le dar m s d e u n a resp u esta.
on los an lisis e in stru ccion es tratad os asta el m om en to estas pr egu n tas
tien en qu e ser tr atadas su bd ividin d olas en cada u n a de su s op cion es d e
r espu esta. Por e
em plo, sea la p regu n ta a del estu d io postelector al d e las
eleccion es d e .
ILUSTR ACI 8.1 . r e gn t a d e r e se st a lt ile
o ci n c d igo b in a r io
provecan do qu e est codificada con valores -, se podra utilizar la igu aldad en tre
u n a proporcin la m edia de u na variable dicotm ica para em plear la instru ccin
06/06/12 09:34
Puede com probarse qu e la presen tacin de los resultados es larga innecesariam en te. Para solventarlo, se a de recu rrir a un a rutin a o m dulo especial creado para tata, que a de descargarse de
nternet de las pginas de su revista .
n et from ttp
.stata -
ou rn al.com
softare
s
-
n et in stall st
Para variables dicotm icas, com o es el caso de las que se acaban de sealar
para el e
em plo, la instruccin para obtener una tabla no puede ser m s sencilla
m rtab pa-p a , title(
ecu erdo pu blicid ad
) n on am es
in em bargo, la salida, m ostr ada en la ilu stracin .r equ iere u n com en tar io m s eten d ido. n p rim er lu gar, con vien e fi
ar se en el fin al, d on d e
06/06/12 09:34
3065
2192
06/06/12 09:34
tas, qu e con ciertas p recau cion es pod ra in ter pr etarse com o el porcen ta
e
d e r ecu erd os de u n partido sobr e la totalid ad de p ar tidos recor dad os. el
con
u n to de r ecu er dos, casi u n son de p u blicid ad d el Partid o Pop u lar,
u n d el Par tido ocialista u n d e
zqu ierd a Un ida.
l pr ob lem a qu e p resen ta la tabla an terior es qu e su b ase (los n o filtr ad os en la pr egu n ta an terior ) es u n a p ar te n o r epresen tativa de la m u estr a
son slo aqu ellos qu e vieron pu b licidad. Por tan to, debera m od ificar se a fin
d e qu e la base sea el con
u n to d e los casos en cu estados. Par a ello aqu e
acer dos op eracion es
todos los qu e n o su pier on o n o con testaron a la p regu n ta p(la
qu e ace el papel de filtro) otor gar el valor en la var iable m ltip le
qu e r ecoge el valor n s
n c (p a, en este caso).
b) rear u n a n u eva var iable (p a, por e
em plo) qu e r eco
a a aqu ellos su
etos qu e di
eron n o en la pr egu n ta filtro, es decir, en la
pr egu n ta p, esto es, a todos aqu ellos qu e d i
eron n o aber visto
pu blicid ad de partidos p olticos en la televisin .
a)
a ven ta
a d el n u evo resu lta do est en qu e el porcen ta
e de los ca sos
est ca lcu lad o sobre el con
u n to d e la m u estra , en lu ga r de slo sob re los
qu e r ecord a ron a ber visto p u blicid ad . e este m odo, p u ed e estim a rse qu e
ap en a s el de los ciu d ad a n os m a or es d e a os vier on p u blicida d en
la ca m pa a de la s eleccion es gen era les d e de a lgu n o de los dos pa r tidos m a orita rios d el sistem a poltico espa ol. ste p orcen ta
e es ta n ba
o
com o con secu en cia d e qu e m s del de los en tr evista dos se a la ron
n o a ber visto n in g n esp acio d e p ropa ga n da electora l de alg n pa rtido o
coa licin .
06/06/12 09:34
5283
0
06/06/12 09:34
a in str u ccin p ar a elabor ar tab las de d istr ibu cion es de r esp u esta con
este tipo d e codificacin es la m ism a qu e la qu e se acaba d e escribir. o
n ico d istin to es la opcin , a qu e aqu e in d icar qu e los cd igos son
m ltiples, en lu gar d e b in arios con la op cin oly. n esta m odalidad es
con ven ien te esp ecificar otra op cin qu e r estrin
a los cd igos qu e se van a
r econ tarse tr ata de reson se(listavalores), don de la lista deb e in d icar los
valor es qu e se d esean r epr esen tar. Par a ob ten er al u n son o las fr ecu en cias
d e las dos respu estas de la pr egu n ta de la ilu stracin ., abr a qu e esp ecificar los cd igos com p ren did os en tr e .
m rtab papa , p olrespon se(
) title(
pcion es en du da
) n on a m es
06/06/12 09:34
538
4745
n este tipo de var iables es m u til u tilizar u n a opcin de esta in stru ccin llam ada in clu de, qu e in corp ora tam b in tod os los casos qu e n o an
d ado n in gu n a r esp u esta.
m rtab papa, polrespon se(
) title(
pciones en du da
) n on am es
in clu d e
06/06/12 09:34
5283
0
i se qu isier a sa b er qu p or cen ta
e ep r esa du d a , a b r a qu e con ver tir a los qu e
n o d u d a n (cod ifica d os a qu com o ) en u n n u evo va lor (, p or e
em p lo) ta b u la r lo
com o u n a ca tegor a m s. l p or cen ta
e com p lem en ta r io d e esta ca tegor a ser a el cor r espon d ien te a la s p er son a s qu e d u d a n . n este e
em p lo a b r a .qu e n o d u d a n , esto
es, u n . n con secu en cia , los qu e d u d a n son u n . s en con cr eto, d e .
en tr evista dos.
06/06/12 09:34
r t a b listava rm u l, b y(variable)
c o ln r o c e ll n o fr e c ilr cit e s t
lr c i
n esta or d en a qu e n o ta r qu e la va r ia b le sen cilla d e la s co lu m n a s a p a r ece en tr e la s o p cio n es, a n teced id a p o r by()p u ed en ob ten erse tip o s d e p or cen ta
es sim ila r es a los d e la ta b la n or m a l, a s co m o
su p r im ir la s fr ecu en cia s. a m b in se p u ed e ca lcu la r u n c co n
u n to
d e Pea r so n u o tr o b a sa d o en la r a z n d e ver osim ilitu d , o p u ed e op ta r se
p o r m ltip les p r u eb a s p o r fila s , en cu o ca so d eb er a m o s o p ta r p o r
m test o esta segu id a d e m lrch i2, a fin d e ca lcu la r la s p or el segu n d o
m to d o.
Pa r a p r o b a r la ip tesis d e q u e n o a d ifer en cia s en el r ecu er d o
d e p u b licid a d d e los p a r tid os p o ltico s d u r a n t e la ca m p a a elector a l
en tr e o m b r es m u
er es, a b r a q u e solicita r u n a ta b la d e p or cen ta
es
q u e in clu er a la s p r u eb a s m ltip les el test co n
u n to d e la c d e P ea rson
m rta b pa-p a pa , b(seo) n ofreq col cim test title(
ec
)
n on am es
Para el clcu lo de este estadstico, el program a epan de las filas a tantas com o com bin aciones em pricas eisten de m u ltirrespu estas. Un e
em plo sencillo aclarar esto ltim o.
m agin em os slo dos partidos optados. a tabla aparen tem ente tiene slo dos filas, pero pu eden
epan dirse a cuatron o elige nin gu no, slo elige el prim ero, slo elige el segun do o elige los
dos. n general, el n m ero de filas epan didas es i. in em bargo, es preciso ten er en cu en ta
que aqu e elim in ar aqu ellas com bin acion es sin n in gun a frecu en cia, a fin de obten er los verdaderos grados de libertad de la tabla.
06/06/12 09:34
chi 2/ p*
72.
34.
51.
0.
3.
12.
5.
5.
4.
11.
3.
5.
13.
4.
30.
575/
740/
829/
956/
874/
353/
525/
120/
809/
668/
833/
389/
859/
931/
741/
0.
0.
0.
0.
0.
0.
0.
0.
0.
0.
0.
0.
0.
0.
0.
000
000
000
328
049
000
019
024
028
001
050
020
000
026
000
5283
0
Pr = 0. 000
8..
e r cicio s
. r u za el u so d e
n ter n et en los d oce ltim os m eses (cisP.) por
seo, ed ad (r ecod ificada en tr es in ter valos) estu dios. u var iable
par ece ten er m aor in flu en cia(e recom ien d a p on er valor es p er didos
a los qu e n o con testan a la p regu n ta sob re
n ter n et a los estu d ios).
. alcu la los r esidu os a
u stad os d e la tabla
n ter n et por estu d ios. n
qu casillas se en cu en tr an los r esidu os sign ificativosu im plica qu e
u n os sean positivos otros n egativos
. ealiza u n cr u ce d e u so d e
n ter n et por ed ad estu d ios, con tr olan do
por seo. s d ifer en te la in flu en cia de la ed ad de los estu dios seg n
se sea om br e o m u
er
. m p lean do aora el b arm etr o de abr il d e (cis), o cu alqu ier
otr o de en er o, abr il,
u lio u octu b re, az u n a tab la con los estad sticos
pr in cip ales (n , m ed ia desviacin tp ica) d e la valor acin de los pr in -
06/06/12 09:34
cip ales lderes p olticos (P.). om p ar a estos resu ltados por id eologa
agru p ada en tr es categor as (izqu ier da, cen tro dereca).
. n el bar m etro de m ao de (cis) se ace u n a pr egu n ta de
r espu esta m ltiple (P.a) sob re las p er son as con las qu e con vive el en trevistado. ealiza u n a tabla en la qu e est recogida tam b in la categora n adie. r zala p or la edad recodificad a en cu atro in tervalos
etrae con clu sion es sobr e la r elacin en tre am b as var iables.
. on el m ism o estu d io, ob tn u n a tab la de d istr ib u cin de frecu en cias
con los pr in cipales pr oblem as del pas (P.). r zala por ideologa com en ta la in flu en cia d e la ideologa en la p er cep cin tem tica de los prob lem as del pas.
06/06/12 09:34
06/06/12 09:34
9
La r e gr e si n 1
Un aspecto d e pr im ord ial aten cin en el an lisis d e las var iables cu an titativas es el estu dio de la asociacin en tre ellas, par a averigu ar si los valores
d e u n as deter m in adas variables var an con la m ism a pau ta qu e los de otr as.
Un a per spectiva ya vista en el captu lo r elacion ad o con las com paracion es es estu d iar, por ejem p lo, si la tasa de in flacin es m ayor o m en or en
Fran cia qu e en sp a aotr a per spectiva qu e pu ede ad op tar se es la de ver si
varan con ju n tam en te, esto es, si en los m om en tos en qu e en Fran cia es alta,
tam bin lo es en spa a, m ien tras qu e cu an do el ascen so d e los p recios se
en cu en tra en cotas b ajas en Fr an cia, tam bin lo ace d e ese m odo en spa ao si, p or el con trar io, n o eiste relacin algu n a en tre los datos de cad a
u n o de estos p ases, y la evolu cin de la in flacin en u n o de estos p ases es
in depen dien te de la del otr o. on ien do otro ejem plo, p odra in d agarse en
u n con ju n to de p ases si, p or trm in o m edio, la esp er an a d e vid a de los
om b res es distin ta -m ayor o m en or qu e la d e las m u jer es, en este caso
estar am os an te u n a com paracin . in em b ar go, si se d esea averigu ar si
aqu ellos p ases en los qu e viven m s tiem po los om br es son los m ism os en
los qu e tam b in las m u jeres tien en u n a esp er an
a de vid a m ayor, en ton ces
se est an te el estu d io d e la asociacin en tre las var iables. atu ralm en te,
p u ed e darse el caso en el qu e la r elacin o asociacin sea de distin to sign o,
p u es p od ra ocu rr ir qu e los casos qu e en u n a variab le tien en valor es m s
altos, lo tien en m s b ajos en la otr a variab le. or ejem p lo, es clar o qu e en
los pases con alta ren ta per cpita, la m ortalid ad in fan til es pequ e a, p u es
los pases qu e tien en m ejor es n iveles de in gr esos su elen ten er m ejores con d icion es san itarias p ar a su s recin n acid os, por lo qu e la tasa de u n a m u erte
p ostn atal es m en or.
ara los prim os dos captulos y, en parte, tam bin para los dos sigu ien tes se recom iendan los m an uales de econom etra. n tre los m s conocidos se en cu en tran ovales
, e a
, u jarati
, ooldridge
, reen
, addala
am bin eisten
libros de econ om etra basados en tata. n tre ellos, se encu en tran am eron
y au m
. sim ism o, en focados desde el an lisis m u ltivarian te con abu ndan tes ejem plos, pueden
citarse, entre otros m u cos, air
y ea
9.1.
Nu b e d e p u n t o s, co va r ia n za y co r r e la ci n
200
GR F I 9 .1.
10000
20000
30000
PNB por unidad de compra
40000
l traar las dos ln eas d e r eferen cia qu e r ep resen tan las m edias d e cada
u n a d e las variab les, resu lta qu e la m ayor a d e los p ases se en cu en tr an o
b ien p or en cim a en m or talidad in fan til, pero por d ebajo en p rod u cto n acion al bru to p er cp ita, o bien por d eb ajo en m or talidad y p or en cim a d e la
m ed ia en ren ta. in em b ar go, au n qu e en m en or n m er o en con ju n to, tam b in ay otro gru po de p ases qu e p oseen b aja m ortalid ad y b ajo p rod u cto
n acion al bru to y slo u n caso qu e se en cu en tra con valor es por en cim a en
las dos var iables con sid er adas.
200
GR F I 9 .. Nu b e d e p u n t o s co n la s e d ia s r e p r e se n t a d a s
Sudfrica
10000
20000
30000
PNB por unidad de compra
40000
Un con cepto clave para la com pren sin de la asociacin en tre dos variables
de tipo cuan titativo es el de covarian a. om o es fcil dedu cir, procede del con cepto de varian a, es decir, del prom edio de las distan cias cu adradas de los valores con respecto a la m edia. n el caso de trabajar con dos variables, en lu gar
de un a, se pu eden calcu lar sen das distan cias con respecto a la m edia, u n a para
e
. a covarian
cada u n a de las variables
xi x
yi y
a es u n prom edio del
produ cto en tre estas dos distancias, y su frm ula adopta la sigu ien te epresin
.
a covariana pu ede adoptar cu alqu ier valor positivo o n egativo. i se divide el grfico en cu atro sectores por las m edias aritm ticas de cada u na de las
variables, es fcil advertir que los produ ctos de las diferen cias en los casos qu e
estn en el cu adran te superior de la dereca
slo u dfrica en este casoan
com o
son positivos. am bin los prode ser positivos, pu es tanto
xi x
yi y
du ctos de las diferen cias de los casos qu e se encuentran en el cu adran te inferior
iqu ierdo
por ejem plo, eorgiason su periores a porqu e am bas diferen cias
en x e y son n egativas. n cam bio, los pun tos o casos qu e se u biquen en los
cu adrantes superior i
quierdo e in ferior dereco gen eran produ ctos n egativos,
pu es u n a de las diferen cias es positiva y la otra n egativa. n este caso, com o la
m ayor parte de los pun tos se encuen tran en cu adran tes con produ ctos n egativos
y, sobre todo, las distan cias de estos a las m edias son bastan te m ayores, el su m atorio, y en con secu en cia la covarian
a, arroja u n valor por debajo de .
a t r iz d e va r ia n za s
c o va r ia n za s
( obs =125)
|
t mi
pnbppa
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - t mi |
1493. 36
pnbppa |
- 194352 6. 2e+07
a var ian
a de las tasas de m ortalid ad su p era el m illar y la del p rod u cto
n acion al bru to su per a las d ecen as de m illn . on tan gran d es porqu e estn r eferen ciad as en u n id ades cu adr ticas. a covarian a con u n valor d e
-.sale n egativa, com o se dedu jo d e los raon am ien tos ep u estos m s
ar rib a. esu lta evid en te qu e la in terp retacin de estas can tidades d epen de
d e las u n idades de m edid a qu e em p leem os en cada variable. or ello, es
con ven ien te, par a p od er reali
ar com par acion es, tr an sform ar las variab les
en u n idades tp icas, esto es, con ver tir las en otr as, lin ealm en te depen dien tes,
en fu n cin de u n a fr m u la qu e logra qu e se con viertan en var iables con
m ed ia y desviacin tpica igu al a .
.
i se r ealia esta op eracin tan to sob re la var iable x com o sobr e la var iable y, m edian te la in stru ccin egen y la fu n cin std()
ara reali
ar operacion es repetitivas sobre variables, es til la utili
acin del bu cle for.
u nque ya est descatalogado y su stitu ido en tata por in stru ccion es m s com plejas y com pletas, n o deja de ser til y sen cillo su u so. ras la in struccin se escribe u n a lista de variables
segu idas de dos pu ntos. con tinu acin se escribe otra orden en la qu e la letra m ayscu la
ser reem pla
ada por los n om bres de las variables. n el ejem plo del cu erpo del teto, la
aparece dos veces en la in struccin egen.
n clu so en un a de ellas se escribe precedida de u n a
z, lo qu e perm ite crear n uevas variables con el nom bre de las an tigu as an tecedidas por dica
letra m in scula.
al aber ap licad o u n a tran sfor m acin lin eal sob re las dos variab les
estu d iadas, el gr fico qu e repr esen ta su relacin qu ed a in alterado en com p ar acin con el an ter ior y ofrece en con secu en cia el sigu ien te asp ecto
GR F I 9 .. Nu b e d e p u n t o s d e la s va r ia b le s e st a n d a r iza d a s
1
2
Standardized values of (pnbppa)
er o, au n qu e el grfico sea sim ilar, las covar ian as son distin tas. on la
m ism a in stru ccin an tes u sada, aplicada a las variab les tr an sform ad as
correla te
tm i
p n bp pa, cova rian ce
om o p u ede apr eciar se, es la m ism a qu e si se p idier a la m atr ide corr elacion es d e las var iables or igin ales. sto es as p orqu e, m atem ticam en te,
el coeficien te de cor relacin en tr e d os var iables es igu al a la covar ian
a de
estas variab les tipificad as o, ep u esto dir ectam en te en u n a fr m u la, el coeficien te de correlacin se epr esa com o la covar ian a divid id a por las desviacion es tp icas d e am b as variab les
.
a m atrian ter ior p odr a aberse ob ten ido d e m odo m u co m s sim ple
con la in stru ccin correlate aplicada a las var iables or igin ales
correlate tm i pn bp pa
9 .. R e gr e si n sip le
eali
ar u n a r egr esin sim p le con siste en bu scar u n a ln ea qu e pase lo m s
cerca posible de los pu n tos qu e r eflejan la distribu cin con ju n ta d e dos var iables. l m od elo m s sim p le de ln ea qu e pu ede en con trar se es u n a r ecta.
on n ocion es b sicas de lgebr a, se sabe qu e u n a ln ea r ecta p u ed e rep resen tar se m atem ticam en te a travs d e u n a ecu acin .
n esta ecu acin slo resu lta d e m om en to con ocid o xi, qu e repr esen ta
los valores d e la variable predictor, en este caso, el pr odu cto n acion al b ru to
p er cpita.
yi son los valores tericos
por eso, el acen to cir cu n flejoqu e d eb er a ten er el resu ltado o variab le depen dien te
por eso, y
, si esta sigu iera
fielm en te el m od elo de la r ecta. b 0 es la con stan te d e la regresin , o pu n to
d on d e la recta corta el eje de ab scisas
el vertical
. b 1 es otr a con stan te, qu e
r efleja la in clin acin d e la r ecta
su tan gen teo, dico de otro m odo, el cam b io qu e se p rod u ce en la var iable depen dien te cu an do en la in depen dien te
se pr od u ce el au m en to de u n a u n id ad.
GR F I 9 .. R e p r e se n t a ci n a t e t ica y ge o t r ica d e u n a r e ct a
b0
b1xi
1 2xi
y
x
b1
b0
0
lin e
ylin e
sort
p n bp pan am e
, repla ce
e este m odo se obtien e el sigu ien te grfico, d on d e, ad em s de los p u n tos qu e rep resen tan a los p ases, aparece u n a recta qu e r ep resen ta el m od elo. om o clar am en te se ve, ay u n a d iscrepan cia en tr e la r ealid ad
los p u n tosy el m odelo
la recta
. ad a u n a d e las d iscrepan cias, corr esp on dien te a
u n caso, r ecibe el n om br e de residu o, qu e se ob tien e m edian te la su straccin
d e los valores tericos a los reales
GR F I 9.. N u b e d e p u n t o s y r e ct a e st ia d a d e va r ia b le s e st a n d a r iza d a s
1
Standardized values of (pnbppa)
tztmi
. ste
procedim ien to es vlido en tata slo si la orden est locali
ada en u n program a. o fu n cion a
si se in trodu ce desde la ventana interactiva de in struccion es. ara que lo aga, an de om itirse
las tres barras.
la ep resin
yi y
, qu e p or eten sin tien e ta m bin la s m ism a s p r op ieda des qu e x.
n la r egr esin basada en el criter io d e m n im os cu adrados se preten d e
n o slo qu e la su m a de r esidu os sea igu al a , ya qu e esta p rop iedad la cu m
p len in fin itas rectas, esto es, todas las qu e p asan por el pu n to
x, y
, sin o, sob re tod o, en con tr ar la r ecta en la qu e sea m n im a la su m a d e las d istan cias
al cu ad rad o de su s pu n tos con respecto a los p u n tos em p r icos, esto es, en la
qu e la su m a d e los resid u os elevados al cu adr ad o sea la m en or posible.
.
a in stru ccin del program a que perm ite obtener los parm etros b o y b 1
correspondien tes a la recta obten ida con el criterio de m n im os cu adrados
ordin arios es regress. u sin tais m s sim ple se com pon e de la orden seguida
por la variable depen dien te
resultadoy la independien te
predictora
, en este
orden
r e gr e ss vard ep varin dep
n este caso, los coeficien tes sa len com p letam en te distin tosel cor respon dien te a la va r ia ble dep en d ien te pa sa a ser d e -,, pu esto qu e seg n la n u eva r ecta en con tra da ca d a d la r qu e u n pa s a u m en ta en su
pr od u cto n a cion a l b ru to im p lica u n a r edu ccin en m illon sim a s en su
ta sa d e m or ta lida d in fa n til. el va lor ,d e la con sta n te sign ifica qu e
en el im p osible caso de qu e u n pa s tu vier a u n a pr odu ccin n u la , igu a l a
dla res per c pita , la ta sa de m or ta lida d in fa n til pr ed ica p or la r ecta
ser a del .
m o se podr an ob ten er con tata los valor es pr ed icos p or este m od eloay dos frm u las. n tr e las in str u ccion es con ocidas, la m s con ven ien te es gen erate, tal com o se io an ter iorm en te con las dos variab les tip ificad as, au n qu e en este caso aya qu e em plear los dos coeficien tes, p u esto
qu e la con stan te (b 0) n o es igu al a
gen era te ttm ib.-.
p n bp pa
cons
b
pn bppa
pnbppa.
lin e
pn b pp aylin e
tm isort
p n bp pan am e
, rep lace
50
50
100
150
GR F I 9.. Nu b e d e p u n t o s y r e ct a e st ia d a d e va r ia b le s o r igin a le s
10000
20000
PNB por unidad de compra
Fitted values
30000
9 .. o n d a d d e l a
u st e d e la r e gr e s i n
e acab a de ob ten er la recta
el m odelo lin ealqu e m ejor se aju sta a los
valor es em p r icos d e la d istrib u cin d e d os variab les. er o el m ejor n o n ecesar iam en te qu iere decir qu e sea bu en o. ar a m ed ir la bon d ad d el m odelo se
u tilian dos m ed idasu n a ab solu ta y otr a r elativa.
a m edida ab solu ta p ara evalu ar u n a r egr esin es el er ror tp ico d e la
r egr esin o desviacin tpica de los resid u ales. n el fon d o es u n p rom ed io
.
n la r egr esin d e la tasa de m ortalid ad con el p rodu cto n acion al br u to
p er cpita, el valor obten id o (Root ,) es ,. sto qu ier e d ecir qu e,
u tili
an do la segu n da d e las variables, p u ede pr ed ecir se la pr im era con u n
err or por tr m in o m edio del , , epr esad o en tan tos p or m il, por cu an to las u n id ad es de la var iable d ep en d ien te estn m edid as d e esta form a.
tam b in pu ede con sid er arse com o u n a m ed id a de la d esviacin d e las
p rediccion es, d e m odo qu e podr a pen sar se qu e u n a gr an m ayora de los
valor es observados d e la var iable d ep en d ien te estaran com pr en d idos en el
r an go s e en tor n o a los valores pr ed icos. n el ejem plo actu al el ran go
apr oim ad o estara cifr ado en , u n a cifr a n ada desde ab le, com o se
apr ecia al p en sar sob re ello.
s evid en te qu e esta m ed id a de aju ste estar m u y d eter m in ada por las
u n id ad es qu e se em pleen en la var iable d epen dien te y, en con secu en cia, si,
en lu gar de aber m edido la tasa de m or talidad en tan tos p or m il, se u bier a eco en tan tos p or cien , el valor d e e ab ra cam b iado. or eso, y par a
p od er com par ar las regresion es efectu adas en tre variab les m u y d iferen tes,
es m u y til el em pleo d e m edidas relativas d e aju ste. Un a d e las p ropied ades
qu e estas an de ten er es u n con ocim ien to pr eciso d e su s lm ites, con el fin
d e saber el gr ad o de aju ste qu e tien e la r ecta allada.
a m edida de aju ste relativo m s em plea da en la r egr esin es el R o
coeficien te de determ in acin . n rea lida d, n o es m s qu e el coeficien te
de cor relacin a l cu a dr ad o, pero se p u ede in terp reta r m ejor sa bien d o qu e
es el cocien te en tr e dos su m a s cu a dr tica sla cor respon dien te a la r egr esin y la cor r esp on d ien te a la va r ia ble d ep en d ien te.
tata calcu la e com o si los datos procedieran de u n a m u estra. or ello, en lu gar de dividir por n , lo ace por los grados de libertad
n-
, de a qu e, cu an do se ten ga un bajo n m ero
de casos, pu eda aber u n a divergencia im portan te en el resu ltado en tre esta frm u la y la qu e
u tili
a el program a estadstico.
.
n cam bio, la su m a cu adrtica de la regresin es la su m a de las d istan cias al cu ad rado de los n valores p redicos p or la regresin con r esp ecto a
la m edia aritm tica
.
a r esta de am bas su m as cu ad rticas es la ya con ocid a com o su m a d e
los resid u os al cu ad rado, o su m a cu adrtica residu al
.
, su m a d e la difer en cia al cu ad rado en tr e valor es reales y p redicos, qu e por el criterio
d e m n im os cu adr ad os or din ar ios a de ser la m en or p osible con los d atos
d isp on ibles.
.
or tan to, en tr e ellas se estab lece la sigu ien te igu aldad
.
u esto qu e la s su m a s cu a d r tica s slo p u ed en ser p ositiva s, el va lor
d e la d e la r egr esin a d e ten er com o lm ite su p er ior el va lor d e la
tota l, en el su p u esto d e qu e tod os los va lor es em p r icos se en con tr a r a n sob r e la ln ea r ecta d el m od elo. a d a esta situ a cin , el va lor d e R
ser a igu a l a . n ca m b io, si la d e la r egr esin fu er a igu a l a , esto
es, tod os los va lor es p r ed icos p or la r ecta fu er a n igu a l a la m ed ia d e la
va r ia b le d ep en d ien te, en este ca so R ser a igu a l a . m b os, y , son
los lm ites en tr e los qu e se m u eve este coeficien te d en om in a d o d e d eterm in a cin .
GR F I 9.. Gr
ico d e la d e sco p o sici n d e la va r ia n za e n la r e gr e si n
(y y ) (y y )
i
y
i
(y y)
y
y
i
y
i
.
n el ejem p lo con tem p lado
-R es igu al a ,y el cocien te variab les
casos
. l p rod u cto de am bos es tan bajo qu e el R origin al apen as se
r edu ce m ilsim as.
9 .. In
e r e n cia s e n la r e gr e si n sip le
e la ilu str acin .tan slo se a ep licad o la in ter pr etacin d e los p ar m etros b 0, b 1 , las su m as cu adr ticas y el coeficien te d e deter m in acin , p u es
el r esto tien e relacin con in fer en cias estad sticas cu ya d ificu ltad im p lica
qu e se le d ed iqu e especficam en te este apar tado. dem s, asta el m om en to
los estad sticos con tem plados se an calcu lado en y p ar a la m u estra ob ten id a. in em b argo, es com n en estadstica etrapolar los datos ob ten idos en
la m u estr a a la p oblacin d e la qu e pr oced en . n regresin p asa lo m ism o,
los clcu los qu e se ob tien en pr oceden gen eralm en te de u n a m u estra y p ar a
traslad arlos a la p oblacin ay qu e ten er en cu en ta las leyes d e la in fer en cia
estad stica.
n te tod o, es p reciso con ver tir la ecu acin m u estral de la r egr esin a su
ep resin pob lacion al
.
n el captu lo relacion ad o con las com p aracion es se in tr odu jo el con cepto d e pr u eba estad stica y cm o se pr ocede par a en u n ciar iptesis estad sticas n u las y alter n ativas. de la m ism a form a qu e pu eden realiarse
p ru ebas d e sign ificacin con m ed ias, pr opor cion es, m ed ian as, varian as,
tam bin pu eden efectu arse con los par m etros de la r egr esin , en cu yo caso
se an d e form u lar del sigu ien te m od o
.
or su p arte, en relacin con el com p ortam ien to d el estadstico b 0, tam b in con los m ism os su pu estos, su d istr ibu cin m u estr al es t-tu d en t con
(n -gr ad os d e lib er tad , m ed ia b, pero con esta otr a d esviacin tp ica
.
or a bien , m s im por tan te en este con teto qu e las frm u las es la in ter pr etacin y u so d e estos er ror es tpicos. ar a ep licarlo, es con ven ien te
volver al resu ltado an terior d e la regresin d e la tasa de m or talidad in fan til
con el pr od u cto b ru to n acion al per cpita
ILR IN 9.. R e gr e si n sip le
Sour c e |
SS
df
MS
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - Model |
75976. 9095
1 75976. 9095
Res i dual |
109199. 139
123 887. 797874
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - Tot al |
185176. 048
124 1493. 35523
Number of obs
F( 1,
123)
Pr ob > F
R- s quar ed
Adj R- s quar ed
Root MSE
=
=
=
=
=
=
125
85. 58
0. 0000
0. 4103
0. 4055
29. 796
-----------------------------------------------------------------------------t mi |
Coef .
St d. Er r .
t
P>| t |
[ 95% Conf . I nt er val ]
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - pnbppa |
- . 0031526
. 0003408
- 9. 25
0. 000
- . 0038272
- . 002478
_cons |
65. 15607
3. 604551
18. 08
0. 000
58. 02108
72. 29106
------------------------------------------------------------------------------
. esd e el pu n to d e
vista pr ctico, en tan to se cu m p lan los su pu estos eplicad os m s adelan te,
si la p rob ab ilidad es m en or del o d el , seg n sea el n ivel de sign ificacin ad optad o, se p u ed e r eca
ar la iptesis n u la sob re el coeficien te.
tr o m od o de plan tear lo m ism o es a travs de los in tervalos de con fian a, qu e se obtien en con las sigu ien tes operacion es
.
sien d o t c el valor cr tico de d os colas de la distrib u cin t de tu d en t
con el n ivel de con fian
a igu al a c y n -gr ados de libertad .
n el ejem plo de la ilu str acin p reced en te los valores de los in tervalos se
ob ten dr an con las sigu ien tes operacion es
.
om o en am b os casos los dos lm ites d el in tervalo tien en el m ism o sign o
.
n la regresin sim ple la pr u eb a de ald n o es m u y im por tan te, ya qu e
slo eisten d os coeficien tes
la con stan te y el corr esp on dien te al pred ictor
,
cu ya com paracin n o tien e sen tid o p or ser de tan diferen te in terp retacin .
tata perm ite el em pleo del test de ald a travs de la in stru ccin test, en la
qu e deben especificarse las variables cu yas iptesis qu ieren com probarse, ju n to con el valor, en el caso de qu e se qu ieran com probar valores distin tos de .
en se dos ejem plos de esta in stru ccin . n p rim er lu gar, si se qu ier e
acer la ip tesis de qu e tan to la con stan te com o el coeficien te son n u los.
n cu yo caso
test con s p n bp pa
_c ons = 0
pnbppa = 0
F(
2,
123) =
Pr ob > F =
171. 17
0. 0000
pnbppa = - . 003
F(
1,
123) =
Pr ob > F =
0. 20
0. 6551
.
n el d e la residu al respon d er a a esta otr a
.
con el cocien te de am bas m edias cu adrticas se obtien e el estadstico F
.
e sab e qu e este n u evo estadstico tien e u n a distr ibu cin de n ed ecor
con (-1) y (n -) gr ad os d e lib er tad , a par tir de la cu al pu ede calcu larse la
p rob ab ilidad d e qu e se d este valor o u n o m ayor.
a ip tesis n u la con la qu e se trabaja en este caso es la d e qu e el par m etro es igu al a . s sim ilar a la qu e se form u laba an ter iorm en te con la
d istr ib u cin de tu den t. e eco, en la regresin sim p le se d a la sigu ien te
r elacin en tr e am b os estad sticos d e sign ificacin
.
n con secu en cia lgica, siem pr e qu e sea sign ificativo el coeficien te b 1,
tam bin lo ser la r egr esin en la qu e est in clu ido.
9 .. R e gr e si n lt ip le
dem s de la con stan te y u n a var iable in depen dien te, en la regresin pu ed en in trod u cir se otr as variab les con u n a d oble fin alidadla d e m ejor ar la
p rediccin d e la variab le d ep en d ien te y la d e con tr olar la in flu en cia qu e
sob re ella tien en el r esto d e las var iables in clu id as en la regresin .
.
sien d o el n m ero d e var iables in depen d ien tes.
ar a obten er u n a r egr esin m ltip le con el pr ogr am a tata b asta con
a adir a con tin u acin de la pr im era variab le in dep en d ien te tan tas com o
se d eseen in tr odu cir, con la lim itacin d e qu e n o pu eden in clu irse m s del
n m ero de casos d e qu e se dispon ga.
or tan to, a la regresin an ter ior p od ra a adr sele u n a n u eva variab le y,
d e este m od o, la r egr esin aju sta el p lan o qu e pasa lo m s cer ca posib le de
los p u n tos qu e se alan en u n plan o tr id im en sion al, d os de cu yas dim en sion es son las var iables in d ep en d ien tes y la tercera es la var iable d ep en d ien te.
n este caso, adem s del p rod u cto in ter ior br u to, se in tr od u ce en la r egr esin el por cen taje de este qu e es d eb id o al sector agr cola, con la su posicin
d e qu e los pases en los qu e tien e m s peso el pr im er sector poseen u n a tasa
d e m or talidad in fan til su p er ior.
regress tm i pn bp pa piba g
l for m ato d e la salida es idn tico al de la r egr esin sim ple. o n ico
qu e lo diferen cia es la adicin de u n a ln ea corr esp on dien te a u n a var iable
con el valor de su coeficien te, er ror tpico, sign ificacin e in tervalos d e con fian a.
ILR IN 9.9 .
R e gr e si n lt ip le
Sour c e |
SS
df
MS
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - Model |
102524. 348
2
51262. 174
Res i dual |
82651. 70
122 677. 472951
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - Tot al |
185176. 048
124 1493. 35523
Number of obs
F( 2,
122)
Pr ob > F
R- s quar ed
Adj R- s quar ed
Root MSE
=
=
=
=
=
=
125
75. 67
0. 0000
0. 5537
0. 5463
26. 028
-----------------------------------------------------------------------------t mi |
Coef .
St d. Er r .
t
P>| t |
[ 95% Conf . I nt er val ]
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - pnbppa |
- . 0015201
. 0003958
- 3. 84
0. 000
- . 0023036
- . 0007366
pi bag |
1. 323406
. 2114112
6. 26
0. 000
. 9048969
1. 741916
_cons |
29. 5263
6. 504691
4. 54
0. 000
16. 64962
42. 40299
------------------------------------------------------------------------------
es con ven ien te fijarse en estos cam bios, p er o p reviam en te es p reciso r eparar
en lo qu e perm an ece in alterado.
u ed e ver se tam bin cm o lo n ico qu e n o cam b ia, ad em s del n m er o
d e casos , es la su m a y m ed ia cu adr ticas de la var iacin total. so es as
p or u n a r a
n m u y sen cilla, la variab le resu ltado n o cam bia y, por tan to, la
su m a de las d esviacion es d e los valor es de esta var iable con r esp ecto a su
m ed ia es con stan te cu alqu ier a qu e sea el n m ero de variab les in depen d ien tes qu e se in trodu can en el m odelo .
n cam bio, son difer en tes la s su m a s cu a dr tica s d e la r egr esin y la
r esidu a l. s obvio qu e cu a n ta s m s var ia bles in corpor em os a u n a r egr esin , el a ju ste ser ta n to m a yor, y slo en el ca so de in trod u cir u n a var ia b le n a d a r eleva n te pa ra la depen dien te, el valor d e la su m a cu a dr tica d e
la regresin sera igu a l al a n terior sin la n u eva va r ia ble in tr od u cida . la
in versa , la su m a de r esidu os a l cu ad ra do se ir acien do ca da vem s p equ e a a m edid a qu e se va ya n in trodu cien do m s va ria b les in dep en d ien tes
r eleva n tes.
os gr ados d e libertad sigu en la ten d en cia op u esta. or cada var iable
in trod u cida en la regresin , los grados d e lib er tad d e su su m a cu adr tica
au m en tan en u n a u n id ad , m ien tr as qu e los d e la resid u al dism in u ir n en u n
p u n to por p arm etr o calcu lab le.
l ca m b ia r tan to la s su m a s cu a dr ticas d e la r egr esin y de los resid u os com o su s r espectivos gra d os de libertad , es obvio qu e tam bin a n
d e ca m b ia r la s m edia s cu a dr tica s y los esta dsticos y R , qu e de ellos
se der iva n p or c lcu lo, com o es ob vio a l ea m in a r la s fr m u las
.y
.
. stos d os ltim os son m ayor es a m ed ida qu e el m odelo in cor pora
m s var ia bles.
ecu rd ese qu e R es el coeficien te d e deter m in acin y epr esa el porcen taje d e la var ian
a d e la variab le d epen dien te qu e es eplicado p or el
con ju n to d e in d ep en dien tes, m ien tr as qu e es u n estadstico d e sign ificacin qu e es cap ad e com p rob ar sim u ltn eam en te la ip tesis d e qu e tod os
los coeficien tes de la r egr esin sean igu al a , es d ecir, pr u eba la certidu m b re de qu e sea cier ta la sigu ien te r elacin
n la m ayor parte de las ocasion es tam bin cam bia el n m ero de casos. n gen eral,
siem pre que las n u evas variables in corporadas posean casos perdidos en tre sujetos con valores
vlidos en las variables de m odelos m s sim ples, el n m ero de casos ser inferior en tan tos
enteros com o casos perdidos con esas caractersticas aya.
odra ocu rrir, sin em bargo, qu e el n m ero de casos en la regresin descendiera al incluir m s variables in depen dientes que con tribu yeran a dism in uir el tam a o m u estral. n estos
casos descendera necesariam en te la su m a cu adrtica total.
.
s decir, la m ortalid ad in fan til es in icialm en te de , en u n su p u esto p as cu yo p rod u cto in terior per cpita fu er a n u lo, y p or cada dlar qu e
au m en ta el
, esa cifr a dism in u ye en m ilsim as.
in em bargo, al in trodu cir la var iable porcen taje d el p rod u cto in terior
b ru to atr ibu id o a la agricu ltu r a, la ecu acin cam b ia a la sigu ien te
.
n este caso, u n pas sin
n i pr od u cto agr ar io ten dr a u n a m ortalid ad
in fan til p rom ed io del , , y por cada d lar d e au m en to en el p rod u cto
in ter ior b ru to bajara la tasa de m or talidad m ilsim as y, en con dicion es
igu ales d e ren ta, p or cada p u n to qu e su b iera el por cen taje del pr od u cto agr cola, la tasa de m or talidad in fan til su b ir a u n , .
os asp ectos son su ficien tem en te im por tan tes a la or a de in terp retar
estos coeficien tes
. o p rim er o es qu e el valor d el coeficien te depen de d e las u n id ad es
en las qu e estn m edid as pr in cipalm en te las variab les p red ictoras,
pero tam bin de la variab le resu ltado, au n qu e esta sea m en os tr ascen d en te, por qu e es n ica, en tan to qu e los coeficien tes d e cad a variab le in d ep en d ien te se refier en a u n id ad es d istin tas en tr e s.
ara solucionar este problem a se puede recurrir a la estan dari
acin de los coeficientes, operacin qu e puede plantearse de dos form as,
que dan lugar al m ism o resultado. a prim era es m s com pleja de rea-
li
ar, pero refleja bastante m ejor el planteam ien to del procedim ientose
trata de convertir todas las variables de la regresin en valores tpicos,
esto es, m edia y desviacin tpica . i se reali
a la regresin con las
variables tipificadas, los coeficientes resu ltan tes seran los coeficientes
estandari
ados, que podran interpretarse com o el cam bio en unidades
de desviacin tpica de la variable depen diente, que im plica el cam bio en una un idad de desviacin tpica de la variable in depen diente en
cuestin, m anten ien do constan te el resto de las variables. a segu nda
es m s inm ediata en su clculo y con siste en m u ltiplicar el coeficien te
original por la desviacin tpica de la variable dependiente y dividirlo
por el de la independiente. e les denom in a coeficien tes beta, aunque
no deban con fun dirse con los parm etros b de la poblacin que se estim an a partir de los estadsticos b de la m uestra.
.
n tata, en la regresin m ltip le, com o en la sim p le, p u ed en ob ten erse estos coeficien tes estan dariad os, en lu gar d e los origin ales,
sim plem en te a adien do la op cin beta. dem s, com o ya se an ob ten ido los datos gen erales del m od elo de varian a, pu ed e a ad irse otra
op cin p ara qu e n o m u estre el an lisis de varian a de la regresin n i
el coeficien te de determ in acin . e trata d e la op cin n oead.
regress tm i p n bp pa p ibag, beta n oead
R e gr e si n sin ca b e ce r a
-----------------------------------------------------------------------------t mi |
Coef .
St d. Er r .
t
P>| t |
[ 95% Conf . I nt er val ]
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - pnbppa |
. 0020745
. 000961
2. 16
0. 033
. 0001719
. 0039772
pi bag |
1. 142371
. 2033324
5. 62
0. 000
. 7397867
1. 544955
l i nt f no |
- . 1533458
. 0376802
- 4. 07
0. 000
- . 22795
- . 0787416
_cons |
34. 82963
6. 23195
5. 59
0. 000
22. 4908
47. 16846
------------------------------------------------------------------------------
.
. l cocien te en tre cada coeficien te y su error tpico posee en
m u estras aleatorias u n a distribu cin de t de tu den t con n --grados
de libertad. u an do el n m ero de casos m en os el de parm etros es
su perior a , en ton ces la distribu cin pu ede con siderarse n orm al, y
si el valor absolu to del m en cion ado cocien te es su perior a ,, podra
con siderarse sign ificativo con u n riesgo de error estadstico de tipo
,
in ferior al . n este ejem plo se ve qu e todos los coeficien tes son
sign ificativam en te distin tos de , lo cu al n o sign ifica n ecesariam en te
qu e la relacin sea fu erte. n el caso de m u estras gran des, relacion es
m u y dbiles pu eden m ostrar coeficien tes sign ificativos.
obre todo, la precau cin m s im portan te de todas es la alta correlacin entre estos
tres predictores, especialm en te, entre el produ cto nacion al bru to per cpita y el n m ero de
ln eas telefn icas, que es m ayor de ,. ase el problem a de la m u lticolin ealidad en el prim o captu lo.
9.. R e gr e si n co n va r ia b le s
ict icia s
u n qu e los m ecan ism os m a tem ticos de la regresin sea n p ropios d e va ria b les cu a n titativa s, ta m b in se p er m ite la in tr odu ccin de va riab les cu a lita tiva s, siem pr e y cu a n do se tom en p reca u cion es. or ejem plo, ten ien do
u n a var ia ble en la ba se de da tos com o el con tin en te, qu e in clu ye cin co
va lores a rb itr a ria m en te codificad os desd e a l
u ropa a sta el
cea n a
, n in g n sen tid o ten d ra in tr odu cir la com o va ria b le in dep en d ien te. n
ca m b io, si tom a m os u n o de los valor es d e esta va r ia ble y se tr a n sform a
en u n a n u eva va ria b le dicotm ica con va lor es y , los coeficien tes d e la
regresin y esta m ism a a d op ta n u n sign ifica do in ter pretab le, pu esto qu e
la u n ida d repr esen ta la ca ra cterstica qu e repr esen te al va lor. Un ejem plo
pu ede a cla ra r lo qu e se aca ba d e d ecir. i se seleccion a el va lor frica ,
cod ifica do com o , den tr o d e la va riab le con ti, se tr an sfor m a en , y el
con ju n to de p ases qu e n o est n situ a dos en el con tin en te a fr ica n o se les
otorga el va lor de , el coeficien te p rop io d e la n u eva va r ia ble a frica sign ifica r la d iferen cia m edia de valores en la var ia ble d ep en d ien te, la ta sa
de m orta lid ad in fa n til en este ca so, en tre los p ases a fr ica n os y el r esto,
m a n ten ien d o con sta n te los va lores d el resto d e la s va r ia bles in clu ida s en
la regresin .
ar a r ealiar la regresin con este tip o de var iables, la solu cin m s
eviden te es la de crear la n u eva var iable y, u n a vequ e ya est creada, se
in trodu ce en la r egr esin
gen era te africa
con tiif con ti.
regress tm i pn bp pa africa
r as la ejecu cin de estas dos in str u ccion es, la regresin r esu ltan te es la
sigu ien te
ILR IN 9 .1. R e gr e si n lt ip le co n va r ia b le
ict ic ia
Sour c e |
SS
df
MS
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - Model |
129825. 14
2 64912. 5701
Res i dual |
55350. 9078
122 453. 695966
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - Tot al |
185176. 048
124 1493. 35523
Number of obs
F( 2,
122)
Pr ob > F
R- s quar ed
Adj R- s quar ed
Root MSE
=
=
=
=
=
=
125
143. 08
0. 0000
0. 7011
0. 6962
21. 3
-----------------------------------------------------------------------------t mi |
Coef .
St d. Er r .
t
P>| t |
[ 95% Conf . I nt er val ]
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - pnbppa |
- . 0018975
. 0002695
- 7. 04
0. 000
- . 002431
- . 001364
af r i c a |
50. 70149
4. 653904
10. 89
0. 000
41. 48862
59. 91436
_cons |
41. 61537
3. 362865
12. 37
0. 000
34. 95824
48. 2725
------------------------------------------------------------------------------
con n ect
l l . .lp attern
solid dassym b ol
i i o s
ytitle
sort
pn b pp an am e
, replace
n el gr fico p u ed e ver se claram en te qu e la in trod u ccin d e u n a var iab le d icotm ica gen er a d os pr ediccion es paralelas. n la ln ea con tin u a se
en cu en tra la d e los pases african os, m ien tras qu e la discon tin u a se refier e
al r esto d e los con tin en tes. sta ltim a n ace en el eje d e ord en adas en la
con stan te d e la r egr esin
,
, qu e es el valor esp er ado d e la tasa d e m ortalid ad in fan til de u n p as n o afr ican o. n cam b io, la ln ea african a arr an ca
,pu n tos m s arr iba
este es el coeficien te de la variab le ficticia africa
,
esto es, en tor n o a los .
GR F I 9 .. R e p r e se n t a c i n gr
ica d e u n a r e gr e si n co n va r ia b le
d ico t ic a
5000
10000
15000
PNB por unidad de compra
Ajuste africano
Tmi africana
20000
Ajuste resto
Tmi resto
m bas rectas son paralelas y su in clin acin r efleja el efecto d el pr odu cto
n acion al en la m ortalid ad. e tr ata de rectas d escen den tes
coeficien te n egativo-en la m ed ida en qu e esta var iable tien e u n a in flu en cia p ositiva
en el d escen so de la m ortalid ad in fan til. or cad a m il dlar es, baja pr cticam en te dos p u n tos la tasa. ste m odelo asu m e qu e el efecto del pr odu cto
n acion al b ru to es igu al en fr ica qu e en el resto de los con tin en teslo qu e
p u ed e ser du doso. s ad elan te se ver cm o reali
ar u n a r egr esin qu e n o
asu m a qu e am bas rectas sean par alelas.
l aber tran sfor m ado slo u n o de los cin co valores origin ales de la
variab le n om in al se pier de in for m acin . o se sabe cu l es el efecto de los
otr os con tin en tes. a solu cin est en crear tan tas variables com o valores
-dispon ga la var iable. n este caso, pu esto qu e ay cin co con tin en tes, se
d eb er an crear para disp on er de toda la in for m acin cu atro variab les y d ejar
u n o de los valores com o r eferen cia. u ede ser cu alqu iera, p ero par a ob ten er
u n a r egresin con sim ilar in form acin , se va a d ejar com o categor a b ase el
valor frica d e la variab le con tin en te, codificad o com o el valor . u n qu e
lu ego se m u estre u n a in str u ccin esp ecfica para ello, p u ed e recor dar se lo
visto en el cap tu lo de tran sfor m acion es y cr ear se m edian te u n a in stru ccin
r ecu rsiva en u n a sola in stru ccin . or ejem p lo, d e este m odo
e presen ta u n nu evo y m s com plejo uso del for, qu e im plica dos parm etros qu e cam bian de m odo paraleloun o n u m rico (n u m ) y otro tetual, qu e represen ta tetos em pleados
para gen erar n uevas variables (an y). m bas listas estn separadas por y term in an con los dos
pun tos. a prim era se llam a en la in stru ccin con , la segu n da con .
con tin u acin ya p u ed e for m u larse la regresin con las cu atro n u evas
variab les creadas, desde eu ropa asta ocean ia
regress tm i pn b pp a eu ropa-ocea n ia
Number of obs
F( 5,
119)
Pr ob > F
R- s quar ed
Adj R- squar ed
Root MSE
=
=
=
=
=
=
125
59. 89
0. 0000
0. 7156
0. 7037
21. 036
-----------------------------------------------------------------------------t mi |
Coef .
St d. Er r .
t
P>| t |
[ 95% Conf . I nt er v al ]
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - pnbppa |
- . 0016082
. 0002996
- 5. 37
0. 000
- . 0022015
- . 0010149
eur opa |
- 59. 75014
6. 163719
- 9. 69
0. 000
- 71. 95492
- 47. 54536
asi a |
- 45. 83031
5. 304399
- 8. 64
0. 000
- 56. 33355
- 35. 32707
amer i c a |
- 52. 55179
5. 895357
- 8. 91
0. 000
- 64. 22519
- 40. 8784
oceani a |
- 46. 6498
13. 13383
- 3. 55
0. 001
- 72. 65608
- 20. 64351
_c ons |
91. 77734
3. 550267
25. 85
0. 000
84. 74745
98. 80722
------------------------------------------------------------------------------
p red ict p tm i
toay
scatter tm i p n bpp a, legen d
lab el
frica
m rica
sia
u rop a
cea n a
if
e
sam ple
tm i ptm i
, ytitle
100
GR F I 9.9.
10000
20000
PNB por unidad de compra
Tasa de mortalidad infantil (1988)
mrica
uropa
30000
frica
sia
ceana
tese, adem s, que la in stru ccin toay con tiene seis grficos distin tos qu e se represen tan en las m ism as coordenadas cada u n o con su s propias opciones. ero, adem s, term ina
con dos ln eas de cdigos qu e afectan al con ju nto del grfico. a prim era es u n a seleccin de
casos qu e slo evita represen tar los pases qu e n o estn en la regresin
e(sam ple)
, as com o
los qu e no tienen un a tasa de m ortalidad etrem adam en te alta
tm i100
, n i u n pron stico n egativo de este in dicador
ptm i0
la segu nda son las opcion es qu e repercuten de m odo gen eral
en el grfico com pu esto. lgu nas de ellas, com o legen d e ytitle, pueden colocarse in distin tam en te en cada grfico o en el con ju n to.
om o pu ede dedu cir se d e los r esu ltad os, la r espu esta a la p rim er a p regu n ta es p ositiva y a la segu n d a es n egativa.
ILR IN 9.1. r u e b a s d e ip t e sis so b r e igu a ld a d
d e p a r e t r o s e n la r e gr e si n
( 1)
eur opa - as i a = 0
F(
( 1)
1,
119) =
Pr ob > F =
5. 68
0. 0187
as i a - amer i c a = 0
F(
1,
119) =
Pr ob > F =
1. 29
0. 2589
tr o m od o m s directo y m u co m s cm odo de pr oceder a la creacin d e va riab les ficticia s es m ed ia n te el u so de fa ctor es en ta ta. esde
su ver sin u n dcim a cu a lqu ier var ia ble discr eta es su scep tible d e ser em p lea da en la m ayor pa rte de la s in str u ccion es com o u n con ju n to d e va ria b les dicotm icas o ficticia s. u a lqu ier va ria b le qu e slo con ten ga va lor es
en teros p u ed e ser r efer en cia d a con el pr efijo i segu ido d e u n pu n to, en
cu yo ca so se crea n
n version es an teriores tam bin era posible u sar factores, aun que para ello era n ecesario em plear la prein stru ccin xi. s detalles de esta posibilidad pu eden en con trarse en elp xi.
am bin en la versin sigue eistien do esta posibilidad, com o pu ede com probarse en tata
e-
.
ILR IN 9.1. R e gr e si n lt ip le co n va r ia b le s
ict icia s a u t o t ic a s
a c t o r e s
Sour c e |
SS
df
MS
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - Model |
132516. 756
5 26503. 3511
Res i dual |
52659. 2923
119 442. 515061
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - Tot al |
185176. 048
124 1493. 35523
Number of obs
F( 5,
119)
Pr ob > F
R- s quar ed
Adj R- s quar ed
Root MSE
=
=
=
=
=
=
125
59. 89
0. 0000
0. 7156
0. 7037
21. 036
-----------------------------------------------------------------------------t mi |
Coef .
St d. Er r .
t
P>| t |
[ 95% Conf . I nt er val ]
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - pnbppa |
- . 0016082
. 0002996
- 5. 37
0. 000
- . 0022015
- . 0010149
|
c ont i |
2 |
13. 91983
5. 838961
2. 38
0. 019
2. 358107
25. 48156
3 |
59. 75014
6. 163719
9. 69
0. 000
47. 54536
71. 95492
4 |
7. 198347
6. 102943
1. 18
0. 241
- 4. 886089
19. 28278
5 |
13. 10034
12. 66966
1. 03
0. 303
- 11. 98684
38. 18753
|
_cons |
32. 0272
5. 476525
5. 85
0. 000
21. 18313
42. 87126
------------------------------------------------------------------------------
, frica
, m rica
y
cean a
. o apar ece el
u r opa
, pu es, p or om isin , este recu rso d eja
com o categor a base el pr im er valor d e la variab le categr ica y, en este caso,
corr esp on de a este con tin en te. or tan to, aor a los coeficien tes n o m ar can
la difer en cia de u n con tin en te con respecto a fr ica, tal com o se io en el
caso an ter ior, sin o con r esp ecto a u rop a y, au n qu e esta r egr esin eplica
lo m ism o qu e la an ter ior, en tr e las variab les ficticias de los con tin en tes slo
apar ecen com o sign ificativas las corr espon dien tes a fr ica y a sia, porqu e
el r esto de los con tin en tes n o tien en tasas de m or talidad in fan til su stan cialm en te difer en tes d e las de u rop a, qu e es la con sid er ada en este caso base.
ay u n a m an era fcil de cam b iar la categor a base. s epr esan d o en tr e
la i y el pu n to u n a b segu id a d el valor qu e se d esea tom ar com o tal.
regress tm i pn bp pa ib .con ti
sin con la m ism a in str u ccin qu e an ter iorm en te, el r esu ltad o sera com o
el ep u esto en el pr im er ejem plo
ilu str acin .
. o n ico qu e cam biar a
ser a el n om br e d e las variab les n d ices o ficticias.
9 .. R e gr e sio n e s co n in t e r a cci n
ay d os m an er as de en ten d er las in teraccion es. or u n lad o, si la r elacin
en tr e dos var iables dep en d e de los valor es de u n a tercer a, estam os an te u n a
clara situ acin de in teraccin . igu ien d o con el ejem plo an ter ior sim p lificad o al con tin en te african o fr en te al r esto, abr a in ter accin en tre la tasa d e
m or talidad in fan til, el pr odu cto n acion al br u to per cpita y el con tin en te, si
la relacin en tr e las dos p rim er as var iables fu er a distin ta seg n si el p as se
en cu en tra en fr ica o fu era de ella.
am bin se dice qu e ay in teraccin cu an do dos variables tien en u n a in flu en cia con ju n ta en u n a tercera. con ju n ta n o sign ifica qu e am bas pu edan
in flu ir por su lado, sin o qu e in ciden slo o adicion alm en te en el resu ltado si se
da u n a com bin acin especfica de valores en los predictores. e podra pon er
u n ejem plo sim ple dicien do qu e agu a y lu in teract an en el crecim ien to de las
plan tas. or m u ca agu a con qu e se riegu e u n vegetal por s solo, o por m u ca
lu qu e se le proporcion e sin qu e se le a ada agu a, este ser vivo n o sobrevivir
adecu adam en te. e n ecesita la accin con ju n ta de am bos agen tes.
l m odo de trabajar con in teraccion es en u n a regresin es m edian te la
m u ltiplicacin de las variables in depen dien tes. l porqu es as se ve m an ifiestam en te en variables dicotm icas, n dices o ficticias. om an do el ejem plo
an terior y recodifican do las variables lu z y agu a a presen cia y au sen cia , al m u ltiplicar am bas, slo da el valor u n idad en el caso de qu e am bas sean igu al a
R 9.1.
u a d r o d e la in t e r a cci n e n t r e d o s va r ia b le s
gu a
Lu z
In t e r a cc i n
ive
os son las propiedad es qu e p u ed en d escu b rirse en la cu adro .. n p rim er lu gar, qu e la in teraccin se obtien e m u ltip lican d o los valores d e las variab les origin ales y, en segu n do lu gar, qu e el valor qu e m ejor predice el prod u cto
Number of obs
F( 3,
121)
Pr ob > F
R- s quar ed
Adj R- s quar ed
Root MSE
=
=
=
=
=
=
125
123. 71
0. 0000
0. 7541
0. 7480
19. 398
-----------------------------------------------------------------------------t mi |
Coef .
St d. Er r .
t
P>| t |
[ 95% Conf . I nt er val ]
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - pnbppa |
- . 0017201
. 0002479
- 6. 94
0. 000
- . 0022108
- . 0012294
af r i c a |
68. 87338
5. 53297
12. 45
0. 000
57. 9194
79. 82735
pnbppaXaf r ~a |
- . 0090408
. 0017696
- 5. 11
0. 000
- . 0125441
- . 0055375
_cons |
39. 975
3. 07931
12. 98
0. 000
33. 87869
46. 0713
------------------------------------------------------------------------------
Un a m ejor com pren sin de este an lisis se con sigu e represen tan do grficam en te el m odelo. ara con segu ir el grfico ., abra qu e acer dos prediccion es por separadou n a para el con tin en te african o y otra para el resto.
sim ism o, para represen tar los pu n tos de los con tin en tes con distin ta form a, se
an vu elto a u tiliar las variables em pricas de la tasa de m ortalidad in fan til di-
feren ciadau n a con los valores african os (tm ia) y otra con el resto de los valores (tm ir). as in stru ccion es para gen erar este grfico, in m ediatam en te despu s
de aber solicitado la regresin con el efecto in teractivo in clu ido, an sido
p red ict ptm iif
africa
label var p tm i
ju ste resto
p red ict ptm iif a frica
label var p tm i
ju ste african o
sca tter ptm iptm itm ia tm ir pn b pp a if e
sam p le ptm i,
con n ect
l l . .
lp attern
solid da ssym b ol
i i o s
ytitle
GR F I 9 .1 . R e p r e se n t a c i n gr
ica d e u n a r e gr e si n co n in t e r a cci n
5000
10000
15000
PNB por unidad de compra
Ajuste africano
Tmi africana
20000
25000
Ajuste resto
Tmi resto
-p ib ag
sta in stru ccin gen era la variab le qu e rep resen ta la in teraccin se alad a. om o p u ed e ap reciarse, se a obten ido el porcen taje d el
n o agrario,
restan d o de el porcen taje corresp on dien te a la produ ccin agrcola. Un a
vequ e se obtien e la n u eva variab le, pu ede ser in trodu cid a en la regresin .
, a con tin u acin , se gen er a la ecu acin con los dos efectos pr in cipales
Number of obs
F( 3,
121)
Pr ob > F
R- s quar ed
Adj R- s quar ed
Root MSE
=
=
=
=
=
=
125
104. 12
0. 0000
0. 7208
0. 7139
20. 671
-----------------------------------------------------------------------------t mi |
Coef .
St d. Er r .
t
P>| t |
[ 95% Conf . I nt er val ]
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - pnbppa |
- . 0565354
. 0064721
- 8. 74
0. 000
- . 0693487
- . 0437222
pi bag |
1. 683842
. 1731587
9. 72
0. 000
1. 341029
2. 026655
pnbXpi bnag |
. 0005579
. 0000656
8. 51
0. 000
. 0004281
. 0006877
_cons |
47. 45577
5. 578999
8. 51
0. 000
36. 41067
58. 50087
------------------------------------------------------------------------------
os tres coeficien tes, adem s del correspondien te a la con stan te, son significativos. a m ortalidad in fan til desciende con el au m en to del produ cto nacion al
bruto per cpita, asciende a m edida qu e el porcentaje del
sea m s agrario,
pero tam bin au m en ta a m edida qu e se produ ce u n a conju ncin de au m en to de
ren tas y de produ ccin n o agraria. in em bargo, esta ecu acin posee un problem a im portan te qu e se ver cu ando se aborden los diagnsticos de la regresin .
am b in , com o es ob vio, a p artir del prim er ejem p lo d ad o se pu eden con str u ir in ter accion es con variab les categricas, siem pr e y cu an d o se con viertan en variab les ficticias.
n clu so, p u ed e acerse u so d e las p rop iedades d e
los factor es. e este m odo, si dos variab les con valores en ter os se separ an
con el sign o , tata las con sider ar ficticias y con stru ir au tom ticam en te
las in teraccion es. d icion alm en te, si se separan con dos sign os , n o slo
in clu ir au tom ticam en te en la regresin las in teraccion es, sin o tam b in los
tr m in os pr in cipales. am b in pu eden in clu ir se in teraccion es
y tr m in os
p rin cip alesau tom ticam en te con variab les cu an titativas, siem pr e y cu an do
se pr ecedan con c y u n pu n to. isten las sigu ien tes m odalidades
vcategoricavcategor icao vcategor icavcategor ica
vcategoricac.vcu an titativa o vcategor icac.vcu an titativa
c.vcu an titativac.vcu an titativa o c.vcu an titativac.vcu an titativa
o es n ecesario preceder las variables con valores en teros con la i y el pu nto. partir
de la versin , se em plean estos n uevos sign ospara in dicar in teraccin en tre variables
categricas y para especificar n o slo las in teraccion es, sin o tam bin los efectos prin cipales.
l con tin en te (con ti) tien e cin co valor es, por tan to se gen er an cu atr o
variab les ficticiasla variable ocde slo tien e dos cod ificad os com o y . a
in teraccin deb er a in cor por ar, por tan to, cu atr o m odalidades
ILR IN 9 .1 9.
R e gr e si n lt ip le co n in t e r a ccio n e s a u t o t ica s
fectivam en te, se gen eran cu atro coeficien tes r elacion ad os con el con tin en te, d esde asta , qu e equ ivalen a sia, frica, m r ica y cean a,
p u es u rop a, al estar cod ificad a con el valor m s bajo, qu ed a com o categor a base. e ellas, d estacan sia y sobr e todo fr ica, qu e tien en coeficien tes
sign ificativos y positivos, en la m ed ida en qu e en am b os con tin en tes la tasa
-
. n tre ellas, se d escarta p or qu e n o
ay pas afr ican o qu e p erten e
ca a esta organ iacin com er cial.
i se desea in tr odu cir en la ecu acin de regresin u n a in teraccin en tr e
u n a var iable categr ica y u n a cu an titativa, basta con separ ar las con d oble
alm oad illa y pr eceder la segu n d a con la letr a c segu id a de pu n to.
regress tm i con tic.pn b pp a
a regr esin in clu ye tan to los efectos pr in cipales com o los in ter acctivos,
com o pu ede ap reciarse a con tin u acin
ILR IN 9 .. R e gr e si n lt ip le co n in t e r a cci n e n t r e va r ia b le
cu a n t it a t iva y c u a lit a t iva
Sour c e |
SS
df
MS
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - Model |
145869. 64
9 16207. 7378
Resi dual |
39306. 4077
115
341. 79485
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - Tot al |
185176. 048
124 1493. 35523
Number of obs
F( 9,
115)
Pr ob > F
R- squar ed
Adj R- squar ed
Root MSE
=
=
=
=
=
=
125
47. 42
0. 0000
0. 7877
0. 7711
18. 488
-----------------------------------------------------------------------------t mi |
Coef .
St d. Er r .
t
P>| t |
[ 95% Conf . I nt er val ]
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - c ont i |
2 |
30. 91629
7. 637111
4. 05
0. 000
15. 78864
46. 04393
3 |
90. 16486
7. 682314
11. 74
0. 000
74. 94767
105. 382
4 |
19. 00068
8. 447558
2. 25
0. 026
2. 26769
35. 73366
5 |
43. 94498
21. 30635
2. 06
0. 041
1. 741206
86. 14875
|
pnbppa |
- . 0006379
. 0003968
- 1. 61
0. 111
- . 0014238
. 000148
|
c ont i #|
c . pnbppa |
2 |
- . 0016523
. 0006366
- 2. 60
0. 011
- . 0029133
- . 0003914
3 |
- . 010123
. 0017164
- 5. 90
0. 000
- . 0135229
- . 0067232
4 |
- . 0007495
. 000697
- 1. 08
0. 284
- . 0021302
. 0006312
5 |
- . 0022423
. 0013203
- 1. 70
0. 092
- . 0048576
. 000373
|
_cons |
18. 68352
6. 310526
2. 96
0. 004
6. 183581
31. 18346
------------------------------------------------------------------------------
n gen eral, el coeficien te de u n efecto prin cipal de u n a variable debe interpretarse ten ien do en cuenta que slo m ide el efecto de ella, cu ando la otra variable con la qu e est interactu ando posee el valor de .
e todos los coeficien tes r elacion ados con la in ter accin , el m s sign ificativo es el corr esp on dien te a frica
con tic.p n bp pa
, qu e in dica qu e el
au m en to de la r en ta per cpita en este con tin en te tien e m s efectos positivos
r edu ctoressob re la m ortalid ad in fan til qu e en el eu ropeo, com o ya se
vio en u n ejem p lo an terior.
i la ep r esin d e la in ter a cci n se u b ier a r ea lia d o con u n a sola
a lm oa d illa
, en lu ga r d e d o s
R e gr e si n lt ip le co n in t e r a c cio n e s sin e
e ct o s
p r in cip a le s
Sour c e |
SS
df
MS
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - Model |
81451. 8192
5 16290. 3638
Res i dual |
103724. 229
119 871. 632175
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - Tot al |
185176. 048
124 1493. 35523
Number of obs
F( 5,
119)
Pr ob > F
R- squar ed
Adj R- squar ed
Root MSE
=
=
=
=
=
=
125
18. 69
0. 0000
0. 4399
0. 4163
29. 523
-----------------------------------------------------------------------------t mi |
Coef .
St d. Er r .
t
P>| t |
[ 95% Conf . I nt er val ]
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - c ont i #|
c . pnbppa |
1 |
- . 0029641
. 0003833
- 7. 73
0. 000
- . 0037231
- . 0022052
2 |
- . 0031422
. 0006845
- 4. 59
0. 000
- . 0044975
- . 0017868
3 |
. 0020754
. 0021563
0. 96
0. 338
- . 0021943
. 006345
4 |
- . 0031168
. 0007029
- 4. 43
0. 000
- . 0045086
- . 001725
5 |
- . 0028194
. 0010749
- 2. 62
0. 010
- . 0049478
- . 0006911
|
_c ons |
61. 4754
3. 926884
15. 66
0. 000
53. 69978
69. 25102
------------------------------------------------------------------------------
9.. t r a s r e la cio n e s
u n cio n a le s d e la r e gr e si n
edian te m n im os cu adrados ordin arios n o slo pu eden aju starse ln eas rectas
plan os o iperplan os cu an do se tien e m s de u n a variable in depen dien te
para pron osticar los valores de la variable depen dien te en fu n cin de la
s
in depen dien te
s
. am bin es posible aju star cu rvas qu e en determ in ados casos se aproim an m s a los valores em pricos qu e se in ten tan pron osticar. l
procedim ien to en tata pasa por la tran sform acin adecu ada de las variables
y la posterior in trodu ccin de las n u evas variables en la regresin .
ecu rdese qu e las relacion es fu n cion ales n o lin eales m s frecu en tes son
aas regresion es cu adr tica y c b ica.
ba regr esin in ver sa.
cas regresion es con var iables logar tm icas.
on el ejem p lo de la regresin d e la m ortalidad in fan til sobr e el pr od u cto n acion al br u to p er cp ita, se ver cm o se op er a p ar a ob ten er las y
r ep resen tarlas.
Regresin cu adrticaara pr odu cir la, ay qu e obten er pr im ero el cu ad rado de la variab le in d ep en d ien te p ar a d esp u s in trod u cir lo ju n to con la
variab le origin al. or ello el p rim er paso con siste en gen er ar los valores
cu ad rticos m edian te la in str u ccin gen erate.
gen era te pn bpn b pp a
e esta for m a, sale u n a ecu acin con tr es coeficien tes, la con stan te, el
d e la variab le y el d e esta al cu ad rad o .
tro m odo de obten er el m ism o resu ltado con adicion ales ven tajas es aciendo u so de
las posibilidades de in corporar trm in os de in teraccin, ya que elevar al cuadrado es com o
m u ltiplicar u na variable por s m ism a
e esta m an era, pu eden calcu larse con propiedad los efectos m argin ales de pn bppa (elp
m argin s
.
ILR IN 9 .. R e gr e si n cu a d r t ica
Sour c e |
SS
df
MS
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - Model |
115248. 64
2 57624. 3202
Resi dual |
69927. 4075
122 573. 175471
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - Tot al |
185176. 048
124 1493. 35523
Number of obs
F( 2,
122)
Pr ob > F
R- s quar ed
Adj R- squar ed
Root MSE
=
=
=
=
=
=
125
100. 54
0. 0000
0. 6224
0. 6162
23. 941
-----------------------------------------------------------------------------t mi |
Coef .
St d. Er r .
t
P>| t |
[ 95% Conf . I nt er v al ]
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - pnbppa |
- . 0118483
. 0010856
- 10. 91
0. 000
- . 0139974
- . 0096992
pnb_2 |
3. 46e- 07
4. 18e- 08
8. 28
0. 000
2. 63e- 07
4. 29e- 07
_c ons |
88. 35696
4. 030461
21. 92
0. 000
80. 37826
96. 33566
------------------------------------------------------------------------------
om o p u ed e a p reciar se a tra vs d el gr fico, el m od elo cu a d r tico p red ice qu e la ta sa d e m or ta lida d in fan til b aja a m edid a qu e a u m en ta la r en ta
p er c pita en los p ases pob res, pero, a p ar tir d e d eter m in a do n ivel de
r en ta, la relacin se in vier te y la p rod u ccin in cide n ega tiva m en te en este
in d icad or.
a ra
n por la qu e est acom paada por un if es para qu e slo prediga en caso de que
los valores de la depen dien te sean vlidos. i no se ace eplcita esa condicin, tam bin aparecera prediccin para u n posible valor etrem o de x, qu e n o poseyera valor en la dependien te.
ste es el caso en este ejem plo, porqu e de u em bu rgo, con u na alta ren ta per cpita, n o se
dispon e del dato de la tasa de m ortalidad in fan til.
R e p r e se n t a ci n gr
ic a d e la r e gr e si n c u a d r t ica
50
100
150
200
GR F I 9 .11 .
10000
20000
PNB por unidad de compra
Prediccin cuadrtica
30000
ILR IN 9 .. R e gr e si n c b ica
Sour c e |
SS
df
MS
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - Model |
131330. 579
3 43776. 8596
Resi dual |
53845. 4692
121 445. 003877
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - Tot al |
185176. 048
124 1493. 35523
Number of obs
F( 3,
121)
Pr ob > F
R- s quar ed
Adj R- squar ed
Root MSE
=
=
=
=
=
=
125
98. 37
0. 0000
0. 7092
0. 7020
21. 095
-----------------------------------------------------------------------------t mi |
Coef .
St d. Er r .
t
P>| t |
[ 95% Conf . I nt er v al ]
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - pnbppa |
- . 021411
. 0018562
- 11. 53
0. 000
- . 0250858
- . 0177362
pnb_2 |
1. 33e- 06
1. 68e- 07
7. 93
0. 000
9. 98e- 07
1. 66e- 06
pnb_3 |
- 2. 50e- 11
4. 16e- 12
- 6. 01
0. 000
- 3. 32e- 11
- 1. 68e- 11
_c ons |
104. 6266
4. 465046
23. 43
0. 000
95. 7869
113. 4664
------------------------------------------------------------------------------
ras lo cu al se p u ed en gen er ar los valores tericos d e la var iable depen d ien te a fin de ob ten er la r ep resen tacin d el aju ste c bico
p red ict ttm iif e
sam ple
label variable ttm i
rediccin c bica
scatter ttm itm i pnbppa if e
sam ple
, connect
lsym bol
i onam e
, replace
50
100
150
200
GR F I 9 .1. R e p r e se n t a ci n gr
ic a d e la r e gr e si n c b ic a
10000
20000
PNB por unidad de compra
Prediccin cbica
30000
Regresin in ersaara con segu ir u n a r egr esin de este tip o, es su ficien te con vertir pr eviam en te la var iable in d ep en d ien te en su in ver sa con la in stru ccin gen erate e in trodu cir la com o n ico pr ed ictor d e la ecu acin .
l form ato d el resu ltado es idn tico al de u n a r egr esin sim ple.
ILR IN 9.. R e gr e s i n in ve r sa
Sour c e |
SS
df
MS
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - Model |
139222. 172
1 139222. 172
Res i dual |
45953. 8759
123 373. 608747
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - Tot al |
185176. 048
124 1493. 35523
Number of obs
F( 1,
123)
Pr ob > F
R- s quar ed
Adj R- s quar ed
Root MSE
=
=
=
=
=
=
125
372. 64
0. 0000
0. 7518
0. 7498
19. 329
-----------------------------------------------------------------------------t mi |
Coef .
St d. Er r .
t
P>| t |
[ 95% Conf . I nt er val ]
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - i nvpnb |
67857. 04
3515. 193
19. 30
0. 000
60898. 93
74815. 14
_cons |
11. 53628
2. 365531
4. 88
0. 000
6. 853862
16. 21871
------------------------------------------------------------------------------
50
100
150
200
GR F I 9 .1. R e p r e se n t a ci n gr
ic a d e la r e gr e si n in ve r sa
10000
20000
PNB por unidad de compra
Prediccin inversa
30000
u edan fin alm en te por eplicar las r egr esion es log-lin eales qu e, a su
ve
, p u eden ad op tar tres m odalidad es
Regresion es log-logon aqu ellas en las qu e tan to la var iable depen dien te
com o la in depen dien te son tr an sform ad as en su cor respon d ien te logar itm o.
u coeficien te, en lu gar de in dicar cu n tas u n idad es cam bia la var iable d ep en dien te por cad a u n idad qu e cam bia la in d epen dien te, in dica la tasa de
cam b io qu e su fr e la p rim er a por u n cam b io r elativo en la segu n d a. e pu ede
ep resar d e los d os m odos sigu ien tes
.
a pr im era fr m u la es tal cu al se p repar an los d atos para qu e p u ed a
r ealiarse la regresin com o si fu era lin eal. n la segu n d a, el valor d e la
variab le dep en d ien te se epr esa en fu n cin d e elevar el valor de la variab le
in depen dien te a u n a determ in ad a poten cia (b 1) y m u ltiplicar el r esu ltad o
p or u n a con stan te, ep(b 0).
a pr ep ar acin de esta r egr esin logar tm ica im p lica la gen eracin d e
d os n u evas variab les, qu e sean logaritm os n ep er ian os de las origin ales, y a
con tin u acin la realiacin de la r egr esin com o si fu ese lin eal
gen erate lpn bp pa ln
pn bp pa
gen erate ltm iln
tm i
regress l
tm i l
p n bp pa
l pr od u cto d e estas tres in str u ccion es es tam bin com o el d e la regresin sim ple
ILR IN 9.. R e gr e si n lo ga r t ica
lo g
lo g
Sour c e |
SS
df
MS
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - Model |
128. 217683
1 128. 217683
Resi dual |
24. 1159321
123 . 196064489
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - Tot al |
152. 333615
124 1. 22849689
Number of obs
F( 1,
123)
Pr ob > F
R- s quar ed
Adj R- squar ed
Root MSE
=
=
=
=
=
=
125
653. 96
0. 0000
0. 8417
0. 8404
. 44279
-----------------------------------------------------------------------------l _t mi |
Coef .
St d. Er r .
t
P>| t |
[ 95% Conf . I nt er v al ]
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - l _pnbppa |
- . 8884191
. 0347411
- 25. 57
0. 000
- . 9571869
- . 8196512
_c ons |
10. 58703
. 2899
36. 52
0. 000
10. 01319
11. 16087
------------------------------------------------------------------------------
osterior m en te, p ara obten er los valor es tericos de y, abr a qu e realiar la sigu ien te op er acin yep
,
x,,x ,. llo im plica
el dob lea ,
el coeficien te b 1). am bin , d e m odo m s d irecto,
p u ed e in ter pr etar se el coeficien te afir m an do qu e u n a su bid a d el en el
p redictor, im p lica u n a b ajada del , en el r esu ltad o.
ar a con segu ir con tata los valores ter icos de la var iable depen dien te,
p rim er o se obtien en los valor es de la variab le logartm ica y poster iorm en te
se con vier ten a su ep resin or igin al. s n ecesario, pu es, proceder en d os
p asos
r as d ispon er de los valor es tericos de la var iable d ep en dien te, se p u ed e dem an d ar el grfico del m od o ab itu al
scatter ttm gg tm i pnbppa if e
sam ple
, connect
l .sym bol
i onam e
, replace
ste proceder n o genera la m edia con dicion al en la m trica origin al. ara solven tarlo,
icard oldstein a gen erado u n procedim ien to llam ado predlog. st locali
ado en la red.
ara su b squ eda e in stalacin, escriba n et searcpredlog. Una vein corporado, pu ede obten erse ayu da de su u so y resultados, m edian te elp predlog.
50
100
150
200
GR F I 9 .1. R e p r e se n t a ci n gr
ic a d e la r e gr e si n lo ga r t ic a
10000
20000
PNB por unidad de compra
Prediccin loglog
30000
Regresin log-lin n este caso, slo se tr an sform a la variable d ep en d ien te. or tan to, los coeficien tes de la r egresin in d ican el cam b io relativo qu e
su fre esta, cu an d o la in depen d ien te vara en u n a u n idad. a epr esin m atem tica qu e respon de a este m od elo es la sigu ien te
.
ar a pod er obten er este m odelo y su rep resen tacin m ed ian te las in stru ccion es tata, estas d eberan ten er la secu en cia sigu ien te
a ecu acin r esu ltan te, em plean d o com o resu ltad o la tasa de m or talidad
in fan til
en realidad, su logaritm oy com o p redictor el pr od u cto n acion al
b ru to p er cpita, ofrece u n coeficien te de -,, lo qu e su pon e qu e
p ara b ajar u n esta tasa en este pas, se n ecesita au m en tar en .la
r en ta p er cp ita de su s ciu dadan os
-ep
-,
,
.
ILR IN 9 .. R e gr e si n e p o n e n cia l
lo g
lin
Sour c e |
SS
df
MS
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - Model |
109. 28253
1
109. 28253
Res i dual |
43. 0510845
123 . 350008817
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - Tot al |
152. 333615
124 1. 22849689
Number of obs
F( 1,
123)
Pr ob > F
R- s quar ed
Adj R- s quar ed
Root MSE
=
=
=
=
=
=
125
312. 23
0. 0000
0. 7174
0. 7151
. 59162
-----------------------------------------------------------------------------l _t mi |
Coef .
St d. Er r .
t
P>| t |
[ 95% Conf . I nt er val ]
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - pnbppa |
- . 0001196
6. 77e- 06
- 17. 67
0. 000
- . 000133
- . 0001062
_cons |
4. 094556
. 0715704
57. 21
0. 000
3. 952887
4. 236225
------------------------------------------------------------------------------
50
100
150
200
GR F I 9 .1. R e p r e se n t a ci n gr
ic a d e la r e gr e si n e p o n e n cia l
10000
20000
PNB por unidad de compra
Prediccin loglin
30000
Regresin lin -logFin alm en te, qu ed a el m odelo d on de la variab le d ep en d ien te n o se tr an sform a en su logar itm o, p ero s lo ace la in d epen dien te.
a ecu acin m atride este m odelo es
.
or ello, slo es n ecesar ia la tradu ccin logartm ica d e la var iable in d ep en d ien te, y la secu en cia de in str u ccion es par a r ep resen tar u n a relacin
en tr e variab les de este tipo sera la sigu ien te
.
ILR IN 9.. o e
icie n t e s d e la r e gr e si n d e l o d e lo lin
lo g
Sour c e |
SS
df
MS
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - Model |
133783. 834
1 133783. 834
Resi dual |
51392. 2139
123 417. 822877
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - Tot al |
185176. 048
124 1493. 35523
Number of obs
F( 1,
123)
Pr ob > F
R- s quar ed
Adj R- squar ed
Root MSE
=
=
=
=
=
=
125
320. 19
0. 0000
0. 7225
0. 7202
20. 441
-----------------------------------------------------------------------------t mi |
Coef .
St d. Er r .
t
P>| t |
[ 95% Conf . I nt er v al ]
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - l _pnbppa |
- 28. 69761
1. 603762
- 17. 89
0. 000
- 31. 87216
- 25. 52306
_c ons |
279. 9285
13. 38273
20. 92
0. 000
253. 4382
306. 4188
------------------------------------------------------------------------------
50
100
150
200
GR F I 9 .1 . R e p r e se n t a c i n gr
ica d e la r e gr e si n lin
lo g
10000
20000
PNB por unidad de compra
Prediccin linlog
9.9.
30000
e r cicio s
. on la b a se d e d a tos m u n d ia l d e
m u n d o
, elige com o va r ia b le d ep en d ien te la esp er a n a d e vid a a l n a cer y com o in d ep en d ien tes la r en ta p er c p ita
en u n id a d es d e p od er d e com p r a y el
con tin en te. ep r od u ce la s r egr esion es r ea lia d a s en este ca p tu lo y
en cu en tr a u n m od elo sa tisfa ctor io.
. on la m ism a b ase d e d a tos, seleccion a u n a n u eva va r ia b le d ep en d ien te y seleccion a las va r ia b les in d ep en d ien tes m s a d ecu a d a s p a r a
la d efin icin d e u n b u en m od elo.
n tr od u ce tam b in , si te p a r ece con ven ien te, a lgu n a otr a va r ia b le n om in a l
factor
, com o, p or ejem p lo, la
p er ten en cia o n o al .
. on los d a tos em p lea d os en este ca p tu lo
m u n d o
, r ealia u n a tab la qu e cr u ce el con tin en te con la p er ten en cia a la p on ien d o en
la s ca sillas la m ed ia d e la ta sa d e m or ta lid a d in fan til. con tin u acin ,
a u n a r egr esin d e la ta sa sob r e a m b os factor es y su in ter accin .
com p or tam ien to elector a l. om p a r a , fin a lm en te, los r esu ltad os d e las
cu a tr o ecu a cion es.
. or a , em p lean d o el b a r m etr o d e m ar o
cis
, tom a la p r im er a
p a r te d e la .com o va r ia b le r esp u esta . u sca ep lica cion es a la va r ia cin en la d isp osicin d el tiem p o lib r e d e la s p er son a s en el r esto
d el cu estion a r io. l m en os, in tr od u ce el seo com o fa ctor y la ed ad
com o p r ed ictor cu an tita tivo.
10
Dia gn st ico
d e
la
r e gr e si n
1 0.1.Su p u e st o s
de
la
r e gr e si n
lin e a l
E l m odelo poblacion al d el qu e se p arte para el corr ecto fu n cion am ien to de
la estim acin de los parm etr os de la r egr esin por el pr ocedim ien to de
m n im os cu ad rados r esp on de a la sigu ien te ecu acin :
(10.1)
Seg n ellaeiste en la p oblacin u n a r elacin lin eal en tr e u n con
u n to
k de ariab les in depen dien tes (xi) qu e dan lu gar d e m od o estocstico o in
d eterm in ad o a la ariab le d ep en d ien te (yi). or elloap arece en la ecu acin
la ar iable aleatoria
de la qu e se su pon e en el m odelo qu e se d istr ibu e
i
n or m alm en te con u n a m edia de 0.
ero en esta ecu acin d el m odelo n o estn d eclarados epresam en te u n a
serie d e prerrequ isitos p ara qu e los estim adores de los parm etros b ob ten i
dos p or el criterio de m n im os cu ad rados ten gan la p rop iedad de ser los m e
E S E
S
(10.)
. ar a cada con
u n to d e casos con u n a xi d ad ael alor m edio de la
pertu rb acin (
i ) es cer o.
(10.)
. E n el caso de qu e las xi sean estocsticasn o eiste corr elacin en tre
estas los trm in os d e p ertu r bacin .
(10.)
. ar a cada con
u n to de casos con u n a xi d adala ar ian
a de
i es
con stan te u om oced stica.
(10.)
(10.)
. o eiste au tocor relacin en tr e las p er tu r bacion es.
(10.)
10.
11.
S
S E S S
(10.10)
b)
(10.11)
1
n problem a bastan te com n en la regresin m ltiple es el del descen so del n m ero de
casos de la m u estra origin al al in trodu cir m u cas
ariables con u n alto n m ero de casos per
didos.
n clusoau nque no lo seanse pu ede dar u n a com bin acin de au sen cia de inform acin
entre ellas (com o en el caso de pregun tas filtradas)qu e aga ba
ar su stan cialm en te el n m ero
de casos con los qu e se opera. E n estas ocasion eses conen ien te prescin dir de las predictores
que causen u n con siderable descen so de la m u estrano slo por los problem as de au m ento del
error tpicosino sobre todo por los de seleccin sesgada de in diidu os m u estrales.
c)
E S E
S
os resid u os stu d en ti
ad ossi se diid e por la d esiacin tpica d e los
resid u ales resu ltan te de elim in ar el caso en cu estin (s e(i)) (,rstu den t):
(10.1)
E stas tr es ariab les pu eden obten erse al solicitar el com an do predict
tr as la e
ecu cin de u n a r egr esin con la cor resp on d ien te opcin
obia
m en teel n om b re qu e se le qu ier a d ar a la n u ea
ar iable:
p r e d ict
n u eaar
r e sid u a l
p r e d ict
n u eaarr st a n d a r d
p r e d ict
n u eaarr st u d e n t
n e
em p lo de aplicacin d e in stru ccion es se p u ede aplicar a u n a de las
r egr esion es obten id as en el cap tu lo an ter ior :
regress
p red ict
p red ict
p red ict
tm i pn bp pa
tm irresidu al
tm irtrstan da rd
tm irsrstu d en t
S
S E S S
ILUSTR ACIN
1 0.1 .E st a d st ico s
de
lo s
r e sid u o s
Var i abl e |
Obs
Mean
St d. Dev .
Mi n
Max
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - t mi r |
125
7. 63e- 08
29. 67555 - 41. 25054
105. 1491
t mi r t |
125
. 0020788
1. 00298
- 1. 39146
3. 553735
t mi r s |
125
. 0051997
1. 012505
- 1. 39683
3. 736263
com o con secu en cia de esta in stru ccin aparecer el sigu ien te grfico:
50
Residuals
50
100
R IC
1 0.1.Nu e
de
p u n t o s
d e
lo s
r e sid u o s
40
20
20
Fitted values
40
60
E n este e
em p lo es obio qu e el
alor m ed io d e los r esidu os cam b ia con
los alor es a
u stad osqu e en este casocom o slo se dispon e de u n a aria
E S E
S
cu r t o sis
d e
lo s
r e sid u o s
Sk ewness / Kur t os i s t est s f or Nor mal i t y
- - - - - - - j oi nt - - - - - Var i abl e |
Pr ( Sk ewness )
Pr ( Kur t osi s ) adj c hi 2( 2)
Pr ob>c hi 2
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - t mi r |
0. 001
0. 476
9. 34
0. 0094
t mi r s |
0. 001
0. 486
9. 30
0. 0096
t mi r t |
0. 001
0. 261
10. 78
0. 0046
se obtien en las m ism as con clu sion es qu e con las pr u eb as d e sim etr a
cu rtosispu es en cada
ar iable p u ed e r ecaarse con u n n iel de sign ifica
cin in ferior al 0
0la iptesis n u la d e qu e la distribu cin es n orm al.
S
S E S S
ILUSTR ACIN
10 ..r u e a s
d e
n o r a lid a d
de
lo s
r e sid u o s
Shapi r o- Wi l k W t es t f or nor mal dat a
Var i abl e |
Obs
W
V
z
Pr ob>z
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - t mi r |
125
0. 94111
5. 866
3. 972 0. 00004
t mi r s |
125
0. 94104
5. 873
3. 975 0. 00004
t mi r t |
125
0. 93902
6. 074
4. 051 0. 00003
.1
Density
.2
.3
.4
Standardized residuals
Kernel density estimate
Normal density
kernel = epanechniko
andidth = 0.343
E S E
S
eco de qu e las ar ian as resid u ales sean las m ism as in dep en d ien tem en te
d e los
alores de las ariab les in depen dien tes
p or eten sin d e los alor es
p redicos de la d ep en d ien te. or ellola for m u lacin ep resada en (10.)
p u ed e r eform u larse m edian te la sigu ien te epr esin :
(10.1)
E l m edio grfico id n eo p ar a ob serar la p resen cia d e eter ocedasti
cidad es el qu e cru a r esidu os con los alor es pr edicos d e la ariab le de
p en d ien tequ e se obtien e m ed ian te la in stru ccin rvfplotcom o se a isto
an terior m en te a se a e
em plificad o en el grfico 10.1.
Stata disp on en o ob stan tede u n a pr u eb a qu e da cu en ta n u m r icam en te
d e la eisten cia de la eter ocedasticidad. Se tr ata del test d e oo
eisberg
(1)qu e se obtien e esp ecifican d o la in str u ccin hettest tr as la e
ecu cin
d e u n a r egr esin . s pu estras la regresin d e la tasa d e m ortalid ad in fan til
sobr e el pr od u cto n acion al b ru to p er cpitaal escrib ir la sigu ien te ln ea:
ettest
e ise r g
Br eus ch- Pagan / Cook- Wei s ber g t est f or het er os kedast i ci t y
Ho: Cons t ant var i anc e
Var i abl es : f i t t ed v al ues of t mi
c hi 2( 1)
Pr ob > c hi 2
=
=
12. 23
0. 0005
S
S E S S
(10.1)
ed ian te el pr ogr am a Stata se p u ed en obten er estos n d ices d e m u lti
colin ealid ad al in tr od u cir la in str u ccin vif desp u s d e u n a in stru ccin . e
este m odosi se in tr odu cen estas dos in stru ccion es:
regress tm i pn b pp a lin tfn o pibag
if
e este m odose gen era el sigu ien te r esu ltad oen el qu e claram en te se
e la p ecu liar r elacin lin eal en tre el p rodu cto n acion al b ru to p er cp ita el
n m er o d e ln eas telefn icas p or cada m il ab itan tes.
E S E
S
R IC
1 0..a t r i
d e
n u e s
d e
p un tos
PNB por
unidad
de
compra
00
Lineas
telefonicas
(x 1000
hbs) 1998
00
00
0
0
0
PIB en
agricultura
0
0
0
0000
0000
0
00
00
00
S
S E S S
E l resu ltado m u estr a u n a difer en cia sign ificatia d e con sider acin .
ILUSTR ACIN
1 0..r u e a
d e
R a se
so r e
o isi n
d e
a r ia le s
en
la
r e gr e si n
r e gu la r
Rams ey RESET t es t us i ng power s of
Ho:
model has no omi t t ed
F( 3, 120) =
Pr ob > F =
t he f i t t ed v al ues of t mi
var i abl es
56. 11
0. 0000
Sin em b ar goal tr an sform ar las ariab les en su s logar itm oses pr eciso
r ealiar de n u e
o la p ru eba.
for
a r tm i p n bp pa:gen era te l
ln ()
regress l
tm i l
p n bp pa
o
test
t he f i t t ed v al ues of l _t mi
var i abl es
1. 84
0. 1444
E S E
S
a instruccin es fcil de e
ecutar. asta con escribir avplots. Si as se especi
ficase gen erar un grfico por cada
ariable independiente. aso de que se quie
ra slo el grfico de una
ariablela instruccin a de eplicitarse en singu lar
(avplot), seguida de la
ariable in dependiente que se desee representar. aunqu e
se qu ieran todos los grficoses preferible para m e
or detalle obtenerlos in di
i
dualm ente. tro aspecto que a de ten erse en cuen ta es que esta instruccin
com o la de los grficos an teriorespuede utili
arsiem pre que le sea pertin ente
las opciones propias de la instruccin
raph. e este m odoentre otros aspectos
se podran obtener grficos con las etiqu etas de los casos presentes en la nube
de pu ntos. sen la regresin del logaritm o de la tasa de m ortalidad infantil en
funcin del logaritm o del producto n acional bruto per cpita de las lneas tele
fnicas por m il abitan tesse pueden gen erar los grficos de este m odo:
regress ltm i l
p n b pp a lin tfn o
aplot lpn b pp am label(pa is)
aplot lin tfn om lab el (p ais)
lo g
lo g
de
la
t a sa
de
o r t a lid a d
in
a n t il
so r e
p r o d u ct o
n a cio n a l
per
c p it a
n e r o
de
ln e a s
t e le
n ica s
Sour c e |
SS
df
MS
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - Model |
133. 661425
2 66. 8307126
Res i dual |
18. 4490767
121 . 152471708
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - Tot al |
152. 110502
123 1. 23667075
Number of obs
F( 2,
121)
Pr ob > F
R- s quar ed
Adj R- s quar ed
Root MSE
=
=
=
=
=
=
124
438. 32
0. 0000
0. 8787
0. 8767
. 39048
-----------------------------------------------------------------------------l _t mi |
Coef .
St d. Er r .
t
P>| t |
[ 95% Conf . I nt er v al ]
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - l _pnbppa |
- . 5244678
. 0674209
- 7. 78
0. 000
- . 6579452
- . 3909904
l i nt f no |
- . 0022806
. 0003767
- 6. 05
0. 000
- . 0030264
- . 0015348
_cons |
7. 98921
. 4993729
16. 00
0. 000
7. 000569
8. 97785
------------------------------------------------------------------------------
En el e
e de orden adas se represen tan los residu os de la ariable depen dien
te obten idos con su regresin sobre el logaritm o del produ cto n acion al per c
pita en el e
e de abscisas se represen tan los residu os de las ln eas telefn icas
obten idos en su regresin sobre el logaritm o del produ cto n acion al per cpita
esto esel resto de las ariables in depen dien tes. Es preciso n otar qu e la in cli
n acin de la ln ea represen tada es el coeficien te parcial de regresin m ltiple
an otado tam bin en la parte in ferior del grfico
u n to con su error tpico. o
qu e aqu e com probarpara erificar el su pu esto de lin ealidades qu e n o aa
u n a pau ta cu riln ea o plan a de distribu cin de los casos.
S
S E S S
R IC
1 0..r
ico
de
r e sid u o s
d e p e n d ie n t e s
so r e
lo s
in d e p e n d ie n t e s
(a vp lo t)
Surafrica
Botsuana Namibia
Guinea
Mexico
eltmi
Brasil
Argentina
Peru
Argelia
Tailandia
Tunez
esoto
Zimbabue
Dominicana
ep
Egipto
ndia
Marruecos
uruia
aos
Paistan
Estados Unidos
Mauritania
Costa deCambo
Mar
il a
Papua Nueva Guinea
olivia
Uganda
ran
Ghana
Centroafricana (Rep)
Mozambique
Colombia
Camerun
Filipinas
rugua angladesh
ogo
Belgica
umania
Corea del
Sur
aiti ibano
ndonesia
Bur
ina aso
enezuela China
Nepal
ur
menistan
enegal
Portugal
Niger eino nido
Panama
usia
Paraguay
MaliZambia
Jordania
Canada Dinamarca
rlanda Austria
Chad
Malaui
Angola
Kazajistan
Congo
Holanda
ungria
Australia
Alemania
Benin
Francia
Sierra
SuizaLeona
Ecuador
onduras
Kenia
talia
Noruega
Letonia Singapur
Madagascar
Mongolia
Nicaragua iria
Burundi
Eslovauia
Etiopia
Japon
Chile
Grecia
Albania
Polonia
Costa
ica
Eritrea
Espana
Nueva Zelanda
Jamaica
emen
ep
NigeriaFinlandia
ielorrusiaMacedonia
ulgaria
ietnam
Estonia
Eslovenia
Kirguizistan
Malaisia
Georgia
epublica Checa
Lituania
ong ong
China Tanzania
Croacia
Sri an
a
zbeistan
Guatemala
Suecia
Ucrania
Molda
ia
Azerbai
an
Tayikistan
elint
no
coe
22se
2t
Se an
isto las erram ientas de las que dispone Stata para detectar el in
cu m plim iento de los supuestos de la regresin . ara acabar este apartado n o
estara de m s reali
ar un com pendio sim plificado de ellas
iendo su s efectos
el m odo de detectarlas. a m aor parte de ellas inciden en la ba
a eficiencia de
los estim adoreses decirm ultiplican la posibilidad de que obtengam os una es
tim acin ale
ada del
alor correcto. os in cum plim ientos qu e gen eran slo pro
blem as de eficiencia son la eterocedasticidad la autocorrelacin . a prim era
se detecta m ediante el grfico de residuos sobre los
alores predicos (rvfplot)
de m odo m s preciso con el test de oo
eisberg (hettest). a segunda con el
estadstico de urbin
atsonaun que en principio no debera preocupar siem
pre que n o se tengan datos de series tem porales. a m ulticolinealidad tam bin
gen era problem as de ineficiencia e incluso pu ede llegar a acer qu e sean in
calculables los parm etros de la regresin en el caso de qu e sea perfecta. Su
m odo de deteccin es a tra
s de la toleran cia o del factor de inflacin de la
arian
a obtenido m edian te la orden vif. Si las perturbaciones no son norm a
leslos estim adoresadem s de ineficientesn o estarn distribuidos norm al
m entepor lo que no sern
lidas las pru ebas de significacin . dem ssi las
m edias de las perturbaciones no son 0los parm etros sern segadosespecial
m ente peligrososi la esperan
a de las perturbaciones es adem s inconstante
porqu e afectara no slo a la constantesino tam bin a los coeficien tes de las
E S E
S
10 ..An lisis
d e
lo s
ca so s
en
la
r e gr e s i n
dem s de erificar qu e se cu m p len los su pu estos de la regresin es til
eam in ar el com p or tam ien to d e los casospor cu an to estos p u ed en sesgar
el com portam ien to d e los estim ador es de los par m etros. atres tipos de
m edida qu e d eb en eam in arse p ara er si eisten casos qu e p u eden estar
p er tu r ban do u n a r egr esin . E n pr im er lu garlos a con ocid os r esidu osde
los qu e aor a se estu diar n o su com por tam ien to con
u n tosin o el p articu
lar de cad a caso. E n segu n do lu garestn las m edid as qu e pon der an la car
ga d e las
ariables in dep en d ien tesd e m odo qu e ten gan p u n tu acion es m s
altas m ien tr as
alores m s etrem os ten gan en estas. fin alm en teestn
aqu ellas pu n tu acion es qu e r efle
an de u n o u otr o m odo su con tr ib u cin a
los coeficien tesa los
alores pr edicos o al er ror estim ado de la regresin .
as p rim er as d e estas p u n tu acion es son los resid u os. s com o an terior
m en te eam os su s pr om ed ios su s distrib u cion esaor a r esu lta m s pro
p io el eam en d e los alor es etr em os. ara ellose disp on e en Stata tan to
d e err am ien tas n u m r icas com o gr ficas.
E n tr e las p rim er as est la in str u ccin listqu e en con
u n cin con la in s
tr u ccin sort la esp ecificacin ifp u ed e dar cu en ta d e m od o ord en ad o slo
d e los casos qu e ten gan alor es etr em os.
sdespu s de la regresin de la tasa logartm ica de m ortalidad in fan til
con el logaritm o del produ cto n acion al per cpita las ln eas telefn icastras
la a efectu ada gen eracin de los distin tos residu osse pu eden localiar aqu e
llos casos con alores etraordin ariossi as se con sideran aqu ellos cu o
alor
est 1
desiacion es tpicas por en cim a o por deba
o de la m edia aritm tica:
for an r rs rt a n resid u a l rstan dar rstu den t: p red ict ltm i
gen era te ltm ira abs(ltm ir)
gsort
ltm ira
list pa is ltm ir ltm irs ltm irt if (a bs(ltm irs)1.abs(ltm irt)1.) e(sam ple)
edian te estas in stru ccion esse crea u n a ariab le con los alores absolu
tos de los resid u os para pod erlos ord en ar d escen den tem en te por su tam a o.
fin alm en tese seleccion an los p ases qu e an en trad o en la regresin con
alores absolu tos tpicos o stu d en tiad os su p eriores al pu n to crtico de 1
l reali
ar u na regresinStata registra u na serie de resu ltados estim acion es con u n
n om bre especfico. na de las m s tiles es la fu ncin e(sam ple), qu e perm ite seleccionar los
casos qu e an en trado en la ltim a regresin al especificarla dentro de u na clu su la if de u na
in stru ccin posterior.
S
S E S S
ILUSTR ACIN
1 0..List a d o
de
r e sid u o s
1.
2.
3.
4.
5.
6.
7.
8.
+- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - +
|
pai s
l t mi r
l t mi r s
l t mi r t |
| ----------------------------------------------------|
|
Tayi k i s t an
- 1. 156497
- 2. 999984
- 3. 105277 |
|
Sr i Lank a
- . 9439814
- 2. 442333
- 2. 494482 |
|
Sur af r i c a
. 9388283
2. 458475
2. 511833 |
|
Az er bai y an
- . 8882979
- 2. 286082
- 2. 327433 |
| Es t ados Uni dos
. 8813
2. 323113
2. 366879 |
| ----------------------------------------------------|
|
Nami bi a
. 8771846
2. 284423
2. 325668 |
|
Bot suana
. 851571
2. 22672
2. 264379 |
|
Tur qui a
. 8011727
2. 061442
2. 089934 |
+- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - +
R IC
10 ..r
ic o
d e
ca
as
d e
lo s
r e sid u o s
t p ico s
st u d e n t ia d o s
Residuales estandarizados
Residuales studentizados
E S E
S
(10.1)
a m atri
se obtien e a partir d e la m atri
d e alor es d iferen ciales
d e xes d ecir(xi x)a la qu e se le agr ega com o pr im era colu m n a el ector
d e u n osqu e r epr esen ta la con stan tede acu erd o con la sigu ien te epr esin
m atr icial:
(10.1)
a m atri
es u n a m atride ord en n n . os elem en tos d e la diagon al
d e
son las llam ad as car gas (levera
e), qu e tom an u n alor com pr en d ido
en tr e 1
n en la circu n stan cia de qu e u n caso ten ga los
alores de todas las
ar iables igu al a su s r esp ecti
as m edias1cu an do u n in d iidu o posee
alor es totalm en te etr em os en todas las ar iables.
edian te Stata estas cargas p u ed en calcu larse m ed ian te la opcin leve
ra
e o hat de la in stru ccin predict segu id a d el n om br e d e la n u ea ariab le
con la qu e sern recon ocid as.
p red ict carga leerage
S
S E S S
ILUSTR ACIN
1 0.1 0.List a d o
d e l
n d ic e
d e
ca r ga
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
+- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - +
|
pai s
l _pnbppa
l i nt f no
c ar ga |
| ------------------------------------------------|
|
Suec i a
9. 943861
674
. 0735858 |
|
Si er r a Leona
6. 025866
4
. 0697807 |
|
Sui z a
10. 22143
675
. 0632281 |
|
Di namar c a
10. 09741
660
. 0619916 |
|
Nor uega
10. 18573
660
. 0592642 |
| ------------------------------------------------|
|
Tanzani a
6. 169611
4
. 0586668 |
| Es t ados Uni dos
10. 32876
661
. 0561181 |
|
Canada
10. 07428
634
. 0540864 |
|
Bur undi
6. 315358
3
. 0484039 |
|
Mal aui
6. 364751
3
. 0453132 |
+- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - +
R IC
1 0..r
ico
de
ca r ga s
so r e
r e s id u o s
n o r a lia d o s
a l
cu a d r a d o
Suecia
Sierra Leona
Suiza
Dinamarca
Noruega
Tanzania
Estados Unidos
Canada
Malaui
Etiopia Holanda
Mexico
Angola
Surafrica
Botsuana
rancia
Alemania
Yemen
(Rep)
Zambia
Hong Kong (China)
Reino Unido
Singapur
Finlandia
Mali Argentina
Grecia
iger
igeria
Argelia
Madaga
ailandiacar
une
Au
tralia
apon
Belgica
Mozambique
Austria
Chad
Brasil
Filipinas
Nueva
Zelanda
Italia
Paraguay
Benin
Congo
ina Faso
Peru
IrlandaBur
amibia
ayi
istan
enia
uatemala
spana
ritreadel
Corea
ur
ominicana
Chile
ep
Iran
Bulgaria
enezuela
Portugal
slovenia
Malaisia
Centroa
ricana
ep Albania
ganda
Zimbabue
aza
istan
Nepal
Marruecos
gipto
epublica Checa
Papua
Nueva
uinea
CamboyaCroacia
enegal
Indonesia
ogo
slovaquia Polonia
esoto
China
aiti
umania
Camerun
Bangladesh
ungria
uinea
Mauritania
Uruguay
aos Rica
Ghana
Jordania
India
Mongolia
Estonia
Costa
de Marfil
Costa
Colombia
Pakistan
Nicaragua
Rusia
Panama
Honduras
ietnam
etonia
Moldaia
urkmenistan
ituania
Georgia
U
bekistan
oliia
Ecuador
Ucrania
irgui
istan
ielorrusia
iria
uruia
Jamaica
Macedonia
ibano
ri an
a
erbaiyan
Carga
Burundi
Residuos normali
ados al cuadrado
E n este gr ficose
e qu econ la ecepcin d e E stados n idosel r esto
d e los pases qu e tien en alta car ga (por en cim a de alai) p oseen ba
os r e
sidu alespor lo qu e n o an de p reocu p ar en la r egr esin por m u co qu e su s
cargas en las
ar iables in d epen dien tes sean con sider ab les. ar a ob ten erlo
se a in tr od u cido la sigu ien te in str u ccin :
E S E
S
(10.1)
E n con secu en ciasu alor pu ede ser tan to positio (si el caso con tr ibu e
a au m en tar el coeficien te) com o n egati
o (si in flu e acia la ba
a) pu ede
ser p reocu p an te en el caso de qu e el alor absolu to sea su per ior a 1p u es
m od ificara el alor d el coeficien te de regresin en m s de u n er ror tp ico.
Sin em bargoelse(10) su giere qu e se com p are con 2 / n .:
E l m odo de obten er estas m edid as es especifican do la in stru ccin dfeta
d esp u s d e u n a regresin . E n el caso d e qu e n o se m en cion e n in gu n a a
r iablecalcu lar para cad a caso las d e tod as las
ar iables. con tin u acin
se m u estra la lista com pleta d e in stru ccion es par a qu e qu eden listad os los
casos qu e su p eren el cocien te m en cion ado en el an terior prr afo.
regress ltm i l
p n b pp a lin tfn o
d fb eta
list pa is
d fbif (
d fb eta
1
sqrt(e())
d fbeta
En
ersiones anteriores de Stata se den om in aban con el nom bre de la
ariable in depen
dien te precedida por las letras m a sculas .
S
S E S S
ILUSTR ACIN
1 0.1 1.List a d o
d e
la s
d fb eta s
4.
7.
11.
16.
28.
46.
60.
65.
+- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - +
|
pai s
_df bet a_1
_df bet a_2 |
| ----------------------------------------|
|
Di namar c a
- . 1117166
. 2098867 |
| Es t ados Uni dos
- . 1412062
. 3598529 |
|
Sur af r i c a
. 4786185
- . 4590031 |
|
Bot suana
. 4019008
- . 4104398 |
|
Nami bi a
. 3554343
- . 3683658 |
| ----------------------------------------|
|
Tayi k i s t an
. 3639386
- . 2352885 |
|
Sr i Lank a
- . 2223299
. 2737852 |
|
Mal ai s i a
- . 2122332
. 1815071 |
+- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - +
Su ra frica
Number of obs
F( 2,
120)
Pr ob > F
R- s quar ed
Adj R- s quar ed
Root MSE
=
=
=
=
=
=
123
459. 08
0. 0000
0. 8844
0. 8825
. 38218
-----------------------------------------------------------------------------l _t mi |
Coef .
St d. Er r .
t
P>| t |
[ 95% Conf . I nt er v al ]
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - l _pnbppa |
- . 5560512
. 0671759
- 8. 28
0. 000
- . 6890548
- . 4230475
l i nt f no |
- . 0021114
. 0003748
- 5. 63
0. 000
- . 0028535
- . 0013693
_c ons |
8. 212053
. 4967513
16. 53
0. 000
7. 22852
9. 195586
------------------------------------------------------------------------------
sqrt(e())
E S E
S
Number of obs
F( 2,
120)
Pr ob > F
R- squar ed
Adj R- s quar ed
Root MSE
=
=
=
=
=
=
123
459. 08
0. 0000
0. 8844
0. 8825
. 38218
-----------------------------------------------------------------------------l _t mi |
Coef .
St d. Er r .
t
P>| t |
[ 95% Conf . I nt er val ]
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - l _pnbppa |
- . 5560512
. 0671759
- 8. 28
0. 000
- . 6890548
- . 4230475
l i nt f no |
- . 0021114
. 0003748
- 5. 63
0. 000
- . 0028535
- . 0013693
_cons |
8. 212053
. 4967513
16. 53
0. 000
7. 22852
9. 195586
------------------------------------------------------------------------------
(10.1)
E n tan to qu e par a obten er la d istan cia d e elscse tr an sform a el r esi
d u o stu d en tiado con esta otra epr esin :
(10.1)
in alm en tela distan cia d e ooes cu adr tica se obtien e a p ar tir d e
los r esidu os tipificad os.
(10.0)
S
S E S S
ras ser obten idasse pu ede solicitar el listad o d e aqu ellos casos con
alor es p or en cim a d e los recom en d ad os:
list p ais ltm iif (ab s(ltm idfits)sqrt((e(d fm )1)
e())
l
tm i
coosd e()
abs(l
tm i
elsc)
sqrt(e(d fm )1)) e(sam ple)
7.
11.
16.
28.
46.
60.
+- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - +
|
pai s
l _t mi _d~s
l _t mi _~d
l _t mi _w~h |
| ---------------------------------------------------|
| Es t ados Uni dos
. 5771238
. 106956
6. 588138 |
|
Sur af r i ca
. 5361364
. 0917866
6. 079978 |
|
Bot s uana
. 4668481
. 0702527
5. 286491 |
|
Nami bi a
. 4294298
. 059309
4. 843116 |
|
Tay i ki s t an
- . 5004939
. 0779316
- 5. 622381 |
| ---------------------------------------------------|
|
Sr i Lanka
- . 3583613
. 0410365
- 4. 015223 |
+- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - +
E n este listado aparecen las tres distan cias m en cion adas en los seis casos
cu as distan cias estn por en cim a (o por d eb a
o) de los lm ites recom en d a
bles. Sin son elim in ados d e la regresin es eid en te qu e se produ cir u n a
m e
ora d el a
u steob ten ien do u n a a
u stada por en cim a tam b in d e 0
1.
regress l
tm i l
pnbppa lintfno if (abs(l
tm i
dfits)
sqrt((e(df
m )1)
e())
l
tm i
coosd
e()
abs(l
tm i
elsc)
sqrt(e(d fm )1))
E S E
S
(10.1)
E n el ca so d e qu e u n d eter m in a d o ca so n o ten ga in flu en cia a lgu n a
sob r e la s a r ia n a s co
a r ia n
a s d e los estim a d or esel
a lor d e este
esta d stico es 1.
u icio d e elsle
u elsc(10)el a lor a b
solu to d e esta m ed id a m en os u n a u n id a d a d e ser m en or d e k
n . e
otr o m od o ten d r a qu e ea m in a r se cu id a d osa m en te la ob ser
a cin qu e
n o ten ga esta s ca r a cter stica s. a r a r ea lia r esta ep lor a cin con Sta ta
tr a s la e
ecu cin d e la r egr esin a d e gen er a r se la m ed id a or d en a rsi
se d esea los ca sos p or su a lor lu ego lista r o r ep r esen ta r los ca sos qu e
n o cu m p len este cr iter io.
p red ict ltm i
co
coratio
sort ltm ico
list pa is l
tm i
coif a bs(l
tm i
co
1)(e(d f
m )1)
e() e(sam p le)
E n este e
em p lo son n u e
e los casos qu e con tien en u n a r an d e co
a
r ian
as su perior a lo d eseado odico d e otr o m odoqu e con su elim in acin
acen
ar iar su stan cialm en te los err ores tp icos d e los estim adores las
co
ar ian
as en tre ellos. E stos son :
ILUSTR ACIN
1 0.1.List a d o
d e
la
r a n
de
co a r ia n a s
1.
2.
3.
4.
120.
121.
122.
123.
124.
+- - - - - - - - - - - - - - - - - - - - - - - - - +
|
pai s
l _t mi _~v |
| -------------------------|
|
Tay i k i s t an
. 8341598 |
|
Sr i Lanka
. 8991215 |
|
Az er bai y an
. 9068658 |
|
Sur af r i ca
. 9191754 |
|
Bur undi
1. 075498 |
| -------------------------|
|
Sui za
1. 077698 |
|
Nor uega
1. 078582 |
| Si er r a Leona
1. 083683 |
|
Suec i a
1. 102308 |
+- - - - - - - - - - - - - - - - - - - - - - - - - +
S
S E S S
1 0..R e gr e s io n e s
e sp e cia le s
esp u s de estu diar los pr oblem as qu e p u ed en plan tear se en u n a r egr esin
a con tin u acin se dan u n a ser ie de tcn icas d e regresin qu e p u ed en solu
cion arloso al m en os diagn osticar los con m s pr ecisin . E s obio qu e lo
qu e se a a estu diar a con tin u acin n o es el n ico rem edio a los pr ob lem as
d eriados d e u n n o cu m plim ien to de los su pu estos d e la regr esin o d e la
p resen cia d e casos an m alos en el an lisis. lgu n os d e elloscom o la tr an s
form acin de las escalas de las
ar iables o la elim in acin d e casos an m alos
a an sido ab ord ad os en las pgin as p reced en tes. con tin u acin lo qu e se
er son otros m odos d e r ealiar la r egr esin qu e se con sider an r egr esion es
r obu stas en la m edid a en qu e su s estim acion es son m s resisten tes a la pr e
sen cia de in cu m plim ien tos en los requ isitos d el m od elo.
E S E
S
cion es d e los coeficien tes son eactam en te igu ales. E n cu alqu ier casocon
asociacion es tan m an ifiestassigu en salien do los tr es coeficien tescon stan te
in clu idasign ificatios.
ILUSTR ACIN
10 .1.R e gr e si n
co n
e r r o r e s
t p ic o s
r o u st o s
Li near r egr ess i on
Number of obs
F( 2,
121)
Pr ob > F
R- s quar ed
Root MSE
=
=
=
=
=
124
601. 43
0. 0000
0. 8787
. 39048
-----------------------------------------------------------------------------|
Robus t
l _t mi |
Coef .
St d. Er r .
t
P>| t |
[ 95% Conf . I nt er val ]
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - l _pnbppa |
- . 5244678
. 0704985
- 7. 44
0. 000
- . 6640382
- . 3848974
l i nt f no |
- . 0022806
. 000407
- 5. 60
0. 000
- . 0030865
- . 0014748
_cons |
7. 98921
. 5093761
15. 68
0. 000
6. 980765
8. 997654
------------------------------------------------------------------------------
e
resion es pon deradas
dem s d el m todo d e m n im os cu ad rad os ord in ariosu n a r egresin pu ede
r ealiar se p on d eran do los datos con u n a determ in ada can tid ad d e tal form a
qu e en la d eter m in acin de la recta in flu an m s u n os casos qu e otros.
E l caso m s clar o r ad ical para p on derar u n a regresin es cu an do se
u tili
a u n a ariab le ficticiapu esto qu e esta fu n cion a com o u n filtr o de en
tr ada d el caso. e este m odotodas las obseracion es qu e ten gan el
alor 1
en la
ar iable d e p on deracin en tr an en la ecu acin en tan to qu e aqu ellas
qu e ten gan el
alor 0 o el alor p er did o n o figu r arn en la r egr esin . E l
m od o m s sim ple de pon d er acin qu e disp on e Stata es m edian te la esp ecifi
cacin gen er al de los p esoses d ecirescr ib ien do en la in stru ccin re
ress el
m od ificador
wei
ht ariab le
. E sta op er acin es equ ialen te a la escritu r a
d e u n con d icion al.
or e
em plosi se d esea acer u n a regresin slo con p ases eu ropeos
su pon ien d o qu e se a cr ead o u n a ariable ficticia den om in ada u ropa con
el
alor 1 par a los p ases de este con tin en tela escritu ra d e estas dos in stru c
cion es d ara resu ltados com pletam en te igu ales:
regress e
n tm i if E u ropa 1
regress e
n tm i
eigtE u ropa
E l r esu ltad o de estas dos ltim as in str u ccion es slo se d ifer en cia en la
aderten cia sob re el tipo de p on deracin qu e se est reali
an d ocom o se
m u estr a a con tin u acin :
S
S E S S
ILUSTR ACIN
1 0.1.R e gr e s i n
co n
p o n d e r a c i n
a n a lt ica
( anal y t i c wei ght s as sumed)
( s um of wgt i s
3. 5000e+01)
Sour c e |
SS
df
MS
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - Model |
275. 704472
1 275. 704472
Resi dual |
282. 466957
33 8. 55960475
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - Tot al |
558. 171429
34 16. 4168067
Number of obs
F( 1,
33)
Pr ob > F
R- s quar ed
Adj R- squar ed
Root MSE
=
=
=
=
=
=
35
32. 21
0. 0000
0. 4939
0. 4786
2. 9257
-----------------------------------------------------------------------------ev n |
Coef .
St d. Er r .
t
P>| t |
[ 95% Conf . I nt er v al ]
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - t mi |
- . 290591
. 051202
- 5. 68
0. 000
- . 3947623
- . 1864197
_c ons |
76. 97623
. 7506194
102. 55
0. 000
75. 44909
78. 50338
------------------------------------------------------------------------------
E fecti
am en tesi n o se esp ecifica el tip o d e pon d er acin qu e se d esea
el pr ogr am a qu e calcu la la r egr esin pon derad a asu m e u n tratam ien to an a
ltico d e los pesos. u iere ello decir qu e (salo p ara datos sin in form acin
casos p er did oso p on deracion es igu ales a 0) los pesos slo se tien en en
cu en ta p ara el clcu lo de los estim ador es en el n m er o d e obser
acion es
ap ar ece el n m ero de casos efectios qu e an o la su m a de las pon d e
r acion escom o as su cedera en el caso de qu e las pon d er acion es fu eran
frecu en ciales (fwei
ht)
E sta d ifer en cia a s com o la com p r en sin d e lo qu e se a ce a l p on
d er a r los ca sos d e u n a r egr esin p u ed e er se cla r a m en te si se p on e u n
e
em p lo con p ocos ca sos. Su p n ga se qu e se d isp on e d e los tr es sigu ien tes
ca sos: (1
) (
) (
)sien d or esp ecti
a m en teel p r im er a lor el d e
el segu n d o el d e . a r a qu e qu ed e m s cla r ose p r esen ta u n lista d o d e
los tr es ca sos con tod a s la s
a r ia b les n ecesa r ia s p a r a el tr a ta m ien to d el
e
em p lo:
ILUSTR ACIN
10 .1.E
e p lo
ia gin a r io
para
e r
c a so s
d e
r e gr e s io n e s
p ond eradas
1.
2.
3.
c as o
A
B
C
X
1
2
2
Y
5
4
6
pes o2
1
2
1
pes o3
1
1
2
E S E
S
ILUSTR ACIN
10 .1.R e gr e si n
sin
p ond erar
Sour c e |
SS
df
MS
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - Model |
0. 00
1
0. 00
Res i dual |
2. 00
1
2. 00
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - Tot al |
2. 00
2
1. 00
Number of obs
F( 1,
1)
Pr ob > F
R- s quar ed
Adj R- s quar ed
Root MSE
=
=
= 1.
= 0.
= - 1.
= 1.
3
0. 00
0000
0000
0000
4142
-----------------------------------------------------------------------------Y |
Coef .
St d. Er r .
t
P>| t |
[ 95% Conf . I nt er val ]
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - X |
0
1. 732051
0. 00
1. 000
- 22. 00779
22. 00779
_cons |
5
3
1. 67
0. 344
- 33. 11861
43. 11861
------------------------------------------------------------------------------
ILUSTR ACIN
1 0.0.R e gr e si n
p ond erada
p e so
( anal yt i c wei ght s ass umed)
( s um of wgt i s
4. 0000e+00)
-----------------------------------------------------------------------------Y |
Coef .
St d. Er r .
t
P>| t |
[ 95% Conf . I nt er val ]
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - X |
- . 3333333
1. 885618
- 0. 18
0. 889
- 24. 29238
23. 62572
_cons |
5. 333333
3. 399346
1. 57
0. 361
- 37. 85946
48. 52612
------------------------------------------------------------------------------
la efectu ada d n d ole el d oble alor al ter cer caso sera esta otr a si
gu ien te:
regress
eigtp eso
n oead
p red ict
S
S E S S
ILUSTR ACIN
1 0.1 .R e gr e s i n
pon derada
p e so
( anal y t i c wei ght s as sumed)
( s um of wgt i s
4. 0000e+00)
-----------------------------------------------------------------------------Y |
Coef .
St d. Er r .
t
P>| t |
[ 95% Conf . I nt er v al ]
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - X |
. 3333333
1. 885618
0. 18
0. 889
- 23. 62572
24. 29238
_c ons |
4. 666667
3. 399346
1. 37
0. 401
- 38. 52612
47. 85946
------------------------------------------------------------------------------
E S E
S
regress
aeigtp eso
ILUSTR ACIN
1 0..R e gr e si n
con
p o n d e r a ci n
a n a lt ic a
( sum of wgt i s
4. 0000e+00)
Sour c e |
SS
df
MS
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - Model |
. 0625
1
. 0625
Res i dual |
2. 00
1
2. 00
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - Tot al |
2. 0625
2
1. 03125
Number of obs
F( 1,
1)
Pr ob > F
R- s quar ed
Adj R- s quar ed
Root MSE
=
=
= 0.
= 0.
= - 0.
= 1.
3
0. 03
8886
0303
9394
4142
-----------------------------------------------------------------------------Y |
Coef .
St d. Er r .
t
P>| t |
[ 95% Conf . I nt er val ]
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - X |
- . 3333333
1. 885618
- 0. 18
0. 889
- 24. 29238
23. 62572
_cons |
5. 333333
3. 399346
1. 57
0. 361
- 37. 85946
48. 52612
------------------------------------------------------------------------------
r e cu e n c ia s
Sour c e |
SS
df
MS
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - Model |
. 083333333
1 . 083333333
Res i dual |
2. 66666667
2 1. 33333333
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - Tot al |
2. 75
3 . 916666667
Number of obs
F( 1,
2)
Pr ob > F
R- s quar ed
Adj R- s quar ed
Root MSE
=
=
= 0.
= 0.
= - 0.
= 1.
4
0. 06
8259
0303
4545
1547
-----------------------------------------------------------------------------Y |
Coef .
St d. Er r .
t
P>| t |
[ 95% Conf . I nt er val ]
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - X |
- . 3333333
1. 333333
- 0. 25
0. 826
- 6. 070204
5. 403537
_cons |
5. 333333
2. 403701
2. 22
0. 157
- 5. 008957
15. 67562
------------------------------------------------------------------------------
S
S E S S
e
resin de m n im os cu adrados
en erali
ados
(pon derados)
n a de las aplicacion es de la pon deracin an altica de las obser
aciones es eli
m in ar el error producido por la presen cia de eterocedasticidad en los datos.
ecu rdese qu e por este trm in o se en tienden
arianas desigu ales en el trm i
n o de pertu rbacin segn el alor de la(s)
ariable(s) indepen diente(s) qu e la
con secu encia estriba en que el error tpico de los estim adores calculado por el
m todo de m nim os cu adrados ordin arios es sesgado. El rem edio de la etero
cedasticidad consiste en pon derar los casos de la regresin por w i 1
s ipero
com o lo que realm ente se pon deran son los residu os cuadrticosse con sigu en
obten er los estim adores de la regresin tran sform an do su s ariables (su cons
tante) por wi en con secu en ciaen este caso por 1
s i. Es decirse a de con ce
bir u na regresin con todos los trm in os de la ecu acin di
ididos por s ilo qu e
con du ce a que el trm ino de error se tran sform ar en con stan te:
(10.)
El resu ltado de esta tran sform acin es qu e el n u e
o trm in o de error
si
i
ten dr arian a con stan tepu esto qu e al di
idir cada pertu rbacin por su des
iacin tpicasiem pre adoptar el alor con stan te de la u n idad.
e este m odoel clcu lo de los coeficien tes de regresin difiere al in tro
d u cir las p on deracion escon
irtin dose en la sigu ien te frm u la:
(10.)
en el clcu lo d e la ar ian
a d el estim ad or tam b in in ter
ien en lgica
m en te las p on deracion es:
(10.)
E S E
S
Y
5
4
6
X
1
2
2
pes o
pes o2
1
1. 414214
1
1
2
1
2. 5000e+00)
Sour c e |
SS
df
MS
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - Model |
. 08
1
. 08
Res i dual |
1. 60
1
1. 60
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - Tot al |
1. 68
2
. 84
Number of obs
F( 1,
1)
Pr ob > F
R- s quar ed
Adj R- s quar ed
Root MSE
=
=
= 0.
= 0.
= - 0.
= 1.
3
0. 05
8600
0476
9048
2649
-----------------------------------------------------------------------------Y |
Coef .
St d. Er r .
t
P>| t |
[ 95% Conf . I nt er val ]
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - X |
. 3333333
1. 490712
0. 22
0. 860
- 18. 60796
19. 27463
_cons |
4. 666667
2. 494438
1. 87
0. 313
- 27. 02818
36. 36151
------------------------------------------------------------------------------
S
S E S S
d ien tes ten gan u n a deter m in ada agru p acin qu e p erm ita calcu lar la ar ian
a de los tr m in os de pertu rb acin .
E l pr im er caso es til cu an do se est an te u n eperim en to se p ien sa
qu e las
ar iacion es d e la p er tu r bacin son solam en te d eb idas a er rores d e
m ed ida. ar a ob ten er la regresin ba
o estos su pu estosse deb e especificar
la op cin sd(variale)con el n om br e de la
ar iable qu e reco
a la des
iacin
tpica d e los m en cion ados err ores. scon tin u an do con el e
em plo an terior
al escr ibir
ls sd (peso)
tese qu eau n qu e los coeficien tes sean igu aleslos er ror es tpicos son
d ifer en tesal calcu larse ba
o otr os su pu estosen este caso el del con oci
m ien to certer o d e los estim adores del er ror d e la ar iable . sim ism oen
lu gar del estadstico se u tilia el estad stico con u n a distr ibu cin d e
n
k
1 grados d e lib er tad. E n este casocom o la pr ob abilid ad de este estad s
tico (el d e la iqu ier da) es su p er ior a 0
0pu ede con sid er arse u n a r egr esin
n o sign ificatia.
E l otr o m od o de fu n cion am ien to del pr ogram a vwls es cu an d o se tien en
alor es agru p ad os d e xien cu o caso b asta con qu e se especifiqu en la
a
r iable d ep en d ien te las in depen dien tesom itien d o la opcin sd. Si eisten
su ficien tes alores para cada x ien ton ces el progr am a calcu la la arian a
d e su s r espectios tr m in os de p er tu r bacin pon d er a la r egresin con su
in
ersa.
1 0..R e gr e s i n
r o u st a
n a d e las p osibilid ades de p on d erar u n a r egr esin es a tras d e pr oce
d im ien tos iter atios qu e agan qu e aqu ellos casos con r esidu os pequ e os
E S E
S
ten gan alta in ciden cia en el clcu lo d e los coeficien tesen tan to qu e los
casos con resid u os gr an des ten gan u n p eso m u p equ e osi son in clu so
m u gr an d esn o ten gan n in gu n a rep er cu sin en la estim acin de los p ar
m etr os. E ste p rocedim ien to es esp ecialm en te til cu an d o los tr m in os de
p er tu r bacin n o tien en u n a distrib u cin n or m al acen qu e el clcu lo d e
los coeficien tes sea sesgad o.
E l p rogram a Stata in clu e u n pr ocedim ien to p ara acer este tip o de r e
gresion es sim ilar al qu e pr opu siera u oin g i (1).
E n pr im er lu garse r ealia u n a r egr esin por m n im os cu adr ad os. Se
calcu la el alor d e la de oose elim in an (o se da u n a pon der acin
igu al a 0) a aqu ellos casos en qu e este estad stico ar ro
e un
alor su perior
a la u n id ad .
on estos pesosse reali
a u n a n u ea regresin de la qu e se calcu lan los
r esidu ales (ei) estos son tran sfor m ados (u i) del sigu ien te m od o:
Se calcu la qu e es la m edian a d e la diferen cia en tr m in os absolu tos
en tr e cad a r esidu o su m ed ian aesto esal tom ar las r estas en tr m in os
absolu tosien e a ser u n a m edida de la dispersin d e los residu os:
(10.)
oster iorm en te se calcu la u id iidien d o el r esidu o (r i) p or
0
con
el pr opsito de qu e sean m s ad elan te in frapon d er ados aqu ellos casos cu o
r esidu al absolu to eced a d os eces la m ed ida .
(10.)
estos resid u os reescalados se les ap lica la fu n cin de u berqu e con
siste en d ar pon der acin 1 a todos aqu ellos casos con
u iin fer ior a u n a
d eter m in ada con stan te c (qu e p ara este pr oced im ien to Stata fi
a en 1
)
u n a p on deracin in ferior a esta can tid adsi esta can tid ad absolu ta est
p or en cim a de la con stan te. a n otacin m atem tica d e esta operacin es
la sigu ien te:
(10.)
1
di
idido por el an terior 0
da u n
alor de . or elloeste procedim ien to lo
qu e ace es pon derar por deba
o de 1 a todos aqu ellos casos cuos residu os estn ale
ados de
la m edian a dos
eces su
alor.
S
S E S S
(10.)
E n esta n u ea p on d eracin Stata u tili
a com o con stan te p or om isin el
alor
qu e ace qu e tod os aqu ellos casos cu os resid u ales se ale
en del
p rom ed io siete eces la desiacin m ed ian a ten gan u n a pon deracin igu al
a 0. or a b ien en este segu n d o p asode su cesias iteracion esel u su ario
p u ed e cam biar el
alor de la con stan tem edian te la op cin tu n e(), en la qu e
se debe ep resar cu n tas eces ale
ad o de la m ed ian a se desea qu e la pon de
r acin sea n u la. E ste alorfi
ado por om isin en sietese recom ien da qu e
est com pr en d ido en tr e 1.
a or den qu e e
ecu ta esta regresin r obu sta es rresegu ida d e
ar iables
d epen dien te e in d epen dien tes por este ord en . sla in str u ccin
u se m u n d o
for
a r tm i p n bp pa: gen erate l
ln ()
rreg ltm i l
p n bp pa lin tfn o
E S E
S
ILUSTR ACIN
1 0..R e gr e s i n
r o u st a
Huber
Huber
Huber
Bi wei ght
Bi wei ght
Bi wei ght
i
i
i
i
i
i
t
t
t
t
t
t
er at
er at
er at
er at
er at
er at
i
i
i
i
i
i
on
on
on
on
on
on
1:
2:
3:
4:
5:
6:
maxi
maxi
maxi
maxi
maxi
maxi
mum
mum
mum
mum
mum
mum
di
di
di
di
di
di
f
f
f
f
f
f
f
f
f
f
f
f
er ence
er ence
er ence
er ence
er ence
er ence
i
i
i
i
i
i
n
n
n
n
n
n
wei
wei
wei
wei
wei
wei
ght
ght
ght
ght
ght
ght
s
s
s
s
s
s
=
=
=
=
=
=
.
.
.
.
.
.
58401938
07575524
01236351
19114446
01413694
00148212
Number of obs =
F( 2,
121) =
Pr ob > F
=
124
462. 99
0. 0000
-----------------------------------------------------------------------------l _t mi |
Coef .
St d. Er r .
t
P>| t |
[ 95% Conf . I nt er val ]
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - l _pnbppa |
- . 5751774
. 0667243
- 8. 62
0. 000
- . 7072758
- . 443079
l i nt f no |
- . 002082
. 0003728
- 5. 58
0. 000
- . 0028201
- . 0013439
_cons |
8. 382187
. 4942138
16. 96
0. 000
7. 40376
9. 360613
------------------------------------------------------------------------------
.2
.4
New weight
.6
.8
R IC
10 ..r
ic o
d e
co p a r a ci n
d e
la s
p o n d e r a c io n e s
de
la
r e gr e s i n
r o u st a
.2
.4
.6
Old weight
.8
S
S E S S
1
New weight
.6
.2
.2
.4
.4
New weight
.6
.8
.8
R IC
10 ..Se c u e n c ia
d e
gr
ic o s
d e
la
r e gr e si n
r o u st a
2
Old weight
.4
.6
.8
Old weight
E n el grfico d e la i
qu ier da aparece el cru ce de p esos tras la pr im er a
iteracin . E l p u n to de p ar tid a (el an tigu o p eso) es qu e tod os los casos ten
gan la pon deracin igu al a 1per oseg n los cr iterios de u b eraqu ellos
qu e estn p or d os eces ale
ados de la d esiacin m edian a reciben u n peso
tan to m en or cu an to m s ale
ad o est de aqu ella. or otr o ladoa la d er eca
ap ar ece el cr u ce tras r ealiar el paso de iteracion es de u b er a ieigts.
os casos alin ead os en el etr em o su perior in d ican tod os aqu ellos qu e p or
ale
arse poco d el
alor de la m ed ian a u ber los pon d er aba con la u n idad.
E n el caso d e iwei
h testos casos se a
u stan n o a u n a igu ald adsin o a u n a
frm u la por eso n o son eactam en te igu ales a 1 n i tan siqu iera en el p ri
m er paso. E l resto son tan to m s par ecid os a los an ter ior es cu an to m s se
u b iqu en en el cen troadoptan d o la relacin u n a form a cu riln ea.
E l p rogr am a rrecon tien e otra op cin qu e perm ite cam biar el lm ite a
p artir d el cu al de
a de r ealiar iter acion es. Se tr ata d e la opcin toleran ce(),
qu e de
a d e r ealiar u n a n u ea iter acin en bu sca de n u eos p esoscu an do
la m aor d iferen cia en tre la an terior la poster ior es m en or qu e el n m er o
E S E
S
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
+- - - - - - - - - - - - - - - - - - - - - - - - - - - - +
|
pai s
w_l t mi |
|----------------------------|
|
Tay i ki s t an
. 19891184 |
|
Sur af r i ca
. 40272357 |
|
Sr i Lanka
. 44528413 |
|
Azer bai y an
. 47349819 |
|
Nami bi a
. 47353931 |
|----------------------------|
|
Bot s uana
. 49146373 |
| Est ados Uni dos
. 49712956 |
|
Tur qui a
. 57274883 |
|
Uzbeki s t an
. 61091855 |
|
Mal ai s i a
. 6412604 |
+- - - - - - - - - - - - - - - - - - - - - - - - - - - - +
S
S E S S
80
60
40
20
0
Tasa de mortalidad in
antil
100
R IC
10 .10 .r
ico
de
co p a r a ci n
d e
r e gr e sio n e s
10000
20000
30000
PNB por unidad de compra
40000
E sta ltim a
ariable est in troducida en el grfico en m odo de control. ara ello se a
tom ado com o
alor con stan te de ella su m edia aritm tica.
E S E
S
coef
1
1
p n bp pacoef
1
tfn o
rreg tm i p n bp pa lin tfn o
m atrircoefe(b)
gen era te rt
tm ircoef
1
rcoef
1
1
p n bp parcoef
1
tfn o
regress ltm i l
p n b pp a lin tfn o
m atricoefe(b)
gen era te tltm icoef
1
coef
1
1
l
p n b pp acoef
1
tfn o
gen era te tltm iep(tl
tm i)
rreg ltm i lpn b pp a lin tfn o
m atrircoefe(b)
gen era te rtltm ircoef
1
rcoef
1
1
l
p n b pp arcoef
1
tfn o
gen era te rtltm iep(rtltm i)
la bel
a ria ble ttm i
asa p red ica lin eal
la bel
a ria ble rttm i
asa predica lin eal robu sta
la bel
a ria ble tltm i
asa p red ica log
log
la bel
a ria ble rtltm i
asa p red ica log
log robu sta
scatter tltm irtl
tm ittm i rt
tm i pn b pp acon n ect (. l . l) sm b ol(o . o .)
l1title(
asa de m ortalid ad in fa n til
) sort(pn b pp a) n am e(
repla ce)
10 ..R e gr e si n
de
cu a n t ile s
tr o m odo de con segu ir regresion es r ob u stas es la de r ealiar m odelos b a
sados en la estim acin d e la m edian ao cu alqu ier otra m edida de locali
a
cin en lu gar de la m ed ia. E stoen u n p rim er m om en top erm ite qu e los
alor es etr em os de la ar iable d epen dien te ten gan m en os in flu en cia en la
con figu racin d e la r egr esin . E n efectoen lu gar de in ten tar pr edecir la
m edia d e y par a cad a alor de xse tr ata d e p redecir la m ed ian a. or ello
la ecu acin de este tip o d e r egr esin se epr esa del sigu ien te m od o:
(10.)
sien d o p u n n m er o en tr e 0 1a m b os eclu id o sq u e r ep r esen
ta el cu a n til so b r e el qu e se q u ier e r ea lia r la r egr esin . E l ca so m s
com n qu e a d op ta el p r o gr a m a p o r o m isi n es el d el a lo r 0
0q u e
r ep r esen ta a la m ed ia n a . e este m o d o a l escr ib ir la sigu ien te in str u c
cin
S
S E S S
qreg tm i lpn bp pa
se ofr ecen las sigu ien tes estim acion es de los coeficien tes d e la regre
sin :
ILUSTR ACIN
10 ..R e gr e si n
d e
cu a n t ile s
I t er at i on
1:
2025. 2391
I t er at i on
I t er at i on
I t er at i on
2007. 8504
1998. 5785
1997. 8248
Medi an r egr es si on
Raw sum of dev i at i ons
3802 ( about 28)
Mi n sum of dev i at i ons 1997. 825
Number of obs =
Pseudo R2
125
0. 4745
-----------------------------------------------------------------------------t mi |
Coef .
St d. Er r .
t
P>| t |
[ 95% Conf . I nt er v al ]
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - l _pnbppa |
- 26. 51133
2. 070181
- 12. 81
0. 000
- 30. 60912
- 22. 41353
_c ons |
263. 1863
17. 2808
15. 23
0. 000
228. 98
297. 3926
------------------------------------------------------------------------------
ora b ien la m e
or for m a d e com p ren der la estim acin d e la r egr esin
cu an tlica es con u n sen cillo e
em plo en el qu e la ariab le in depen dien te
sea dicotm ica se tom e el cu an til 0es decirla m edian a.
m agn ese qu e
ten em os seis casos diid id os en d os gr u pos (a los qu e se les d a arb itr ar ia
m en te los alores de 0 1)en el p rim er gr u po los alores de la
ariable de
p en d ien te son 1m ien tr as qu e los corr espon dien tes al segu n d o gru p o
son . E s eiden te qu e la m ed ian a del pr im er gr u po (x0) es igu al a
m ien tras qu e la del segu n do (x1) es igu al a . E n con secu en ciael alor
d e la con stan te sera igu al a (la m edian a en el gr u po con alor 0 en x) el
alor del coeficien te es igu al a (la d iferen cia en tr e las d os m ed ian as). E l
e
em plo con ten dr a los sigu ien tes datos:
ILUSTR ACIN
10 .0 .a t r i
d e
e
e p lo
para
la
r e gr e si n
d e
cu a n t ile s
1.
2.
3.
4.
5.
6.
X
0
0
0
1
1
1
Y
1
2
3
7
8
9
E S E
S
ILUSTR ACIN
1 0.1.R e gr e si n
d e
c u a n t ile s
s o r e
e l
e
e p lo
ict icio
I t er at i on
1:
I t er at i on
Number of obs =
18 ( about 3)
4
Ps eudo R2
6
0. 7778
-----------------------------------------------------------------------------Y |
Coef .
St d. Er r .
t
P>| t |
[ 95% Conf . I nt er val ]
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - X |
6
1. 379796
4. 35
0. 012
2. 169073
9. 830927
_cons |
2
. 975663
2. 05
0. 110
- . 7088748
4. 708875
------------------------------------------------------------------------------
(10.0)
don de p (yi) es el alor de la p osicin cu an tlica dad a en el con
u n to
d e la m u estr ae
yi el alor pr edico con la ecu acin cu an tlica corr esp on
d ien te a cada u n o de los alor es distin tos d e x. en este casoel alor as
cien de al qu e r ep resen ta la m e
ora en la estim acin de la m ed ian a qu e
su p on e el con ocim ien to d e la(s) ariab le(s) in depen dien te(s).
S
S E S S
1:
3. 6000001
I t er at i on
I t er at i on
I t er at i on
4
3. 5
3
. 25 Quant i l e r egr es s i on
Raw sum of dev i at i ons
Mi n sum of dev i at i ons
Number of obs =
12 ( about 1)
3
Pseudo R2
6
0. 7500
-----------------------------------------------------------------------------Y |
Coef .
St d. Er r .
t
P>| t |
[ 95% Conf . I nt er v al ]
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - X |
6
. 5129548
11. 70
0. 000
4. 575809
7. 424191
_c ons |
1
. 3627138
2. 76
0. 051
- . 0070549
2. 007055
------------------------------------------------------------------------------
E S E
S
u se m u n d oclear
reg tm i pn bp pa
p red ict ttm i
la bel
a r ttm i
red iccin m n im os cu ad rad os
qreg tm i pn bp pa
p red ict qtm i
la bel
a r qtm i
red iccin por cu an tiles
scatter qtm i ttm i pnbppacon nect (.l) sm bol (o.) sort(pnbppa) nam e(
replace)
s se obtien e u n gr fico don de los pu n tos repr esen tan la estim acin d e
la m ed ian am ien tr as qu e la r ecta es la r egr esin lin eal clsica. om o p u ed e
apr eciar sela pr im era pr on ostica
alores m s cen tr ad os en tor n o al pr om e
d io de la ariab le depen dien te (est m en os in clin ad a)al estar su p rediccin
m en os in flu ida por los casos etr em os.
50
50
100
R IC
10 .1 1.r
ico
co p a r a t io
d e
r e gr e si n
d e
la
e d ia n a
ren te
a
la
r e gr e si n
cl sic a
10000
20000
PNB por unidad de compra
30000
40000
10 ..R e gr e si n
p or
a n d a s
tr a posib ilidad p ara efectu ar u n a
u ste a los datos qu e perm ite m s flei
b ilidadp or u n lad otam b in ep lor ar la p osible r elacin fu n cion al en tr e
d os
ar iables es la r egr esin por ban d as. E n r ealid ad n o se trata d e n in g n
p roced im ien to qu e calcu le p arm etr ossin o u n a tcn ica ep lor atoria gr
fica para repr esen tar d e m odo fided ign o la relacin en tre u n p ar de aria
b les. e ecoen Stata n o se reali
a con n in gu n a in stru ccin sim ilar a la
d e las r egr esion essin o con el com an d o
raphics.
S
S E S S
20
Median bands
40
60
80
R IC
10 .1.r
ico
de
r e gr e si n
por
a n d a s
10000
20000
PNB por unidad de compra
30000
1 0..E
e r cicio s
1.
11
La
r e gr e si n
lo gst ica 1
E l m odelo de r egr esin lin eal es u n a tcn ica de gr an poten cia y ver satilid ad. Perm ite p redecir el com portam ien to d e u n a var iable dep en d ien te en
fu n cin de u n a o m s variab les in depen dien tes y estim ar con pr ecisin la
capacidad explicativa del m odelo (gr acias al coeficien te de d eter m in acin ),
en tr e otras m u cas ven ta
as. Per o tien e u n a restr iccin im por tan te para las
cien cias socialesslo se pu ed e u tiliar con variab les dep en d ien tes p u ram en te cu an titativas (de in ter valo o d e r an ). E n sociologa, la m ayor parte
d e las var iables u e se estu d ian son cu alitativas o categr icas (n om in ales u
or din ales), por lo u e la posib ilidad real d e u so d e la regresin lin eal es bastan te lim itad a. Para este tipo de variab les se pu eden u tiliar las tcn icas de
r egr esin logstica, basadas en el m od elo lin eal, p er o ad aptad as a variab les
categricas. u n u e son algo m s com p le
as de in terp retar u e el m odelo
lin eal y algo m en os p recisas en algu n os asp ectos, p er m iten r ealiar u n an lisis de var iables categr icas eu ivalen te al del m od elo lin eal. a base de tod as estas tcn icas logsticas es el m odelo de r egr esin logstica para var iable
d epen dien te dicotm ica (logit), u e es el u e se in clu ye en este cap tu lo.
1 1.1.E l
m o d e lo
e st a d st ico
ay d os m an eras p rin cip ales de
u stificar el m od elo estad stico d e la regresin logsticala pr im era se b asa en la r elacin ter ica en tr e la variab le dep en d ien te observada (dicotm ica) y u n a variab le d epen dien te in ob ser vad a
o laten te (con tin u a)la segu n d a se b asa en la tr an sform acin d e la var iable
d epen dien te dicotm ica en u n a fu n cin de pr obabilid ad n o lin eal (on g y
reese -).
Para am pliar con ocim ien tos de este captulo y el prxim o se recom ien da especialm ente
el libro on g y reese (), cu yos argu m en tos, propu estas y program as au se refle
an .
am bin son tiles orroa(), ldricy elson (), osm er y em eso () y
ilbe (). u y bsico, en castellan o, en esta m ism a coleccin,
ovell (). am bin se a
pu blicado otro m on ogrfico en castellan o en la coleccin de u adernos de E stadstica (ilva
y arroso ).
06/06/12 09:40
E E
11.1.1.E l
m odelo
de
variable
laten te
u alu ier var iable obser vad a d icotm ica p u ed e con cebirse com o u n a m an ifestacin de otra var iable laten te con tin u a. n a variab le dicotm ica observada in dica la existen cia o n o de u n deter m in ado atribu to, o a la ocu r ren cia
o n o de u n d eterm in ad o su ceso. n o p u ed e im agin arse u e tras tal atribu to
o su ceso existe u n a p rop en sin o u n a p rob ab ilid ad de ocu r ren cia (n o observada, n i n ecesar iam en te obser vab le), u e tien e carcter con tin u o y u e, al
su per ar u n cier to u m b ral, deter m in a la existen cia del atr ibu to u ocu r r en cia
d el su ceso en cu estin . a regresin logstica se pu ede en ten der com o u n a
m od eliacin d e la variable laten te (n o observada) en fu n cin d e la r elacin
obser vada en tre la variab le dicotm ica ob ser vad a y la var iable o variab les
in d ep en d ien tes in tr odu cidas en el m odelo.
E n el e
em plo de asisten cia a m an ifestacion es u e se em plear a lo largo
de este apartado, la variable resu ltado o depen dien te es dicotm ica, al tom ar
slo dos valoressi el in dividu o n o a asistido a u n a m an ifestacin y si el
in dividu o lo a eco en determ in ado periodo. E s con cebible u e esta variable depen da de otra variable su byacen te con tin u a u e se pu ede llam ar propen sin a m an ifestarse, por e
em plo. e eco, es excesivam en te restrictivo
el resu m ir toda la in form acin sobre la asisten cia a m an ifestacion es en u n a
variable dicotm ica, pu esto u e se pu ede n o aber asistido n u n ca pese a ten er
u n a actitu d m u y favorable acia ellas, o se pu ede aber asistido sin dem asiado
en tu siasm o, por e
em plo. a (in observada) propen sin a m an ifestarse podra
tom ar, por e
em plo, el valor m n im o en u n a person a u e n o se a m an ifestado
n i probablem en te se m an ifestar por su s con viccion es o valoresvalores m edios en au ellas person as u e se an m an ifestado algu n a ve, pero sin m u co
en tu siasm o, y alcan ara el valor m xim o en au ellos u e n o slo se ayan
m an ifestado an teriorm en te, sin o u e se m an ifiestan y volvern a acerlo de
m an era asidu a. a variable dicotm ica se pu ede en ten der com o u n a m an ifestacin de esa variable laten te con tin u a, pu esto u e a partir de u n determ in ad o
n ivel de propen sin a m an ifestarse (lo u e pu ede den om in arse u n n ivel u m bral) lo m s probable es u e el in dividu o se aya m an ifestado (y lo con trario
si la propen sin del in dividu o est por deba
o de ese n ivel u m bral).
E l grfico .m u estra la relacin ipottica en tre la variable laten te
propen sin a m an ifestarse y u n a variable in depen dien te con tin u a cu alu iera
(por e
em plo, la edad). E l e
e vertical iu ierdo represen ta la variable laten te
o terica (de a el asterisco tras la y), y el e
e ori
ontal la variable independiente
observada (la edad). a ln ea u e cru a el grfico represen ta la relacin en tre
tro e
em plo, tal vem s claro, es el del acu erdo con u n a opin in poltica. na person a
puede estar de acu erdo o en desacu erdo con la frase sin partidos n o puede aber dem ocracia
(si esta variable est codificada com o variable dicotm ica). Pero lo m s probable es u e las
person as ten gan opiniones m s m ati
adas, existiendo un contin uo de opiniones, desde el desacu erdo absolu to asta el acuerdo total. e n u evo, existira u n n ivel u m bral a partir del cu al el
en trevistado respon dera s a la pregu nta.
06/06/12 09:40
y*
y=1
0.5
=0
y=0
E(y*|x)
Pr(y=1|x)
0
25
40
55
70
85
06/06/12 09:40
E E
a regresin logstica se pu ede en ten d er, por tan to, com o u n a m odeliacin de la relacin en tre u n a var iable dicotm ica dep en d ien te obser vad a
y u n a o m s variab les in d ep en dien tes, tal y com o se m u estr a en el grfico ., asu m ien do la existen cia de u n a variable laten te con tin u a su byacen te.
E n trm in os form ales, la relacin en tr e la var ia ble laten te y las va ria b les in d epen dien tes d el m od elo (r ep resen ta da en el gr fico .) es la
sigu ien te
(.)
on de la con stan te est r ep resen tada p or b0, los coeficien tes asociados a
cada var iable x por el resto de b, y el er ror aleator io por
i (se tr ata de u n a
ecu acin estn d ar de regresin ).
a relacin en tre la variab le depen dien te d icotm ica ob ser vad a y la var iable laten te p u ede form u larse del sigu ien te m od o
(.)
Por tan to, para u n valor deter m in ado de u n a sola x, la pr obabilidad de
u e la var iable d icotm ica tom e u n valor d e ser la sigu ien te
(.)
u stitu yen d o d e (.) y r eor gan ian do los tr m in os
(.)
o u e vien e a dem ostrar u e la pr ob abilid ad d e ocu r ren cia d e y d ep en d e n o slo de su r elacin con las var iables in depen dien tes del m odelo, sin o
tam b in d e la distribu cin d el er ror d e la var iable laten te (r ep resen tado en
la por las r eas som b readas).
a d istr ibu cin del err or de la variab le laten te n o es con ocid a, y por tan to se a d e recu rr ir a algu n a distr ibu cin ter ica para d esp e
ar la ecu acin
y pod er calcu lar el m od elo de r egr esin n o lin eal par a var iable d ep en d ien te
d icotm ica. E l m od elo pr obit es el u e d eriva d e asu m ir u e se distr ibu ye
n orm alm en te (con m edia y var ian a d e ), m ien tras u e el m odelo logit
d er iva de asu m ir u e se distrib u ye d e m an er a logstica (con m edia y var ian
a p
). a fr m u la de (.) para el m od elo pr ob it, p or tan to, es
(.)
06/06/12 09:40
(.)
om o se pu ede in ferir del gr fico .y de las ecu acion es (.) y (.),
en fu n cin de la d istr ib u cin u e se asign e al err or de la variab le laten te, la
cu r va d e pr ob abilid ad estim ad a por el m odelo ser liger am en te d ifer en te.
i se asu m en er ror es n orm alm en te d istr ibu idos (m od elo p rob it), la cu r va
ten d er a ap roxim ar se m s rpidam en te a los e
es u e si se con sid er an los
er rores con u n a d istr ib u cin logstica (m od elo logit). Por tan to, los coeficien tes var iarn liger am en te. Per o, en la pr ctica, los r esu ltad os su stan tivos
ser n m u y sim ilar es (pese a u e los coeficien tes n o son d ir ectam en te com p arables), p or lo u e u tiliar u n m odelo u otro dep en d e m s de las pr efer en cias del in vestigador u e d e n in gu n a otra cosa. E n este libr o se em p lea
n icam en te el m odelo logit, u e es el u e m s se u tili
a en las cien cias sociales (sobr e todo en sociologa), p robab lem en te p or su m ayor facilidad de
in terp retacin al poder expr esar se en fu n cin de cocien tes de r aon es (odds
ratio),
com o se exp licar m s adelan te.
11.1.2.E l
m odelo
de
probabilidad
n o
lin eal
n a
u stificacin m s sen cilla, u e n o reu iere recu r rir a la existen cia de
variab les laten tes su byacen tes a la var iable dicotm ica obser vad a, es la u e
d eriva de u n a sim ple tran sfor m acin del m odelo de regresin p ar a var iable
d epen dien te d icotm ica en u n m odelo d e pr obabilid ad n o lin eal, u tilian d o el con cepto de cocien te de r aon es. E sta
u stificacin p er m itir tam b in
u n a p rim er a apr oxim acin a la in ter pr etacin d e los r esu ltad os del m od elo
d e r egr esin logstica.
n a va r ia b le d icot m ica s lo p u ed e tom a r d o s va lo r es, o . i
se u tilia el m od elo d e r egr esi n lin ea l est n d a r co n u n a va r ia b le d ico t m ica co m o va r ia b le d ep en d ien te, lo s va lo r es p r ed ico s d e la va r ia b le d ep en d ien te p u ed en ser m a yo r es u e o m en o r es u e , en fu n ci n d e su r ela cin co n la s va r ia b les in d ep en d ien tes, lo u e o b via m en te
n o tien e n in g n sen tid o. E l m o d elo d e p r ob a b ilid a d lin ea l ser a el sigu ien te
(.)
m o p u ed e m od ificar se el lado iu ierd o d e la ecu acin p ar a con str e ir su ran go d e a n a m an era d e acer lo es con ver tir las p rob ab ilida-
06/06/12 09:40
E E
(.)
Por e
em plo, la ran de aber p articip ado en algu n a m an ifestacin p ara
el total d e los en cu estados es igu al a la probabilidad de aber particip ad o divid ida p or la p rob ab ilidad de n o ab er p articipado, es decir, ,,,.
as raon es in d ican la relacin (o proporcin ) en tre la probabilidad d e ocu rren cia d el su ceso y la prob abilid ad de n o ocu rren cia. E n este caso, la p robab ilidad d e aber particip ad o en algu n a m an ifestacin rep resen ta u n d e
la p rob ab ilidad d e n o ab er participad o. am bin podra ab erse calcu lad o la
ran de n o ab er participad o fren te a la d e ab er participad o
(.)
E n cu yo caso el r esu ltad o u biese sido ,,,. sea, es ,
veces m s p rob ab le n o ab er p ar ticipado n u n ca u e ab er p articipado en
algu n a m an ifestacin para u n caso seleccion ado al aar en la m u estra.
a ran vara d e , cu an d o la pr obabilid ad de ocu rr en cia del su ceso
es y la de n o ocu r ren cia , a , cu an d o la p rob ab ilidad de ocu rr en cia
d el su ceso es y la d e n o ocu r ren cia es . Para con segu ir u e vare de - a
, se u tili
a el logar itm o n ep er ian o de la ran . u an do la r an es m en or
u e , su logar itm o es n egativo, y cu an do es m ayor u e , es positivo. l
logar itm o n ep er ian o de la ran se le d en om in a logit y es lo se u tilia com o
variab le depen dien te en la ecu acin d e la regresin logstica
(.)
e m od o u e el m od elo de regresin logstica es eu iva len te a l m odelo d e r egr esin lin ea l con la difer en cia d e u e tra n sfor m a la var ia ble
depen dien te en el loga ritm o de su ra
n , p a ra con segu ir a s u e va re d e
E l trm in o in gls odds n o tien e u n a tradu ccin clara al espa ol. E n los pases an glosa
on es, odds (en plural) es u n trm in o m u y u tiliado en el m u ndo de las apu estas, y se su ele tradu cir com o pu n tos de ven ta
a o sim plem en te tanto
con tra
tanto, expresan do las probabilidades a
favor y en contra de u n a apu esta, ue determ in arn las gan an cias relacion adas con tal apu esta.
lgu n os au tores ue an escrito sobre logit en castellan o proponen el trm in o castellan i
ado
ods (
ovell ). in em bargo, au se em plear el trm in o razn
para den om inarlo, m ien tras u e ratio ser tradu cido por cocien te.
06/06/12 09:40
(.)
o u e n o es m s u e la m ism a ecu acin (.), en la u e se a desp e
ado el logar itm o del lado iu ierd o de la ecu acin p ara u e este exp rese
slo la ra
n . Por tan to, los coeficien tes wi in d ican cm o vara la ran de la
variab le dep en d ien te cu an do la var iable in depen dien te var a en u n a u n idad.
E ste coeficien te d e la ecu acin logstica, exp resado en raon es, se den om in a
cocien te de r a
on es, y tien e u n a in terpr etacin diferen te al coeficien te de
u n a ecu acin d e r egr esin n orm al. E n u n a regresin n orm al, el coeficien te
in dica en u m ed ida au m en ta el valor d e la variab le d epen dien te cu an d o
au m en ta en u n o la in d epen dien teen u n a r egr esin logstica exp resada en
form a de r a
on es, el coeficien te exp resa en u m ed ida se m u ltip lica la ran de la variable d ep en dien te cu an d o la in d ep en d ien te au m en ta en u n o. E s
d ecir, el cocien te de raon es m ide el efecto en trm in os de tasa d e cam bio,
n o en cu n tas u n idad es au m en ta o d ism in u ye la d ep en d ien te. n cocien te
d e r aon es su p er ior a in dica u e el efecto de la variab le in depen d ien te en
cu estin es positivo (au m en ta la ran de ocu r ren cia d el su ceso estu d iad o), u n cocien te de r a
on es in ferior a in d ica u n efecto n egativo (r edu ce
la ran ) y u n cocien te d e r a
on es de in d ica au sen cia de efecto. e este
m od o, si en este e
em p lo (estu d ian do la p articipacin en m an ifestacion es),
06/06/12 09:40
E E
(.)
E cu acin u e es idn tica a la (.) (a la u e se lleg con el m od elo de
variab le laten te), y u e expr esa la r elacin en tre u n a var iable dicotm ica
y, expr esad a com o pr ob abilid ad de ocu rr en cia del su ceso y, y u n a o
m s variab les in depen dien tes. E l resu ltado d el m od elo n o se saldr del ran go -, y la ln ea d e r egr esin de pr obabilid ad pr ed ica ten dr u n a form a
su avi
ad a, d e s, d e tal m od o u e cu an do la ln ea se ap roxim e a o a in crem en tos gran des en las variab les in d ep en d ien tes se cor resp on d ern con
in crem en tos cada vem en or es en la pr obabilidad d e la d epen dien te (com o
u ed m ostr ad o an ter iorm en te en el gr fico .).
11 ..E s t im a ci n
d e l
m o d e lo
n a vecon tem p la d o el fu n d a m en to m a tem tico d el m od elo d e r egr esin logstica , se exa m in a a con tin u a cin m ed ia n te u n e
em p lo la estim a cin con ta ta y la in ter p r eta cin d e los p a r m etr os y coeficien tes
esen cia les d e este p r oced im ien to esta d stico. E l p r op sito d el e
em p lo ya
com en a d o es estu d ia r u tip o d e p er son a es m s fr ecu en te o p r ob a b le
u e a ya a sistid o a m a n ifesta cion es a lgu n a veen su vid a , con va r ia b le
d ep en d ien te d icotm ica (a a sistid o a lgu n a vea u n a m a n ifesta cin
n o a a sistid o n u n ca ). om o va r ia b les in d ep en d ien tes, se em p lea r n
d istin ta s va r ia b les sociod em ogr fica s ta n to cu a n tita tiva s com o cu a lita tiva s (in gr esos, ed a d , estu d ios, situ a cin la b or a l, gn er o y ta m a o d e b ita t). o u e se p er sigu e es con str u ir u n m od elo u e exp liu e la m a yor
ca n tid a d p osib le d e va r ia b ilid a d d e la va r ia b le d ep en d ien te con el m en or
n m er o p osib le d e va r ia b les in d ep en d ien tes (es d ecir, el m od elo m s p a rsim on ioso).
as variables cualitativas ue se in clu yan com o variables in depen dien tes en la regresin
deben estar codificadas com o ficticias, lo u e ya se a explicado en la seccin ..
06/06/12 09:40
), e in gresos
(tam bin con ver tid a
en factor con tres categorasm en os d e .pesetas al m es
categora
b ase
, de .a .p esetas y m s d e .). E n tr e todas las var iab les sociod em ogr ficas se an in clu id o estas cu atro poru e se sosp eca u e
son las u e m e
or exp lican la frecu en cia r elativa de u e u n a p er son a aya
asistid o algu n a vea u n a m an ifestacin .
o pr im ero u e ap ar ece en la ilu stracin .es el pr oceso iter ativo d e
estim acin d el m od elo a tr avs del m todo de m xim a ver osim ilitu d . tata
m u estra los valores su cesivos de la fu n cin de ver osim ilitu d p ar a los distin tos p arm etr os u e va estim an do. E n la iteracin , todos los coeficien tes
valen m en os la con stan te, y en iter acion es su cesivas se van ap roxim an d o
valor es de los coeficien tes u e in cr em en tan el valor d e la fu n cin de ve
as asu n cion es son las abitu ales de los m odelos de regresin ue n o falten variables
im portantes en el m odelo, u e no aya m u lticolin ealidad en tre las variables indepen dien tes,
etc. ase el segu ndo captulo dedicado a la regresin.
e eco, n o se m axim i
a directam en te la fun cin de verosim ilitu d, sin o su logaritm o
(log
lieliood), lo u e sim plifica la com pu tacin . E ste log
lieliood es el ue aparece en la
salida de tata de logit.
06/06/12 09:40
E E
r osim ilitu d . om o pu ede apr eciar se, en cad a iteracin el logar itm o d e la
ver osim ilitu d es m ayor (m en os n egativo en este caso), au n u e dado u e
en cada iteracin se apr oxim a m s la fu n cin a su m xim o, cada iter acin
a ade m en os valor. u an d o el m ecan ism o iter ativo con sidera u e ya n o es
n ecesario segu ir refin an d o la estim acin , p or u e ya las iter acion es n o a ad en p rcticam en te n ada d e verosim ilitu d al m odelo, se detien e el pr oceso y
m u estr a los coeficien tes estim ad os. om o se pu ede ver, la d ifer en cia en tre
el log
lieliood de la iter acin y el d e la iteracin es m n im a, por lo u e
ya n o es n ecesario segu ir refin an d o la estim acin . E n tres iteracion es se an
con segu id o estim ar los coeficien tes u e m s verosm ilm en te p u ed en aber
p rodu cid o los valores observados de la var iable depen dien te.
ILR CI
11 .1.R e gr e si n
lo gst ica
I
I
I
I
I
t
t
t
t
t
er at
er at
er at
er at
er at
i
i
i
i
i
on
on
on
on
on
0:
1:
2:
3:
4:
l
l
l
l
l
og
og
og
og
og
l
l
l
l
l
i
i
i
i
i
k el
k el
k el
k el
k el
i
i
i
i
i
hood
hood
hood
hood
hood
Logi st i c r egr es s i on
Log l i k el i hood = - 2164. 7337
=
=
=
=
=
- 2459.
- 2168.
- 2164.
- 2164.
- 2164.
6045
0953
7366
7337
7337
Number of obs
LR c hi 2( 6)
Pr ob > c hi 2
Ps eudo R2
=
=
=
=
3717
589. 74
0. 0000
0. 1199
-----------------------------------------------------------------------------mani f |
Coef .
St d. Er r .
z
P>| z |
[ 95% Conf . I nt er v al ]
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - muj er |
- . 400606
. 0738638
- 5. 42
0. 000
- . 5453763
- . 2558357
edad |
- . 0145314
. 0023736
- 6. 12
0. 000
- . 0191836
- . 0098792
es t udi os |
2 |
. 6236568
. 0934946
6. 67
0. 000
. 4404109
. 8069028
3 |
1. 42194
. 1148799
12. 38
0. 000
1. 19678
1. 647101
i ngr es os |
2 |
. 5415312
. 0833178
6. 50
0. 000
. 3782313
. 7048311
3 |
. 618273
. 1250371
4. 94
0. 000
. 3732047
. 8633413
_c ons |
- . 3795612
. 1479147
- 2. 57
0. 010
- . 6694687
- . 0896536
------------------------------------------------------------------------------
E stos coeficien tes estim ados ap ar ecen a con tin u acin . os resu ltados
u e pr opor cion a tata p ara el logit son sim ilares a los d e la r egr esin . rr ib a a la dereca aparece el n m er o de observacion es y u n a p ru eba estadstica d e sign ificacin del m odelo b asad a en el . on u n n ivel de con fian a
d el , el m od elo es sign ificativo si la pr obabilidad u e aparece es in fer ior
a ,. E n este caso, pu ede d ecirse u e la r elacin en tr e los coeficien tes d el
m od elo y la p robab ilidad d e ab er participad o algu n a veen u n a m an ifestacin es sign ificativa estadsticam en te. Por ltim o, ap arece en esta colu m n a
d e estad sticos el p seu d o . om o su pr opio n om b re in dica, es u n estad stico an logo al , u e in dica la b on d ad d e a
u ste del m odelo a los datos.
u n u e n o tien e la in m ed iated e in terp retacin d el de la regresin lin eal, u e directam en te in d ica u pr oporcin de la varian a d e la var iable
d ep en d ien te es explicado por el m odelo, es u n a ap roxim acin b asad a en
06/06/12 09:40
u n a com par acin de la ver osim ilitu d d el m od elo slo con la con stan te
,
con la ver osim ilitu d del m odelo con todos los p ar m etros estim ad os
(.)
(.)
ico con p alabras, el logaritm o d e la ran d e aber participad o en algu n a m an ifestacin es igu al a -,m s ,si se tien en estu d ios secu n d arios, m en os ,p or cad a a o de edad , etc. la vista de esta ecu acin ,
resu lta eviden te u e, a diferen cia d e la regresin lin eal, en el m od elo logit n o
se pu eden in terp retar directam en te los coeficien tes. ab er u e el ser m u
er
d ism in u ye en ,el logaritm o d e la ran de aber particip ad o algu n a veen
u n a m an ifestacin n o sirve p ara m u co. E l logaritm o de la ran es u n a m ed ida d e prob abilid ad in in teligib le, d ificilsim a d e in terp retar tal cu al. E s n ecesario tran sform ar la ecu acin logit origin al en u n a ecu acin m s fcilm en te
in terpretable, u e m u estre la relacin en tre las variab les in depen dien tes y la
d ep en d ien te d el m odelo d e m an era m s com pren sible. E xisten varias estrategias diferen tes u e p erm iten in terp retar el m odelo logit m s fcilm en te. Pero
esto se ver m s ad elan te, en el apartado de in terpretacin d el m od elo. Por
el m om en to, a d e en ten derse cm o se estim a la ecu acin logit y sab erse u
son los estadsticos u e se gen eran con esta in stru ccin de tata.
E l r esto de las colu m n as d e coeficien tes son exactam en te igu ales u e las
u e ap arecen en la salid a d e tata para u n a r egr esin lin eal, y la in terp retacin tam bin es esen cialm en te la m ism a. par ece el er r or tpico d e cad a
coeficien te, su valor z y la p rob ab ilidad asociada a ese valor z (u e in d ica si
el coeficien te es estadsticam en te sign ificativo), y los in ter valos de con fian a
d e cad a coeficien te. o m erece la p en a exten derse m u co m s au , p u esto
u e, com o ya a u edado dico, en el m od elo logit la in ter pr etacin n o se
ace sobr e los coeficien tes com o en la r egr esin lin eal, sin o sob re las p red iccion es o los cocien tes de raon es, com o se ver m s ad elan te.
06/06/12 09:40
E E
ed ia n te la or den logit se m u estr a n dos p ru eba s d e sign ifica cin d iferen tesp or u n la d o, el test d e ci , u e in d ica la sign ifica cin del m odelo
com pleto (o sea , asta u p u n to la r ela cin existen te en tr e la var ia ble d epen dien te y el con
u n to d e var ia bles in depen dien tes es sign ifica tiva )por
otro la do, a pa rece el test de z pa ra ca da coeficien te, in d ica n d o a sta u
pu n to ca d a coeficien te tien e u n efecto sign ifica tivo en la ecu a cin . d icion alm en te se pu eden rea li
a r otra s pr u eb a s de iptesis sob re los coeficien tes d e la ecu a cin p u ede in ter esa r, por e
em p lo, sab er si u n coeficien te es
igu a l a u n determ in ad o va lor, o si dos coeficien tes tien en el m ism o efecto
sobr e la va riab le depen dien te, o si el efecto d e dos coeficien tes d iferen tes
es sim u lt n ea m en te igu a l a . a y d os in stru ccion es u e p er m iten r ea li
a r pr u eb a s de ip tesis sob re los coeficien tes d e u n m odelo logit tr as la
estim a cin test (u e r ealia el test d e a ld) y lrtest (u e realia u n test
de coeficien te de verosim ilitu d o lieliood
ra tio).
E sta dsticam en te n o ay
m u cos a rgu m en tos pa ra pr efer ir u n o u otroa m bos son a sin tticam en te eu iva len tes (slo difieren en m u estra s peu e as, cu a n to m a yor es la
m u estr a, los resu lta dos u e m u estr a n son m s cer ca n os, a sta llegar a ser
pr cticam en te idn ticos en m u estr as gra n des). Por ello, slo se explica a
con tin u a cin la pr u eb a d e a ld (m edia n te la in tr u ccin test) por u e r esu lta m s sen cilla d e u sa r.
Par a r ealiar u n a pr u eba de iptesis con la in stru ccin test, basta con
escr ib ir a con tin u acin la exp resin u e se u ier a com pr ob ar r efer id a a los
coeficien tes d e u n m od elo logit. E l test se r efer ir al ltim o m odelo logit
estim ad o (ay u e ten er cu id ad o con esto, p u esto u e la in stru ccin test
n o in d ica a u m odelo se r efier e, lo u e p u ed e in du cir a err or). on u n os
e
em p los u edar m s claro el u so d e esta in str u ccin , u e, p or otr o lad o,
es sim ilar al corr espon dien te a la regresin com n .
i se desea com pr obar si u n coeficien te es sign ificativo (sign ificativam en te distin to de ), sim plem en te se escribe test segu id o p or el n om br e de
coeficien te. E n el caso de la var iable edad,
la in stru ccin ser a la sigu ien te
test ed ad
[ mani f ] edad = 0
chi 2( 1) =
Pr ob > c hi 2 =
37. 48
0. 0000
om o se p u ed e ob ser va r, en este ca so ta ta r ea li
a la p r u eb a d e a ld
com p r ob a n d o si el coeficien te ed a d tien e u n va lor sign ifica tiva m en te d is-
06/06/12 09:40
[ mani f ]
[ mani f ]
c hi
Pr ob
edad = 0
muj er = 0
2( 2) =
> chi 2 =
65. 09
0. 0000
06/06/12 09:40
E E
ILR CI
11 ..r u e b a
d e
i t e sis
d e
igu a ld a d
de
a r m e t r o s
en
la
r e gr e si n
lo gst ica
( 1)
11 ..ia gn st ico
d e l
m o d e lo
06/06/12 09:40
(.)
p artir de esta estim acin de la varian a, se pu ede obten er el resid u o
d e Pear son , d ividien d o la d iferen cia en tr e la p robab ilidad r eal y la esperad a,
p or su err or tp ico, es d ecir, p or la r acu adr ada de (.).
(.)
este es el p r ob lem a la va r ia n
a de los r esid u a les de u n m odelo de
r egr esin logstica n o es om ogn ea . sea , u e el err or es eter osced stico y la estim a cin d e r esid u a les es in cor recta . tr o p r ob lem a d el
r esid u o d e Pea r son es u e n o p osee u n a d esvia cin tpica igu a l a . Pa r a
ob ten erla , es n ecesa r io u tilia r el r esid u o tip ifica d o p r op u esto p or Pr egib on (), u e r esu elve este p r ob lem a d ivid ien d o, com o en el ca so
d e la r egr esin , el a n ter ior p or
, sien do i la ca r ga d e la s va r ia b les
in d ep en d ien tes.
06/06/12 09:40
E E
(.)
Par a obten er los resid u ales logsticos con tata, de la m ism a m an era
u e en la regresin , es n ecesar io crear u n a n u eva u e alm acen e la d ifer en cia
p ar a cada ob servacin en tre el valor obser vado de la var iable d epen dien te
y el valor pr edico p or el m odelo. E n este caso, la variable depen d ien te es
asisten cia
a
m an i
estacion es
a variable resid u al alm acen a aora la diferen cia en tre la p rob ab ilidad
p redica d e ab er asistid o y el eco d e aber asistid o o n o (seg n la frm u la
vista en
.
). tilian d o la in stru ccin list pu eden exam in arse los prim eros casos, para obten er u n a id ea del con ten id o d e la variable residu al
ILR CI
1 1..List a d o
de
r e sid u o s
e st a n d a r ia d o s
+- - - - - - - - - - - - - - - - - - - +
| mani f
r es mani f |
|-------------------|
1. |
1
- . 3140299 |
4. |
1
1. 006958 |
7. |
1
1. 685212 |
+- - - - - - - - - - - - - - - - - - - +
06/06/12 09:40
ello, es m e
or repr esen tar los r esid u ales grficam en te. E sto tien e dos ven ta
as. Pr im er o, p erm ite acerse u n a id ea gen er al del a
u ste del m odelo a los
d atos, al m ostr ar todos los datos en u n grfico, y detectar fcilm en te casos
extrem os p ar a su in sp eccin m s d etallad a. , segu n do, d ado u e se pu eden
r epr esen tar los resid u ales
u n to con cu alu ier otr a var iable d el m od elo (en
u n grfico de d os d im en sion es d e tata), p u ed en detectar se sesgos o d eficien cias en el a
u ste. odo ello pu ede ver se m e
or con el e
em plo u tili
ad o.
e van a m ostrar en u n grfico los residu os en fu n cin de la variab le edad.
E s p reciso fi
arse en d os cosasprim ero, en la existen cia de casos extrem os,
u e se salgan m u y m arcadam en te de las pred iccion es del m od elosegu n d o,
en la existen cia de relacin en tre la edad y los residu ales. E n el grfico n o se
debe en con trar relacin algu n a en tre la variable edad y la variab le residu al
si ay in dicios de tal relacin , es u e el m odelo est m al especificado (falta
algu n a variab le u e est relacion ada con la ed ad ). Para acer este grfico,
pu ede u tiliarse la ord en scatter de tata (vase el captu lo de grficos)
sca tter resm a n if eda d, yla bel(-) n a m e(, replace)
Residuos estandarizados
0
GR F ICO
1 1..Gr
ico
de
r e sid u o s
e st a n d a r ia d o s
so b r e
una
va r ia b le
in d e e n d ie n t e
20
40
60
edad
80
100
06/06/12 09:40
E E
mani f
1
1
1
1
1
0
1
1
0
1
s exo
Muj er
Muj er
Muj er
Hombr e
Hombr e
Hombr e
Hombr e
Hombr e
Hombr e
Hombr e
edad
74
74
92
56
56
56
56
56
56
56
Pr i
Pr i
Pr i
Pr i
Pr i
Pr i
Pr i
Pr i
Pr i
Pr i
mar i
mar i
mar i
mar i
mar i
mar i
mar i
mar i
mar i
mar i
os
os
os
os
os
os
os
os
os
os
es t
y
y
y
y
y
y
y
y
y
y
udi os
menos
menos
menos
menos
menos
menos
menos
menos
menos
menos
De 150. 0000 a
De 150. 0000 a
Menos de
Menos de
Menos de
Menos de
Menos de
Menos de
Menos de
Menos de
i ngr esos
300. 000
300. 000
150. 000
150. 000
150. 000
150. 000
150. 000
150. 000
150. 000
150. 000
u riosam en te, tata trata los valores perdidos de u n a variable lgica com o verdaderos.
Por eso en la recodificacin para obten er la variable lgica extrem o, los valores perdidos, represen tados con un pu n to, son recodificados al valor .
ese en cm o delan te del -,ay u n
pun to aislado, u e representa cu aluier valor perdido.
06/06/12 09:40
E l estu d io d e los r esidu os p er m ite, por tan to, com p rob ar el n ivel d e a
u ste d e los datos obser vados a los pr ed icos por el m odelo. Per o los r esidu ales
slo in d ican la existen cia de casos extr em os, n o la in flu en cia u e estos casos
tien en sobr e el m odelo de regresin logstica. esto ltim o p u ed e ser a n
m s im p or tan te. u pn gase u e ay u n caso u e a sido m al codificad o y
tien e u n valor absu r do en la variab le depen d ien te (con r especto a su s valor es en las var iables in depen dien tes), p or lo u e se a
u sta m u y m al al m odelo
logstico. E l p roblem a p rin cip al u e pr esen ta este caso n o es u n m al a
u ste
(d esp u s de todo el u e u n caso a
u ste m al n o tien e dem asiada im por tan cia
en s), sin o el eco d e u e p u ed e aber d istor sion ad o la p rop ia estim acin
d el m odelo gen eran do u n os coeficien tes en la ecu acin logstica in corr ectos.
i se r ecu erd a, m s arr ib a la estim acin del m od elo logstico se r ealiaba
p or el m todo de m xim a verosim ilitu du n p roceso estad stico u e estim a
los coeficien tes de la ecu acin logstica u e m s pr obablem en te gen er an
los valores ob ser vad os d e la variab le depen d ien te. Por tan to, si ay valores
er rn eos en la var iable d epen dien te, la estim acin de los coeficien tes estar
sesgada, n o ser corr ecta, p u esto u e se b asa en los valores observados.
u an do se estu d ian los resid u os, p or tan to, n o slo es im p or tan te d etectar los casos u e se a
u stan m al al m od elo, sin o tr atar de evalu ar u
in flu en cia tien en estos casos. E viden tem en te, los casos u e d eb en estu diar se
con m s detalle son au ellos u e n o se a
u sten bien a la ecu acin logstica
y ad em s e
er
an u n a in flu en cia im p or tan te.
m o p u ed e apr eciar se la in flu en cia de los casos in d ividu ales sobr e el
m od eloE l con cep to clave p ar a en ten d er el estu dio de la in flu en cia en la r egr esin es el sigu ien tela in flu en cia de u n caso se m ide a tr avs d el cam bio
u e pr odu ce en el m odelo su elim in acin d el p roceso d e estim acin . sea,
si al u itar u n caso en con cr eto el m odelo cam bia m u co (los coeficien tes,
la con stan te, la sign ificacin ), se dice u e ese caso e
er ce u n a gran in flu en ciasi p rcticam en te n o ay cam bios en el m odelo, la in flu en cia de tal caso
ser peu e a. Pu esto u e resu ltara m u y com plicado r ealiar u n a estim acin n u eva para valorar la in flu en cia de cad a caso (u itn d olo del m odelo y
r epitien do la estim acin ), lo u e en la pr ctica se u tili
a es la apr oxim acin
d e Pr egib on (on g y reese, ) llam ad o en tata dbeta . ado u e
esta m edid a es eu ivalen te a la d istan cia de ood e la regresin lin eal, a
veces se le llam a tam bin d e ese m od o.
E l estu dio de la in flu en cia de los casos en tata es igu al u e el d e los
r esidu alesse gen era u n a var iable n u eva u e alm acen a la in form acin de la
in flu en cia de cad a caso y se estu dia tal var iable. a or den para gen er ar la
variab le d e in flu en cia tam bin es la m ism a, predict, slo u e en este caso
con la opcin dbeta
ri 2 hi
(1 hi ) 2
, i fu e definido en (.).
06/06/12 09:40
E E
. 0066305
. 0194973
. 0361494
. 0524679
. 090478
.
.
.
.
Lar gest
1024203
1024203
1024203
1024203
Mean
St d. Dev .
. 013848
. 0180839
Var i anc e
Sk ewnes s
Kur t osi s
. 000327
2. 254821
9. 039001
67.
68.
cook
. 1024203
. 1024203
mani f
0
0
s ex o
Muj er
Muj er
edad
70
70
es t udi os
Pr i mar i os y menos
Pr i mar i os y menos
i ngr esos
Menos de 150. 000
Menos de 150. 000
06/06/12 09:40
- 2459. 605
4329. 467
0.
0.
0.
4.
0.
1.
- 26169.
4387.
120
147
191
068
687
169
226
012
- 2164.
589.
0.
0.
0.
0.
3.
0.
4343.
- 540.
4343.
734
742
000
117
200
150
290
167
467
418
467
u ll
odel) y d e a u ella (
) d el
m od elo u e slo in clu ye la con sta n te (og-i
n tercept
n ly). E stos son
los r esu lta d os p r in cip a les d el p r oceso d e estim a cin p or m xim a ver osim ilitu d . om o se exp lic m s a r r ib a , la fu n cin d e ver osim ilitu d se
p u ed e en ten d er com o la p r ob a b ilid a d d e u e los d a tos ob ser va d os en la
m u estr a a ya n sid o gen er a d os p or u n os d eter m in a d os coeficien tes. Por
ta n to, la ver osim ilitu d d el m od elo slo con la con sta n te es u n a m ed id a
d e la p r ob a b ilid a d d e u e los d a tos ob ser va d os a ya n sid o gen er a d os p or
u n m od elo logstico en el u e tod os los coeficien tes va len o, lo u e es
lo m ism o, u n m od elo en el u e la s va r ia b les in d ep en d ien tes n o tien en
n in g n efecto im p or ta n te sob r e la va r ia b le d ep en d ien te. Por el con tr a r io,
la ver osim ilitu d d el m od elo com p leto es u n a m ed id a d e la p r ob a b ilid a d
d e u e los d a tos a ya n sid o gen er a d os p or u n m od elo logstico en el u e
tod os los coeficien tes son im p or ta n teso sea , en el u e tod a s la s va r ia b les in d ep en d ien tes tien en efecto sob r e la d ep en d ien te. a com p a r a cin
d e a m b a s r a on es d e ver osim ilitu d (la d el m od elo slo con la con sta n te
y la d el m od elo com p leto) p er m ite com p r ob a r si r ea lm en te la s va r ia b les
in d ep en d ien tes tien en efecto sob r e la d ep en d ien te. i la ver osim ilitu d
d el m od elo com p leto es sign ifica tiva m en te m a yor u e la d el m od elo slo
con la con sta n te, p u ed e d ecir se u e lo m s p r ob a b le es u e la s va r ia b les
06/06/12 09:40
E E
u n to con el seu do
2 estn d ar aparece el a
u stad o, u e sim p lem en te cor rige el eco de u e el pr im ero au m en ta ar tificialm en te al a ad ir n u evas
variab les, restan do al n u m erador d el pseu do
2 el n m ero d e p ar m etros
(coeficien tes m s la con stan te) del m od elo. Por esta r an , el a
u stado es
pr eferible al estn d ar.
(.)
as tres sigu ien tes filas n o se com en tan , p oru e son slo otros tip os de
m en os u tiliad os abitu alm en te y u n as m ed idas b asad as en el m od elo d e
variab le laten te (y*) u e n o in teresan en este con texto .
e eco, el de cadden (com o se explica en el apartado de estim acin del m odelo) es precisam ente el com plem en tario de la ra
n de am bas verosim ilitu des.
06/06/12 09:40
Por su ced er a u n estim ad or, es esta u n a in str u ccin sim ilar a predict,
au n u e en este caso su resu ltado n o sea cr ear u n a ser ie de n u evas variab les,
sin o u n a tab la de con tin gen cia, segu ida de u n con
u n to d e estadsticos sob re la cor recta clasificacin d e la variab le m an ia p ar tir d e los p redictor es
em p leados en la ecu acin logstica.
ILR CI
1 1..a b la
de
cla si
ica c i n
d e
la
r e gr e si n
lo gst ica
Logi s t i c model f or mani f
- - - - - - - - Tr ue - - - - - - - Cl as s i f i ed |
D
~D |
Tot al
- - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - +- - - - - - - - - - +
|
629
396 |
1025
|
766
1926 |
2692
- - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - +- - - - - - - - - - Tot al
|
1395
2322 |
3717
Cl as s i f i ed + i f pr edi c t ed Pr ( D) >= . 5
Tr ue D def i ned as mani f ! = 0
-------------------------------------------------Sens i t i v i t y
Pr ( +| D)
45. 09%
Spec i f i c i t y
Pr ( - | ~D)
82. 95%
Posi t i ve pr edi c t i v e val ue
Pr ( D| +)
61. 37%
Negat i ve pr edi c t i v e val ue
Pr ( ~D| - )
71. 55%
-------------------------------------------------Fal s e + r at e f or t r ue ~D
Pr ( +| ~D)
17. 05%
Fal s e - r at e f or t r ue D
Pr ( - | D)
54. 91%
Fal s e + r at e f or c l ass i f i ed +
Pr ( ~D| +)
38. 63%
Fal s e - r at e f or c l ass i f i ed Pr ( D| - )
28. 45%
-------------------------------------------------Cor r ec t l y c l ass i f i ed
68. 74%
--------------------------------------------------
om o r epetid am en te se a in sistid o, el m odelo logit pr ed ice la p robab ilid ad d e ocu r ren cia de u n su ceso. Pu es b ien , en con son an cia con ello, en tod os au ellos casos en los u e el m odelo p rediga m s de ,d e p robab ilidad
d e ocu rr en cia, la pr ediccin ser u e ocu rr a (
lassi
ied)y en todos los casos en los u e el m odelo d u n a pr ob abilid ad in fer ior a ,, se p ron osticar
u e n o su ceder (-
lassi
ied). E l ou n t
2 es sim p lem en te la p rop orcin d e
p red iccion es cor rectas seg n este cr iterioo sea, en u p orcen ta
e de casos
la p rediccin derivada del m odelo de r egr esin logstica acierta. a fr m u la
es, p or tan to
06/06/12 09:40
E E
(.)
ien d o
ilas cu atr o fr ecu en cias d e la tab la d e clasificacin y ofr ecien do
el su m ator io d e las casillas con idn tico n dice (i
), el n m ero de casos en
los u e la pr ed iccin coin cid e con la realidad en cada u n a de los dos posib les tipos d e r esu ltad os (
) y (-
) el m odelo acier ta en el , de
los casos, lo u e par ece u n por cen ta
e bastan te alto d e acier to. em asiado
alto, de eco. E l ou n t
2 pu ede dar u n a im pr esin excesiva d e cap acidad
p redictiva del m odelo por u n a r an m u y sim p ledad o u e los valores u e
p u ed e tom ar la var iable depen dien te en u n m od elo logstico son slo d os (
o ), se p u ed e acertar en m s del d e los casos sim plem en te cogien do
tod os los casos de la categor a u e ten ga m s casos. E n este e
em plo, d ad o
u e se sab e u e el de los en cu estad os n o an asistido a n in gu n a m an ifestacin , sim p lem en te pr on ostican do siem p re la categora se asegu r a
m s de u n de acier tos . Por tan to, el ou n t
2 n o sir ve para com p arar
con dicion es de p artida d iferen teses n ecesar ia u n a m edida u e ten ga en
cu en ta cu n to se m e
ora la capacidad d e pr ed iccin con el m odelo estim ado, con respecto al sim p le con ocim ien to d e la categora con m s casos.
E sto es exactam en te lo u e ace el d
ou n t
2. E ste estadstico es u n a
m od ificacin del an terior, u e elim in a d e la cu en ta d e acier tos los r elacion ados con el m ar gin al d e fila m ayor
(.)
ien d o m axi (
i ) la fr ecu en cia m ar gin al m s alta en tr e la ocu rr en cia o
n o del fen m en o u e se u iere p ron osticar. E n este e
em plo ser n los .
in d ividu os u e n u n ca an id o a u n a m an ifestacin , en lu gar de los .
u e s lo icieron .
os subn dices i y son pecu liares en esta tabla de dim en siones . i sign ifica la presen cia () o ausen cia () de la calidad de la variable dependien te ( y ). den ota el pron stico por la regresin logstica de presencia (o ) o au sen cia (o -). e este m odo,
11 es el
n m ero de casos u e se an m anifestado y de los u e se predice u e se m an ifestaron
sera
por el con trario el n m ero de casos u e n o se an m an ifestado y de los u e el m odelo au gu ra
u e no lo an eco. an to
1 com o
1 son errores, pu es im plican a los casos con predicciones
distintas de la realidad. onsecuen tem en te, la su m a de todas las
ies igual a n .
a sen sibilidad (sensitivity en la ilu stracin .) es la probabilidad de clasificar certeram en te a alguien con la categora positivam ien tras ue la especificidad (speci
icity,
ibidem )
es la proporcin de clasificaciones correctas para los u e poseen em pricam en te u n a categora
n egativa. e acierta m s predicien do a u ien es n o asisten a m an ifestaciones (,) u e a
u ienes lo acen (,).
06/06/12 09:40
E sta m edid a es m s
u sta, p or tan to, pu esto u e in dica la pr oporcin
d e aciertos m s all de los u e derivaran sim plem en te d e p on er todas las
ap u estas en el m ayor m ar gin al. om o pu ed e com p rob ar se fcilm en te, en
este caso, la pr op orcin es m u co m en orel m odelo logit estim ado slo
in cr em en ta la capacidad d e acierto en u n , con respecto a la u e se
ten d ra sim p lem en te pr ed icien do para todos los casos el valor m s com n
(o sea, la n o participacin en m an ifestacion es). o es u n r esu ltad o dem asiad o alto, p er o in dica u e el m odelo tien e cierta capacid ad par a pr ed ecir la
asisten cia a m an ifestacion es.
os dos ltim os estadsticos u e aparecen en la salida de
itstat,
(aie
n
orm ation
riteria)
se calcu la u tili
an d o la verosim ilitu d del m odelo y el n m er o d e p ar m etr os. a fr m u la es
(.)
es
valor de
es in ter pr etab le sobr e todo en la com par acin , m s u e en s
m ism oel m od elo con u n
m en or es el m e
or a
u stad o.
E l
(ayesian
n
orm ation
riterion ) es u n a m edida a n m s til par a
com p ar ar distin tos m odelos logit, pu esto u e est m e
or d esar rollada tericam en te. E st b asad a en la ver osim ilitu d del m od elo en cu estin y en su s
p ecu liares grados de liber tad (sien do estos igu al a n --)
(.)
E l
es u n a
u ste del
u e u tili
a el o r a
n de verosim ilitu d
d el m od elo, el n m ero de coeficien tes () y el de casos (n )
(.)
06/06/12 09:40
E E
om o en el ca so del
, el
es sob re tod o in ter esa n te p a ra com pa ra r m odelos d istin tos, m s u e pa ra in ter pr eta r su va lor en trm in os
ab solu tos. E n p rin cip io, cu a n to m s n ega tivo es el
, m e
or es el a
u ste. a difer en cia en el
d e d os m odelos d istin tos in d ica u m od elo
es m s corr ecto. a ftery () prop u so u n a s p au ta s de in terp reta cin de
la diferen cia en el
(o
) de dos m odelos d istin tos. E n fu n ci n d e la
d ifer en cia
1 -
2 , la evid en cia d e u e el m o d elo m s cor r ecto es el
segu n d o ser
CR O
1 1.1 .a b la
de
in t e r r e t a c i n
en
la
c o m a r a c i n
de
m o d e lo s
i
e r e n cia
IC1
IC
E vid e n cia
de
u e
e l
se gu n d o
m o d e lo
e s
m e
or
u e
e l
r im e r o
E n tre y
bil
E n tre y
aon able
E n tre y
u erte
s de
u y fu erte
11 ..Co m a r a ci n
d e
m o d e lo s
veces r esu lta difcil decidir u va r ia bles d eb er n in clu ir se en u n m odelo
de regresin , sea logstica , lin ea l o de cu a lu ier otr o tip o. E n pr in cipio,
a la ora d e elegir la in clu sin o exclu sin de u n a determ in a da var ia ble
en u n m od elo d e r egresin m ltip le, se pu ede op ta r por r a
on es ter icas
o por ra
on es estad stica s. a ra
n terica lleva ra a in trod u cir a u ella s
va r ia bles u e pa recen r elevan tes en fu n cin de la teor a o la s iptesis de
pa rtida . a r a
n esta dstica lleva ra a elegir la s va r ia bles u e m u estra n u n
m a yor gra do de asocia cin estad stica con la va ria b le depen dien te u e se
desea exp lica r. ea lm en te, a la or a d e d ecid ir u var ia bles se in clu yen
en el m od elo, a n d e u tili
a rse a m b os tipos d e ra
on es. e a d e ten er en
cu en ta la asocia cin esta d stica en tr e la s va riab les, per o el sim p le eco
de u e exista a sociacin n o
u stifica la in clu sin o n o de u n a d eterm in a d a
va r ia ble en el m od elo d e r egr esin . l u tili
a r tcn ica s esta dstica s m u ltiva r ia bles com o la u e con tem p la este cap tu lo, se cor re el r iesgo de p er der
com p leta m en te la su sta n cia ter ica p or desa rr olla r m od elos m a tem ticos
m u y ela bor ad os, con a ltos gra dos de a socia cin y de rob u steesta dstica,
pero n in g n in ters su stan tivo. a esta dstica n o es m s u e u n a er ra m ien ta d e a n lisis, u e sir ve pa ra com p rob ar la va lidede con cep tos e
iptesis d esa r rolla d as ter icam en te.
n a tcn ica u tili
a d a m u y a m en u d o a la or a d e seleccion a r la s va r ia b les u e se a n d e in clu ir en u n m od elo d e r egr esin es el lla m a do
06/06/12 09:40
m tod o d e seleccin p or p a sos. on siste b sica m en te en in tr od u cir o elim in a r la s va r ia b les in d ep en d ien tes en eta p a s su cesiva s, estu d ia n d o la va lid ed el m od elo en ca da u n a d e ella s, p a r a u ed a r se fin a lm en te con a u el
m od elo u e m s se a
u ste a los d a tos. sica m en te a y d os tip os d e seleccin p or p a sosd e in cor p or a cin p r ogr esiva o d e elim in a cin p r ogr esiva .
E n el p r im er ca so se tr a ta d e ir a a d ien d o va r ia b les in d ep en d ien tes a l
m od elo, com pr oba n d o la sign ifica cin d el m odelo en ca d a p a so y d e ca d a
va r ia b le in d ep en d ien te y n o in cor p or a n d o a u ella s va r ia b les u e n o a a d en sign ifica cin a l m od elo o u e n o son sign ifica tiva s ella s m ism a s. E l
segu n d o tip o d e seleccin p or p a sos d e va r ia b les con siste en p a r tir d e u n
m od elo con el m a yor n m er o p osib le de va r ia b les in d ep en dien tes seg n
el p la n tea m ien to terico u e se r ea lice, p a r a elim in a r p r ogr esiva m en te
la s va r ia bles u e n o sea n sign ifica tiva s o cu ya elim in a cin n o a fecte d e
m a n er a im por ta n te a la sign ifica cin d el m od elo. E n cu a lu ier a d e los
ca sos, a y u e ten er en cu en ta u e a m b os m todos d e seleccin p or p a sos slo a p or ta n
u stifica cion es tcn ica s, esta d stica s, p a r a la in clu sin o
n o de u n a o va r ia s va r ia b les en el m od elocom o se a d ico a n tes, esta s
u stifica cion es esta d stica s n o b a sta n p or s sola s p a r a opta r p or la in clu sin o n o d e u n a va r ia ble, sin o u e es n ecesa r io u e estn vin cu la d a s a u n
ra
on a m ien to su sta n tivo.
a in stru ccin
itstat de tata es u n a p oten te er ram ien ta para la seleccin d e var iables con el m todo p or p asos, pu es apor ta u n a in for m acin m u y til par a com par ar dos m odelos d istin tos y decidir cu l es m e
or.
om o se acaba d e ver, la or den
itstat se u tilia despu s de la estim acin d el
m od elo, y m u estra distin tas m edid as escalares de a
u ste d el m odelo. dem s de esto,
itstat p er m ite gu ar dar en m em or ia las m ed idas de a
u ste d e
u n m odelo d eter m in ado, y lu ego com p ar arlas con las d e otr o m od elo para
d eterm in ar cu l es el u e m e
or se a
u sta a los datos observados. ase a
con tin u acin u n e
em plo
u ietly logit m an if m u
er eda d i.estu dios i.in gresos am adeca sa estu d ian te
u ietly fitsta t, save
u ietly logit m an if m u
er eda d i.estu dios i.in gresos am adeca sa
fitstat, d if
06/06/12 09:40
E E
ILR CI
11 .1.Co m a r a ci n
d e
la s
m e d id a s
de
a
u st e
entre
m o d e lo s
Model :
N:
Log- Li k I nt er c ept Onl y
Log- Li k Ful l Model
D
LR
Pr ob > LR
McFadden' s R2
McFadden' s Adj R2
ML ( Cox - Snel l ) R2
Cr agg- Uhl er ( Nagel k er k e) R2
McKel vey & Zav oi na' s R2
Ef r on' s R2
Var i anc e of y*
Var i anc e of er r or
Count R2
Adj Count R2
AI C
AI C* n
BI C
BI C'
BI C used by St at a
AI C used by St at a
Di f f er ence of
Cur r ent
l ogi t
3700
- 2448. 039
- 2146. 163
4292. 326( 3692)
603. 753( 7)
0. 000
0. 123
0. 120
0. 151
0. 205
0. 197
0. 154
4. 098
3. 290
0. 693
0. 182
1. 164
4308. 326
- 26041. 472
- 546. 240
4358. 054
4308. 326
8. 137 i n BI C'
Saved
l ogi t
3700
- 2448. 039
- 2146. 123
4292. 246( 3691)
603. 833( 8)
0. 000
0. 123
0. 120
0. 151
0. 205
0. 197
0. 154
4. 098
3. 290
0. 692
0. 180
1. 165
4310. 246
- 26033. 335
- 538. 104
4366. 191
4310. 246
Di f f er enc e
0.
- 0.
0.
0.
0.
- 0.
0.
- 0.
- 0.
0.
- 0.
0.
0.
0.
0.
- 0.
- 1.
- 8.
- 8.
- 8.
- 1.
0
000
040
080( 1)
080( 1)
778
000
000
000
000
000
000
000
000
001
002
001
920
137
137
137
920
06/06/12 09:40
a situ acin laboral tam bin abra podido ser in troducida com o variable factor. o se
a eco de este m odo para m ostrar ue es posible m e
clar variables in dicadores con variables
factores y, sobre todo, poru e la salida es m u co m s clara, ya u e con los factores slo se
m u estra el cdigo y no la etiu eta del valor. E s m s ilustrativo estu dian te ue .
06/06/12 09:40
E E
logit m a n if m u
er ed ad i.estu dios i.in gresos
u bila do p arad o estu dian te
am ad ecasa
estim ates store odelo, title(
odelo su p erior
)
logit m a n if m u
er ed ad i.estu dios i.in gresos
u bila do a m ad ecasa if e(sa m p le)
estim ates store odelo, title(
odelo in term ed io
)
logit m a n if m u
er ed ad i.estu dios i.in gresos if e(sam p le)
estim ates store odelo, title(
odelo in ferior
)
estim ates table odeloodeloodelo, sta r stats( llll cirp aic bic)
on ob
eto de reali
ar las pru ebas de los m odelos
erru icos con el m ism o n m ero
de caso, con viene e
ecu tar en prim er lu gar el m odelo con m s parm etros y, a con tinu acin ,
los sigu ien tes tenien do cu idado de inclu ir en la in struccin logit la seleccin i
06/06/12 09:40
ILR CI
11 .11 .E o sici n
d e
a r m e t r o s
con
sign i
ica ci n
d e
va r io s
m o d e lo s
-------------------------------------------------------------Var i abl e |
Model o1
Model o2
Model o3
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - muj er | - . 40227661* * *
- . 25954549* *
- . 26264363* *
edad | - . 01448026* * *
- . 00657854*
- . 00597551
est udi os |
2 |
. 62288533* * *
. 5919637* * *
. 58675585* * *
3 |
1. 4243038* * *
1. 3544712* * *
1. 3472467* * *
i ngr esos |
2 |
. 54855537* * *
. 52480584* * *
. 52926195* * *
3 |
. 63062047* * *
. 57590225* * *
. 58352454* * *
j ubi l ado |
- . 47203306* * *
- . 47685376* * *
amadec as a |
- . 60354102* * *
- . 59545554* * *
par ado |
. 02651879
es t udi ant e |
. 10327419
_c ons | - . 38311017* *
- . 57134389* * *
- . 60620518* * *
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - N |
3700
3700
3700
l l _0 | - 2448. 0392
- 2448. 0392
- 2448. 0392
l l | - 2153. 3079
- 2140. 208
- 2139. 9926
c hi 2 |
589. 46276
615. 66246
616. 09327
r 2_p |
. 12039488
. 12574603
. 12583403
ai c |
4320. 6157
4298. 416
4301. 9852
bi c |
4364. 1284
4354. 3608
4370. 3622
-------------------------------------------------------------l egend: * p<0. 05; * * p<0. 01; * * * p<0. 001
06/06/12 09:40
E E
iem p re y cu an d o se u bieran grabad o an teriorm en te los tres m odelos citad os, el resu ltado de la an terior in stru ccin aparece en la ilu stracin ..
ILR CI
1 1.1.Ocio n e s
d e
or m a to
en
la
r e se n t a ci n
d e
m o d e lo s
----------------------------------------------Var i abl e | Model o1
Model o2
Model o3
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - muj er |
- 0. 4
- 0. 3
- 0. 3
|
0. 07
0. 08
0. 08
|
5. 6e- 08
1. 5e- 03
1. 4e- 03
edad |
- 0. 0
- 0. 0
- 0. 0
|
0. 00
0. 00
0. 00
|
1. 2e- 09
4. 0e- 02
7. 3e- 02
est udi os |
2 |
0. 6
0. 6
0. 6
|
0. 09
0. 09
0. 09
|
3. 0e- 11
3. 6e- 10
6. 1e- 10
3 |
1. 4
1. 4
1. 3
|
0. 12
0. 12
0. 12
|
0. 0e+00
0. 0e+00
0. 0e+00
i ngr es os |
2 |
0. 5
0. 5
0. 5
|
0. 08
0. 08
0. 09
|
5. 1e- 11
5. 4e- 10
7. 4e- 10
3 |
0. 6
0. 6
0. 6
|
0. 13
0. 13
0. 13
|
5. 0e- 07
5. 5e- 06
5. 7e- 06
j ubi l ado |
- 0. 5
- 0. 5
|
0. 14
0. 14
|
5. 7e- 04
6. 0e- 04
amadecas a |
- 0. 6
- 0. 6
|
0. 13
0. 13
|
2. 0e- 06
4. 4e- 06
par ado |
0. 0
|
0. 14
|
8. 5e- 01
es t udi ant e |
0. 1
|
0. 16
|
5. 2e- 01
_cons |
- 0. 4
- 0. 6
- 0. 6
|
0. 15
0. 16
0. 17
|
9. 9e- 03
3. 0e- 04
3. 2e- 04
----------------------------------------------l egend: b/ s e/ p
11 ..In t e r r e t a ci n
d e l
m o d e lo
e llega, por fin , a lo u e r ealm en te in teresala in ter pr etacin de los r esu ltados d el m od elo logit. on respecto a la regresin lin eal, ay u n par
d e aspectos u e ay u e ten er en cu en ta, u e acen la in terp retacin de la
r egr esin logstica con sid er ablem en te m s com plicada.
Pr im er o, com o ya se a com en tado a lo lar go d e este captu lo, ay u e
con siderar u e los coeficien tes d el m odelo logit tal cu al n o sir ven par a su
in ter pr etacin . i se r ecu erd a la ecu acin b sica d el logit
(.)
06/06/12 09:40
p u ede verse u e la variable depen dien te ap arece en u n a form a n o directam en te in terpretable, por lo u e el efecto sob re ella d e las variab les in d ep en d ien tes n o se p od r estu diar d e m an era directa. Por e
em p lo, en el m od elo
p resen tado, el coeficien te d e la variab le edad
tien e u n valor de -,. u
sign ificad o sociolgico tien e u e por cada a o d e edad d ism in u ya en ,
el logaritm o d e la ran de asisten cia a m an ifestacion esPoco se pu ede decir
d e este dato, salvo u e m u estra u n efecto n egativo. Para estu diar el m odelo
logit, ser n ecesario tran sform ar la ecu acin origin al, com o se vio en (.) y
en (.), para con segu ir coeficien tes u e p u ed an ser in terp retados.
ay dos tran sfor m acion es d e la ecu acin logit or igin al u e p er m iten su
in terp retacin in m ed iata. a pr im era su pon e elim in ar el logaritm o del lad o
d er eco de la ecu acin origin al. espe
an d o
(.)
E n este caso, los valor es de los coeficien tes in dican cm o vara la ran
d e ocu rr en cia del su ceso m edid o p or la variab le depen dien te en fu n cin d e
u n cam b io de m agn itu d en el valor d e las var iables in depen d ien tes. E sta
form a d e in ter pr etar los resu ltados d el logit ser la exp licad a en el ap ar tado
a, pero, au n u e es u n a for m a vlida d e in terp retar u n a r egr esin logstica,
sigu e sien do b astan te com ple
a, p or u e el cam bio en la var iable d epen dien te se expr esa en trm in os d e (cocien te d e raon es), con cep to asu m ible en
teor a, pero poco in tu itivo. era m u co m s fcil si el cam b io en la variab le
d ep en dien te se exp resara sim plem en te en trm in os de p rob ab ilidad de ocu r ren cia del su ceso estu d iado.
e
or com p ren sin , p or tan to, p u ed e con segu irse m edian te u n a segu n da
tran sfor m acin d e la ecu acin logit or igin al u e en el lado der eco expr ese
las var iacion es en la pr ob abilid ad de ocu r ren cia d el su ceso. esp e
an do
(.)
ora b ien , esta ecu acin tien e u n pr oblem a, p u esto u e expr esa u n a
fu n cin n o lin eal. E sto u iere d ecir u e el efecto de u n a var iable in depen d ien te sobr e la var iable depen dien te es diferen te seg n el valor u e ten gan tod as las dem s var iables in dep en d ien tes, adem s de seg n su p ropia
m agn itu d. E n la r egr esin lin eal, el efecto d e las variab les d el m odelo es
in depen dien te y con stan teel cam bio en la var iable in dep en d ien te pr odu ce
siem pre el m ism o cam b io en la d epen dien te, d a igu al cu l sea el valor d e las
otras variab les d el m od elo. a m agn itu d d e ese cam b io es la u e se exp resa
en el valor del coeficien te asociado a cada variab le in depen dien te en la r e-
06/06/12 09:40
E E
gresin lin eal. Pero en el caso d e la r egr esin logstica, dado u e el cam bio
u e pr ovoca cad a var iable en la p rob abilid ad d e ocu rr en cia del su ceso estu d iado d ep en d e del valor d e todas las dem s variab les, n i siu ier a se pu ed e
asociar u n coeficien te a cada var iable in depen dien te cu an do el m odelo est
expr esad o en pr obabilidades com o en (.) . Por tan to, ay u e cam b iar
totalm en te la estr ategia de an lisis. a m an era d e estu diar u n a ecu acin
logstica en form a pr ob abilstica es u tilian d o las p rob ab ilidad es pr ed icas
por el m od elo p ar a valores esp ecficos de las variab les in d epen dien tes. E sta
segu n d a estr ategia d e in terpr etacin se ver en el apar tado ...
11..1.
n terpretacin
a
travs
de
cocien tes
de
razon es
Par a u e se m u estre la ecu acin logit en tr m in os de cocien tes de r a
on es,
ay u e a adir la op cin or (o escrib ir sin opcin la in stru ccin logistic, en
lu gar de logit).
i ya se an pedido los coeficien tes n orm ales, n o es n ecesar io r ep etir el con
u n to de variab les, pu esto u e tata recu er da la ltim a lista
d e variables, en caso d e u e n o se esp ecifiu e n in gu n a. ase u e m u estra
esta opcin en el e
em plo segu ido
ILR CI
11 .1 .R e gr e si n
lo gst ic a
con
co cie n t e
d e
r a o n e s
Logi s t i c r egr es s i on
Number of obs
LR c hi 2( 6)
Pr ob > c hi 2
Pseudo R2
=
=
=
=
3717
589. 74
0. 0000
0. 1199
E ste problem a slo existe cu an do se u tilia la form a probabilstica de la ecu acin logit. i se estudia la ecu acin en trm in os de cocien te de raon es, se obtien en coeficien tes de
variacin con stan tes para cada variable, por lo u e el anlisis se reali
a de m an era an loga al
de la regresin lineal. e eco, la ecu acin logit en trm in os de cocien tes de raon es es u na
ecu acin lin eal. om o se ver m s adelante, esto es as poru e la ecu acin logit n o expresa
probabilidades, sin o cam bios en el cocien te de las ra
ones.
06/06/12 09:40
06/06/12 09:40
E E
06/06/12 09:40
om o pu ede apreciarse in m ediatam en te, esta orden m u estra m s in form acin u e la in stru ccin origin al logit,
or. as tres prim eras colu m n as m u estran los coeficien tes logit estn dar (b),
su valor z
(z)
y su probabilidad (
z
).
a cu arta colu m n a m u estra el cocien te de ra
on es, el m ism o u e m u estra
la an terior in stru ccin logit,
or. a colu m n a u e in teresa au es la u in ta
(ebtd), u e m u estra el cam bio en las ra
on es para u n in crem en to de la
variable in depen dien te de u n a desviacin tpica. l u tili
ar com o u n idad de
variacin de la variable in depen dien te su desviacin tpica, todos los coeficien tes pu eden com pararse en tre s. e este m odo, aparece cm o la m agn itu d
relativa de la variable edad au m en ta su stan cialm en te al m edirla en desviacion es tpicasde eco, tien e u n efecto en la ra
n m ayor (m s prxim o a )
u e la variable m u
er
(m s prxim a a ), au n u e en u n prin cipio pareciera lo
con trario. alcu lan do los valores in versos de edad
y mu
er, para com parar su s
m agn itu des con el resto de las variables, pu ede con clu irse la in terpretacin
de los cocien tes de ra
on es. E l in verso de edad
es ,y el de m u
er
es ,.
anto el nivel de estudios com o el nivel de ingresos afectan positivam ente a la
probabilidad de aber asistido a alguna m anifestacin. a edad y el gnero afectan, en cam bio, negativam ente (cuanto m s edad tiene el individuo, ay m enos
probabilidad de ue aya asistido a alguna m anifestaciny, adem s, las m u
eres
tienen m enos probabilidad de aber asistido ue los om bres). na veestandari
adas todas las m edidas, la variable ue tiene un efecto m s im portante en la
probabilidad de m anifestarse es el nivel de estudioscuantos m s estudios, m s
probabilidad de aber asistido a m anifestaciones. am bin bastante im portante,
aunue m enos, es la variable edad,
en el sentido ya explicado.
ngresos
y gnero
presentan tam bin una asociacin significativa, aunue m enos im portante.
11..2.
n terpretacin
a
travs
de
prediccion es
n a segu n d a m an era d e estu diar los resu ltados d e u n a r egr esin logstica
es, com o ya se a alu dido m s ar riba, a tr avs d e las pr ed iccion es del m odelo p ara valor es especficos d e las var iables in d ep en d ien tes. E sta for m a tien e
la ven ta
a d e u e los resu ltados son m s in tu itivos u e los d er ivados del estu dio de los cocien tes de r a
on es, u e n o de
an de ser u n a m edid a r elativam en te com ple
a y difcil d e in terp retar. Per o esta for m a tam poco es sen cilla,
p u esto u e la fu n cin logit en trm in os pr ob abilsticos n o es lin eal, com o ya
se a r efle
ado, lo u e ace con siderablem en te m s com p le
o su an lisis. E s
p reciso n otar u e la regresin logstica n o es u n a tcn ica sen cilla y reu iere
d e u n a cier ta pr ctica sob re todo en la in terp retacin de los par m etros.
tata in cor por a pocas err am ien tas para estu diar la r egr esin logstica
a travs de las p rob abilid ad es pr edicas. Por ello, au se u tiliar n b sicam en te los p rogr am as d el con
u n to de er ram ien tas ost.
e a explicado m s arriba u e el efecto de u n a variable in depen dien te
sobre la depen dien te en u n m odelo logit en form a probabilstica depen de del
06/06/12 09:40
E E
valor de todas las variables in clu idas en el m odelo, as com o de su propia m agn itu d. Por ello, n o es posible ten er u n coeficien te asociado a cada variable in depen dien te u e exprese el efecto de esa variable sobre la variable depen dien te
de m an era probabilstica. ay dos m an eras de estu diar este efecto ten ien do
en cu en ta el problem a alu didou n a, m an ten er todas las variables en u n valor
determ in ado (n orm alm en te, pero n o n ecesariam en te, la m edia) y acer variar
slo u n a variable, estu dian do cm o afecta a las prediccion es del m odelola
otra form a con siste en dar valores especficos a todas las variables del m odelo,
seg n in terese, y ver u prediccin arro
a el m odelo en esos casos.
a prim era de las dos estrategias de an lisis se pu ede desarrollar m edian te
la in stru ccin prcan ge. E sta m u estra cm o afecta la variacin de u n a o m s
variables en la prediccin de ocu rren cia del su ceso estu diado, m an ten ien do
con stan tes el resto de las variables in trodu cidas en el m odelo (en la m edia). Por
e
em plo, se pu ede estu diar cm o afecta el eco de ser m u
er sobre la probabilidad de aber participado en m an ifestacion es. a in stru ccin n ecesaria sera
logit m a n if m u
er ed ad estu estu in grin gr
p rcan ge m u
er, from to
muj er
f r om:
x =mi n
0. 4058
muj er
t o:
x +1/ 2
0. 3123
Pr ( y | x)
0
0. 6431
x=
s d( x ) =
es t u2
. 273339
. 445733
t o:
di f :
x =max mi n- >max
0. 3139
- 0. 0919
di f :
- +1/ 2
- 0. 0917
f r om:
x=0
0. 4058
f r om:
x- 1/ 2s d
0. 3802
t o:
x+1/ 2s d
0. 3342
edad
46. 6718
18. 4357
i ngr 2
. 386333
. 486974
t o:
x=1
0. 3139
di f :
0- >1
- 0. 0919
f r om:
x - 1/ 2
0. 4040
di f :
- +s d/ 2 Mar gEf c t
- 0. 0459
- 0. 0919
1
0. 3569
est u3
. 15604
. 362942
i ngr 3
. 121334
. 326559
muj er
. 518698
. 499717
as erram ien tas ost contem pladas en este apartado no fun cionaban con variables
factores en el m om en to en el u e se redact este texto. Por ello, an tes de aplicarlas, se vu elve
a e
ecutar la regresin logstica em plean do variables ficticias con valores
. esde la versin
, tata in corpora la instru ccin m argin s y, desde la , m argin splot, u e pu ede acer lo fu n dam ental de prcange y prvalu e y otras operaciones tam bin con factores y con otros m odelos.
s detalles y explicaciones de esta n u eva orden se pueden en con trar en el m an u al (tata
-y -).
06/06/12 09:40
in la opcin
rom to se m u estr a la m ism a in for m acin , pero m en os detallada. E n este caso, d e eco, la ord en prcan ge
m u estra m u ca m s in form acin d e la verd aderam en te n ecesar ia, pu esto u e al tr atarse de u n a
variab le d icotm ica ficticia slo pu ede ten er d os valores (y ), y la op cin
rom to
m u estra in for m acin p ar a m u cos otros valores p osibles. ase lo
u e pu ede in ter pr etarse de la ilu stracin .. a p rim era colu m n a (
rom
xm ax)
m u estr a la
p rob ab ilidad p redica par a u n in divid u o d e id n ticas caractersticas p er o
con valor en la variab le m u
er.
Par a la m u
er m edia, p or tan to, la pr obabilid ad de aber asistido a algu n a m an ifestacin es de ,, seg n el m odelo
logstico. Por tan to, ser m u
er redu ce la pr ob abilid ad de ab er asistid o a
algu n a m an ifestacin en ,para u n a p erson a de caracter sticas m edias,
lo u e ap arece en la ter cer a colu m n a. as sigu ien tes colu m n as con in for m acin de tip o
rom
to
n o tien en r elevan cia par a el caso d e variab les ficticias,
(m s tar de, se estu diar u n a var iable con tin u a, edad,
en la u e s u e tien en r elevan cia). a
o las colu m n as de
rom
to,
aparece la pr obabilid ad d e
ocu rr en cia y n o ocu rr en cia del su ceso con los valores de todas las var iables
in depen dien tes en su s m edias. ba
o d el tod o ap ar ecen pr ecisam en te estos
valor es m edios, los u e se an u tili
ad o para acer las p rediccion es, y su s
d esviacion es tp icas.
e estu d ia a con tin u acin el efecto sob re la pr obabilidad de asisten cia
a m an ifestacion es de la variable edad,
en este caso, dado u e la var iable es
con tin u a, p u ed e ob ten er se m u ca m s in for m acin r elevan te con la in stru ccin prcan ge.
ILR CI
1 1.1.E
ecto
so b r e
la
va r ia b le
d e e n d ie n t e
de
lo s
ca m b io s
en
una
in d e e n d ie n t e
n u m r ica
l ogi t : Changes i n Pr edi c t ed Pr obabi l i t i es f or mani f
edad
edad
f r om:
x =mi n
0. 4570
t o:
di f :
x =max mi n- >max
0. 2156
- 0. 2414
t o:
di f :
x +1/ 2
- +1/ 2
0. 3552
- 0. 0033
Pr ( y | x )
0
0. 6431
x=
s d( x ) =
est u2
. 273339
. 445733
f r om:
x - 1/ 2sd
0. 3882
f r om:
x =0
0. 5223
t o:
x =1
0. 5187
di f :
0- >1
- 0. 0036
f r om:
x - 1/ 2
0. 3585
t o:
di f :
x +1/ 2sd
- +s d/ 2 Mar gEf ct
0. 3267
- 0. 0614
- 0. 0033
1
0. 3569
est u3
. 15604
. 362942
edad
46. 6718
18. 4357
i ngr 2
. 386333
. 486974
i ngr 3
. 121334
. 326559
muj er
. 518698
. 499717
06/06/12 09:40
E E
06/06/12 09:40
a an ter ior in str u ccin m u estra el r esu ltad o u e se pr esen ta a con tin u acin , d on d e apar ecen las m edias de las var iables in depen dien tes, p er o, en
r ealid ad , lo u e gen era son tres n u evas variab les con valores com pr en did os
en tr e y de la var iable edad.
ILR CI
11 .1.List a d o
de
la
a lica c i n
de
la
in st r u cci n
p r gen
l ogi t : Pr edi c t ed v al ues as edad v ar i es f r om 18 t o 95.
est u2
. 27333871
x=
est u3
. 15603982
edad
46. 671778
i ngr 2
. 38633306
i ngr 3
. 12133441
muj er
. 51869787
Por o m isin s lo en los p r im er os ca so s d el ficer o , la in str u cci n prgen cr ea tr es n u eva s va r ia b les con el n om b r e esp ecifica d o en tr e
p a r n tesis tr a s gen era te
ter m in a d o en x,
p
y p1.
a va r ia b le eda dx sim p lem en te a lm a cen a va lor es a in ter va los igu a les d e la m en cio n a d a va r ia b le in d ep en d ien teeda dp
con tien e la s p r ob a b ilid a d es p r ed ica s d e u e
el in d ivid u o n o a ya a sistid o a n in gu n a m a n ifesta cin (o sea , d e u e
m a n if) y edadp1, d e u e el in d ivid u o a ya a sistid o (m a n if). a s va r ia b les edadplb,
edadp1lb,
edadpu b
y edadp1u b
con tien en los in ter va los
d e con fia n a (in fer ior y su p er ior ) d e la s p r ob a b ilid a d es p a r a ca d a va lor
d e x. o u e in ter esa sa b er es cm o va r a en fu n cin d e la ed a d la p r ob a b ilid a d d e a sisten cia a m a n ifesta cion es, lo u e p u ed e m ostr a r se con
sen cillem ed ia n te u n gr fico d e r a n go u e r efle
e los in ter va lo s d e con fia n a d e la p r ed iccin d e p r ob a b ilid a d d e a sisten cia a m a n ifesta cion es
p or ed a d es.
06/06/12 09:40
E E
xtitle(
a lores distin tos de edad
)
ytitle(
an go d e p roba bilidad de acu dir a m an ifestacin
)
GR F ICO
1 1..Gr
ico
de
r o b a b ilid a d e s
r e d ica s
a r a
d ist in t o s
va lo r e s
de
una
va r ia b le
in d e e n d ie n t e
20
40
60
Valores distintos de edad
80
100
om o p u ed e apr eciar se, el grfico .m u estr a cm o vara la pr obabilidad d e asisten cia a m an ifestacion es en fu n cin de la ed ad, m an ten ien do
tod as las dem s var iables d el m odelo con stan tes en su valor m edio.
Pu eden in clu so com p licar se algo m s las cosas y p lasm ar en u n m ism o
grfico m s de u n a var iable. Por e
em p lo, se pu ede m ostrar cm o var a la
p robab ilidad de asisten cia a m an ifestacion es en fu n cin de la edad y d el gn ero. E llo se pu ede acer apr ovecan d o la p osibilidad u e b rin d a la or den
prgen d e esp ecificar el valor d e las otr as var iables del m odelo, con la opcin
x(variab levalor ). i se esp ecifica n in g n valor d e n in gu n a variab le, prgen
m an tien e todas las var iables en su m ed ia salvo la u e sirve p ar a acer la
p rediccin . Per o con esta op cin p u ed e otor gar se u n valor esp ecfico a u n a
o m s var iable seg n se d esee. ase con u n e
em plo p ar a u n a m e
or com p ren sin de este pr oceso.
06/06/12 09:40
xtitle(
alores d istin tos d e eda d
)
ytitle(
an go de prob abilida d d e a cu dir a m an ifesta cin
)
GR F ICO
1 1..Gr
ico
de
r o b a b ilid a d e s
r e d ica s
a r a
d ist in t o s
va lo r e s
de
una
va r ia b le
co n t in u a
y
otra
va r ia b le
d isc r e t a
20
40
60
Valores distintos de edad
1
ombres
80
100
1
mu
eres
e pu ed e apr eciar u e este m u estra la pr ob abilid ad p red ica de asisten cia a m an ifestacion es en fu n cin d e la edad p ar a om bres y m u
er es. d e-
06/06/12 09:40
E E
Pr ( y=1| x ) :
Pr ( y=0| x ) :
x=
es t u2
0
0. 3393
0. 6607
es t u3
0
95% Conf . I nt er v al
[ 0. 3035,
0. 3751]
[ 0. 6249,
0. 6965]
edad
25
i ngr 2
. 38633306
i ngr 3
. 12133441
muj er
. 51869787
06/06/12 09:40
r(y
x)
. Por tan to, la p robab ilidad d e u e u n
oven de a os sin estu dios aya asistido a algu n a m an ifestacin es d e ,. l lado apar ece el
in tervalo de con fian
a de la pr ediccin , con u n d e pr obabilidades, y
d eba
o los valor es d e las variab les in d ep en d ien tes u e se u tili
ar on para
r ealiar la p rediccin .
om o p u ed e f cilm en te a p r ecia r se, esta for m a d e estu d ia r los r esu lta d os d el logit es la m s in tu itiva y f cil d e com p r en d er. Per m ite estu d ia r cu l es la p r ob a b ilid a d d e ocu r r en cia d el su ceso estu d ia d o a socia d a
a p er files esp ecficos d e la s va r ia b les in d ep en d ien tes. E l p r ob lem a u e
tien e es u e a cer u n a n lisis d eta lla d o d el efecto d e tod a s la s va r ia b les
in d ep en d ien tes es u n a op er a cin m u y ted iosa , p u esto u e es n ecesa r io ir
esp ecifica n d o u n o p or u n o tod os los p er files. om o e
em p los (p r op u estos
ta n slo p a r a u e el p r op io lector los in ter p r ete) se m u estr a n a con tin u a cin u n p a r d e p er files m s (p er son a con a os y estu d ios a ltosy
p er son a d e cin cu en ta y u n a os sin estu d ios). a s in str u ccion es ser a n
la s sigu ien tes
p rva lu e, x(estu estu edad ) rest(m ea n )
p rva lu e, x(ed ad estu estu ) rest(m ea n )
los r esu ltad os d e aplicar las son los u e se m u estran en la sigu ien te
ilu stracin
ILR CI
11 .1.C lcu lo
d e
r o b a b ilid a d e s
de
o cu r r e n c ia
de
la
va r ia b le
d e e n d ie n t e
a r a
otr o
a r
d e
co n
un to
de
va lo r e s
de
la s
va r ia b le s
in d e e n d ie n t e s
06/06/12 09:40
E E
11 ..E
e r cicio s
. on sid er an do com o variab le r esu ltad o el u so de
n ter n et en los doce ltim os m eses (E stu dio Pregu n ta ), em p lea el sexo, la edad (r ecodificada en tres in ter valos) y los estu dios en u n m odelo logstico bin ar io.
u var iable parece ten er m ayor in flu en ciaom p ara estos resu ltados
con los ob ten idos en el p rim er y en el tercer e
er cicio del captu lo de
tab las ().
. E m p lean do el b ar m etro de abr il (cis), o cu alu ier otr o d e en ero,
abr il,
u lio u octu b re, tom a com o variab le d ep en d ien te la in ten cin d e
voto, elim in an d o a u ien es n o apor ten u n a op cin con cr eta, crea dos
var iables dicotm icasvotar al PP y votar al PE . om o variab les in dep en d ien tes, se te su giere u e em plees la exp osicin a d istin tos m ass
m edia
(P.a-P.c) la id eologa, la edad y la religin .
06/06/12 09:40
12
R e gr e si n
lo gst ica
para
va r ia b le
o r d in a l
y
m u lt in o m ia l
El m odelo de regresin logstica bin ario, visto h asta ah ora, es la base de toda
u n a fam ilia de m odelos estadsticos de gran u tilidad para las cien cias sociales,
pu esto qu e se pu eden u tilizar para variables depen dien tes cu alitativas de distin tos tipos y con distin tos objetivos de in vestigacin . En este captu lo se explicarn brevem en te las dos exten sion es m s u tilizadas del m odelo de regresin
logstica bin ario, el logit ordin al y el logit n om in al
ologit y m logit en tata
.
Existen otros m odelos derivados de la regresin logstica bin aria qu e se pu eden
u tilizar para variables cu alitativas, pero su u so es m u ch o m en os h abitu al, por
lo qu e para su estu dio se rem ite al lector in teresado a u n texto especializado
com o el de on g y reese
o el de osm er y em esh o
1 2.1.E l
m o d e lo
e st a d st ico
d e l
lo git
o r d in a l
a regresin logstica or din al es u n a exten sin d e la r egr esin logstica bin ar ia. or tan to, par a exp licar el m od elo estad stico su byacen te, se sigu e
la m ism a exp licacin u tilizad a en la seccin .p ar a explicar el m odelo
b in ario. a pr im era ap roxim acin , por tan to, se basa en la idea de qu e tr as
la var iable dep en d ien te ord in al existe u n a var iable laten te con tin u am s
tarde, se ab ord ar otr a apr oxim acin b asad a en el con cep to d e cocien te d e
r azon es y pr obabilid ades n o lin eales.
n a variab le ord in al es aqu ella en la qu e pu eden or den arse las categor as, p er o se d escon oce la distan cia existen te en tr e ellas
si se con ocier a, se
tratar a de u n a var iable de in tervalo o razn
. ese a qu e es relativam en te
com n u tilizar m odelos de regresin lin eal estn dar p ar a este tip o d e var iab les, este tr atam ien to es in adecu ad o, pu es vu ln er a los su pu estos m s b sicos d e la r egr esin lin eal
prin cipalm en te por el h ech o d e qu e las distan cias
en tr e categor as son d escon ocidas y n o con stan tes
. E l m odelo d e regresin
logstica ord in al es el m od elo ad ecu ado par a este tip o d e var iables, tan com u n es en las cien cias sociales.
n ejem plo tp ico de var iable ord in al es el grado d e acu erdo con u n a
p regu n ta de actitu d es p olticas. E n este apartad o u tilizarem os u n ejem p lo
E E
as posib les respu estas son m u y de acu erd o, d e acu er do, en desacu er do y m u y en desacu er do. u an do se r ealiz la en cu esta
m ar zo d e
, u n de la pob lacin se declar m u y de acu erd o con esta afirm acin , u n de acu erd o, u n en desacu erd o y u n m u y en d esacu erd o, lo qu e refleja u n con sider ab le grado de desafeccin h acia los p ar tid os
p olticos
las categor as de acu erd o y m u y de acu er do alcan zan en total u n
del total de las r espu estas
. asi u n d e los en cu estad os n o r espon d ier on a la p regu n ta.
ILUSTR I
1 2.1.ist r ib u ci n
d e
r e cu e n c ia s
d e
la
va r ia b le
o r d in a l
l os par t i dos s e |
c r i t i c an muc ho |
ent r e s , per o en |
r eal i dad t odos |
s on i gual es |
Fr eq.
Per cent
Cum.
- - - - - - - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - muy de ac uer do |
895
16. 96
16. 96
de ac uer do |
2, 350
44. 54
61. 50
en des ac uer do |
1, 443
27. 35
88. 86
muy en des ac uer do |
284
5. 38
94. 24
n. s . |
275
5. 21
99. 45
n. c . |
29
0. 55
100. 00
- - - - - - - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - Tot al |
5, 276
100. 00
caso
pu r am en te ilu str ativo
, la edad au m en tar a claram en te la desafeccin
p artidista.
ara la r epr esen tacin de la var iable depen dien te or din al de desafeccin
p artidista, p u ed e su p on er se qu e existe u n a ser ie d e valores u m bral qu e p erm iten r elacion ar la var iable laten te con tin u a con la var iable obser vada ord in al. n in d ividu o cu yo n ivel de d esafeccin partidista sea m u y bajo
en la
variab le laten te con tin u arespon d er con tod a p robab ilidad m u y en d esacu erd o a la pregu n ta. u n ivel d e d esafeccin pod ra au m en tar d e m an er a
m od erada sin qu e cam biar a su r espu esta a esta pr egu n ta, h asta qu e llegar a
u n p u n to en qu e r espon dier a en d esacu er do en lu gar de m u y en desacu erd o. E n ese m om en to, su n ivel de d esafeccin laten te h abr a su per ad o
el u m br al qu e sep ara la p rim er a de la segu n d a categora de r esp u esta en
la pr egu n ta p . u n ivel d e d esafeccin podr a segu ir au m en tan do h asta
el p u n to de su p erar el sigu ien te u m br al y em p ezara a estar de acu er do
con la fr ase, o in clu so p odr a llegar a su p er ar el ter cer y ltim o u m br al y
estar m u y de acu er do. E stos tr es n iveles u m b ral estn r epr esen tad os en el
gr fico .por tr es ln eas discon tin u as h orizon tales, etiqu etadas com o t 1,
t 2 y t 3. u an d o la ln ea qu e relacion a la variab le laten te y la ed ad
en el eje
d e ab scisasest p or d eb ajo d el n ivel t 1, el in dividu o ten der a r espon der
m u y en desacu er do, cu an d o est en tr e t 1 y t 2, ten der a r esp on der en
d esacu erd o, etc.
R I
12 .1.R e la ci n
entre
va r ia b le
la t e n t e
y
va r ia b le
o r d in a l
o b se r va d a
co n
una
va r ia b le
in d e p e n d ie n t e
y*
0
y=4
3
y=3
2
y=2
1
y=1 E(y*
25
40
55
70
|x)
85
om o en el m odelo bin ar io, la r elacin en tre la var iable laten te y la var iable ordin al obser vada es estocstica, p or lo qu e est som etid a a u n cierto n ivel de err or r epr esen tado en el gr fico .por las r eas som br ead as
acopladas a cad a u n a de las ed ad es d estacadas en la ilu stracin . a var iable
E E
.
a r elacin en tr e la variab le depen d ien te or din al ob ser vad a y la variab le
laten te es m s com p leja qu e en el caso d e la var iable b in aria por la existen cia de var ios p u n tos de cor te
.
E n este caso, con cu atro categor as p ar a la variab le or din al y, por tan to,
tr es p u n tos de cor te
.
u stitu yen d o
.y despejan d o se llega a la fr m u la d e pr obabilid ad
p redich a seg n el m od elo logit or din al
.
a ecu acin
.es equ ivalen te a la ecu acin
.qu e se m ostr
p ara el m od elo bin ar io. om o en el m od elo bin ar io, la form a con creta qu e
ad op te el m odelo depen de de la distr ibu cin qu e se su pon ga p ar a el trm in o
d e er ror, qu e en el m od elo logit tien e u n a m edia de y varian za d e p
.
a ju stificacin del logit or din al m ed ian te u n m odelo de p robab ilidad
n o lin eal es m s sen cilla, y tam bin deriva d e la del m od elo b in ario. ada
categor a d e la variab le d ep en d ien te ord in al se p u ed e tr an sform ar en u n
cocien te d e r azon es, divid ien do la pr obabilid ad de obten er esa categor a o
u n a categora m en or p or la p rob ab ilidad de ob ten er u n a categora m ayor.
ien do m u n a categor a cu alqu iera excepto la categor a su p er ior de la var iable depen dien te
.
E l m od elo logit derivar a de u tilizar el logaritm o n eperian o d e
.
com o el lado d e u n a ecu acin de regresin p ar a cad a categor a de la var iab le dep en d ien te
.
as frm u las par a el clcu lo d e cocien te d e r azon es, etc., se pu eden der ivar d e m an er a an loga a com o se h izo en el apar tado .par a el m od elo
b in ario.
1 2.2.E st im a ci n
e
in t e r p r e t a ci n
d e l
m o d e lo
E E
recode p
.a
.b
, gen
dep
ILUSTR I
1 2.2.R e gr e si n
lo gst ic a
o r d in a l
de
la
o p in i n
so b r e
lo s
p a r t id o s
p o lt ic o s
I
I
I
I
t
t
t
t
er at
er at
er at
er at
i
i
i
i
on
on
on
on
0:
1:
2:
3:
l
l
l
l
og
og
og
og
l
l
l
l
i
i
i
i
k el
k el
k el
k el
i
i
i
i
hood
hood
hood
hood
=
=
=
=
- 4230.
- 4162.
- 4162.
- 4162.
6463
4171
1521
1521
Number of obs
LR c hi 2( 6)
Pr ob > c hi 2
Pseudo R2
=
=
=
=
3530
136. 99
0. 0000
0. 0162
-----------------------------------------------------------------------------dep |
Coef .
St d. Er r .
z
P>| z|
[ 95% Conf . I nt er v al ]
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - es t u2 |
- . 345338
. 0846675
- 4. 08
0. 000
- . 5112833
- . 1793928
es t u3 |
- . 7965289
. 1025494
- 7. 77
0. 000
- . 9975221
- . 5955358
edad |
- . 006256
. 0020093
- 3. 11
0. 002
- . 0101941
- . 0023178
i ngr 2 |
- . 2177021
. 0731058
- 2. 98
0. 003
- . 3609868
- . 0744174
i ngr 3 |
- . 4079552
. 1117292
- 3. 65
0. 000
- . 6269403
- . 18897
muj er |
. 1970506
. 0633609
3. 11
0. 002
. 0728655
. 3212357
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - / c ut 1 |
- 3. 310537
. 1458847
- 3. 596466
- 3. 024608
/ c ut 2 |
- 1. 157784
. 130701
- 1. 413953
- . 9016142
/ c ut 3 |
1. 015081
. 1305644
. 7591794
1. 270982
------------------------------------------------------------------------------
a relacin en tre la con stan te del logit bin ario y los pu n tos de corte en el
logit ordin al se pu ede ilu strar del sigu ien te m odo. E l logit bin ario qu e se gen er m s atrs para la variable de asisten cia a m an ifestacion es fu e el sigu ien te
ILUSTR I
1 2..R e gr e si n
lo gst ica
b in a r ia
d e
la
a sist e n cia
a
m a n i
e st a cio n e s
I
I
I
I
t
t
t
t
er at
er at
er at
er at
i
i
i
i
on
on
on
on
0:
1:
2:
3:
l
l
l
l
og
og
og
og
l
l
l
l
i
i
i
i
k el
k el
k el
k el
i
i
i
i
hood
hood
hood
hood
Logi s t i c r egr es s i on
= - 2463. 521
= - 2172. 6106
= - 2168. 7572
= - 2168. 7488
Number of obs
LR c hi 2( 6)
Pr ob > c hi 2
Pseudo R2
=
=
=
=
3721
589. 54
0. 0000
0. 1197
-----------------------------------------------------------------------------mani f |
Coef .
St d. Er r .
z
P>| z|
[ 95% Conf . I nt er v al ]
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - es t u2 |
. 6304916
. 0933244
6. 76
0. 000
. 4475791
. 813404
es t u3 |
1. 422758
. 1148576
12. 39
0. 000
1. 197642
1. 647875
edad |
- . 0145194
. 0023696
- 6. 13
0. 000
- . 0191637
- . 0098751
i ngr 2 |
. 5353647
. 0832126
6. 43
0. 000
. 3722711
. 6984584
i ngr 3 |
. 6102257
. 1249707
4. 88
0. 000
. 3652877
. 8551638
muj er |
- . 4031246
. 073787
- 5. 46
0. 000
- . 5477444
- . 2585047
_c ons |
- . 3741699
. 1476936
- 2. 53
0. 011
- . 663644
- . 0846958
------------------------------------------------------------------------------
i, en vez d e la ord en logit, se u tiliza el ologit con las m ism as var iab les
E E
t
t
t
t
er at
er at
er at
er at
i
i
i
i
on
on
on
on
0:
1:
2:
3:
l
l
l
l
og
og
og
og
l
l
l
l
i
i
i
i
k el
k el
k el
k el
i
i
i
i
hood
hood
hood
hood
= - 2463. 521
= - 2172. 6106
= - 2168. 7572
= - 2168. 7488
Number of obs
LR chi 2( 6)
Pr ob > c hi 2
Ps eudo R2
=
=
=
=
3721
589. 54
0. 0000
0. 1197
-----------------------------------------------------------------------------mani f |
Coef .
St d. Er r .
z
P>| z |
[ 95% Conf . I nt er val ]
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - est u2 |
. 6304916
. 0933244
6. 76
0. 000
. 4475791
. 813404
est u3 |
1. 422758
. 1148576
12. 39
0. 000
1. 197642
1. 647875
edad |
- . 0145194
. 0023696
- 6. 13
0. 000
- . 0191637
- . 0098751
i ngr 2 |
. 5353647
. 0832126
6. 43
0. 000
. 3722711
. 6984584
i ngr 3 |
. 6102257
. 1249707
4. 88
0. 000
. 3652877
. 8551638
muj er |
- . 4031246
. 073787
- 5. 46
0. 000
- . 5477444
- . 2585047
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - / cut 1 |
. 3741699
. 1476936
. 0846958
. 663644
------------------------------------------------------------------------------
om o pu ede ap reciarse fcilm en te, los resu ltados son absolu tam en te
igu ales, con la salvedad de qu e la con stan te se tran sfor m a en u n cu tpoin t
m an ten ien do el m ism o valor, pero cam b ian do el sign o d eb ido a la difer en te
p ar am etrizacin
.
a in terp retacin del m od elo de regresin logstica ord in al es sim ilar a
la d e u n m od elo bin ar io
y lo d ich o en los apar tados an terior es de este cap tu lo se ap lica d ir ectam en te
, con dos d ifer en cias im por tan tespr im ero, el
m od elo ord in al m ostrar u n a ser ie de pu n tos d e corte cu ya in ter pr etacin
es an loga
au n qu e ob viam en te n o idn ticaa la de la con stan te en u n a
r egr esin logstica bin ar iasegu n do, si el an lisis se cen tr a en la p rediccin
d e p rob ab ilidad es d e respu esta, se obten d r siem p re tan tas p rob ab ilid ad es
com o categor as ten ga la variab le depen dien te
en lu gar de u n a n ica pr ob ab ilidad d e ocu rr en cia com o se ob ten dra en el caso del logit bin ar io
. i
el an lisis se cen tr a en el an lisis d e cocien tes d e razon es (odds ratio) o en
el cam bio m argin al asociad o a cada coeficien te, la in ter pr etacin del logit
ord in al es pr cticam en te id n tica a la del logit b in ario.
el m ism o m od o qu e se pr oced a con la regresin logstica, tr as la estim acin de u n m odelo logit or din al se pu ede solicitar u n a descripcin m s
d etallad a d e las var ian tes d e los coeficien tes m edian te la or den listcoef.
l m ostrar los cocien tes d e razon es (odds ratio) con listcoef, n o apar ecen
los pu n tos de cor te, pu esto qu e estos cocien tes son relativos, y se ap lican
p or igu al a tod as las categor as. E n efecto, el m odelo d e logit or din al asu m e qu e el efecto de los coeficien tes es el m ism o
en trm in os r elativos, r ecu rd ese qu e se tr ata de u n m odelo n o lin eal
, o qu e las ln eas qu e asocian
la p robab ilidad de ocu rr en cia de cad a u n a de las categor as d e la var iable
d epen dien te con las variab les in d ep en d ien tes son par alelas
en el sigu ien te
su b apartad o se ver esto con m s d etalle
.
ILUSTR I
12 ..o e
ic ie n t e s
d e l
m o d e lo
o r d in a l
d e
la
d e sa
e cc i n
p o lt ic a
ol ogi t ( N=3530) : Fac t or Change i n Odds
Odds of : >m v s <=m
---------------------------------------------------------------------dep |
b
z
P>| z |
e^ b
e^ bSt dX
SDof X
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - es t u2 |
- 0. 34534
- 4. 079
0. 000
0. 7080
0. 8559
0. 4505
es t u3 |
- 0. 79653
- 7. 767
0. 000
0. 4509
0. 7464
0. 3672
edad |
- 0. 00626
- 3. 114
0. 002
0. 9938
0. 8926
18. 1702
i ngr 2 |
- 0. 21770
- 2. 978
0. 003
0. 8044
0. 8990
0. 4888
i ngr 3 |
- 0. 40796
- 3. 651
0. 000
0. 6650
0. 8735
0. 3316
muj er |
0. 19705
3. 110
0. 002
1. 2178
1. 1035
0. 5000
----------------------------------------------------------------------
a in ter pr etacin d e los cocien tes de razon es es, p or tan to, id n tica a
la del m odelo logstico bin ar io. a variab le qu e tien e u n m ayor efecto es,
claram en te, el n ivel d e estu diosla r azn de d esafeccin p oltica d ism in u ye
a m en os d e la m itad para los qu e tien en estu d ios altos con respecto a los
qu e tien en estu dios b ajos, y u n ter cio p ar a los qu e tien en estu d ios m edios.
as m u jeres tien den a u n a m ayor d esafeccin qu e los h om b res, la edad tien e u n efecto n egativo sob re la desafeccin
a m s edad , m en os d esafeccin
p oltica
, as com o los in gr esos
a m ayor n ivel d e in gr esos, m en or r azn de
d esafeccin poltica
. od os los coeficien tes son estadsticam en te sign ificativos, y la qu in ta colu m n a
qu e m u estr a los coeficien tes estan dar izad os, p ar a
p oder com par ar loscon fir m a qu e el n ivel d e estu d ios es la variab le qu e tien e u n m ayor im p acto
n egativosobr e la desafeccin poltica.
om o se dijo an ter ior m en te, si se em plean las pr obabilidades pr ed ich as
p or el m od elo, los r esu ltados del logit ord in al difieren liger am en te de los del
logit bin ar io, pu esto qu e siem pre h abr qu e an alizar varias p rob ab ilidad es
d istin tas, tan tas com o categor as ten ga la var iable depen dien te. or ejem p lo, si se in ten ta estim ar la p robab ilidad d e desafeccin poltica par a d os
E E
Pr ( y=1|
Pr ( y=2|
Pr ( y=3|
Pr ( y=4|
x=
x) :
x) :
x) :
x) :
est u2
0
0.
0.
0.
0.
es t u3
1
1138
4112
3816
0934
[
[
[
[
95% Conf . I nt er v al
0. 0898,
0. 1377]
0. 3753,
0. 4471]
0. 3450,
0. 4183]
0. 0741,
0. 1127]
edad
40
i ngr 2
0
i ngr 3
1
muj er
1
. pr v al ue, x ( es t u3=0 est u2=0 edad=40 i ngr 2=0 i ngr 3=0 muj er =0)
ol ogi t : Pr edi c t i ons f or dep
Conf i dence i nt er v al s by del t a met hod
Pr ( y=1|
Pr ( y=2|
Pr ( y=3|
Pr ( y=4|
x=
x) :
x) :
x) :
x) :
es t u2
0
0.
0.
0.
0.
est u3
0
0448
2427
4924
2201
[
[
[
[
edad
40
95% Conf . I nt er v al
0. 0368,
0. 0528]
0. 2189,
0. 2665]
0. 4747,
0. 5102]
0. 1952,
0. 2449]
i ngr 2
0
i ngr 3
0
muj er
0
12 ..
E l
su p u e st o
de
r e gr e sio n e s
p a r a le la s
o
r a o n e s
p r o p o r cio n a le s
n ltim o ap u n te a n tes de pa sa r a la r egr esin logstica m u ltin om ia l. om o
se h a explica do an ter iorm en te, en el logit ord in a l existe u n n ico coeficien te pa ra cad a va ria b le in dep en d ien te. o qu e esto qu iere decir es qu e el logit
n a vez in stalada, la pr u eba de regresion es par alelas se ejecu ta escr ib ien do la p alabr a om odel, segu ida d e logit
p u es el m odelo en cu estin es el
logsticoy d esp u s la especificacin d el m odelo d el qu e se desea obten er
in form acin . E n el ejem p lo actu al h abr a qu e escr ibir
om od el logit dep estu estu eda d in grin grm u jer
a p arte su perior d e su r esu ltad o sim p lem en te r epite la salid a d e la ord en ologit estn d ar. o qu e in teresa es la p arte in fer ior, en la qu e se m u estr a
u n a pr u eb a de sob re el su pu esto de regresion es paralelas. E l valor d e es
d e ,, qu e para grados de libertad d a u n a sign ificativid ad de ,.
E l resu ltado de este test su gier e qu e los d atos n o se adecu an al su pu esto de
r egr esion es par alelas, p u esto qu e el n ivel d e sign ificacin est p or debajo
d el valor cr tico de ,.
ssc descarga paqu etes y fich eros del (Statistical Software om pon ents) qu e form an
parte del rch ivo del oston ollege.
E E
ILUSTR I
12 ..r u e b a
d e l
su p u e st o
de
r e gr e sio n e s
p a r a le la s
en
la
r e gr e si n
lo gst ica
o r d in a l
I
I
I
I
t
t
t
t
er at
er at
er at
er at
i
i
i
i
on
on
on
on
0:
1:
2:
3:
l
l
l
l
og
og
og
og
l
l
l
l
i
i
i
i
k el
k el
k el
k el
i
i
i
i
hood
hood
hood
hood
=
=
=
=
- 4230.
- 4162.
- 4162.
- 4162.
6463
4171
1521
1521
Number of obs
LR chi 2( 6)
Pr ob > c hi 2
Ps eudo R2
=
=
=
=
3530
136. 99
0. 0000
0. 0162
-----------------------------------------------------------------------------dep |
Coef .
St d. Er r .
z
P>| z |
[ 95% Conf . I nt er val ]
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - est u2 |
- . 345338
. 0846675
- 4. 08
0. 000
- . 5112833
- . 1793928
est u3 |
- . 7965289
. 1025494
- 7. 77
0. 000
- . 9975221
- . 5955358
edad |
- . 006256
. 0020093
- 3. 11
0. 002
- . 0101941
- . 0023178
i ngr 2 |
- . 2177021
. 0731058
- 2. 98
0. 003
- . 3609868
- . 0744174
i ngr 3 |
- . 4079552
. 1117292
- 3. 65
0. 000
- . 6269403
- . 18897
muj er |
. 1970506
. 0633609
3. 11
0. 002
. 0728655
. 3212357
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - _cut 1 |
- 3. 310537
. 1458847
( Anc i l l ar y par amet er s )
_cut 2 |
- 1. 157784
. 130701
_cut 3 |
1. 015081
. 1305644
-----------------------------------------------------------------------------Appr oxi mat e l i k el i hood- r at i o t es t of pr opor t i onal i t y of odds
acr os s r es pons e c at egor i es:
c hi 2( 12) =
26. 02
Pr ob > c hi 2 =
0. 0107
a otr a pr u eb a estadstica disp on ible es u n test de ald dise ad o esp ecficam en te p ar a com pr obar si u n m od elo logstico cu m ple el su pu esto d e
r egr esion es p ar alelas, y for m a par te del paqu ete d e in str u ccion es SPost de
on g y r eese
qu e se h a u tilizad o a m en u do en este cap tu lo, por lo qu e
ya debe estar in stalada
. E sta pr u eb a d a m s in for m acin qu e la pr im era,
p u esto qu e m u estra la con trib u cin d e cada coeficien te a la violacin d el su p u esto d e r egr esion es par alelas, lo qu e per m ite r evisar el m odelo y afin ar lo
si es n ecesario. a in str u ccin es bran t, segu id a d e la op cin detail
b ran t, d eta il
ILUSTR I
1 2..r u e b a
de
r e gr e sio n e s
p a r a le la s
de
r a n t
y >1
- . 5015509
- . 72265037
- . 00963421
- . 34940201
- . 48946785
. 52981587
3. 4305133
y >2
- . 41440488
- . 87996476
- . 00746843
- . 28486464
- . 43298489
. 26463519
1. 2539669
y >3
- . 1813542
- . 63582219
- . 00308335
- . 07959308
- . 33855764
. 01476179
- 1. 1783949
Regr es s i on As s umpt i on
Var i abl e |
chi 2
p>c hi 2
df
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - Al l |
25. 70
0. 012
12
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - es t u2 |
4. 01
0. 135
2
es t u3 |
2. 77
0. 251
2
edad |
2. 56
0. 279
2
i ngr 2 |
4. 00
0. 135
2
i ngr 3 |
0. 39
0. 824
2
muj er |
11. 69
0. 003
2
---------------------------------------A si gni f i cant t est s t at i s t i c pr ov i des ev i dence t hat t he par al l el
r egr es si on as sumpt i on has been v i ol at ed.
Regr es s i on As s umpt i on
Var i abl e |
chi 2
p>c hi 2
df
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - Al l |
14. 00
0. 173
10
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - es t u2 |
4. 41
0. 110
2
es t u3 |
2. 89
0. 236
2
edad |
2. 91
0. 234
2
i ngr 2 |
4. 74
0. 093
2
i ngr 3 |
0. 72
0. 698
2
---------------------------------------A si gni f i cant t est s t at i s t i c pr ov i des ev i dence t hat t he par al l el
r egr es si on as sumpt i on has been v i ol at ed.
1 2..
R e gr e s i n
lo gst ica
para
va r ia b le
d e p e n d ie n t e
n o m in a l
or ltim o, en este captu lo se discu tir b revem en te el m odelo de regresin
logstica m u ltin om ial. e trata de u n a n u eva exten sin d el m odelo logsti-
E E
.
o qu e h ace la in str u ccin m logit d e tata es casi exactam en te estoestim ar de m an era sim u ltn ea tan tos logit b in arios com o categoras m en os u n a
j-ten ga la variab le dep en d ien te m u ltin om ial, a adien d o algu n as restr iccion es especficas par a d ar cu en ta del h ech o d e qu e se tr ata d e u n con ju n to
exh au stivo y m u tu am en te exclu yen te de eleccion es
p or ejem plo, los coeficien tes de las com par acion es bin ar ias deben su m ar y u tilizan d o la m ism a
1 2..E st im a ci n
e
in t e r p r e t a ci n
d e l
m o d e lo
tilizan do la en cu esta postelector al d el
de
estu d io
, se recodifica la variab le de r ecu erd o d e voto en cin co categoras
, E ,
,
n acion alistas y otros
, elim in an d o a los qu e n o votaron y a los qu e n o con testaron a la pr egu n ta. ar a estim ar u n m od elo m u ltin om ial d e esta variab le
sob re n ivel de estu d ios, edad, in gresos y gn ero, se em p lea la in stru ccin
m logit del m ism o m odo qu e se h an u tilizado logit u ologit
m logit voto estu estu eda d in grin grm u jer
E l resu ltado es m u y sim ilar al del logit bin ario, excep to en u n a cosa
m u estra cu atro b loqu es de coeficien tes en lu gar de u n o. ad a u n o d e los bloqu es d e coeficien tes qu e aparecen es u n m odelo logstico b in ario qu e com p ara la prob abilid ad de voto al partido m ostrado al com ien zo d e cad a b loqu e
fren te a la probabilidad d e voto al
, qu e es la categora de referen cia.
or om isin , la in stru ccin ologit seleccion a la pr im er a categor a d e la
variab le d epen dien te com o categor a de r eferen cia. E n este caso tien e sen tido
pu esto qu e el fu e el p ar tid o qu e gan las eleccion es d e , r esu lta
ad ecu ado u tilizar lo com o refer en cia par a las com par acion es bin ar ias
, p er o
si se deseara fijar otr a categor a de referen cia, h abr a qu e h acer lo u tilizan d o
la op cin base
d e la in stru ccin m logit. or ejem plo, escr ibien d o b ase
,
la categora d e r efer en cia sera el E en vez d el
.
om o en los m od elos bin ario y ord in al, la in terp retacin d e los coeficien tes del logit m u ltin om ial n o es in m ediata, sin o qu e h ay qu e r ecu r rir a
la tran sfor m acin d e estos coeficien tes en cocien tes de razon es o en pr ob abilid ad es. E n el caso d el logit m u ltin om ial, la in ter pr etacin se com p lica
a n m s al ten er n o u n n ico m od elo, sin o tan tos com o categoras ten ga la
variab le d epen dien te m en os u n o
o sea, cu atro en este caso
. a in ter pr etacin de los r esu ltad os r equ ier e el an lisis sim u ltn eo d e la in for m acin
con ten id a en todos los b loqu es de coeficien tes.
En el m om ento de escribir estas pginas, tanto la instruccin listcoef com o m logplot del m dulo SPost no funcionaban en la versin de tata con los m odelos m ultinom iales de la versin .
ara poderlas ejecutar sin problem as hay que anteceder la orden m logit de la instruccin version 1.
egn los autores, se espera solucionar en una prxim a revisin de estos program as ado.
E E
m od elo m u ltin om ial, b asad a en los cocien tes de r azon es. or defecto, esta
ord en , ejecu tad a tras u n m odelo m u ltin om ial, m u estra el efecto d e cada var iable in depen dien te sob re todas las com b in acion es p osibles de categor as
d e la variab le d ep en d ien te, lo qu e qu iere decir qu e en este caso la salida de
listcoef abarcara varias pgin as.
ILUSTR I
1 2.1.R e gr e si n
m u lt in o m ia l
d e l
vo t o
so b r e
e st u d io s
in gr e so s
ed ad
y
g n e r o
I
I
I
I
I
t
t
t
t
t
er at
er at
er at
er at
er at
i
i
i
i
i
on
on
on
on
on
0:
1:
2:
3:
4:
Mul t i nomi al
l
l
l
l
l
og
og
og
og
og
l
l
l
l
l
i
i
i
i
i
k el
k el
k el
k el
k el
i
i
i
i
i
hood
hood
hood
hood
hood
=
=
=
=
=
l ogi s t i c r egr es s i on
- 3443.
- 3355.
- 3348.
- 3348.
- 3348.
9749
8843
7016
5892
5891
Number of obs
LR chi 2( 24)
Pr ob > c hi 2
Ps eudo R2
=
=
=
=
2745
190. 77
0. 0000
0. 0277
-----------------------------------------------------------------------------vot o |
Coef .
St d. Er r .
z
P>| z |
[ 95% Conf . I nt er val ]
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - PSOE
|
est u2 |
- . 2761143
. 1216149
- 2. 27
0. 023
- . 5144752
- . 0377533
est u3 |
- . 3350645
. 1536301
- 2. 18
0. 029
- . 636174
- . 033955
edad |
- . 0118825
. 0028957
- 4. 10
0. 000
- . 017558
- . 006207
i ngr 2 |
- . 4300943
. 1033985
- 4. 16
0. 000
- . 6327517
- . 2274369
i ngr 3 |
- . 5357216
. 1666942
- 3. 21
0. 001
- . 8624362
- . 209007
muj er |
. 0468428
. 0892647
0. 52
0. 600
- . 1281129
. 2217985
_cons |
. 4292741
. 1875246
2. 29
0. 022
. 0617328
. 7968155
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - IU
|
est u2 |
. 2634419
. 2116822
1. 24
0. 213
- . 1514476
. 6783315
est u3 |
. 7091275
. 2312174
3. 07
0. 002
. 2559497
1. 162305
edad |
- . 0238329
. 0054325
- 4. 39
0. 000
- . 0344804
- . 0131854
i ngr 2 |
- . 0798113
. 1839424
- 0. 43
0. 664
- . 4403317
. 2807091
i ngr 3 |
- . 4557999
. 271775
- 1. 68
0. 094
- . 9884691
. 0768694
muj er |
- . 4344044
. 1619694
- 2. 68
0. 007
- . 7518586
- . 1169502
_cons |
- . 851463
. 3311246
- 2. 57
0. 010
- 1. 500455
- . 2024708
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - NAC
|
est u2 |
. 1777215
. 1857499
0. 96
0. 339
- . 1863416
. 5417845
est u3 |
. 248793
. 2168983
1. 15
0. 251
- . 1763199
. 6739059
edad |
- . 0052523
. 0046174
- 1. 14
0. 255
- . 0143022
. 0037976
i ngr 2 |
. 2194708
. 1670888
1. 31
0. 189
- . 1080172
. 5469587
i ngr 3 |
. 2243626
. 2354624
0. 95
0. 341
- . 2371352
. 6858604
muj er |
- . 2053962
. 1407716
- 1. 46
0. 145
- . 4813035
. 070511
_cons |
- 1. 58083
. 3045848
- 5. 19
0. 000
- 2. 177805
- . 9838552
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - OTR
|
est u2 |
. 0814243
. 2598894
0. 31
0. 754
- . 4279495
. 590798
est u3 |
. 8242985
. 2652403
3. 11
0. 002
. 304437
1. 34416
edad |
- . 0374769
. 0067912
- 5. 52
0. 000
- . 0507873
- . 0241665
i ngr 2 |
- . 2583509
. 2267261
- 1. 14
0. 255
- . 7027259
. 186024
i ngr 3 |
. 1483741
. 2768184
0. 54
0. 592
- . 39418
. 6909281
muj er |
- . 2173894
. 1883927
- 1. 15
0. 249
- . 5866323
. 1518535
_cons |
- . 7795759
. 3901126
- 2. 00
0. 046
- 1. 544183
- . 0149693
-----------------------------------------------------------------------------( vot o==PP i s t he base out come)
E s con ven ien te, por tan to, delim itar la p rod u ccin d e coeficien tes a tr avs de las op cion es pvalu e
E E
ILUSTR I
1 2.11 .List a
de
co e
icie n t e s
sign i
ica t ivo s
d e
una
r e gr e si n
m u lt in o m ia l
Var i abl e: es t u2 ( s d=. 44680195)
Odds compar i ng
|
Al t er nat i v e 1
|
t o Al t er nat i ve 2 |
b
z
P>| z |
e^ b
e^ bSt dX
- - - - - - - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - PSOE
- PP
|
- 0. 27611
- 2. 270
0. 023
0. 7587
0. 8839
IU
- PSOE
|
0. 53956
2. 460
0. 014
1. 7152
1. 2726
NAC
- PSOE
|
0. 45384
2. 321
0. 020
1. 5743
1. 2248
---------------------------------------------------------------Var i abl e: es t u3 ( s d=. 37290877)
Odds compar i ng
|
Al t er nat i v e 1
|
t o Al t er nat i ve 2 |
b
z
P>| z |
e^ b
e^ bSt dX
- - - - - - - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - PSOE
- PP
|
- 0. 33506
- 2. 181
0. 029
0. 7153
0. 8825
IU
- PSOE
|
1. 04419
4. 260
0. 000
2. 8411
1. 4761
IU
- PP
|
0. 70913
3. 067
0. 002
2. 0322
1. 3027
NAC
- PSOE
|
0. 58386
2. 504
0. 012
1. 7929
1. 2432
OTR
- PSOE
|
1. 15936
4. 187
0. 000
3. 1879
1. 5409
OTR
- PP
|
0. 82430
3. 108
0. 002
2. 2803
1. 3599
---------------------------------------------------------------Var i abl e: edad ( s d=17. 951914)
Odds compar i ng
|
Al t er nat i v e 1
|
t o Al t er nat i ve 2 |
b
z
P>| z |
e^ b
e^ bSt dX
- - - - - - - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - PSOE
- PP
|
- 0. 01188
- 4. 103
0. 000
0. 9882
0. 8079
IU
- PSOE
|
- 0. 01195
- 2. 133
0. 033
0. 9881
0. 8069
IU
- PP
|
- 0. 02383
- 4. 387
0. 000
0. 9764
0. 6519
NAC
-IU
|
0. 01858
2. 798
0. 005
1. 0188
1. 3959
OTR
- PSOE
|
- 0. 02559
- 3. 696
0. 000
0. 9747
0. 6316
OTR
- NAC
|
- 0. 03222
- 4. 138
0. 000
0. 9683
0. 5607
OTR
- PP
|
- 0. 03748
- 5. 518
0. 000
0. 9632
0. 5103
---------------------------------------------------------------Var i abl e: i ngr 2 ( s d=. 48991269)
Odds compar i ng
|
Al t er nat i v e 1
|
t o Al t er nat i ve 2 |
b
z
P>| z |
e^ b
e^ bSt dX
- - - - - - - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - PSOE
- PP
|
- 0. 43009
- 4. 160
0. 000
0. 6504
0. 8100
NAC
- PSOE
|
0. 64957
3. 734
0. 000
1. 9147
1. 3747
---------------------------------------------------------------Var i abl e: i ngr 3 ( s d=. 3388137)
Odds compar i ng
|
Al t er nat i v e 1
|
t o Al t er nat i ve 2 |
b
z
P>| z |
e^ b
e^ bSt dX
- - - - - - - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - PSOE
- PP
|
- 0. 53572
- 3. 214
0. 001
0. 5852
0. 8340
NAC
- PSOE
|
0. 76008
2. 996
0. 003
2. 1385
1. 2937
NAC
-IU
|
0. 68016
2. 052
0. 040
1. 9742
1. 2592
OTR
- PSOE
|
0. 68410
2. 350
0. 019
1. 9820
1. 2608
---------------------------------------------------------------Var i abl e: muj er ( s d=. 50005045)
Odds compar i ng
|
Al t er nat i v e 1
|
t o Al t er nat i ve 2 |
b
z
P>| z |
e^ b
e^ bSt dX
- - - - - - - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - IU
- PSOE
|
- 0. 48125
- 2. 872
0. 004
0. 6180
0. 7861
IU
- PP
|
- 0. 43440
- 2. 682
0. 007
0. 6477
0. 8047
----------------------------------------------------------------
ese a que la orden listcoef hace la in tepretacin del logit m ultinom ial m ucho m s sencilla que la instru ccin m logit de tata, sigue siendo bastante com plicada por la cantidad tan enorm e de coeficien tes y valores que hay que tener
en cuenta de m anera sim ultnea. En el m ism o conjunto de u tilidades Spost, hay
un program a especfico que perm ite una interpretacin visual m u cho m s sencilla de los resu ltados del logit m ultin om ial. Este program a es m logplot . ras la
estim acin del m odelo m ultinom ial anterior, si se introdu ce la sigu iente lnea
m logplot estu estu eda d in grin grm u jer, std
sp
.
se con sigu e qu e se r ep resen ten sim u ltn eam en te todas las variab les in dep en d ien tes d el m odelo
estu 2, estu 3, edad, in gr2, in gr3 y m u
er
. a op cin
std
especifica qu cam bio en las variab les in d ep en d ien tes qu iere m ostr arse en el gr ficopara var iables dicotm icas se esp ecifica el valor , y p ar a
edad , qu e es con tin u a, se m ar ca con la opcin s, qu e r epr esen ta el cam bio
en el cocien te d e razon es asociad o a u n au m en to d e u n a d esviacin tp ica
et
0
1
et3
StCoef
ingr
ingr3
0
1
er
0
1
P
P
0
1
.43
1.86
0
1
ea
1.4
.73
.46
.19
.08
Logit Coefficient Scale Relative to Category PP
.3
.6
.89
a in stru ccin m logview perm ite generar el m ism o tipo de grficos qu e m logplot pero de
m an era interactiva, a travs de un cu adro de dilogo.
E E
E n el grfico .se m u estr an de m an er a visu al los cocien tes de r azon es asociados a cad a u n a d e las categoras d e la var iable d epen dien te
en
el eje h or izon tal
, p ara cad a valor d e las var iables in depen dien tes
en el eje
ver tical
. ad a categora se r ep resen ta a tr avs d e la pr im era letr a d e su
etiqu eta, con la categor a d e r efer en cia
el en este casoocu pan do siem p re el valor d e
pu esto qu e es el p u n to d e refer en cia para los cocien tes de
r azon es de todas las d em s categorasd e ah se d ed u ce qu e la otra qu e
n o est en el cen tro siem p re cor respon d e al E
. a distan cia en tr e categoras, por tan to, r efleja el im p acto de cad a var iable in d ep en d ien te sobr e la
p robab ilidad de voto a cad a partido p oltico. or ejem p lo, el gr fico m u estra
clar am en te cm o la razn de voto al E fr en te al r esto de las categor as
d ism in u ye en fu n cin de los estu dios. E l voto a
y otr os p ar tidos es m u ch o m s p rob ab le p ar a los qu e tien en estu d ios su perior es qu e par a los qu e
tien en estu dios elem en tales
las letr as y estn m u y a la d er ech a
. as
ln eas qu e con ectan d os partidos in d ican qu e la diferen cia en tr e ellos n o es
sign ificativa a u n de n ivel de ,
el especificado en la ord en
as, par a los
estu d ios su p erior es
segu n d o bloqu e
, la d iferen cia en tre el cocien te de razon es de voto al E y todos los d em s par tid os es sign ificativa, m ien tras
qu e la d iferen cia en tr e el voto a
y a los partidos n acion alistas o a otr os
n o es sign ificativa
p u esto qu e estn u n id os por u n a ln ea
.
a m ayor p ar te de las otr as tcn icas par a ayu d ar a la in ter pr etacin d e
los r esu ltad os d el m odelo logstico bin ario
com o el u so de pr obabilid ades,
visto en el apar tado .d el captu lo an ter iortam b in se p u ed en ap licar al
m od elo m u ltin om ial.
12 ..
E l
su p u e st o
de
in d e p e n d e n cia
de
a lt e r n a t iva s
ir r e le va n t e s
E n el m odelo d e regresin logstica m u ltin om ial, las razon es de ocu r ren cia
(odds) de cad a p ar de valor es d e la var iable d ep en d ien te n o deb en ser afectad as por el r esto de las alter n ativas posib les
a adir o elim in ar altern ativas
n o deb e m od ificar los coeficien tes
. e trata d el su p u esto d e in dep en d en cia
d e alter n ativas ir relevan tes, qu e r equ ier e qu e cad a u n a de las p osibles alter n ativas est n etam en te diferen ciad a y sea valor ada d e m an er a in d ep en d ien te p or el qu e tom a la decisin . i n o se cu m ple este su pu esto, el m od elo
m u ltin om ial n o r esu lta adecu ad o, pu es pu ede d ar lu gar a coeficien tes in cor rectos .
am bin de m odo algo m s com plejo puede efectu arse la com probacin del su pu esto
de in dependen cia de altern ativas irrelevan tes con la in stru ccin au sm an de tata. ara u n a
explicacin de su u so en los m odelos m u ltin om iales, vase tata -.
E E
ILUSTR I
12 .1 2.R e su lt a d o s
de
la s
p r u e b a s
d e
a u sm a n
y
Sm a ll
sia o
* * * * Hausman t est s of I I A as s umpt i on ( N=2745)
Ho: Odds( Out c ome- J v s Out c ome- K) ar e i ndependent of ot her al t er nat i v es.
Omi t t ed |
c hi 2
df
P>c hi 2
ev i dence
- - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - PSOE |
0. 262
21
1. 000
f or Ho
IU |
- 0. 509
19
----NAC |
5. 579
21
1. 000
f or Ho
OTR |
- 0. 059
21
-------------------------------------------------Not e: I f c hi 2<0, t he es t i mat ed model does not
meet as ympt ot i c as sumpt i ons of t he t es t .
* * * * Smal l - Hsi ao t est s of I I A as sumpt i on ( N=2745)
Ho: Odds( Out c ome- J v s Out c ome- K) ar e i ndependent of ot her al t er nat i v es.
Omi t t ed |
l nL( f ul l ) l nL( omi t )
chi 2
df
P>chi 2
ev i dence
- - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - PSOE |
- 842. 489
- 832. 172 20. 634
21
0. 481
f or Ho
IU |
- 1362. 391 - 1347. 485 29. 811
21
0. 096
f or Ho
NAC |
- 1304. 436 - 1293. 449 21. 975
21
0. 401
f or Ho
OTR |
- 1489. 086 - 1477. 799 22. 575
21
0. 367
f or Ho
-------------------------------------------------------------------
12 ..E
e r cicio s
. san d o el barm etro d e abril de
situ acin de crisis econ m ica
,
seleccion a com o variab le depen d ien te la prim era p regu n ta
valoracin
d e la situ acin econ m ica gen eral
. ran sfrm ala p ara qu e p u ed a ser
con sid erada ord in al y la categora m s positiva ten ga m ayor pu n tu acin .
eleccion a, fin alm en te, com o in depen dien tes al m en os el estatu s
con las
cin co categoras qu e el
con sidera
, la in ten cin d e voto
d os ficticias,
al m en os con los d os partidos p rin cip alesy otra variab le qu e con sid eres
relevan te. p lica u n m odelo logit ord in al y com en ta los resu ltados.
. az el ejer cicio de la pgin a , pero en lu gar de con siderar d os var iables bin ar ias com o d ep en d ien tes, em plea el voto com o m u ltin om ial
con valoresE , , n acion alistas,
y otr os.
13
E l
a n lisis
d e
la
h ist o r ia
de
a co n t e cim ie n t o s
co n
St a t a
E n los ltim os 20 a os el an lisis d e h istoria de acon tecim ien to (even t h istory an alysis en in gls) se h a aplicado d e form a crecien te en los estu d ios
de sociologa y d e cien cia p oltica 1. E n trm in os gen eralesel an lisis d e la
h istoria d e acon tecim ien tos (d e ah ora en ad elan te ) perm ite in estigar
los factores u e in flu yen en u e su ceda u n acon tecim ien to dado. n acon te
cim ien to p u ed e defin irse com o u n cam io de tip o cu alitatio de la u n id ad d e
an lisisd esde el estad o j al estad o ku e ocu rre en u n m om en to con creto
del tiem po. E l e
em p lo u e se desarrolla en este cap tu lo se refiere a la tran
sicin desde la con d icin de parad o (estado j) a la de ocu p ad o (estad o k).
eido a u e los lm ites d e esp acio oligan a ser m u y selecti
osel o
etio d e este captu lo es p rop orcion ar u n a in tr odu ccin sim ple a los fu n
d am en tos del y m ostr ar algu n as aplicacion es u tili
an do el pr ogr am a
tata. E n gen er al h an pr im ad o los aspectos ap licad os sore los d etalles
form ales y estadsticos. E n la p rim a seccin se pr oporcion a u n sin ttico
com p en d io sor e u es el y cm o fu n cion a. E n la segu n d a seccin se
p resen tan las in str u ccion es sicas de tata p ar a el y en la ter cer a las
tcn icas n o param tr icas d e an lisis d escr iptio. in alm en teen la cu arta
seccin se descrien los m odelos m u ltiar iados m s sim p les de la tasa de
tran sicin con tiem po con tin u o.
1 3.1.Qu
e s
y
c m o
fu n cio n a
e l
AH A
E l perm ite in estigar los cam ios d e tip o cu alitatio de la u n id ad d e
an lisis u e ocu r ren en u n m om en to con creto del tiem p o y en tre u n con
1
an to los tem as u e se tratan en este captu lo com o los aspectos m s sofisticados del
u e au n o se discu ten son desarrollados de form a eh au stia en un a m onografa pu licada en
la oleccin u adern os etodolgicos del
(ern ardi 200). E l presen te captu lo se asa en
dich a m on ografaa la u e se rem iten los lectores in teresados para profu n diar en el estu dio del
. ara otros artcu los y m anu ales de in trodu ccin al ase llison (1)am agu ch i
(11)tran g (1)etersen (1)erm u n t (1) y lossfeld y oh er (2001).
E E
im porta n te p oru e en los dos ca sos se p recisa la a p lica cin d e tcn ica s d e
a n lisis distin ta s. E ste ca ptu lo se cen tr a slo en los da tos con d u ra cion es
d e tipo con tin u o u e son los m s h a itu ales en las a p lica cion es d e socio
loga y cien cia s poltica s 2 . E n el cu a dr o 1.1 se r ecogen d e form a sin ttica
la s defin icion es de los con ceptos m s im porta n tes p resen ta dos h a sta au .
on r esp ecto a la s tcn ica s tr a d icion a les d e a n lisis d e tip o tr a ser sa l
el p er m ite tr a ta r d e for m a a d ecu a d a la s d u r a cion es cen su r a d a s y es
p ecifica r a r ia les in d ep en d ien tes u e se m od ifica n en el tiem p o . E l p r o
lem a d e la s d u r a cion es cen su r a d a s tien e u e er con el h ech o d e u e en
la m a yor a d e la s in estiga cion es la s in for m a cion es sor e la s d u r a cion es
d e los ep isod ios est n in com p leta s. E l ca so m s tp ico es el d e la cen su ra
a la derech a u e ocu r r e cu a n d o se con oce la fech a d e in icio d el ep isod io
p er o cu a n d o a ca a el p er iod o d e oser a cin el a con tecim ien to d e in ter s
tod a a n o h a su ced id o. or e
em p lose sa e u e u n in d iid u o h a em p e
a d o a esta r d esem p lea d o en m a yo d e 200y u e sigu e esta n d o d esem
p lea d o en en er o d e 200m om en to en el u e se a p lica la en cu esta . E l ep i
sod io d e d esem p leo en este ca so n o h a ter m in a d o con u n a con tecim ien to
y la d u r a cin cor r esp on d ien te (m eses) se con sid er a com o cen su r a d a a
la d er ech a . in en tr a r en m s d eta llescon el es p osile tr a ta r la s
d u r a cion es cen su r a d a s a la d er ech a sin sesgos en la s estim a cion es.
2
dem ssi los in ter
alos discretos del tiem po en el cual se oser
an los acon tecim ien
tos son peu e oslos m odelos estadsticos con tiem po discreto son u n a aproim acin a los
de tiem po contin uo yen la prcticalos resultados son eu ialen tes. ara un a discu sin m s
profu n diada del para datos con duracin discreta
ase ern ardi (200).
ara u na discu sin detallada de todos los tipos de censu ra y los prolem as a ellas aso
ciados
ase lossfeld y oh er (2001).
E E
CUAD
13 .1.o s
c o n ce t o s
sico s
d e l
AH A
Aco n t e cim ie n t o
Ca m io
de
la
u n id a d
de
a n lisis
d e l
e st a d o
j
a l
e st a d o
k
E pisodio
roceso con un solo
episodio y dos estados
roceso m ulti
estado
roceso m ulti
episdico
iem po contin uo
iem po discreto
(1.1)
a s a r ia les X u e se m o d ifica n en el tiem p o p u ed en r efer ir se ta n to
a ca r a cter stica s in d iid u a les d e la s u n id a d es d e a n lisis co m o a fa cto r es
co n tetu a les u e o p er a n a n iel m a cr o . o r e
em p lo a l estu d ia r la d u r a
ci n d e lo s ep isod io s d e d esem p leop u ed e in estiga r se cm o in flu yen en
la tr a n sici n d el d esem p leo a l em p leo ta n to fa ctor es m a cr o (p o r e
em p lo
la s a r ia cion es m en su a les en la in fla ci n o el n m er o d e p u esto s d e tr a
a
o cr ea d os) com o fa cto r es u e a ta en a la s ca r a cter stica s in d iid u a les
d e los en tr eista d o s (p o r e
em p lo los ca m ios en su situ a ci n fa m ilia r o
el fin d e la p er cep ci n d el su sid io d e d esem p leo). r ecisa m en te gr a cia s
a la p o siilid a d u e o fr ecen d e ea lu a r el efecto d el ca m io d e u n a a r ia
le in d ep en d ien te sor e la p r oa ilid a d d e u e su ced a u n ca m io en la
a r ia le d ep en d ien tea lgu n o s a u to r es a fir m a n u e la s tcn ica s d el
(1.2)
d on d e es la d u r a cin a n tes d e u e su ced a el a con tecim ien to. E n
otr os tr m in oses el tiem p o u e la u n id a d d e a n lisis p a sa en el esta d o
d e or igen j h a sta el m om en to d e la tr a n sicin a l esta d o d e d estin o k. a
ta sa d e tr a n sicin r(t)jk ep r esa p or lo ta n tola p r oa ilid a d in sta n t n ea
d e u e el a con tecim ien to ocu r r a en el in ter
a lo d e tiem p o in fin itesim a l
t-tcon la con d icin d e u e el een to n o h a ya ocu r r id o a n tes d e t. a
ta sa d e tr a n sicin se in ter p r eta com o la p r op en sin a ca m ia r d esd e el
esta d o d e or igen j a l esta d o d e d estin o k en el m om en to t. a con d icin
t sign ifica u e esta p r op en sin a l ca m io es d efin id a con r esp ecto
a l con
u n to d e u n id a d es d e a n lisis tod a a en r iesgo d e ep er im en ta r
el a con tecim ien to en el tiem p o tes d ecirel con
u n to d e u n id a d es d e
a n lisis cu ya d u r a cin es m a yor o igu a l a t. or m a lm en tela ta sa d e tr a n
sicin n o p u ed e ser in ter p r eta d a com o u n a p r oa ilid a d p or u e p u ed e
a su m ir a lor es m a yor es u e 1. in em a r gosi el in ter
a lo d e tiem p o t-t
es p eu e oen ton ces
(1.)
a tasa de tr an sicin se ap roim aen este casoa la pr oailid ad con di
cion al de u e el acon tecim ien to ocu r ra en in ter alo t-t (lossfeld y oh er
2001). E s im por tan te resaltar u e la tasa de tr an sicin d efin id a en la fr
m u la (1.2) con tien e d os tip os de in for m acion esla calid ad del cam io des
d e j a k y la d u r acin an tes de u e el cam io ocu rr a. a tasa de tran sicin
est adem s relacion ada con otr os d os im por tan tes con cep tos estadsticos
la fu n cin d e su p er ien cia y la fu n cin de den sid ad .
a fu n cin de la d istr iu cin (t) d escr ie la p roailid ad de u e la
d u racin de u n episodio sea m en or o igu al a t. ich o con otr as palaras
la pr oailid ad de u e u n acon tecim ien to ocu r ra en el in teralo de 0 a t.
orm alm en te
lu strar el fun cion am iento de la tcn ica de particin del episodio (episode splitting) u e
perm ite defin ir las
ariales u e se m odifican en el tiem po reuerira m ucho m s espacio ue
el de u e se dispon e. ara diferen tes e
em plos de defin icin de ariales u e se m odifican en
el tiem po con tata
ase el captu lo en ernardi (200).
E E
(1.)
d em sse defin e la fu n cin d e su per
i
en cia (t) com o la fu n cin
com plem en taria de (t)
(1.)
a fu n cin de su perien cia (t) descrie la pr oailid ad de u e la du
r acin d e u n episod io sea com o m n im o igu al a t. ich o de otr o m odola
p roailidad d e u e la u n id ad de an lisis h aya soreiido en el estado j
h asta el tiem p o t. E n el e
em plo de la salid a del desem pleo(t) ep resara
la proailid ad de segu ir estan d o d esem p leado en el tiem p o t.
in alm en tela fu n cin de den sidad
(t) d escr ie la proailid ad in s
tan tn ea in con d icion al de u e u n acon tecim ien to ocu r ra en el in teralo de
tiem po in fin itesim al t-t
(1.)
E s im p ortan te d estacar la diferen cia en tr e la tasa de tr an sicin y la fu n
cin d e d en sidad. E n la fu n cin d e den sidad la pr oailid ad d e u e ocu rr a
el acon tecim ien to n o est con d icion ad a a la su per
i
en cia h asta el tiem po
tm ien tr as u e en la tasa d e tr an sicin la pr oailid ad se com pu ta slo
con r esp ecto a las u n idad es de an lisis u e se h an u edado en r iesgo de
eper im en tar el acon tecim ien to. E istead em su n a relacin en tre la tasa
d e tran sicin la fu n cin de den sid ad y la fu n cin d e su p er ien ciad e tal
m an era u e (lossfeld y oh er 2001)
(1.)
or ltim ola idea cen tr al del es con sider ar la tasa d e tr an sicin
r(t) com o la ar iale d epen dien te y d efin ir u n m odelo d e la tasa de tran si
cin de la sigu ien te m an er a
(1.)
on u n m odelo de la tasa d e tr an sicin se estu d ia cm o la pr open sin a
p asar d esde el estado j al estado kes decirla p rop en sin de u e ocu rr a el
1 3..
E l
AH A
co n
St a t a
in st r u ccio n e s
a r a
d e fin ir
lo s
d a t o s
E n tata tod as las in str u ccion es p ara an aliar d atos d e h istor ias d e acon te
cim ien tos em p iean con el pr efi
o stu e es la ar eiatu r a de su rvival tim e.
ara pod er u tiliar las r den es u e em p iean p or st es n ecesario u e los
d atos h ayan sido d efin id os pr e
iam en te com o datos de h istoria de acon te
cim ien tos. a in stru ccin p ara defin ir los d atos com o h istor ia d e acon teci
m ien tos en tata es stset. ara ilu str ar cm o fu n cion a la in stru ccin stset
se lan a a con tin u acin u n e
em p lo con creto u e se r efiere a la d u racin
d e episod ios de desem pleo. E n este casoel acon tecim ien to in estigad o es
la tr an sicin d esd e el desem pleo h asta la ocu p acin . E l fich ero d e d atos
se llam a u n em ploym en t.dta. os episod ios d e los su
etos u e tod a
a estn
d esem p leados en el m om en to d e la en tr eista se con sideran cen su r ados a la
d erech a. E n la ilu stracin 1.1 se pr esen tan algu n os episod ios del fich er o de
d atos con sid er ado y la d escr ipcin de las ariales in depen dien tes .
E E
USAC
1 3.1 .a r ia le s
y
a lu n o s
e iso d io s
d e l
fich e r o
d e
d a t o s
r e la t io s
a
la s
d u r a cio n e s
de
lo s
e iso d io s
de
d e se m le o
(u n em p loym en t.d ta )
Var i abl e
Desc r i pc i n
------------------------------------------id
Nmer o de i dent i f i c aci n
or g
Es t ado de or i gen ( 0=des empl eado; t odos l os epi s odi os t i enen c omo
est ado de or i gen 0)
des t
Es t ado de des t i no ( 0=c ens ur ado a l a der ec ha, es dec i r des empl eado en
el moment o de l a ent r evi s t a, 1=empl eado, 2=i nact i v o)
begi n
Fecha de i ni c i o en mes es del s i gl o
end
Fecha de f i n en mes es del s i gl o
dat ei nt
Fecha de l a ent r ev i st a en mes es del s i gl o
s ex
Gner o ( 1=v ar n, 0=muj er )
dbi r t h
Fecha de nac i mi ent o en mes es del si gl o
c ohor t
Cohor t e de naci mi ent o ( 1=nac i ant es de 1940, 2=nac i ent r e
1940 y 1959, 3=nac i des pus de 1959)
c oh2
Cohor t e 1940- 1960 ( 1 s i c ohor t =2, O s i no)
c oh3
Cohor t e >1960 ( 1 s i cohor t =3, O s i no)
---------------------------------------------------------------------id
1000031
1000031
1000031
1000043
1000051
1000061
1000062
1000071
1000112
or g
0
0
0
0
0
0
0
0
0
dest
1
1
0
0
1
0
0
1
2
begi n
953
1063
1167
1101
982
1170
1170
982
928
end
967
1099
1168
1171
990
1171
1171
992
934
dat ei nt
1168
1168
1168
1171
1170
1171
1171
1170
1169
s ex
0
0
0
0
1
1
0
1
0
dbi r t h
708
708
708
797
702
662
669
587
628
c ohor t
2
2
2
3
2
2
2
2
2
(1.10)
or e
em plola fech a 2 en m eses d el siglo corr espon de a octu re del
11 . E l p roceso in
estigad o en este e
em p lo es m u lti
episd ico y m u lti
E sto poru e 2
12 1 y resta 10u e corresponde al m es de octu re.
estad o. E s m u lti
ep isdico poru e cad a en treistad o p u ed e h aer ten id o
m s de u n episod io de d esem p leo. or e
em ploel su
eto con el n m er o d e
iden tificacin igu al a 100001 tien e tres episodios de desem pleolos d os pr i
m er os term in an con u n a tr an sicin a la ocu p acin com o in dica la ariale
dest con
alor 1m ien tras u e el ter cer o est cen su r ad o a la der ech acom o
in dican las ariales dest con alor 0 y en d igu al a la fech a d e la en tr eista.
d em sel pr oceso es m u lti
estadoya u e la salida del desem pleo pu ede
ocu rr ir ien con u n a tran sicin a la ocu pacin ien con la in acti
idad. i
m on os en el su
eto con el n m ero de iden tificacin igu al a 1000112. u
ep isodio d e d esem p leo em piea en la fech a 2y acaa en la fech a con
u n a tr an sicin a la in actiid adcom o in dica la ar iale dest con
alor 2.
om o se d i
o an terior m en tela in str u ccin sica p ar a d efin ir los d atos
com o h istor ia de acon tecim ien to en tata es stset. u form u lacin m s sim
p lela sigu ien te
stset artem poralfailu re(arin terru p )
E E
e u tili
a la opcin origin ( ) para d efin ir u e el ep isodio in icia en la
fech a in d icada por la ariale egin . on la opcin
ail(dest1) se esp e
cifica u e la tran sicin de in ter s es la tr an sicin a la ocu pacin y u e la
tran sicin a la in actiid ad tien e u e ser con siderad a com o eu ialen te a u n a
cen su ra a la derech a. E n la ilu str acin 1.2 se p resen tan los r esu ltad os de
la aplicacin de la in stru ccin stset. e los episodios de d esem p leo
ter m in an con u n a tran sicin a la ocu pacin . dem spar a el su
eto con el
n m er o de id en tificacin igu al a 1000112 u e sale d el d esem p leo en la fech a
con u n a tr an sicin a la in actiidad (dest2)la ar iale d es igu al a 0.
i tam in fu er a in ter esan te in
estigar la tr an sicin a la in actiidad con el
fin d e com parar los m ecan ism os u ed esd e la con d icin de desem plead o
d eter m in an la salida del m ercado d e traa
o o la
u elta a la ocu p acin se
r a n ecesario oler a defin ir los datos com o h istor ias d e acon tecim ien tos
u tili
an d o stsetp er o esta eespecifican do u e el acon tecim ien to su ced e
cu an do la
ar iale dest es igu al a 2 10 . a ln ea de in stru ccin cor respon d ien
te sera
stset en d origin (egin ) fail(dest2)
USAC
E E
13 .3 .a
fu n ci n
de
su e r ie n cia
E l gr fico 1.1 p resen ta la fu n cin d e su perien cia par a la salid a del
d esem p leo y m u estr a la p rop or cin de episod ios de d esem p leo (e
e er tical)
u e tod aa n o h an term in ado con u n a tran sicin a la ocu pacin en fu n
cin d e la d u racin d e los episod ios (e
e h ori
on tal). u ede as com pr oarse
u e m s d e la m itad de los episod ios de desem pleo acaan con u n a tr an si
cin a la ocu pacin d u ran te el p rim er a op er o u n o d e cad a cu atro tien e
u n a du racin su perior a los m eses.
C
1 3.1.u n ci n
d e
su e r ie n cia
a r a
la
sa lid a
d e l
d e se m le o
1.00
0.75
Funcin de supervivencia
0.50
0.25
0.00
0
12
24
36
48
60
72
84
Duracin del episodio de desempleo
96
108
120
h istorias de acon tecim ien tos m ed ian te la in stru ccin stset. i se u ier en
com p ar ar las fu n cion es de su p erien cia par a d iferen tes gru poses decir
p ara difer en tes alor es d e u n a ariale in depen d ien telas in str u ccion es u e
se pr ecisan son
sts grap h y(
arlist)
sts listy(arlist)
y(coh ort) n a m e(
repla ce)
11
a eolu cin con saltos y la rusca cada de la fu ncin de superien cia de la
cohorte m s an ciana al fin al del interalo de oseracin se deen a su escaso nm ero de casos.
E E
C
1 3..u n ci n
d e
su e r ie n cia
a r a
la
sa lid a
d e l
d e se m le o
a r a
t r e s
co h o r t e s
de
e d a d .
o d e lo s
d e
t r a n sici n
co n
t ie m o
co n t in u o
unciones de super
iencia
1.00
0.75
0.50
0.25
0.00
0
12
24
36
48
60
72
84
Duracin del episodio de desempleo
cohort = 1940
cohort = 1960
96
108
120
cohort = 1940
1960
13 ..
o d e lo s
de
la
t a sa
d e
t r a n sici n
co n
t ie m o
co n t in u o
E n trm in os gen er alesu n m odelo de la tasa d e tr an sicin p u ed e ser espe
cificad o com o
(1.11)
sse estu dia la tasa de tr an sicin en fu n cin de u n ector de
ariales
in d ep en d ien tes Xt y de la du racin t del pr oceso. os coeficien tes epr e
san el efecto de Xt sor e la tasa d e tr an sicin y son los factor es u e in teresa
estim ar.
E n tr e los m odelos de la tasa de tr an sicin la esp ecificacin m s com n
de la ecu acin gen eral (1.11) es
(1.12)
a ecu a cin (1.12) d escr ie los m od elos p r op or cion a les d e la ta sa
d e tr a n sicin . a for m a fu n cion a l d e la r ela cin en tr e la s a r ia les Xt y
la ta sa d e tr a n sicin es ep on en cia l p or u e la ta sa d e tr a n sicin n o p u e
d e a su m ir a lor es n ega tios. d em sr esp ecto a la for m u la cin gen er a l
d e la ecu a cin (1.11)la fu n cin (t) en (1.12) in d ica u e la p a u ta d e
(1.1)
E l su pu esto d e con stan cia de la tasa d e tran sicin im p lica u e el r iesgo
d e u e ocu r ra el acon tecim ien to n o
ar a en fu n cin del tiem po. E sto sig
n ifica u e el p roceso n o tien e m em or iala erosim ilitu d d e u e ocu r r a el
acon tecim ien to es la m ism a
u sto al pr in cipio del p roceso com o en m om en
tos p osterior es d el tiem p o.
a tasa d e tran sicin del m odelo om per tse epr esa com o
(1.1)
E ste m odelo im p lica u e la tasa d e tr an sicin es m on otn ica crecien te
si el par m etro es m ayor u e 0 o m on otn ica d ecr ecien te si es m en or
u e 0. i es igu al a 0el m odelo om p er teu iale al m odelo epon en
cial. a solu cin m s com n p ara esp ecificar los efectos d e las
ar iales
in depen dien tes es in trodu cir lo a tr a
s d el par m etro acon aep( X). a
m ism a n otacin se u tili
ar tam in p ar a los otr os m odelos p aram tr icos.
e este m odo el par m etro epr esa la for m a d e depen den cia tem p or al del
m od eloy el p arm etr o a se u tilia p ar a estim ar los efectos de las ariales
in depen dien tes. E n el len gu a
e estad sticoel p arm etr o a se defin e com o
p arm etr o secu n dario (an cillary).
12
a pr esen ta cin de los m odelos con sider ad os se lim ita a su s p r opiedad es m s ge
n er ales.
E E
(1.1)
os efectos de las
ariales in depen dien tes se especifican a tras del par
m etro acon aep( X). E ste m odelo es m s fleile u e los an terioresya u e
si es m en or o igu al a 1la tasa de tran sicin es m on otn icam en te decrecien te
m ien tras u e si es m ayor u e 1tien e u n a form a de cam pan a (grfico 1.d).
1
E isten en literatura param etriacion es altern ati
as para este m odelo. u se sigu e la
param etri
acin u tiliada en lossfeld y oh er (2001).
C
13 .3.E
e m lo
d e
r fic o s
d e
la
t a sa
d e
t r a n sicio n e s
r(t)
0 .5 11.522.53
Gompertz
r(t)
0 .5 11.522.53
Exponencial
2
t
a=1
a=0.5
a=1 b=0.5
a=2
a=1 b=0.5
a=1 b=0
r(t)
0 .5 11.522.53
Loglogstico
r(t)
0 .5 11.522.53
Weibull
t
a=1 b=0.5
a=1 b=1
t
a=1 b=1.5
a=1 b=3
a=1 b=0.5
a=1 b=1
E E
a rlist
d ist (d istn am e)
(1.1)
(1.1)
USAC
1 3.3 .o d e lo
e o n e n cia l
y
o m e r t
a r a
la s
d u r a cio n e s
d e
lo s
e iso d io s
d e
d e se m le o
m o d e lo
1
* model o 1
f ai l ur e _d:
anal y s i s t i me _t :
or i gi n:
I
I
I
I
I
t
t
t
t
t
er at
er at
er at
er at
er at
i
i
i
i
i
on
on
on
on
on
0:
1:
2:
3:
4:
Ex ponent i al
l
l
l
l
l
og
og
og
og
og
l
l
l
l
l
des t == 1
( end- or i gi n)
t i me begi n
i
i
i
i
i
k el
k el
k el
k el
k el
i
i
i
i
i
hood
hood
hood
hood
hood
=
=
=
=
=
- 1546.
- 1491.
- 1486.
- 1486.
- 1486.
1636
1689
9766
9488
9488
r egr es s i on - - l og r el at i v e- haz ar d f or m
No. of s ubj ec t s =
No. of f ai l ur es =
Ti me at r i s k
=
Log l i kel i hood
973
734
17922
- 1486. 9488
Number of obs
973
LR chi 2( 3)
Pr ob > chi 2
=
=
118. 43
0. 0000
-----------------------------------------------------------------------------_t |
Coef .
St d. Er r .
z
P>| z|
[ 95% Conf . I nt er v al ]
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - sex |
. 2575632
. 0739688
3. 48
0. 000
. 1125871
. 4025394
c oh2 |
. 8885871
. 1985
4. 48
0. 000
. 4995343
1. 27764
c oh3 |
1. 445604
. 1952503
7. 40
0. 000
1. 06292
1. 828287
_c ons |
- 4. 429246
. 1947556
- 22. 74
0. 000
- 4. 81096
- 4. 047532
------------------------------------------------------------------------------
1) 100
0. or lo tan tose p u ed e con clu ir u e la tasa de tr an sicin al traa
o es
u n 0 m ayor p ara los h om res u e para las m u
eres. am in se p u ed e
calcu lar la r atio d e las tasas d e tran sicin d e los h om r esr(h)y de las
m u
eresr(m )
(1.1)
e esto m od ola tasa d e tran sicin a la ocu pacin d e los h om res es
1
eces la d e las m u
eres. d ich o sin n m eroslos h om r es salen del
E E
sera posile estim ar otros m odelos param tr icos com o el eiu ll y el log
logsticom edian te las opcion es dist(ei) y dist(logl) 1.
USAC
1 3..o d e lo
e o n e n cia l
y
o m e r t
a r a
la s
d u r a cio n e s
d e
lo s
e iso d io s
d e
d e se m le o
m o d e lo
* model o 2
f ai l ur e _d:
anal y s i s t i me _t :
or i gi n:
des t == 1
( end- or i gi n)
t i me begi n
t
t
t
t
t
er at
er at
er at
er at
er at
i
i
i
i
i
on
on
on
on
on
0:
1:
2:
3:
4:
Fi t t i ng f ul l
I
I
I
I
I
t
t
t
t
t
er at
er at
er at
er at
er at
i
i
i
i
i
on
on
on
on
on
l
l
l
l
l
og
og
og
og
og
l
l
l
l
l
i
i
i
i
i
k el
k el
k el
k el
k el
i
i
i
i
i
hood
hood
hood
hood
hood
=
=
=
=
=
- 1546. 1636
- 1488. 497
- 1484. 7369
- 1484. 7314
- 1484. 7314
l
l
l
l
l
i
i
i
i
i
k el
k el
k el
k el
k el
i
i
i
i
i
hood
hood
hood
hood
hood
=
=
=
=
=
- 1484.
- 1447.
- 1445.
- 1445.
- 1445.
model :
0:
1:
2:
3:
4:
l
l
l
l
l
og
og
og
og
og
7314
5164
2048
1962
1962
973
734
17922
- 1445. 1962
Number of obs
973
LR chi 2( 3)
Pr ob > chi 2
=
=
79. 07
0. 0000
-----------------------------------------------------------------------------_t |
Coef .
St d. Er r .
z
P>| z|
[ 95% Conf . I nt er v al ]
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - sex |
. 2224324
. 074057
3. 00
0. 003
. 0772832
. 3675815
c oh2 |
. 8207023
. 198552
4. 13
0. 000
. 4315475
1. 209857
c oh3 |
1. 256413
. 1961255
6. 41
0. 000
. 8720137
1. 640812
_c ons |
- 3. 934596
. 2007817
- 19. 60
0. 000
- 4. 328121
- 3. 541071
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - gamma |
- . 0189706
. 0022907
- 8. 28
0. 000
- . 0234603
- . 0144808
------------------------------------------------------------------------------
m a gn esepor e
em p lou e n u estra teor a de r efer en cia pr e u e la p ro
p en sin a sa lir d el desem pleo dism in u ye d e for m a m on ton a con el pa so
d el tiem po d eid opor e
em p loa u n efecto estigm a . E n ese ca so se po
d ra a
u star la dep en d en cia tem por al con u n m odelo om p er to eiu ll
ya u e a m os im plica n u n a ta sa de tra n sicin m on ton a en el tiem po. i
p or el con tra r ion u estr a teor a su giere u e la ta sa de tra n sicin crece h as
ta u n d eterm in a d o m om en to del tiem po pa ra decr ecer d esp u sel m od elo
m s a decu a d o sera el log
logsticou e p erm ite u n a depen den cia tem pora l
con for m a de ca m p an a . E n cu a lu ier ca soresu lta opor tu n o estim ar m o
E E
... l m odelo o
E l m od elo pr opu esto por o(12) ofr ece u n a estim acin de los coeficien
tes a tra
s d e u n m tod o d e la
er osim ilitu d pa r cia l y de
a la fu n cin (t)
sin esp ecifica r 1. E l m od elo d e op er ten ece a la fa m ilia d e los m od elos
pr oporcion a les yp or lo ta n tose a sa en el su pu esto d e u e los efectos de
la s ar ia les X in du cen slo d esp laa m ien tos pr oporcion a les h a cia a rr ia o
a a
o d e (t)sin m odifica r su form a . E n ta ta la in str u ccin p a ra estim a r
u n m odelo de oes stcoel cu a l reu iere h a er defin ido p reia m en te los
da tos com o h istor ia de a con tecim ien tos con la ord en stset. E n la ilu stra cin
1.se pr esen ta n los r esu lta d os de la estim a cin de u n m odelo opa ra la
du r acin d e los episod ios de desem pleo. os coeficien tes estim ad os se in
terp reta n de la m ism a m an er a u e p a ra los otr os m odelos p ropor cion ales.
ta ta u tili
a p or d efecto el m tod o d e r eslo p a r a con tr ola r u e n o
h a ya a gr u p a cion es en la d istr iu cin d e la s d u r a cion esesto esu e n u
m er osos ep isod ios a ca en en el m ism o m om en to d el tiem p oh ech o u e
com p lica r a la estim a cin d e la er osim ilitu d p a r cia l1. om o se a p r ecia
n o h a y n in g n coeficien te p a r a el efecto d e la d u r a cin d e la legisla tu r a
sor e el r iesgo d e d isolu cin d e los goier n oses d ecirla fu n cin (t) se
d e
a si esp ecifica r. d em slos coeficien tes estim a d os p a r a la s a r ia les
in d ep en d ien tes son m u y p a r ecid os a los d el m od elo om p er td e la ilu s
tr a cin 1..
1
ara u n a ilustracin de cm o fu ncion a el m todo de estim acin con erosim ilitu d par
cial
ase el pn dice
en ern ardi (200).
1
ara m s detalles sore las com plicacion es relacion adas con la eistencia de agru pa
m ien tos (ties) en la distriu cin de las du raciones y sore los
arios m todos para tratarlas
USAC
1 3..o d e lo
Co
a r a
la s
d u r a c io n e s
de
lo s
e iso d io s
d e
d e s e m le o
s t cox sex c oh2 c oh3,
nohr
f ai l ur e _d:
anal y s i s t i me _t :
or i gi n:
I t er at
I t er at
I t er at
I t er at
I t er at
Ref i ni
I t er at
i on 0:
l
i on 1:
l
i on 2:
l
i on 3:
l
i on 4:
l
ng es t i mat
i on 0:
l
og
og
og
og
og
es :
og
l
l
l
l
l
des t == 1
( end- or i gi n)
t i me begi n
i
i
i
i
i
k el
k el
k el
k el
k el
i
i
i
i
i
hood
hood
hood
hood
hood
=
=
=
=
=
- 4454.
- 4419.
- 4418.
- 4417.
- 4417.
3466
3661
0157
9969
9969
973
734
17922
- 4417. 9969
Number of obs
973
LR chi 2( 3)
Pr ob > chi 2
=
=
72. 70
0. 0000
-----------------------------------------------------------------------------_t |
Coef .
St d. Er r .
z
P>| z|
[ 95% Conf . I nt er v al ]
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - sex |
. 2272679
. 0741742
3. 06
0. 002
. 0818891
. 3726467
c oh2 |
. 814659
. 1989799
4. 09
0. 000
. 4246656
1. 204653
c oh3 |
1. 223955
. 1969942
6. 21
0. 000
. 8378532
1. 610056
------------------------------------------------------------------------------
ara con clu irel m od elo d e oh a sido trad icion alm en te u n a eleccin
m u y pop u lar en tre los in estigadores socialesu is p or la relatia facilid ad
con la u e se pu ede estim arin clu so con las p rim eras
ersion es de pau etes
estadsticos estn dares com o y . in em argosu lim itacin prin
cipal es la de n o proporcion ar n in gu n a in form acin sore la p au ta d e dep en
den cia tem poral d el proceso in estigado. or esta ra
n se aprecia u n a clara
ten den cia a u tiliar el m od elo epon en cial con stan te a in teralos en tre los
m odelos sem ip aram tricos en los ltim os a os (ern ard i 20010).
1 3..E
e r cicio s
1.
2.
14
An lisis d e d a t o s d e e n cu e st a co n St a t a
E n cien cias sociales casi n u n ca se trabaja directam en te con d atos d e la p oblacin objeto d e estu dio. Pu esto qu e en la m ayor p arte d e los casos se estu dian poblacion es m u y gran d es, costossim as de an alizar directam en te, se
su ele recu rrir a la realizacin de en cu estas adm in istrad as a u n a m u estra p robabilstica d el u n iverso en estu dio. E l prin cipio fu n dam en tal en el m u estreo
es la aleatoried ad: sobre ese prin cipio est d esarrollad a tod a la estadstica
in feren cial, com o se a ep licad o en la segu n d a parte del cap tu lo destin ad o
al an lisis d e u n a sola variable. i se elige al azar u n n m ero determ in ado
de in dividu os (m u estra n ) de u n a poblacin de u n determ in ado tam a o (poblacin N), los resu ltad os obten id os con los d atos de la m u estra (estadsticos
m u estrales) se podrn u tilizar p ara estim ar los datos p oblacion ales reales
(parm etros poblacion ales), den tro de u n ran go p roporcion ad o por las probabilid ades de la cu rva n orm al con u n determ in ado n ivel d e con fian za.
odo lo visto asta a ora en este m an u a l sigu e estos pr in cip ios. a estim a cin d e pa r m etros, los err or es tpicos, las pr u eba s d e ip tesis, la s
r egr esion es, etc., qu e asta a or a se a n eplica do, p ar ten d el su p u esto de
qu e los d atos a n a liza dos pr ovien en d e u n a m u estr a a lea tor ia sim ple d e la
p ob lacin ob jeto d e estu dio. Por ta n to, siem pr e qu e se a n a licen d a tos esta d sticos gen era d os tra s u n m u estreo a lea tor io sim p le, se pu eden a p lica r la s
tcn ica s ta l com o a n sido ep lica da s a sta el m om en to. Per o qu ocu r r e
si la en cu esta rea liza d a n o sigu i u n m u estreo aleatorio sim pleealm en te,
en la m a yora de la s oca sion es, en la s cien cia s socia les n o se u tiliza m u estreo alea torio sim ple, pu esto qu e se r equ ier en m u estra s m u y gr an d es de
p ob lacion es m u y dispersa s en el esp a cio geogr fico. s ab itu a lm en te,
se u tiliza n form a s de m u estr eo com pleja s, con seleccin n o estr icta m en te
a lea tor ia d e los ca sos, a tr avs d e la con str u ccin d e estr a tos, con glom er ad os o cu ota s, en los qu e las pr oba bilida des d e ca d a in dividu o d e ser selec-
. am bin pu eden
con su ltarse zorn y ncez respo
, Prez
y, de m odo aplicado a en cuestas,
odrgu ez su n a
E E
cion ad o va r a n
n o son idn tica s com o en el m u estreo a lea tor io sim p le
.
Pu es bien , si los da tos n o r esp on den a u n m u estr eo a lea tor io sim p le, la
a plicacin literal de la s tcn ica s vista s a sta aor a p u ede da r lu ga r a estim a cion es y pa r m etros sesga dos, a s com o a la a cepta cin com o ver da dera s de ip tesis qu e r ea lm en te son fa lsa s. Por su pu esto, eso n o qu ier e d ecir
qu e n o se pu ed an u tilizar las tcn ica s esta dstica s vista s a sta a or a , per o
es n ecesar io u tiliza r las er ra m ien ta s qu e ta ta n os pr opor cion a p a ra el
a n lisis de da tos de m u estr as com p leja s. E so es lo qu e se eplicar en este
ca p tu lo.
14 .1 .
Aju st e s e n e l a n lisis d e m u e st r a s co m p le ja s
om o se acab a de decir, el su pu esto de todas las p ru ebas estadsticas an alizadas en el cu er po de este libr o, qu e tien en com o m isin la gen eralizacin
d e los r esu ltad os de en cu estas r ep resen tativas, es el m u estreo aleator io sim p le. Pero en la m ayor p ar te d e las en cu estas socioecon m icas, el m u estreo
qu e se u tiliza n o es
dir ectam en tealeator io, n i sim ple. E l desar r ollo de las
tcn icas de m u estr eo com plejas a p er m itido r ed u cir los costes de la in vestigacin m edian te en cu estas y a u n tiem p o au m en tar la fiab ilid ad de los r esu ltados. E l in con ven ien te d e estas tcn icas com p lejas es qu e n o se p u ed en
an alizar los d atos directam en te com o si de m u estras aleator ias sim p les se
tr ataran , sin o qu e d eb en r ealizarse u n a serie d e aju stes p revios.
as ven tajas d el m u estr eo com p lejo se en tien den m ejor m edian te u n
ejem p lo. E n el su p u esto d e qu e se desee r ealizar u n a m u estr a r epr esen tativa
d el con ju n to de los esp a oles m ayor es de a os. i, sobr e la base d el cen so, se seleccion ar an de m an er a pu r am en te aleator ia .in d ivid u os par a
acer les u n a en trevista p er son al, el coste de la realizacin d e estas en tr evistas sera eager adam en te alto, d eb ido a la n ecesid ad de desplazar se p or
tod a la geografa esp a ola d e los en trevistador es
.desplazam ien tos
aleator ios p or toda E spa a
. E ste coste se p u ed e r ed u cir con sid er ablem en te
si en lu gar de seleccion ar d irectam en te a los .in d ividu os, se escogen
aleator iam en te seccion es cen sales , y d en tro d e cada seccin cen sal se
etr aen diez in divid u os al azar. E n lu gar de .desplazam ien tos, slo es
p reciso realizar , pu esto qu e p or d efin icin las d iez en trevistas d e cad a
seccin cen sal estar n m u y pr im as espacialm en te
el d esplazam ien to
d en tro d e cad a seccin p u ed e realizar se a pie
. s se su ele r ealizar ab itu alm en te en este tip o d e en cu estas, y este tip o d e m u estr eo se llam a m u estreo
p olietp ico.
dem s d e ven tajas en tr m in os d e coste, el m u estr eo com p lejo pu ed e
ten er ven tajas en tr m in os d e fiab ilidad de los resu ltados. i se p reten de
as seccion es censales son las zon as qu e perten ecen a u n m ism o colegio electoral.
estu d iar las form as d e or gan izacin del trabajo en las em presas espa olas,
se sabe qu e ay m u cas diferen cias en cm o organ izan el trabajo las em p resas gr an d es y las pequ e as, por lo qu e r esu lta d e gran in ters disp on er
d e d atos fiables p ar a am b os tipos de em pr esas. Per o las em p resas gr an d es,
au n qu e de gran relevan cia econ m ica y social
p or la gran can tidad de em p leo qu e con cen tr an
, son pocas en trm in os n u m ricos: ay m u cas m s
em p resas p equ e as qu e gr an des. asta tal p u n to qu e si se realizar a u n a
seleccin aleatoria sim p le, abra m u csim as em pr esas pequ e as y m u y
p ocas em pr esas gr an des: tan p ocas qu e n o se p odr an gen er alizar los r esu ltados obten id os a su segm en to. Par a evitar este pr ob lem a, p u eden divid ir se
las em pr esas en d os gru p os: gran des y pequ e as, y realizar u n a m u estra
in depen dien te en cad a gr u p o. s, se d isp on d r d e su ficien tes em p resas de
am b os tipos y p od rn gen eralizarse los resu ltados par a am b os casos. E ste
tipo de m u estr eo se den om in a m u estreo estratificado.
E n la pr ctica, la m ayor p ar te d e las en cu estas qu e se realizan sobre
tem as sociales y econ m icos u tilizan u n m u estr eo com plejo, u tilizan d o
m u estreos polietpicos y estratificados en su cesivas etapas. e con sigu e as
r edu cir costes y am p liar la r epr esen tatividad de los resu ltados. Pero estos
p rocedim ien tos de m u estr eo obligan a realizar aju stes sob re los d atos an tes
d e an alizar los.
a razn p or la qu e n o se p u ed en u tilizar los datos de m u estr as com p lejas directam en te, sin aju stes, es m u y sen cilla: los estim adores estar an
sesgados. E n los ejem p los eplicados, en el m u estreo polietp ico, es m u y
p osible qu e aya relacin en tr e los in dividu os p er ten ecien tes a u n a m ism a
seccin cen sal
en u n m ism o b arr io se com par ten n orm alm en te estatu s socioecon m ico y valor es cu ltu rales
, p or lo qu e si se ace u n a estim acin
sim ple, n o se tien e en cu en ta qu e pu ede aber in d ivid u os cu yos valor es estn asociad os
rom p ien do u n o de los su p u estos bsicos d e la in fer en cia estadstica
en el otr o ejem plo, en el qu e se plan tea u n m u estr eo estr atificad o
d e las em pr esas espa olas, si se estim ara la m edia d e u so d e tu rn os de tr ab ajo, sald ra m u co m s alta qu e la m edia real, p u esto qu e en la seleccin
efectu ada las em p resas gr an d es estn sobr err ep resen tadas, y las em p resas
gr an d es u tilizan m s sistem as de tu r n os qu e las em p resas p equ e as. od o
p rocedim ien to com plejo d e m u estr eo requ iere, p u es, la aplicacin de aju stes
p osterior es a los d atos para qu e estos pu edan ser an alizados.
1 4.2.
P o n d e r a cio n e s, e st r a t o s y co n glo m e r a d o s
os in str u m en tos pr in cipales par a realizar los aju stes qu e per m itan gen er alizar los resu ltados d e en cu estas con m u estras com p lejas son los sigu ien tes:
a Pon deracion es: las pon deracion es son la for m a pr in cip al de aju star
los datos de en cu esta a los p ar m etr os poblacion ales. E n el m u es-
E E
de la qu e u b iera sido en u n
m u estr eo aleator io, p or lo qu e debe ap licar se u n a p on d er acin de
E n tata, las pon der acion es m u estrales se llam an pweights. orm alm en te se disp on e de u n a variab le de p on d eracin en la base d e
datos
qu e d eber estar d ocu m en tad a en la m etodologa d e la en cu esta
, variab le qu e con tien e p ar a cad a caso el in verso de su probabilidad de seleccin en la m u estra. Par a ap licar la p on deracin a los
casos, slo es pr eciso in dicar a tata cu l es esta var iable con la in stru ccin sv
set, qu e se eplica en el ejem p lo del sigu ien te ap ar tado.
b stratos: com o se a visto en el caso an ter ior, la u tilizacin d e estr atificacin deter m in a
al m en os en p ar telas pon deracion es de los
datos m u estr ales. a estr atificacin tam b in ace n ecesar ia
o al
m en os r ecom en dablela u tilizacin de in for m acin sobr e los estr atos en s. u an do se realiza estratificacin d e la m u estr a, r ealm en te
se r ealiza u n a m u estr a in depen dien te en cada estr ato. Por ello, si se
in dica a tata cu les son estos estr atos
tam bin con la or den sv
set
, p odr tr atarlos com o m u estr as estadsticam en te in d ep en dien tes, lo qu e p rob ab lem en te redu cir los er ror es tpicos, p er m itien d o
acer p ru ebas de iptesis m s aju stadas y fiab les.
E sto tam bin tien e u n a ep licacin r elativam en te in tu itiva. orm alm en te se r ealizan los estr atos bu scan do qu e ten gan cierta om ogen eidad y r elacin en lo qu e resp ecta a lo qu e a de estu diar se. E n
el caso d e las em pr esas espa olas, se sabe qu e las em pr esas gr an des
or gan izan el tr abajo de m an era m u y d istin ta a las pequ e as. Per o,
dado qu e las em pr esas gr an des son m u y pocas, esta diferen cia pr cticam en te n o qu edar a recogida en la m u estr a
ab ra m u y pocos
casos diferen tes
, por lo qu e p rob ab lem en te n o ser a estadsticam en te sign ificativa. E n cam b io, al estr atificar y sob rerr epr esen tar
las em pr esas gr an d es, pu eden com parar se su s valor es con los de las
em p resas pequ e as de m an er a fiable, d e m od o qu e podr n com p robarse con m ayor facilid ad las ip tesis de in vestigacin .
i la p on deracin es im por tan te para la estim acin d e p arm etros
esto es, para saber si la m edia d e la m u estr a es igu al qu e la
m ed ia d e la pob lacin , por ejem p lo
, la u tilizacin de los estratos es
n ecesar ia par a la estim acin de los err ores y par a la com pr ob acin
ad ecu ada de iptesis. in esp ecificar los estratos, los err ores tp icos
ar rojan valor es m ayor es, por lo qu e se red u cen las p rob abilid ad es d e
recazar las ip tesis n u las cu an d o estas son realm en te falsas.
c on glom erados: en las en cu estas sociales el u so de con glom erad os
o u n idades pr im arias de m u estreo es m u y abitu al, pr in cipalm en te
p or el aorr o de costes qu e su p on e. E sta tcn ica perm ite evitar la
d ispersin pr opia d el m u estr eo aleatorio sim ple, seleccion an d o los
casos en agru p acion es localm en te cer can as m s fcilm en te accesib les en m en or p er iodo d e tiem po.
E l prob lem a qu e p resen ta el m u estreo p or con glom erados es qu e
las observacion es de u n m ism o con glom erad o n o son in d ep en d ien -
E E
,
p or lo qu e en las cir cu n stan cias de este ejem plo sera deseab le op tar
p or la pen ltim a u n idad seleccion ada en el m u estr eo
en el caso
an terior, los b ar r ios
.
E l cu adr o .resu m e lo qu e debe ten er se en cu en ta a la ora d e tr ab ajar con d atos d e m u estras com p lejas.
ay u n a ltim a cu estin im p or tan te qu e debe ten er se en cu en ta al tr ab ajar con datos m u estrales. a u tilizacin o n o de los in stru m en tos en u m er ad os resu lta m s o m en os cr tica en fu n cin d e los objetivos de n u estr o
an lisis. i lo qu e se pr eten d e es estim ar a travs d e los d atos m u estrales los
p ar m etros p oblacion ales
p or ejem p lo, si se qu iere estim ar el p orcen taje
d e voto a u n p artido en fu n cin de u n a en cu esta p reelector al
, la u tilizacin
d e pon der acion es es absolu tam en te fu n d am en tal. i lo qu e se persigu e es
estar m u y segu ros de qu e los r esu ltad os d e la m u estra son cercan os a los
r eales, o si el objetivo fu n dam en tal es r ealizar u n a p ru eba de iptesis d e
sign ificacin con los datos m u estrales, n o slo d eb en em p learse las pon d er acion es, sin o tam bin los con glom er ados y los estratos, siem p re y cu an do
se disp on ga de la in form acin . or a b ien , si lo qu e se d esea es estu d iar la
r elacin en tr e dos o m s variab les
el efecto de la clase social sob re la in ten cin de voto, por ejem plo
, la u tilizacin d e p on deracion es, con glom er ados
y estratos es m u co m en os im p ortan te. iertam en te, si n o se u tilizan , ay
m ayor p rob ab ilid ad de equ ivocar se, p or ejem p lo, en la estim acin d e los
p ar m etros d e la regresin , as com o d e er rar en la sign ificacin d e estos
un qu e las u n idades de m u estreo m s all de la se alada com o prim aria tam bin pueden tener u n efecto sobre los errores tpicos, el error qu e pu ede derivar de su no u tilizacin
es realm en te irrisorio. i se desea, n o obstan te, u tilizar esta in form acin en la estim acin de
parm etros y errores tpicos, pu ede em plearse un program a ya totalm en te especializado com o
.
p arm etr os
r ecazan d o parm etr os qu e r ealm en te s son sign ificativos o,
lo qu e es peor
pero m s difcil
, acep tan do parm etr os r ealm en te n o sign ificativos
. Per o, sin d u da, el pr oblem a es m en or, pu esto qu e de lo qu e
se trata en este caso es de allar r elacion es en tre variab les, n o de pr ed ecir o estim ar los p ar m etros poblacion ales. b viam en te, es m u co m en os
im por tan te sobr eestim ar o in fraestim ar ligeram en te
la diferen cia su ele ser
p equ e a en m od elos d e r elacion es en tr e var iablesu n a relacin en tr e d os o
m s var iables qu e equ ivocarse en la estim acin del voto a u n deter m in ado
p artido. i eiste relacin en tre clase social y voto, aparecer en los r esu ltad os, au n qu e la clase alta est in frar repr esen tad a en r elacin con la baja el
p rob lem a estriba en qu e sea m s d ifcil gen er alizar los resu ltados.
CUADR 14 .1 .
n st r u m e n t o s d e a ju st e s m u e st r a le s y co n se c u e n cia s
ectos sor e
la estim a cin
d el p a r m etr o
p ola cion a l
ectos sore
los errores
tp icos y los test
d e ip tesis
Ponderaciones
m portante
inguno
E stratos
inguno
m portan te,
los reduce
m portan te,
los am pla
m p o r t a n cia d e su u so
p a r a e l a n lisis
p cin d e
svyset e n
St a t a
a recom en d acin , por tan to, es qu e para la estim acin d e parm etros
p ob lacion ales, p ara realizar pred iccion es y p ru ebas d e ip tesis se u tilicen
siem p re los in stru m en tos de an lisis de en cu esta. Para el estu dio d e la asociacin en tre dos o m s variables, tam b in se recom ien d a la u tilizacin siem p re
qu e sea posib le d e la in form acin d el m u estreo, p ara poder afin ar m s el an lisis y acerlo m s rob u sto y fiab le. Pero si n o es p osible o resu lta ecesivam en te com p licado, se pu ede acer el an lisis sin u tilizarla, au n qu e ten ien d o
m u ca m s cau tela en lo qu e resp ecta a la validez etern a d e los resu ltad os.
E E
14 .. Un e je m p lo p r ct ico co n St a t a . a s r d e n e s svy
ay d os m an eras de trab ajar con d atos d e m u estr as com p lejas en tata. a
p rim er a es u tilizan d o las in str u ccion es abitu ales de tata, a adien d o u n as
opcion es especficas para u tilizar datos d e en cu esta . a segu n da m an era,
la m s recom en d ab le, con siste en u tilizar las pr ein str u ccion es svd e tata,
qu e son u n con ju n to d e rd en es especficam en te creadas para tr abajar con
datos d e m u estr as com plejas. asi cada in str u ccin de an lisis estad stico
en tata tien e su corr elativa or den sv
, qu e es eactam en te la m ism a, pero
aju stada para tr abajar con d atos de en cu esta. s, regress tien e sv
:regress,
logit tien e sv
:logit, etc. E n p rin cip io, fu n cion an eactam en te igu al qu e su
equ ivalen te sin pon der acin , ya ep licada, por lo qu e n o se con tem pla d eten id am en te la eplicacin d e cad a or den sv
, sin o qu e m s bien se ep lica el
fu n cion am ien to gen eral de estas in stru ccion es.
u an do se tr ab aja con d atos de en cu esta, lo pr im ero qu e es n ecesar io
acer es acu d ir a la docu m en tacin d e los datos y estu diar en detalle cu l
fu e la m etod ologa segu ida en el m u estr eo. i se u tiliz m u estreo aleator io
sim ple, n o ace falta u sar las in stru ccion es sv
. i se u tiliz algu n a form a
de m u estreo com p lejo, se deben bu scar los tr es elem en tos vistos m s arr iba
pon d er acin , con glom er ad os y estratosy u tilizar los qu e sean r elevan tes,
en fu n cin del d ise o m u estr al y d e la in for m acin d ispon ib le. a variable
de p on deracin su ele estar p resen te en la gran m ayor a de las bases de datos
de en cu esta, lo qu e n o ocu r re con la in form acin sobr e u n idades p rim ar ias
y estr atos. veces la d e con glom erados
o u n idad es p rim ar ias de m u estreo
est disp on ible: en m u cas en cu estas, p or ejem p lo, u n a d e las var iables es
la seccin cen sal. a variab le de estratos, en cam bio, n o su ele apar ecer en
los d atos pr op orcion ados por los in stitu tos estadsticos. E n algu n os casos es
posible recon stru irla con la in form acin d e la docu m en tacin m etodolgica
... stablecer la in
orm acin m u estral: la in stru ccin svyset
ase u n ejem plo. e va a estu diar, con la n cu esta de alidad de ida en el
raba
o de , la satisfaccin de los asalar iados con su em pleo. i se estu dia la m etodologa de esta en cu esta, se d escu br e qu e se r ealiz u n m u estreo trietp ico con estr atificacin de las u n id ades d e p rim er a etapa. as
u n idades de pr im er a etap a fu er on seccion es cen sales, qu e se estr atificar on
en fu n cin del tam a o del m u n icipio, estab lecin dose cin co estr atos con
m u estras in d ep en d ien tes. en tr o de cad a seccin cen sal, se seleccion ar on
fam ilias
u n idad es d e segu n d a etap ay den tr o de las fam ilias, a p oblacin
ocu pad a de m s de a os
u n id ades d e ter cer a etapa
. r as la realizacin
d e la en cu esta, se ap licar on factores d e r eequ ilib rio o aju ste p ar a cor r egir
las d iferen cias d e la m u estra fin al con la p ob lacin en tr m in os de situ acin
p rofesion al, edad y seo. Por tan to, en este caso eisten los tres elem en tos
vistos m s arr ib a.
E n la docu m en tacin se advier te u n a variab le d e p on d eracin , llam ad a pon d, as com o u n a variab le
vqu e in cor pora in for m acin sobr e el
n m er o d e or den d e la seccin cen sal. e lo qu e n o se dispon e es de u n a
variab le qu e con ten ga los estr atos, y tam poco p u ed e r econ str u irse, pu esto
qu e, au n qu e eiste u n a var iable d e tam a o del m u n icip io, las categor as
n o coin ciden con las qu e se aplicaron en la estr atificacin de las seccion es
cen sales. Por ello, se em p lear p on deracin y u n idades p rim ar ias, p er o n o
los estr atos
con lo qu e son pr evisibles er ror es tpicos algo m ayores d e los
r eales
.
Par a dar a tata esta in for m acin , se em p lea la in str u ccin sv
set con el
p eso en tr e corcetes y las op cion es n ecesarias, slo psu (), en este ejem p lo, y
p ara obten er u n a descr ip cin d el resu ltado se u tiliza la in stru ccin sv
des.
svyset
p eigtp on d
, psu
v
svyd es
a pan talla de r esu ltad os d e tata m u estr a, en con secu en cia, la disp osicin m u estr al:
E E
USR AC
14 .1.
De sc r ip ci n d e la m u e st r a c o m p le ja
St r at um
-------1
-------1
pond
l i near i zed
mi s s i ng
<one>
v294
<z er o>
#Uni t s
-------430
-------430
#Obs
-------5998
-------5998
E stas dos in stru ccion es gen er an sen d as estim acion es de las p rop or cion es de la variable b su eda de otro em pleo:
USR AC
14 .2 .
st im a ci n d e p r o p o r cio n e s e n m u e st r a s c o m p le ja s
bsqueda de |
ot r o empl eo |
Fr eq.
Per c ent
Cum.
- - - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - si
|
451
9. 63
9. 63
no |
4, 232
90. 37
100. 00
- - - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - Tot al |
4, 683
100. 00
1
430
Number
Popul at
Subpop.
Subpop.
Des i gn
of obs
i on s i ze
no. obs
s i ze
df
=
=
=
=
=
5998
6020
4683
4799. 5
429
si
no
-------------------------------------------------------------|
Li near i z ed
| Pr opor t i on
St d. Er r .
[ 95% Conf . I nt er v al ]
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - v 42
|
_pr op_1 |
. 1042389
. 0055767
. 0932778
. 1151999
_pr op_2 |
. 8957611
. 0055767
. 8848001
. 9067222
--------------------------------------------------------------
E E
, o sea , ca si u n
p u n to m s. ep en d ien d o d e los ob jetivos d el a n lisis, el er r or d e la estim a cin p u ed e ser m s o m en os im p or ta n te
u n p u n to en la estim a cin
d el p or cen ta je d e p a r o p u ed e ten er u n a gr a n im p or ta n cia , p or ejem p lo
.
E n cu a lqu ier ca so, si se d isp on e d e la in for m a cin m u estr a l, p or r a zon es
d e cor r eccin y d e va lid ez cien tfica , siem p r e es a con seja b le u sa r la en
la s estim a cion es. os er r or es tp icos d e la s p r op or cion es, ob via m en te,
ta m b in son m s cor r ectos, lo qu e p er m ite esta b lecer u n os in ter va los d e
con fia n za cr eb les.
E n el caso de estim acin de m ed ias, la in stru ccin pasa a ser sv
:m ean ,
en lu gar de sv
:proportion .
ci vif valsat
svy, su bp op
valsa t
: m ean v
esta t effects
USR AC
14 .. st im a ci n d e m e d ia s e n m u e st r a s co m p le ja s
Var i abl e |
Obs
Mean
St d. Er r .
[ 95% Conf . I nt er v al ]
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - v92 |
4648
7. 100473
. 0290105
7. 043599
7. 157348
1
430
Number
Popul at
Subpop.
Subpop.
Des i gn
of obs
i on si z e
no. obs
si z e
df
=
=
=
=
=
5998
6020
4648
4763. 2
429
-------------------------------------------------------------|
Li near i z ed
|
Mean
St d. Er r .
[ 95% Conf . I nt er val ]
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - v92 |
7. 085379
. 0371132
7. 012433
7. 158325
----------------------------------------------------------------------------------------------------------------------|
Li near i z ed
|
Mean
St d. Er r .
DEFF
DEFT
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - v92 |
7. 085379
. 0371132
1. 6584
1. 28779
----------------------------------------------------------
E n la ilu stracin .se m u estr a en pr im er lu gar la m ed ia de satisfaccin con el trabajo u tilizan d o la in str u ccin ci, qu e n os d a, ad em s de la
m ed ia, los in ter valos de con fian za de esa m edia . E iste d ifer en cia, au n qu e
p equ e a. in pon deracin , la m ed ia d e satisfaccin en el tr abajo de los asalariad os esp a oles es de ,con p on deracin es liger am en te in fer ior, d e
,. E n cam b io, el er r or tpico d e la m edia en los d atos pon der ad os es m ayor
,fren te a ,
, com o corr esp on de a u n m u estr eo por con glom er ados en dos etap as, lo qu e afecta tam b in al in tervalo d e con fian za, qu e en
la m u estra p on derada es m ayor. e n u evo, las d ifer en cias en la estim acin
n o son m u y gran des, au n qu e algo m ayores son los err ores tp icos.
E sp ecialm en te r evelad or es el clcu lo del efecto del dise o
is
,
qu e se ob tien e con la or den estat e
ects . E ste estad stico in d ica la eficien cia del m u estreo u tilizad o en los d atos. esu lta de d ividir la varian za ob ten ida con los d atos m u estrales en tr e la var ian za qu e se ab ra ob ten ido, si la
om o en el caso anterior, slo se in clu yen los casos de in dividu os asalariados. Por eso,
se especifica la clu sula ivalsat . E n este caso, tam bin se eclu yen aqu ellos casos en los
que n o ay respu esta a la variable satis
accin . a m ism a variable
valsat, igu al a u n o en
los asalariados qu e respon den a la pregu n ta de satisfaccin se u tiliza para definir la su bpoblacin
opcin su bpopde la in stru ccin sv
m ean .
n tes de la versin de tata, el efecto del dise o se proporcion aba au tom ticam en te
al solicitar la m edia. esde esta versin , ay qu e pedirlo eplcitam en te m edian te la orden estat
e
ects.
E E
agran d ase tan to con la pon d er acin qu e los in tervalos de con fian za al
se cr u zasen , d e m odo qu e n o se tu vier a segu r id ad p ar a decir qu e la difer en cia ob ser vad a en tr e las m edias de am bos gru p os eistier a r ealm en te en
la p oblacin y n o se d eb iera a er ror es de m u estreo. Por ello, es acon sejab le
u tilizar la in form acin sobr e p on d eracion es y con glom er ad os en la estim acin de m edias y p ropor cion es.
USR AC
14 .4 .
s t im a ci n p o r in t e r a lo s d e la s m e d ia s e n d o s gr u p o s
- > v 42 = si
Var i abl e |
Obs
Mean
St d. Er r .
[ 95% Conf . I nt er v al ]
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - v92 |
449
5. 52784
. 1076234
5. 31633
5. 739349
_______________________________________________________________________________
- > v 42 = no
Var i abl e |
Obs
Mean
St d. Er r .
[ 95% Conf . I nt er v al ]
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - v92 |
4199
7. 268635
. 0287981
7. 212176
7. 325095
_s ubpop_1: v 42 =
_s ubpop_2: v 42 =
1
430
Number
Popul at
Subpop.
Subpop.
Des i gn
of obs
i on si z e
no. obs
si z e
df
=
=
=
=
=
5998
6020
4648
4763. 2
429
si
no
-------------------------------------------------------------|
Li near i z ed
Over |
Mean
St d. Er r .
[ 95% Conf . I nt er val ]
- - - - - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - v 92
|
_s ubpop_1 |
5. 562022
. 1067634
5. 352177
5. 771866
_s ubpop_2 |
7. 2633
. 0365404
7. 19148
7. 335121
--------------------------------------------------------------
E l ejem p lo sigu ien te es d e tablas de con tin gen cia. om o en los casos
an ter iores se solicita en p rim er lu gar el an lisis sin pon d er ar y lu ego el pon d erado par a qu e se adviertan las difer en cias.
tab u late vvif asa l , col
svy, su bp op
a sal
: tabu la te vv, ob s col per se ci
on la in str u ccin sv
:tabu late pu ede obten erse u n cru ce de var iables
idn tico al realizad o con la in stru ccin tabu late, ya eplicada en el captu lo
d e tablas. E l for m ato es p ar ecido, au n qu e p ara con segu ir qu e m u estre las
E E
obser vacion es com o la in str u ccin tabu late y las p rop orcion es en p orcen tajes, deben a adir se las op cion es obs y per. o qu e m u estran am bas tab las
es u n cr u ce de la var iable qu e in dica si el trabajador est bu scan do otro
em pleo, p or or ar io n octu r n o
parece razon ab le qu e el orar io n octu rn o
lleve a los trab ajador es a n o estar tan con ten tos con su em pleo y, por tan to,
a bu scar otr o
. a relacin , tan to en la tabla con pon der acin com o en la
tab la sin ella, n o es sign ificativa
seg n las p ru ebas d el ciy d e la
. l
aplicar pon der acin y P, los p or cen tajes d e los qu e qu ier en cam biar su
em pleo se elevan , sobr e tod o en el caso de los qu e tr abajan siem p re d e n oce. os estad sticos de asociacin de las variab les n o ap arecen en la or den
sv
:tabu latesi se requ ieren , p u ed en u sarse los de los d atos sin pon d er ar,
p u es la in form acin sob re la r elacin en tre variab les n o se ve tan afectad a
p or el u so o n o de pon d er acin o dem s in for m acin m u estral. E n cu alqu ier
caso, se recom ien da qu e siem pr e qu e se p u ed a se u tilicen las p on d er acion es
y la in for m acin m u estr al par a au m en tar la fiabilid ad de las estim acion es.
USR AC
14 .. a la s d e co n t in ge n c ia e n m u e st r a s co m p le ja s
Number of s t r at a
Number of PSUs
=
=
1
430
Number
Popul at
Subpop.
Subpop.
Desi gn
of obs
i on s i z e
no. of obs
si ze
df
=
=
=
=
=
5998
6020
4683
4799. 505
429
---------------------------------------------------------------------bs queda |
de ot r o
|
hor ar i o noct ur no
empl eo
|
s i empr e
a v ec es
nunc a t
Tot al
- - - - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - si |
15. 23
11. 06
10. 04
10. 42
|
( 3. 024)
( 1. 296)
( . 6139)
( . 5577)
| [ 10. 19, 22. 17]
[ 8. 756, 13. 87]
[ 8. 892, 11. 31]
[ 9. 378, 11. 57]
|
26
75
350
451
|
no |
84. 77
88. 94
89. 96
89. 58
|
( 3. 024)
( 1. 296)
( . 6139)
( . 5577)
| [ 77. 83, 89. 81]
[ 86. 13, 91. 24]
[ 88. 69, 91. 11]
[ 88. 43, 90. 62]
|
164
725
3343
4232
|
Tot al |
100
100
100
100
|
|
|
190
800
3693
4683
---------------------------------------------------------------------Key :
col umn per c ent ages
( l i near i z ed s t andar d er r or s of col umn per c ent ages )
[ 95% c onf i denc e i nt er val s f or c ol umn per c ent ages ]
number of obs er v at i ons
Pear s on:
Unc or r ec t ed
Des i gn- bas ed
c hi 2( 2)
=
F( 2. 00, 857. 09) =
7. 4185
2. 1268
P = 0. 1199
dem s de m ostrar los porcen tajes y el test de in depen den cia de la tabla, sv
:tabu late pu ede calcu lar otros estadsticos qu e n o se obtien en con la
E E
14 .4 .
je r cicio s
. E ste captu lo fu e origin alm en te escr ito en la versin y a sido poster iorm en te m od ificad o par a la versin de tata. as in str u ccion es
vien en en d os ficer os: capitu loy capitu lob. on la pr ecau cin d e
in d icar la ver sin an ter ior al in icio, tata es cap az de ejecu tar ficeros
con in str u ccion es ob soletas en las n u evas version es. om pr u eb a esto y
an aliza las diferen cias qu e se p rodu cen en los r esu ltad os.
. tiliza el ficer o d e p rogram a de la ver sin
cap itu lo.docam b ian do la especificacin del m odelo d e m u estreo. sa, en p rim er lu gar, la
var iable h bitat
vcom o estr ato, adem s d e las u n id ades pr im ar ias.
espu s, reem plaza el estr ato por la com u n idad au tn om a. in alm en te,
r ealzalo por el cr u ce de com u n idad au tn om a por bitat.
. on los datos
d aecvtcon los qu e se a r ealizado este captu lo, realiza u n a regresin lin eal con d atos sin p on derar y p on derados de la satisfaccin por el trabajo
vsobr e el n m er o de oras trabajadas
v
,
el or ar io n octu rn o
v
, el tr abajo en sbado
vy el tr abajo en
dom in go
v
.
. el m ism o m odo qu e en el ejer cicio an ter ior, az p on d er ada y n o p on der ad am en te u n a regresin logstica de b u scar em pleo
vsobr e las
m ism as variab les.
15
Bib lio gr a fa co m e n t a d a
Acock, A. C. (2006): A Gen tle In trodu ction to Stata, College Sta tion (TX): Sta ta Press.
In trodu ccin a Stata u a ccesile de la ersin 0.0, en su segu n da edicin,
a sada rin cialen te en u n u so de este rograa edian te en s. rien ta do
acia la sicologa la s cien cias, sociales, ersigu e el aren dia
e de u en os
itos estadsticos e in
or ticos en tre los u su arios de Stata. In clu e an lisis
actorial.
A
i
i, A. A. et a l. (200): Com pu ter-Aided Mu ltivariate An a lysis (2 ed.), u ea ork:
Caa n all.
iro de an lisis u ltiariado u sico, don de se elica n edian te e
elos
los rin ciales con cetos estadsticos. Tra a
a con P, SSTAT en su segu n da
ersin con S
PS.
Agresti, A. (2002): Ca tegorical Data An alysis, ooken (
):
on ile Son s.
Tra tado de tio edio sore el an lisis de da tos n oin ales. Ades de logit
logit contien e odelos lin eales
logarticos.
Aldric,
. . . . elson (): Lin ea r Probability, Logit, an d Probit Models, on
dres: Sa ge.
iro sico de la coleccin erde de Sage. Idea l ara in troducirse en regresin
logstica.
Allison, P. (): ven t istory An alysis. egression
or Lon gitu din al ven t Data, on
dres: Sa ge.
An dersen , . . (): In trodu ction to te Statistical An alysis oCa tegorical Da ta, er
ln
u ea ork: Srin ger.
Au nue se llae in trodu ccin es u n an u al in teredio ara el an lisis de talas
de con tin gen cia. Presta esecia l an tencin a los odelos log
lin ea les de stos
aorda los odelos logit.
Aorn , .
. . S nce
Creso (6): Mtodos y aplicacion es del m u estreo, adrid:
Alian a .
n cl sico esa ol del u estreo.
a u, C. . (2006): An In trodu ction to Modern con om etrics sin g Stata , College Sta
tion (TX): Stata Press.
iro de n atu ralea u rctica ara estu dia ntes de econ oetra u e u ieran
u sar Sta ta. In clu e series teorales, datos de an el ariales instru en ta les,
ades de los a n lisis sicos. st orien tado a gen erar sen cillos
iceros .do
a ra las tareas reetitias.
(200): An In trodu ction to Stata Progra m in g, College Station (TX): Stata Press.
CAS TICS
iro esecia liado en la rogra acin con Sta ta. Slo ara a u ellos u e u iera n
acer rograas roios.
eaton, A. . . Tuke(): Te ittin g oPoer Series, ean in g Poln oials,
Illu strated on an d
Sectroscoic a ta, ecn om etrics, 6: 6
.
Artcu lo de re
erencia a ra las regresion es rou stas.
elsle
, . A. et a l. (0): egresion Diagn osticsIden ti
yin g In
lu en tia l Data a n d Sou rces oCollin ea rity, uea ork:
on ile Son s.
ern ardi, . (2006): l An lisis de la istoria de acon tecim ien tos, adrid: Cen tro de
In estigacion es Sociolgicas.
on ogr
ico sore an lisis de la istoria de acon teciien tos con n u erosos
e
elos realia dos con Stata u licado en esta isa coleccin or un o de los
au tores de este liro.
lalock, . . (66): stadstica Socia l, ico: C.
Cl sico de la sta dstica con a u n da ntes elicacion es de la ateria ara erso
n as con oca ase a tetica.
loss
eld, . P. . oer (200): ecn iu es oven t istory Modelin g. e Approaces to Ca u sal An alysis (2ed.), aa(
): rlau .
orroa , . . (200): Logit an d Probit. rdered an d Mu ltin om ial Models, ondres:
Sage.
iro esec
ico en la con ocida serie erde de Sage ara logits roits ordin a les
u ltin oia les. Au n sien do de 200, a usa Stata coo rograa rin cial.
Cau ac, . C. ontes (200): Stata Par la Pra ctiu eStatistiu es, Grapiu es et
lm en ts de Program m ation, College Station (TX): Sta ta Press.
an u al
ra ncs ara in iciacin del rogra a. Se cen tra esecialen te en las
rden es de Stata, sin olida r de elicar con claridad los con cetos la in terre
ta cin de los resu ltados. Con tien e ta in u n a in trodu ccin a la rograacin
recu rre tain a in stru ccion es adiciona les del rogra a u e u eden oten erse
de in tern et. edica u n ca tu lo a la eorta cin de resu lta dos a otros rograas
coo rocesadores de tetos, es e inclu so aTeX.
Caeron , A. C. P. . Trieldi (200): Microecon om etrics sin g Stata, College Sta tion
(TX): Stata Press.
an u al de Sta ta esecia len te dirigido a la econ oetra. In clu e teas a a na
dos coo siu lacin , n ios cu a drados gen eraliados, ariales instru en ta
les, datos de an el, regresion es n o lineales. Todo ello con eleen tos sicos de
rograa cin a tricial.
Caroll, . . an n an (2000): e Dem ograpy oCorporations a n d Indu stries, Prin
ceton (
): Prin ceton n iersitPress.
Castro, T. (): Pau tas recien tes en la
oracin de are
a, evista In tern aciona l
de Sociologa , 2: 2
.
Cea, . . (2002): An lisis m u ltiva riable. eora y prctica en la in vestiga cin social,
adrid: Sn tesis.
Con tien e ca tu los con u cos tiles e
elos rcticos de regresin logs
tica , ero sin nin gu n a re
eren cia a Sta ta.
Clees, . et a l. (200): An In trodu ction to Su rvival An alysis sin g Stata , College Sta
tion (TX): Stata Press.
iro de an lisis de su erien cia edian te el rograa Sta ta a ra u ien es n ece
sitan a licar este tio de an lisis a su s datos. Prin cia len te orien ta do a cien t
i
cos de la salu d, ero tain u til a econ oistas, socilogos olitlogos.
u sion Processes,
ou rn al oScienti
ic In du strial esearc, : 2
20.
o,
. .
. . n ders(200): u ltin oia l Proit an d u ltin oia l ogit: A
Coarison oCoise odels
or otin g esea rc, lectoral Stu dies, 2: 0
22.
eritt, . S. (): e An alysis oCon tin gency a bles. on dres: Caan an d all.
sica in trodu ccin a las talas de con tin gen cia .
scoar, . (): An lisis gr
ico
eploratorio, a drid: a u ra lla
esrides.
n a introdu ccin a la stadstica a
o la aroiacin del an lisis elora torio.
a rca erran do, . (): Socioestadsticaintrodu ccin a la estadstica en sociologa , adrid: Alian a .
In trodu ccin a la stadstica con u ltitu d de e
elos sociolgicos.
onle,
.
. (): Clases a lin eaien to electoral al
ina l del ciclo oltico, en
.
Cara a a (ed.), Desigu alda d y Clases Sociales, adrid: u n da cin Argentaria.
reen e, . . (200): con om etric An alysis (6 ed.), n gleood Cli
s (
): Pren tice
a ll.
In trodu ce a los estu dian tes en la econoetra alica da, in clu en do tcn ica s si
ca s de an lisis de regresin. Coien a con u n a serie de ca tu los in stru en tales
sore lgera atricia l, roailida des esta dstica.
u
arati, . . . C. Porter (200): asic con om etrics, u ea ork: cra
illl
du cation .
n clsico de la econ oetra. Por su s e
elos, e
ercicios
, sore todo, elica
cion es clara s es u n u en liro ara in troducirse en el estu dio de la regresin su s
roleas.
air,
. . et a l. (2006): Mu ltiva ria te Data Ana lysis. on dres: Prentice
all Intern a
tion al.
iro con u ca s tcn ica s d e a n lisis u ltia ria da s a coa a da s de a r tcu los
u e la elea n . Pr escin de d e
r u la s a te tica s se cen tr a en la cor en
sin de los con cetos en la in terreta cin d e la s ta la s los gr
icos esta ds
ticos.
CAS TICS
oell, A.
. (): An lisis de egresin Logstica , adrid: Cen tro de In estiga cion es
Sociolgicas.
an u al de esta coleccin sore regresin logstica. leen ta l.
is, . (2): Mu estreo de en cu estas, ico: Trillas.
tro de los clsicos del u estreo.
oler, . . reuter (200): Data An alysis sin g Stata, College Sta tion (TX): Sta ta
Press.
an u al de a n lisis eleental con Sta ta u e elea nu erosos e
elos del an el
socio
econico alen del I (In stitu to Alen de In estiga cion es con
ica s). Su riera ersin
u e escrita en ese idioa . Su traduccin al in gls es
u na se al de su carcter rctico. Su n cleo son las ta la s, los gr
icos las regre
sion es lin eales logstica s.
aal, . (200): Categorica l Data An alysis itSas a nd Spss Aplications, aa
(
): a ren ce rlau Associa tes.
Au n u e n o in clu e Sta ta , se tra ta d e u n u en lir o a r a a a n a r en el a n lisis de
da tos n oin a les: se etien de desde la s ta la s de
r ecu en cia s a sta cla si
ica cin
de ca sos du dosos, in clu en do ta in odelos log
lin ea les r egr esion es logs
tica s.
i, . (): ou st egression , en . C. oaglin , . osteller
. . Tu ke(eds.),
plorin g Data ables, ren ds, an d Sa pes, u ea ork: ile
.
on g,
. S. (200): e or
lo oData An alyis sin g Stata, College Sta tion (TX):
Sta ta Press.
an u al de co la ni
icar el tra a
o con Stata con el
in de realia r a n lisis u e
n os e
icien tes. Presta tain esecial aten cin a co escriir rograa s ti
les. len o de e
elos en Cien cias Sociales.
. reese (2006): egression Models
or Categorical Dependen t ariables sing
Stata. College Station (TX): Stata Press.
n liro u edaggico ara aren der regresion es logsticas su s deria das si
n ecesidad de ten er con ociien tos ateticos. Contien e u n rier catu lo
sore in stru ccion es de Sta ta. Tain es la a se de los rograas Spost, u e son
elicados en este liro en los catu los correson dien tes.
CAS TICS
A. Skron dal (200): Mu ltilevel an d Lon gitu din al Modelin g sin g Stata, College
Sta tion (TX): Sta ta Press.
iro cen trado en los a n lisis ultin iel u e eriten la coin acin de e
ectos
i
os aleatorios. Pa ra u ien ten ga u n u en n iel de estadstica .
a
ter
, A. . (6): Aroia te a es a ctors a nd Accou ntin g
or odel n cer
ta in tin en era lised in ea r odels, iom etria, (2): 2
266.
ase
,
. . (6): Test
or Seci
ication rror in Cla ssical in ear ea st
Sua res
egression An alsis,
ou rn al ote oya l Statistica l SocietySeries
Statistica l
Metodology
, : 0
.
Artcu lo don de se resen ta el test de ase
odrgu esu n a,
. (): Mtodos de Mu estreo, adrid: Cen tro de In estiga cion es
Sociolgicas.
Teto sico sore tcn ica s de u estro u e in clu e ta nto cu estion es terica s coo
r cticas de dise os u estrales.
u i
aa , . (dir.) (0): Metodologa estadstica pa ra el a n lisis de da tos cu a lita tivos, adrid: Cen tro de In estigacion es Sociolgicas.
iro dedica do al a n lisis de en cu esta s. esde la tala de con tin gen cia a los
odelos log
lin eales.
et al. (): An lisis stadstico de ncu esta sDatos Cu an tita tivos, a drid: AC.
iro dedica do a l an lisis estadstico de datos n oin ales. esde la tala de con
tin gencia a los odelos log
lineales.
S n ceCarrin ,
.
. (): An lisis de tablas de con tin gen ciael u so de los porcen ta
es en la s cien cias sociales, adrid: Cen tro de In estigacion es Sociolgica s..
Tcn ica s eleen ta les ara el estu dio de ta la s de con tin gencia. Centrado en di
e
ren cia s de orcenta
es. In clu e u n catu lo sore el estu dio del caio.
Sren sen , A. . Tu a (): a or arket Stru ctu res an d
ooilit, esearc
in Social Strati
ica tion an d Mobility, : 6
.
Siegel, . . (0): stadstica, ico: cra ill.
iro de clsico de stadstica eleen tal, lleno de e
ercicios resu eltos. u til
coo au togu a a ra resoler rolea s de stadstica.
.
. Steen s (200): Scau m s u tlin e oeory an d Problem s oSta tistics (
ed.): u ea ork, cra
ill.
ltia edicin del liro de clsico de sta dstica eleen ta l, con elicacion es
sicas releto de e
ercicios resu eltos.
Stata Corora tion (20a): Stata u ice
eren ce an d In de. elease , College Sta
tion (TX): Stata Press.
s el n dice de todos los de s ol en es. Con tien e tain u na in teresan te
clasi
ica cin de los coan dos. n el a n ua l digitalia do en
orato pdse
en cu en tra al rin ciio (Con ten ts) al
in al (In deSu b
ect in de).
(20): Gettin g Started itStata . elease , College Station (TX): Stata Press.
n a uen a gu a ara uienes coienan a u sar el rograa con los a sectos
estadsticos esen ciales. atres ersion es, u n a ara cada sistea oeratio (ac,
n i, in dos).
(20c): Sta ta sers Gu ide. elease , College Station (TX): Stata Press.
olu en de la docu en ta cin de Sta ta eleen ta l. esu s de la re
eren cia sica
es lo u e dee aren derse ara doin ar los eleen tos cou n es de Stata , coo
las
u n cion es, los
oratos, la sin tais la s cuestion es sica s de rograacin .
(20d): Stata Da ta-Ma na gem ent e
eren ce Ma n u al. elease , College Sta tion
(TX): Stata Press.
ste liro contien e todas las in stru ccion es relaciona das con el an e
o de
iceros:
creacin , odi
ica cin , lectu ra, escritu ra ,
u sin , recorte tran s
oracion es de
orato.
(20e): Stata a se e
erence Man u a l. elea se , College Station (TX): Stata
Press.
ste liro con tres ol en es con tien e la a or a rte de in struccion es de an lisis
sicos de Sta ta: esta dsticos, ta la s regresion es sa lo las teora les, las de
a nel, la s de su erien cia e iu tacin de alores.
(20
): Stata Grapics e
eren ce Ma nu al. elease , College Station (TX): Sta ta
Press.
Todo u n olu en dedicado a las in stru ccion es gen era les de gr
icos, u es las
esec
ica s se docuen tan con su resectia tcnica. Sa lo las rieras gin as,
slo til ara u ien es no eleen el editor de gr
icos.
(20g): Sta ta Su rviva l An alysis an d pidem iologica l a bles e
eren ce Man u al.
elea se , College Station (TX): Stata Press.
olu en de la docu en tacin de Stata esecia liado en las rden es st del an lisis
istrico de a con teciien tos las talas de su erien cia.
(20): Stata Su rvey Da ta e
eren ce Man u a l. elea se , College Station (TX):
Sta ta Press.
olu en dedicado a las in stru cciones svy, a ra la on deracin .
(20i): Sta ta Program m in g e
eren ce Man u a l. elease , College Sta tion (TX):
Sta ta Press.
olu en dedicado a la rogra acin.
(20
): Stata Stru ctu ra l u a tion Modelin g e
erence Man u al. elea se , College
Sta tion (TX): Sta ta Press.
olu en dedicado a los odelos de ecu acion es estru ctu rales.
Stran g, . (): In trodu ction to en t istorAn a lsis, en T.
an oski et a l. (eds.),
e Com parative Political con om y ote el
are State, Ca ridge: Ca ridge
n iersitPress.
eru n t,
. (): Log-Lin ear Models
or ven t istories, on dres: Sage.
ite, . (2): aiu n ikeliood stiation oisseci
ied odels, con om etrica, 0():
2.
ooldridge,
. . (200): In trodu ctory con om etricsA Modern Approa c( ed.), Aus
tra lia : Toson Sou testern .
u in teresan te liro de econ oetra con u n en
ou e u odern o de niel
in teredio llen o de e
elos tiles. stos se en cu en tran desarrollados en Stata
en tt:
.c.edu
gstat
eales
ooldridge
ooldridge.tl.
orld a n k, Te (200): orld Developm en t In dica tors (en C
), a sin g
ton . C.: Te orld a nk.
aagu ci, . (): ven t istory Ana lysis, on dres: Sage.
16
n d ice
de
in st r u ccio n e s
1 .Ge n e r a le s
appen d, 79
aweight, 102
browse, 30
by, 117
bysort, 126, 222, 225
cd, 64
cm dlog close, 42
cm dlog off, 42
cm dlog on , 42
cm dlog u sin g, 42
codebook, 86
com press, 49, 65
db, 37
describe, 45
dir, 26
display, 53, 142
do, 32
doedit, 31
drop, 55, 120
edit, 29, 59
egen , 139
estim ates, 403
for, 145, 281, 306
form at, 50
fweigh t, 100
gen erate, 129
global, 143, 279
gsort, 119
h elp, 28
if, 120
in , 51, 120
in file con form ato libre, 67
in file de an ch o fijo, 69
in fix, 68
in sheet, 65
iweight, 103
join by, 80
keep, 55
label data, 46
label defin e, 46
label drop, 47
label list, 47
label save, 47
label valu es, 46
label variable, 46
labelbook, 47
list, 50
log close, 42
log off, 42
log u sin g, 41
m ark, 235
m arkou t, 235
m erge, 79
n et from , 247, 266
n et in stall, 235, 247, 266
ou tfile, 73
pweight, 102
qu ietly, 402
recode, 134
ren am e, 61
replace, 130
reshape, 127, 230
496
retu rn , 142
ru n , 32
sam ple, 231
save, 63
saveold, 74
set dp, 50
set m em ory, 44
set seed, 132
sort, 117
ssc in stall, 157, 431
stset, 451
svydes, 477
svyset, 477
sysu se, 27
sysu se dir, 19
u se, 44
varm an age, 54
view, 43
2.E st a d st ica s
an ova, 229
asm probit, 440
bran t, 432
ci, 113
cii, 112
correlate, 281
dfbeta, 348
estat classification , 397
estat effects, 481
estat ic, 399
fitstat, 394
friedm an , 235
h au sm an , 441
h ettest, 338
kwallis, 221
listcoef, 410
logit, 383
m argin s, 412
m logit, 435
m logtest, 441
m probit, 440
m rtab, 266
ologit, 426
om odel, 431
on eway, 224
ovtest, 340
prch an ge, 412
predict, 288, 334, 390
prgen , 415
prtest, 199
prvalu e, 418
qreg, 369
ran ksu m , 219
regress, 286, 334
robvar, 224
rreg, 363
sdtest, 216
sfran cia, 336
sign ran k, 211
sign test, 203
sktest, 336
streg, 462
sts list, 456
su m m arize, 96, 120, 142
svy: proportion , 479
svy:logit, 485
svy:m ean , 480
svy:regress, 485
svy:tabu late, 483
swilk, 222, 336
tab1, 88, 238
tabch i, 247
table, 262
tabstat, 232, 259
tabu late, 88, 239
test, 295
ttest, 201
vif, 339
vwls, 360
3.Gr fica s
avplots, 342
catplot, 157
clu ster den drogram , 150
497
dotplot, 150
graph, 150
graph bar, 156
graph box, 167, 345
graph com bin e, 151
graph copy, 151
graph describe, 151
graph dir, 151
graph display, 151
graph drop, 151
graph export, 152
graph h bar, 162
graph m atrix, 174, 339
graph pie, 153
graph qu ery, 186
graph ren am e, 151
graph save, 152
graph twoway, 169
graph twoway area, 176
graph twoway bar, 173
graph twoway con n ected, 175
graph twoway dot, 173
graph twoway droplin e, 173
graph twoway fpfit, 178
graph twoway fpfitci, 181
graph twoway fu n ction , 182
graph twoway kden sity, 166
graph twoway lfit, 177
graph twoway lfitci, 181
Nu m e r o s p u b lica d o s
1.
Met o d o s d e m u e st r e o
Jacin to Rod rgu ez Osu n a
2.
Me t o d o lo ga d e la e va lu a cio n d e p r o gr a m a s
Fran cisco Alvira Martn
3.
Met o d o s d e a n a lis is ca u sa l
Ju an Dez Med ran o
4.
An a lisis d e r e gr e s io n m u lt ip le
Mau r o F. Gu ille n
5.
6.
Met o d o s d e m u e st r e o . Ca so s p r a ct ico s
Jacin to Rod rgu ez Osu n a
7.
Gr a fico s
An ton io Alam in os
8.
9.
E n cu e st a s t e le fo n ica s y p o r co r r e o
J. Llu s C. Bosch y Diego Tor ren te
1 0.
1 1.
E n cu e st a s d e sa lu d
Mar a D. Navarr o Ru bio
1 2.
1 3.
F u e n t e s d e in fo r m a cio n d e m o gr a fica e n E sp a n a
n geles Valer o Lobo
David -Sven Reh er y A
1 4.
An a lisis d e d a t o s co n SP SS/P C+
lvar o E str am ian a y Alicia Garr ido Lu qu e
Jose Lu is A
15.
16.
An a lisis y e st r u ct u r a l y d e r e d e s
Josep A. Rod rgu ez
17.
Au t o /b io gr a fa s
Jesu s M. d e Migu el
18.
R e d e s so cia le s y cu e st io n a r io s
Fe lix Requ en a San tos
19.
20.
Ob se r va cio n p a r t icip a n t e
O scar Gu asch
21.
Me t o d o lo ga d e l a n a lisis co m p a r a t ivo
Jord i Cas
22.
Me t o d o lo ga cu a lit a t iva e n E sp a n a
Ber n ab e Sarabia y Ju an Zarco
23.
24.
B a n co s d e d a t o s
Magdalen a Cor dero Vald avia
25.
An a lisis d in a m ico
E m ilio J. Castilla
26.
Cu e st io n a r io s
Mar a Jose Azofra
27.
An a lisis d e d a t o s e le ct o r a le s
Pablo On ate y Fr an cisco A. Ocan a
28.
29.
E le ccio n r a cio n a l
Pau Mar-Klose
30 .
E s t u d io d e ca so s
Xavier Coller
31 .
Dia r io s d e ca m p o
Ju an M. Gar ca Jorb a
32 .
33 .
34 .
Te o r a d e ju e go s
Ign acio Sa n ch ez-Cu en ca
35 .
La e n cu e st a : u n a p e r sp e ct iva ge n e r a l m e t o d o lo gica
Fr an cisco Alvira Mar tn
36 .
Ma n u a l d e t r a b a jo d e ca m p o e n la e n cu e st a
Vidal Daz de Rad a
37 .
Gr o u n d e d Th e o r y: La co n st it u cio n d e la t e o r a a
t r a ves d e l a n a lisis in t e r p r e t a cio n a l
An ton io Tr in id ad Requ en a, Virgin ia Car rero Plan es
y Rosa M. Sor ian o Mir as
38 .
39 .
40 .
E vo lu cio n d e la Te o r a F u n d a m e n t a d a co m o t e cn ica
d e a n a lisis cu a lit a t ivo
Jaim e An dr e u Abela, An ton io Gar ca-Nieto
y An a M Perez Corb ach o
41 .
42 .
E n cu e st a d e lib e r a t iva
Mara Cu esta, Joan Fon t, E rn esto Gan u za, Br au lio
Go m ez y Sara Pasadas
43 .
44 .
La in ve st iga cio n so b r e e l u so d e l t ie m p o
n geles Du r a n H eras, Jesu s Rogero Garca
M A
45 .
An a lisis d e d a t o s co n St a t a
Modesto E scobar Mer cad o, E n riqu e Fer n a n d ez Macas,
Fabr icio Bern ard i
46 .
Worand cc
pations,
E lurius numCritical Survey of
ouality
ndicators
Socio
Economic Re
ie, con Muode ustillo, Esteve y ntn
ransformations of t
e Employment Str
ct
re in t
e Eand t
e S,
algrave
Macmillan, con Storrie y urley, y eas
ring ore t
an oney: t
e Social Economics of
ob
ality
Edard Elgar, con Muode ustillo, Esteve y ntn.
Fabrizio Bernardi, es profesor de Sociologa en el
nstituto niversitario Europeo,
lorencia.
octor en Sociologa por la niversidad de
rento,
a sido profesor de Estructura Social
Contempornea en la Ey en la niversidad de ielefeld y de Mtodos de
nvestigacin
en la niversidad de olonia. Sus pulicaciones ms recientes incluyennequal
ransitions
Selection ias and t
e Compensatory Effect of Social ac
ground in Educational Careers
e
searcin Social Stratification and obility,
s it a Selection Effect
E
ropean Sociological Re
ie, con Martne
astor, y
e
ecent
ast psurge of
mmigrants in Spain and t
eir Employment atterns and ccupational
ttainment
International igration, con arrido y Miyar. Sus reas de investigacin
principales son la desigualdad social y las dinmicas familiares y laorales.
ISBN 978-84-7476-483-3
GOBIERNO
DE ESPAA
MINISTERIO
DE LA PRESIDENCIA
788474 764833
45
C
M
acultad de Ciencias Sociales de la niversidad de Salamanca, del que fue su primer director.
a pulicado liros como El anlisis grfico/ exploratorio
y El anlisis de segmentacin:
tcnicas y aplicaciones de los rboles de clasificacin
REIS,
. Su rea principal de traa
o son las tcnicas de investigacin social.
2.