Anda di halaman 1dari 41

Bases de Datos II

INDICE:
INDICE:.............................................................................................................................................. 1
CONSIDERACIONES GENERALES.........................................................................................................3
ESTRUCTURA DE BASE DE DATOS DISTRIBUIDAS..............................................................................3
CONSIDERACIONES AL DISTRIBUIR LA BASE DE DATOS......................................................................4
Ventajas de la disti!"#i$n de datos...............................................................................................%
Utilizacin compartida de los datos y distribucin del control..................................................5
Fiabilidad y disponibilidad........................................................................................................5
Agilizacin del procesamiento de consultas...............................................................................6
Des&entajas de la disti!"#i$n de los datos....................................................................................'
TRANS(ARENCIA ) AUTONO*+A........................................................................................................,
Asi-na#i$n de no.!es / a"tono.0a lo#al.....................................................................................1
Tans2aen#ia de la e2eti#i$n / la 3a-.enta#i$n.........................................................................4
Tans2aen#ia de lo#ali5a#i$n........................................................................................................4
Es6"e.a #o.2leto de asi-na#i$n de no.!es.............................................................................17
Tans2aen#ia / a#t"ali5a#iones...................................................................................................17
DISE8O DE LA DISTRIBUCI9N:..........................................................................................................11
Intod"##i$n................................................................................................................................. 11
Dise:o.......................................................................................................................................... 1'
TI(OS DE ;RAG*ENTACI9N:.............................................................................................................14
Gado de ;a-.enta#i$n..............................................................................................................<1
Re-las de #oe##i$n de la 3a-.enta#i$n....................................................................................<<
Altenati&as de asi-na#i$n...........................................................................................................<3
In3o.a#i$n ne#esaia.................................................................................................................. <4
Bases de Datos Disti!"idas (=-ina 1 de 41
Bases de Datos II
;RAG*ENTACI9N >ORI?ONTAL:......................................................................................................<4
In3o.a#i$n ne#esaia 2aa la 3a-.enta#i$n @oi5ontal..............................................................<%
Informacin sobre la base de datos..........................................................................................25
Informacin sobre la aplicacin..............................................................................................25
;a-.enta#i$n @oi5ontal 2i.aia..............................................................................................<'
;a-.enta#i$n @oi5ontal dei&ada..............................................................................................<1
;RAG*ENTACI9N VERTICAL:...........................................................................................................31
Intod"##i$n................................................................................................................................. 31
In3o.a#i$n ne#esaia 2aa la 3a-.enta#i$n &eti#al..................................................................33
;RAG*ENTACI9N *IATA O >+BRIDA:................................................................................................34
In3o.a#i$n ne#esaia.................................................................................................................. 3,
(ROCESA*IENTO DISTRIBUIDO DE CONSULTAS................................................................................31
Re2eti#i$n / 3a-.enta#i$n.........................................................................................................31
(o#esa.iento de intese##i$n si.2le..........................................................................................34
Estate-ias de intese##i$n "tili5ando el 2aalelis.o...................................................................47
Estate-ia de se.intese##i$n......................................................................................................47
CONCLUSIONES ) CONSIDERACIONES:.............................................................................................41
Bases de Datos Disti!"idas (=-ina < de 41
Bases de Datos II
CONSIDERACIONES GENERALES
En "n siste.a de !ase de datos disti!"idaB los datos se al.a#enan en &aios #o.2"tadoes. Los
#o.2"tadoes de "n siste.a disti!"ido se #o."ni#an ente s0 a ta&Cs de di&esos .edios de
#o."ni#a#i$nB tales #o.o #a!les de alta &elo#idad o l0neas tele3$ni#as. No #o.2aten la .e.oia
2in#i2al ni el eloj.
Los 2o#esadoes de "n siste.a disti!"ido 2"eden &aia en #"anto s" ta.a:o / 3"n#i$n. ("eden
in#l"i .i#o#o.2"tadoes 2e6"e:osB esta#iones de ta!ajo / siste.as de #o.2"tadoes -andes de
a2li#a#i$n -eneal. Estos 2o#esadoes e#i!en di3eentes no.!esB tales #o.o lo#alidadesB nodos o
#o.2"tadoes.
Un siste.a disti!"ido de !ases de datos #onsiste en "n #onj"nto de lo#alidadesB #ada "no de las
#"ales 2"ede 2ati#i2a en la eje#"#i$n de tansa##iones 6"e a##edan a datos de "na o &aias lo#alidades.
La di3een#ia 2in#i2al ente los siste.as de !ase de datos #entali5ados / disti!"idos es 6"eB en los
2i.eosB los datos esiden en "na sola lo#alidadB .ientas 6"eB en los Dlti.osB se en#"entan en &aias
lo#alidades.
ESTRUCTURA DE BASE DE DATOS DISTRIBUIDAS
Un siste.a disti!"ido de !ase de datos #onsiste en "n #onj"nto de lo#alidadesB #ada "na de las
#"ales .antiene "n siste.a de !ase de datos lo#al. Cada lo#alidad 2"ede 2o#esa tansa##iones lo#alesB
o !ien tansa##iones -lo!ales ente &aias lo#alidadesB e6"iiendo 2aa ello #o."ni#a#i$n ente ellas.
Las lo#alidades 2"eden #one#tase 30si#a.ente de di&esas 3o.asB las 2in#i2ales son:
Bases de Datos Disti!"idas (=-ina 3 de 41
Bases de Datos II
Red total.ente #one#tada
Red 2=#ti#a.ente #one#tada
Red #on est"#t"a de =!ol
Red de estella
Red de anillo
Las di3een#ias 2in#i2ales ente estas #on3i-"a#iones son:
Coste de instala#i$n: El #oste de #one#ta 30si#a.ente las lo#alidades del
siste.a
Coste de #o."ni#a#i$n: El #oste en tie.2o / dineo 6"e i.2li#a en&ia "n
.ensaje desde la lo#alidad A a la B.
;ia!ilidad: La 3e#"en#ia #on 6"e 3alla "na l0nea de #o."ni#a#i$n o "na
lo#alidad.
Dis2oni!ilidad: La 2osi!ilidad de a##ede a in3o.a#i$n a 2esa de 3allos
en al-"nas lo#alidades o l0neas de #o."ni#a#i$n.
Las lo#alidades 2"eden esta dis2esasB /a sea 2o "n =ea -eo-=3i#a eEtensa Fa lo la-o de "n
2a0sGB lla.adas edes de la-a distan#iaH o en "n =ea ed"#ida Fen "n .is.o edi3i#ioGB lla.adas edes de
=ea lo#al. (aa las 2i.eas se "tili5an en la #o."ni#a#i$n l0neas tele3$ni#asB #oneEiones de .i#oondas
/ #anales de satClitesH .ientas 6"e 2aa las se-"ndas se "tili5a #a!les #oaEiales de !anda !ase o !anda
an#@a / 3i!a $2ti#a.
Bases de Datos Disti!"idas (=-ina 4 de 41
Bases de Datos II
CONSIDERACIONES AL DISTRIBUIR LA BASE DE DATOS
EEisten &aias a5ones 2aa #onst"i siste.as disti!"idos de !ases de datos 6"e in#l"/en
#o.2ati la in3o.a#i$nB 3ia!ilidad / dis2oni!ilidad / a-ili5a el 2o#esa.iento de las #ons"ltas. (eo
ta.!iCn tiene s"s des&entajasB #o.o desaollos de so3tIae .=s #ostososB .a/o 2osi!ilidad de eoes /
#ostos eEtas de 2o#esa.iento.
Ventajas de la distribucin de dats
La 2in#i2al &entaja de los siste.as disti!"idos es la #a2a#idad de #o.2ati / a##ede a la
in3o.a#i$n de "na 3o.a 3ia!le / e3i#a5.
Utilizacin compartida de los datos y distribucin del control
La &entaja 2in#i2al de #o.2ati los datos 2o .edio de la disti!"#i$n es 6"e #ada lo#alidad
2"eda #ontola @asta #ieto 2"nto los datos al.a#enados lo#al.ente. En "n siste.a #entali5adoB el
ad.inistado de !ase de datos de la lo#alidad #ental #ontola la !ase de datos. En "n siste.a disti!"ido
eEiste "n ad.inistado -lo!al de la !ase de datos 6"e se en#a-a de todo el siste.a. (ate de esta
es2onsa!ilidad se dele-a al ad.inistado de !ase de datos de #ada lo#alidad. De2endiendo del dise:o
del siste.a disti!"idoB #ada ad.inistado lo#al 2od= tene "n -ado de a"tono.0a di3eenteB 6"e se
#ono#e #o.o a"tono.0a lo#al. La 2osi!ilidad de #onta #on a"tono.0a lo#al es en ."#@os #asos "na
&entaja i.2otante de las !ases de datos disti!"idas.
Fiabilidad y disponibilidad
Bases de Datos Disti!"idas (=-ina % de 41
Bases de Datos II
Si se 2od"#e "n 3allo en "na lo#alidad de "n siste.a disti!"idoB es 2osi!le 6"e las de.=s
lo#alidades 2"edan se-"i ta!ajando. En 2ati#"laB si los datos se e2iten en &aias lo#alidadesB "na
tansa##i$n 6"e e6"iee "n dato es2e#03i#o 2"ede en#ontalo en .=s de "na lo#alidad. As0B el 3allo de
"na lo#alidad no i.2li#a ne#esaia.ente la desa#ti&a#i$n del siste.a.
El siste.a de!e dete#ta #"ando 3alla "na lo#alidad / to.a las .edidas ne#esaias 2aa e#"2ease
del 3allo. El siste.a no de!e se-"i "tili5ando la lo#alidad 6"e 3all$. (o Dlti.oB #"ando se e#"2ee o
e2ae esta lo#alidadB de!e #ontase #on .e#anis.os 2aa einte-ala al siste.a #on el .0ni.o de
#o.2li#a#iones.
La dis2oni!ilidad es 3"nda.ental 2aa los siste.as de !ases de datos 6"e se "tili5an en
a2li#a#iones de tie.2o eal. (o eje.2loB si "na l0nea aCea no 2"ede tene a##eso a la in3o.a#i$nB es
2osi!le 6"e 2ieda #lientes a 3a&o de la #o.2eten#ia.
Agilizacin del procesamiento de consultas
Si "na #ons"lta #o.2ende datos de &aias lo#alidadesB 2"ede se 2osi!le di&idi la #ons"lta en
&aias s"!#ons"ltas 6"e se eje#"ten en 2aalelo en distintas lo#alidades. Sin e.!a-oB en "n siste.a
disti!"ido no se #o.2ate la .e.oia 2in#i2alB as0 6"e no todas las estate-ias de intese##i$n se 2"eden
a2li#a en estos siste.as. En los #asos en 6"e @a/ e2eti#i$n de los datosB el siste.a 2"ede 2asa la
#ons"lta a las lo#alidades .=s li-eas de #a-a.
Des!entajas de la distribucin de ls dats
La des&entaja 2in#i2al de los siste.as disti!"idos es la .a/o #o.2lejidad 6"e se e6"iee 2aa
-aanti5a "na #oodina#i$n ade#"ada ente lo#alidades.
El a".ento de la #o.2lejidad se e3leja en:
Bases de Datos Disti!"idas (=-ina ' de 41
Bases de Datos II
Coste del desaollo de so3tIae: es .=s di30#il est"#t"a "n siste.a de
!ases de datos disti!"idos / 2o tanto s" #oste es .eno
*a/o 2osi!ilidad de eoes: 2"esto 6"e las lo#alidades del siste.a
disti!"ido o2ean en 2aaleloB es .=s di30#il -aanti5a 6"e los al-oit.os sean
#oe#tos.
*a/o tie.2o eEta de 2o#esa.iento: el inte#a.!io de .ensajes / los
#=l#"los adi#ionales son "na 3o.a de tie.2o eEta 6"e no eEiste en los siste.as
#entali5ados.
TRANS"ARENCIA # AUTONO$%A
En la se##i$n anteio se &io 6"e "na ela#i$n 2"ede al.a#enase de &aias 3o.as en "n siste.a
de !ase de datos disti!"ida. Es esen#ial 6"e el siste.a ed"5#a al .0ni.o la ne#esidad de 6"e el "s"aio
se dC #"enta de #$.o est= al.a#enada "na ela#i$n. Co.o &ee.os. "n siste.a 2"ede o#"lta los detalles
de la disti!"#i$n de la in3o.a#i$n en la ed. Esto se deno.ina tans2aen#ia de la ed. La tans2aen#ia
de la ed se ela#ionaB en al-Dn .odoB a la a"tono.0a lo#al. La tans2aen#ia de la ed es el -ado @asta el
#"al los "s"aios del siste.a 2"eden i-noa los detalles del dise:o disti!"ido. La a"tono.0a lo#al es el
-ado @asta el #"al el dise:ado o ad.inistado de "na lo#alidad 2"eden se inde2endientes del esto del
siste.a disti!"ido . Los te.as de tans2aen#ia / a"tono.0a se=n #onsideados desde los si-"ientes
2"ntos de &ista:
No.!e de los datos.
Re2eti#i$n de los datos.
;a-.enta#i$n de los datos.
Lo#ali5a#i$n de los 3a-.entos / #o2ias.
Bases de Datos Disti!"idas (=-ina , de 41
Bases de Datos II
Asi&nacin de n'bres ( autn')a lcal
Todo ele.ento de in3o.a#i$n de "na !ase de datos de!e tene "n no.!e Dni#o. Esta 2o2iedad se
ase-"a 3=#il.ente en "na !ase de datos 6"e no estC disti!"ida. Sin e.!a-oB en "na !ase de dalos
disti!"idaB las distintas lo#alidades de!en ase-"ase no "tili5a el .is.o no.!e 2aa dos datos
di3eentes.
Una sol"#i$n 2aa este 2o!le.a es e6"ei 6"e se e-isten todos los no.!es en "n asignador
central de nombres. Sin e.!a-oB este en3o6"e tiene &aias des&entajas:
Es 2osi!le 6"e el asi-nado de no.!es se #on&ieta en "n #"ello de !otella..
Si el asi-nado de no.!es se #aeB es 2osi!le 6"e nin-"na de las lo#alidades del siste.a
disti!"ido 2"eda se-"i ta!ajando.
Se ed"#e la a"tono.0a lo#alB /a 6"e la asi-na#i$n de no.!es se #ontola de 3o.a
#entali5ada.
Un en3o6"e di3eente 6"e oi-ina "na .a/o a"tono.0a lo#al es eEi-i 6"e #ada lo#alidad 2on-a
#o.o 2e3ijo "n identi3i#ado de lo#alidad a #"al6"ie no.!e 6"e -enee. Esto -aanti5a 6"e dos
lo#alidades n"n#a -enea=n el .is.o no.!e F/a 6"e #ada lo#alidad tiene "n identi3i#ado Dni#oG.
Ade.=sB no se e6"iee "n #ontol #ental.
Esta sol"#i$n al 2o!le.a de asi-na#i$n de no.!esB lo-a a"tono.0a lo#alB 2eo no tans2aen#ia
de la edB /a 6"e se a-e-an identi3i#adoes de lo#alidad a los no.!es. As0B la ela#i$n de2$sito 2od0a
lla.ase lo#alidad1,.de2$sito en &e5 de de2$sito si.2le.ente.
Cada #o2ia / 3a-.ento de "n ele.ento de in3o.a#i$n de!en tene "n no.!e Dni#o. Es
Bases de Datos Disti!"idas (=-ina 1 de 41
Bases de Datos II
i.2otante 6"e el siste.a 2"eda dete.ina 6"C #o2ias son #o2ias del .is.o ele.ento de in3o.a#i$n /
6"C 3a-.entos son 3a-.entos del .is.o ele.ento de in3o.a#i$n.
Trans*arencia de la re*eticin ( la +ra&'entacin
No es #on&eniente e6"ei 6"e los "s"aios @a-an e3een#ia a "na #o2ia es2e#03i#a de "n
ele.ento de in3o.a#i$n. El siste.a de!e se el 6"e dete.ine a 6"C #o2ia de!e a##ede #"ando se le
soli#ite s" le#t"aB / de!e .odi3i#a todas las #o2ias #"ando se 2od"5#a "na 2eti#i$n de es#it"a.
C"ando se soli#ita "n datoB no es ne#esaio es2e#i3i#a la #o2ia. El siste.a "tili5a "na ta!laJ
#at=lo-o 2aa dete.ina #"=les son todas las #o2ias de ese dato.
De .anea si.ilaB no de!e eEi-ise a los "s"aios 6"e se2an #$.o est= 3a-.entado "n ele.ento
de in3o.a#i$n. Es 2osi!le 6"e los 3a-.entos &eti#ales #onten-an idJt"2lasB 6"e e2esentan
die##iones de t"2las. Los 3a-.entos @oi5ontales 2"eden @a!ese o!tenido 2o 2edi#ados de sele##i$n
#o.2lejos. (o tantoB "n siste.a de !ases de datos disti!"ido de!e 2e.iti las #ons"ltas 6"e se @a-an
en tC.inos de ele.entos de in3o.a#i$n sin 3a-.enta. Esto no 2esenta 2o!le.as -a&esB /a 6"e
sie.2e es 2osi!le e#onst"i el ele.ento de in3o.a#i$n oi-inal a 2ati de s"s 3a-.entos. Sin
e.!a-oB este 2o#eso 2"ede se ine3i#iente.
Trans*arencia de lcali,acin
Si el siste.a es tans2aente en #"anto a e2eti#i$n / 3a-.enta#i$nB se o#"lta= al "s"aio -an
2ate del es6"e.a de la !ase de datos disti!"ida. Sin e.!a-oB el #o.2onente de los no.!es 6"e
identi3i#an a la lo#alidad o!li-a al "s"aio a dase #"enta del @e#@o de 6"e #l siste.a est= disti!"ido.
Bases de Datos Disti!"idas (=-ina 4 de 41
Bases de Datos II
La tans2aen#ia de lo#ali5a#i$n se lo-a #eando "n #onj"nto de se"d$ni.os o alias 2aa #ada
"s"aio. As0B el "s"aio 2"ede e3eise a los datos "sando no.!es sen#illos 6"e el siste.a tad"#e a
no.!es #o.2letos.
Con el "so de se"d$ni.osB no se= ne#esaio 6"e el "s"aio #ono5#a la lo#ali5a#i$n 30si#a de "n
dato. Ade.=sB el ad.inistado de la !ase de datos 2"ede #a.!ia "n dato de "na lo#alidad a ota sin
a3e#ta a los "s"aios.
Es-ue'a c'*let de asi&nacin de n'bres
)a &i.os 6"e "n no.!e 2o2o#ionado 2o el "s"aio de!e 2asa 2o &aios 2asos de tad"##i$n
antes de 6"e 2"eda se&i #o.o e3een#ia a "na #o2ia es2e#03i#a de "n 3a-.ento dete.inado en "na
lo#alidad es2e#03i#a.
(aa il"sta #$.o 3"n#iona el es6"e.aB #onsidea.os "n "s"aio 6"e se en#"enta en la s"#"sal
1 FL1G. Este "s"aio e.2lea el se"d$ni.o de2$sitoJlo#al 2aa el 3a-.ento lo#al de2$sitoJ;1 de la
ela#i$n de2osito. C"ando este "s"aio @a#e e3een#ia a de2$sitoJlo#alB el s"!siste.a de 2o#esa.iento
de #ons"ltas !"s#a de2$sitoJlo#al en la ta!la de se"d$ni.os / la s"stit"/e 2o Ll.de2$sito.;1. Es
2osi!le 6"e L1.de2$sito.;l estC e2etido. Si es as0B de!e #ons"ltase la ta!la de #o2ias 2aa ele-i "na
#o2ia. Esta #o2ia 2od0a ta.!iCn esta 3a-.entadaB lo 6"e @a0a ne#esaio #ons"lta la ta!la de
3a-.enta#i$n. En la .a/o 2ate de los #asosB s$lo es 2e#iso #ons"lta "na o dos ta!las.

Trans*arencia ( actuali,acines
De al-"na 3o.a es .=s di30#il @a#e tans2aente la !ase de datos 2aa "s"aios 6"e la
a#t"ali5an 6"e 2aa a6"ellos 6"e s$lo leen datos. El 2o!le.a 2in#i2al es ase-"ase de 6"e se
a#t"ali5an todas las #o2ias de "n dato / ta.!iCn los 3a-.entos a3e#tados.
Bases de Datos Disti!"idas (=-ina 17 de 41
Bases de Datos II
En el #aso .=s -enealB el 2o!le.a de a#t"ali5a#i$n de in3o.a#i$n e2etida / 3a-.entada est=
ela#ionado #on el 2o!le.a de a#t"ali5a#i$n de &istas.
DISE.O DE LA DISTRIBUCI/N:
Intrduccin
El dise:o de "n siste.a de !ase de datos disti!"ido i.2li#a la to.a de de#isiones so!e la
"!i#a#i$n de los 2o-a.as 6"e a##ede=n a la !ase de datos / so!e los 2o2ios datos 6"e #onstit"/en
esta Dlti.aB a lo la-o de los di3eentes 2"estos 6"e #on3i-"en "na ed de odenadoes. La "!i#a#i$n de
los 2o-a.asB a 2ioiB no de!e0a s"2one "n eE#esi&o 2o!le.a dado 6"e se 2"ede tene "na #o2ia de
ellos en #ada .=6"ina de la ed Fde @e#@oB en este do#".ento se as".i= 6"e as0 esG. Sin e.!a-oB #"=l es
la .ejo o2#i$n 2aa #olo#a los datos: en "na -an .=6"ina 6"e al!e-"e a todos ellosB en#a-ada de
es2onde a todas las 2eti#iones del esto de las esta#iones K siste.a de !ase de datos #entali5ado KB o
2od0a.os 2ensa en e2ati las ela#ionesB las ta!lasB 2o toda la ed. En el s"2"esto 6"e nos
de#ant=se.os 2o esta se-"nda o2#i$nB L6"C #iteios se de!e0an se-"i 2aa lle&a a #a!o tal
disti!"#i$nM LReal.ente este en3o6"e o3e#e= "n .a/o endi.iento 6"e el #aso #entali5adoM L(od0a
o2tase 2o al-"na ota altenati&aM En los 2=a3os s"#esi&os se tata= de es2onde a estas #"estiones.
Tadi#ional.ente se @a #lasi3i#ado la o-ani5a#i$n de los siste.as de !ases de datos disti!"idos
so!e tes di.ensiones: el ni&el de #o.2ati#i$nB las #aa#te0sti#as de a##eso a los datos / el ni&el de
#ono#i.iento de esas #aa#te0sti#as de a##eso F&ea la 3i-"a 1G. El ni&el de #o.2ati#i$n 2esenta tes
altenati&as: ineEisten#iaB es de#iB #ada a2li#a#i$n / s"s datos se eje#"tan en "n odenado #on a"sen#ia
total de #o."ni#a#i$n #on otos 2o-a.as " otos datosH se #o.2aten s$lo los datos / no los 2o-a.asB
Bases de Datos Disti!"idas (=-ina 11 de 41
Bases de Datos II
en tal #aso eEiste "na C2li#a de las a2li#a#iones en #ada .=6"ina / los datos &iajan 2o la edH /B se
e2aten datos / 2o-a.asB dado "n 2o-a.a "!i#ado en "n dete.inado sitioB Cste 2"ede soli#ita "n
Figura 1. Enfoque de la distribucin.
se&i#io a oto 2o-a.a lo#ali5ado en "n se-"ndo l"-aB el #"al 2od= a##ede a los datos sit"ados en "n
te#e e.2la5a.iento. Co.o se #o.ent$ l0neas at=sB en este #aso se o2ta= 2o el 2"nto inte.edio de
#o.2ati#i$n.

Res2e#to a las #aa#te0sti#as de a##eso a los datos eEisten dos altenati&as 2in#i2al.ente: el .odo
de a##eso a los datos 6"e soli#itan los "s"aios 2"ede se est=ti#oB es de#iB no #a.!ia= a lo la-o del
tie.2oB o !ienB din=.i#o. El le#to 2od= #o.2ende 3=#il.ente la di3i#"ltad de en#onta siste.as
disti!"idos eales 6"e 2"edan #lasi3i#ase #o.o est=ti#os. Sin e.!a-oB lo eal.ente i.2otante adi#aB
esta!le#iendo el dina.is.o #o.o !aseB #$.o de din=.i#o esB #"=ntas &aia#iones s"3e a lo la-o del
tie.2o. Esta di.ensi$n esta!le#e la ela#i$n ente el dise:o de !ases de datos disti!"idas / el
2o#esa.iento de #ons"ltas.
La te#ea #lasi3i#a#i$n es el ni&el de #ono#i.iento de las #aa#te0sti#as de a##eso. Una 2osi!ilidad
esB e&idente.enteB 6"e los dise:adoes #ae5#an de in3o.a#i$n al-"na so!e #$.o los "s"aios a##eden
a la !ase de datos. Es "na 2osi!ilidad te$i#aB 2eo se0a ."/ la!oioso a!oda el dise:o de la !ase de
datos #on tal a"sen#ia de in3o.a#i$n. Lo .=s 2=#ti#o se0a #ono#e #on deteni.iento la 3o.a de a##eso
de los "s"aios oB en el #aso de s" i.2osi!ilidadB #on3o.anos #on "na in3o.a#i$n 2a#ial de Csta.
Bases de Datos Disti!"idas (=-ina 1< de 41
Bases de Datos II
El 2o!le.a del dise:o de !ases de datos disti!"idas 2od0a en3o#ase a ta&Cs de esta ta.a de
o2#iones. En todos los #asosB eE#e2to a6"el en el 6"e no eEiste #o.2ati#i$nB a2ae#e=n "na seie de
n"e&os 2o!le.as 6"e son iele&antes en el #aso #entali5ado.
A la @oa de a!oda el dise:o de "na !ase de datos disti!"ida 2ode.os o2ta 2in#i2al.ente 2o
dos ti2os de estate-ias: la estate-ia as#endente / la estate-ia des#endente. A.!os ti2os no son
eE#l"/entesB / no es"lta0a eEta:o a la @oa de a!oda "n ta!ajo eal de dise:o de "na !ase de datos
6"e se 2"diesen e.2lea en di3eentes eta2as del 2o/e#to "na " ota estate-ia. La estate-ia as#endente
2od0a a2li#ase en a6"el #aso donde @a/a 6"e 2o#ede a "n dise:o a 2ati de "n nD.eo de 2e6"e:as
!ases de datos eEistentesB #on el 3in de inte-alas en "na sola. En este #aso se 2ati0a de los es6"e.as
#on#e2t"ales lo#ales / se ta!aja0a 2aa lle-a a #onse-"i el es6"e.a #on#e2t"al -lo!al. A"n6"e este
#aso se 2"eda 2esenta #on 3a#ilidad en la &ida ealB se 2e3iee 2ensa en el #aso donde se 2ate de #eo /
se a&an5a en el desaollo del ta!ajo si-"iendo la estate-ia des#endente. La estate-ia des#endente F&ea
la 3i-"a <G de!e0a es"lta 3a.ilia a la 2esona 6"e 2osea #ono#i.ientos so!e el dise:o de !ases de
datosB eE#e2t"ando la 3ase del dise:o de la disti!"#i$n. (ese a todoB se es".i=n !e&e.ente las eta2as
2o las 6"e se tans#"e.
Bases de Datos Disti!"idas (=-ina 13 de 41
Bases de Datos II
Figura 2. Estrategia descendente.
Bases de Datos Disti!"idas (=-ina 14 de 41
Bases de Datos II
Todo #o.ien5a #on "n an=lisis de los e6"isitos 6"e de3ini=n el entono del siste.a en aas a
o!tene tanto los datos #o.o las ne#esidades de 2o#esa.iento de todos los 2osi!les "s"aios del !an#o
de datos. I-"al.enteB se de!e=n 3ija los e6"isitos del siste.aB los o!jeti&os 6"e de!e #".2li es2e#to a
"nos -ados de endi.ientoB se-"idadB dis2oni!ilidad / 3leEi!ilidadB sin ol&ida el i.2otante as2e#to
e#on$.i#o. Co.o 2"ede o!se&aseB los es"ltados de este Dlti.o 2aso si&en de entada 2aa dos
a#ti&idades 6"e se eali5an de 3o.a 2aalela. El dise:o de las &istas tata de de3ini las inte3a#es 2aa el
"s"aio 3inal /B 2o oto ladoB el dise:o #on#e2t"al se en#a-a de eEa.ina la e.2esa 2aa dete.ina los
ti2os de entidades / esta!le#e la ela#i$n ente ellas. EEiste "n &0n#"lo ente el dise:o de las &istas / el
dise:o #on#e2t"al. El dise:o #on#e2t"al 2"ede inte2etase #o.o la inte-a#i$n de las &istas del "s"aioB
este as2e#to es de &ital i.2otan#ia /a 6"e el .odelo #on#e2t"al de!e0a so2ota no s$lo las a2li#a#iones
eEistentesB sino 6"e de!e0a esta 2e2aado 2aa 3"t"as a2li#a#iones. En el dise:o #on#e2t"al / de las
&istas del "s"aio se es2e#i3i#a=n las entidades de datos / se dete.ina=n las a2li#a#iones 6"e
3"n#iona=n so!e la !ase de datosB as0 .is.oB se e#o2ila=n datos estad0sti#os o esti.a#iones so!e la
a#ti&idad de estas a2li#a#iones. Di#@as esti.a#iones de!e0an -ia en tono a la 3e#"en#ia de a##esoB 2o
2ate de "na a2li#a#i$nB a las distintas ela#iones de las 6"e @a#e "soB 2od0a a3inase .=s anotando los
ati!"tos de la ela#i$n a la 6"e a##ede. Desaollado el ta!ajo @asta a6"0B se 2"ede a!oda la #on3e##i$n
del es6"e.a #on#e2t"al -lo!al. Este es6"e.a / la in3o.a#i$n elati&a al a##eso a los datos si&en de
entada al 2aso distinti&o: el dise:o de la disti!"#i$n. El o!jeti&o de esta eta2a #onsiste en dise:a los
es6"e.as #on#e2t"ales lo#ales 6"e se disti!"i=n a lo la-o de todos los 2"estos del siste.a disti!"ido.
Se0a 2osi!le tata #ada entidad #o.o "na "nidad de disti!"#i$nH en el #aso del .odelo ela#ionalB #ada
entidad se #oes2onde #on "na ela#i$n. Res"lta !astante 3e#"ente di&idi #ada ela#i$n en s"!ela#iones
.enoes deno.inadas 3a-.entos 6"e l"e-o se "!i#an en "no " oto sitio. De a@0B 6"e el 2o#eso del
dise:o de la disti!"#i$n #onste de dos a#ti&idades 3"nda.entales: la 3a-.enta#i$n / la asi-na#i$n. El
Dlti.o 2aso del dise:o de la disti!"#i$n es el dise:o 30si#oB el #"al 2o/e#ta los es6"e.as #on#e2t"ales
lo#ales so!e los dis2ositi&os de al.a#ena.iento 30si#o dis2oni!les en los distintos sitios. Las entadas
2aa este 2aso son los es6"e.as #on#e2t"ales lo#ales / la in3o.a#i$n de a##eso a los 3a-.entos. (o
Dlti.oB se sa!e 6"e la a#ti&idad de desaollo / dise:o es "n ti2o de 2o#eso 6"e ne#esita de "na
Bases de Datos Disti!"idas (=-ina 1% de 41
Bases de Datos II
.onitoi5a#i$n / "n aj"ste 2ei$di#osB 2aa 6"e si se lle-an a 2od"#i des&ia#ionesB se 2"eda etona a
al-"na de las 3ases anteioes.
Dise0
EEisten di&esas 3o.as de a3onta el 2o!le.a del dise:o de la disti!"#i$n. Las .=s "s"ales se
."estan en la 3i-"a 3. En el 2i.e #asoB #aso AB los dos 2o#esos 3"nda.entalesB la 3a-.enta#i$n / la
asi-na#i$nB se a!odan de 3o.a si."lt=nea. Esta .etodolo-0a se en#"enta en des"soB s"stit"ida 2o el
en3o6"e en dos 3asesB #aso B: la eali5a#i$n 2i.ea.ente de la 2ati#i$n 2aa l"e-o asi-na los
3a-.entos -eneados. El esto de los #asos se #o.entan en la se##i$n e3eente a los distintos ti2os de la
3a-.enta#i$n.
Bases de Datos Disti!"idas (=-ina 1' de 41
Bases de Datos II
Figura 3. Enfoques para realizar el diseo distributivo.
Antes de eE2one las altenati&as eEistentes de 3a-.enta#i$nB se desean 2esenta las &entajas e
in#on&enientes de esta tC#ni#a. Se @a #o.entado en la intod"##i$n la #on&enien#ia de des#o.2one las
ela#iones de la !ase de datos en 2e6"e:os 3a-.entosB 2eo no se @a j"sti3i#ado el @e#@o ni se @an
a2otado a5ones 2aa e3e#t"alo. (o elloB desde este 2"nto se &a a intenta a2ota las a5ones ne#esaias
2aa lle&a a #a!o esa des#o.2osi#i$nB esa 3a-.enta#i$n.
El 2in#i2al 2o!le.a de la 3a-.enta#i$n adi#a en en#onta la "nidad a2o2iada de disti!"#i$n.
Una ela#i$n no es "na !"ena "nidad 2o ."#@as a5ones. (i.eoB las &istas de la a2li#a#i$n
no.al.ente son s"!#onj"ntos de ela#iones. Ade.=sB la lo#alidad de los a##esos de las a2li#a#iones no
est= de3inida so!e ela#iones enteas 2eo s0 so!e s"!#onj"ntos de las .is.as. (o elloB se0a no.al
#onsidea #o.o "nidad de disti!"#i$n a estos s"!#onj"ntos de ela#iones.
Se-"ndoB si las a2li#a#iones tienen &istas de3inidas so!e "na dete.inada ela#i$n F#onside=ndola
a@oa "na "nidad de disti!"#i$nG 6"e eside en &aios sitios de la edB se 2"ede o2ta 2o dos altenati&as.
(o "n ladoB la ela#i$n no esta= e2li#ada / se al.a#ena en "n Dni#o sitioB o eEiste C2li#a en todos o
al-"nos de los sitios en los #"ales eside la a2li#a#i$n. Las #onse#"en#ias de esta estate-ia son la
-enea#i$n de "n &ol".en de a##esos e.otos inne#esaio. Ade.=sB se 2"eden eali5a C2li#as
inne#esaias 6"e #a"sen 2o!le.as en la eje#"#i$n de las a#t"ali5a#iones / 2"ede no se desea!le si el
es2a#io de al.a#ena.iento est= li.itado.
Te#eoB la des#o.2osi#i$n de "na ela#i$n en 3a-.entosB tatados #ada "no de ellos #o.o "na
"nidad de disti!"#i$nB 2e.ite el 2o#eso #on#"ente de las tansa##iones. Ta.!iCn la ela#i$n de estas
ela#ionesB no.al.enteB 2o&o#a= la eje#"#i$n 2aalela de "na #ons"lta al di&idila en "na seie de
s"!#ons"ltas 6"e o2ea= so!e los 3a-.entos.
Bases de Datos Disti!"idas (=-ina 1, de 41
Bases de Datos II
(eo la 3a-.enta#i$n ta.!iCn a#aea in#on&enientes. Si las a2li#a#iones tienen e6"isitos tales
6"e 2e&en-an la des#o.2osi#i$n de la ela#i$n en 3a-.entos ."t"a.ente eE#l"si&osB estas a2li#a#iones
#"/as &istas estCn de3inidas so!e .=s de "n 3a-.ento 2"eden s"3i "na de-ada#i$n en el endi.iento.
(o tantoB 2"ede se ne#esaio e#"2ea los datos de dos 3a-.entos / lle&a a #a!o so!e ellos o2ea#i$n
de "ni$n / /"nto B lo #"al es #ostoso.
Un se-"ndo 2o!le.a se e3iee al #ontol se.=nti#o. Co.o es"ltado de la 3a-.enta#i$n los
ati!"tos i.2li#ados en "na de2enden#ia se des#o.2onen en di3eentes 3a-.entos los #"ales 2"eden
destinase a sitios di3eentes. En este #asoB la sen#illa taea de &ei3i#a las de2enden#ias 2"ede es"lta
"na taea de !Ds6"eda de los datos i.2li#ados en "n -an nD.eo de sitios.
TI"OS DE 1RAG$ENTACI/N:
Dado 6"e "na ela#i$n se #oes2onde esen#ial.ente #on "na ta!la / la #"esti$n #onsiste en
di&idila en 3a-.entos .enoesB in.ediata.ente s"-en dos altenati&as l$-i#as 2aa lle&a a #a!o el
2o#eso: la di&isi$n @oi5ontal / la di&isi$n &eti#al. La di&isi$n o 3a-.enta#i$n @oi5ontal ta!aja so!e
las t"2lasB di&idiendo la ela#i$n en s"!ela#iones 6"e #ontienen "n s"!#onj"nto de las t"2las 6"e al!e-a
la 2i.ea. La 3a-.enta#i$n &eti#alB en #a.!ioB se !asa en los ati!"tos de la ela#i$n 2aa e3e#t"a la
di&isi$n. Estos dos ti2os de 2ati#i$n 2od0an #onsidease los 3"nda.entales / !=si#os. Sin e.!a-oB
eEisten otas altenati&as. ;"nda.ental.enteB se @a!la de 3a-.enta#i$n .iEta o @0!ida #"ando el
2o#eso de 2ati#i$n @a#e "so de los dos ti2os anteioes. La 3a-.enta#i$n .iEta 2"ede lle&ase a #a!o
de tes 3o.as di3eentes: desaollando 2i.eo la 3a-.enta#i$n &eti#al /B 2osteio.enteB a2li#ando la
2ati#i$n @oi5ontal so!e los 3a-.entos &eti#ales Fdeno.inada 2ati#i$n V>GB o a2li#ando 2i.eo "na
di&isi$n @oi5ontal 2aa l"e-oB so!e los 3a-.entos -eneadosB desaolla "na 3a-.enta#i$n &eti#al
Flla.ada 2ati#i$n >VGB o !ienB de 3o.a die#ta #onsideando la se.=nti#a de las tansa##iones. Oto
en3o6"e distinto / elati&a.ente n"e&oB #onsiste en a2li#a so!e "na ela#i$nB de 3o.a si."lt=nea / no
Bases de Datos Disti!"idas (=-ina 11 de 41
Bases de Datos II
se#"en#ialB la 3a-.enta#i$n @oi5ontal / la 3a-.enta#i$n &eti#alH en este #asoB se -eneaa "na ejilla /
los 3a-.entos 3o.aan las #eldas de esa ejillaB #ada #elda se= eEa#ta.ente "n 3a-.ento &eti#al / "n
3a-.ento @oi5ontal Fn$tese 6"e en este #aso el -ado de 3a-.enta#i$n al#an5ado es .=Ei.oB / no 2o
ello la des#o.2osi#i$n es"lta= .=s e3i#ienteG.
Vol&iendo a la 3i-"a 3B 2"ede o!se&ase #o.o los #asos C / D se !asan en la .en#ionada
-enea#i$n de la ejillaB #on la di3een#ia 6"e en el 2i.eo de ellos se 2od"#e "na 3"si$nB "na
des3a-.enta#i$n de las #eldasB a-"2=ndolas de la .anea .=s ade#"ada 2aa o!tene .a/o
endi.ientoB /a 6"e los 3a-.entos -eneados son ."/ 2e6"e:os. En el se-"ndo #aso se asi-nan las
#eldas a los sitios / l"e-o se eali5a "na i-"osa o2ti.i5a#i$n de #ada sitio. El #aso E se0a a6"el en el
6"e se "tili5a la 3a-.enta#i$n V> o la 3a-.enta#i$n >V.
Bases de Datos Disti!"idas (=-ina 14 de 41
Bases de Datos II
Figura 3. Enfoques para realizar el diseo distributivo.
Gado de 3a-.enta#i$n. C"ando se &a a 3a-.enta "na !ase de datos de!e0a.os so2esa 6"C
-ado de 3a-.enta#i$n &a a al#an5aB /a 6"e Cste se= "n 3a#to 6"e in3l"i= nota!le.ente en el desaollo
de la eje#"#i$n de las #ons"ltas. El -ado de 3a-.enta#i$n 2"ede &aia desde "na a"sen#ia de la
di&isi$nB #onsideando a las ela#iones "nidades de 3a-.enta#i$nH o !ienB 3a-.enta a "n -ado en el
#ada t"2la o ati!"to 3o.e "n 3a-.ento. Ante estos dos #asos eEte.osB e&idente.ente se @a de !"s#a
"n #o.2o.iso inte.edioB el #"al de!e0a esta!le#ese so!e las #aa#te0sti#as de las a2li#a#iones 6"e
@a#en "so de la !ase de datos. Di#@as #aa#te0sti#as se 2od=n 3o.ali5a en "na seie de 2a=.etos. De
a#"edo #on s"s &aloesB se 2od= esta!le#e el -ado de 3a-.enta#i$n del !an#o de datos.
Bases de Datos Disti!"idas (=-ina <7 de 41
Bases de Datos II
Figura 4. Distintos tipos de fragmentacin.
Grad de 1ra&'entacin
C"ando se &a a 3a-.enta "na !ase de datos de!e0a.os so2esa 6"C -ado de 3a-.enta#i$n &a a
al#an5aB /a 6"e Cste se= "n 3a#to 6"e in3l"i= nota!le.ente en el desaollo de la eje#"#i$n de las
#ons"ltas. El -ado de 3a-.enta#i$n 2"ede &aia desde "na a"sen#ia de la di&isi$nB #onsideando a las
ela#iones "nidades de 3a-.enta#i$nH o !ienB 3a-.enta a "n -ado en el #ada t"2la o ati!"to 3o.e "n
3a-.ento. Ante estos dos #asos eEte.osB e&idente.ente se @a de !"s#a "n #o.2o.iso inte.edioB el
#"al de!e0a esta!le#ese so!e las #aa#te0sti#as de las a2li#a#iones 6"e @a#en "so de la !ase de datos.
Di#@as #aa#te0sti#as se 2od=n 3o.ali5a en "na seie de 2a=.etos. De a#"edo #on s"s &aloesB se
2od= esta!le#e el -ado de 3a-.enta#i$n del !an#o de datos.
Bases de Datos Disti!"idas (=-ina <1 de 41
Bases de Datos II
Re&las de crreccin de la +ra&'entacin
A #ontin"a#i$n se en"n#ian las tes e-las 6"e se @an de #".2li d"ante el 2o#eso de
3a-.enta#i$nB las #"ales ase-"a=n la a"sen#ia de #a.!ios se.=nti#os en la !ase de datos d"ante el
2o#eso.
1. Complecin. Si "na ela#i$n R se des#o.2one en "na seie de 3a-.entos R1, R2, ..., RnB
#ada ele.ento de datos 6"e 2"eda en#ontase en R de!e= 2ode en#ontase en "no o &aios
3a-.entos Ri. Esta 2o2iedad eEte.ada.ente i.2otante ase-"a 6"e los datos de la ela#i$n
-lo!al se 2o/e#tan so!e los 3a-.entos sin 2Cdida al-"na. Ten-a en #"enta 6"e en el #aso
@oi5ontal el ele.ento de datosB no.al.enteB es "na t"2laB .ientas 6"e en el #aso &eti#al es
"n ati!"to.
<. Reconstruccin. Si "na ela#i$n R se des#o.2one en "na seie de 3a-.entos R1, R2, ..., RnB
2"ede de3inise "na o2eado ela#ional tal 6"e el o2eado se= di3eente de2endiendo de las
di3eentes 3o.as de 3a-.enta#i$n. La e#onst"##i$n de la ela#i$n a 2ati de s"s 3a-.entos
ase-"a la 2ese&a#i$n de las esti##iones de3inidas so!e los datos en 3o.a de de2enden#ias.
3. Disyuncin. Si "na ela#i$n R se des#o.2one @oi5ontal.ente en "na seie de 3a-.entos R1,
R2, ..., RnB / "n ele.ento de datos di se en#"enta en al-Dn 3a-.ento RjB enton#es no se
en#"enta en oto 3a-.ento Rk Fk jG. Esta e-la ase-"a 6"e los 3a-.entos @oi5ontales sean
disj"ntos. Si "na ela#i$n R se des#o.2one &eti#al.enteB s"s ati!"tos 2i.aios #la&e
no.al.ente se e2iten en todos s"s 3a-.entos.
Alternati!as de asi&nacin
(atiendo del s"2"esto 6"e el !an#o de datos se @a/a 3a-.entado #oe#ta.enteB @a!= 6"e de#idi
so!e la .anea de asi-na los 3a-.entos a los distintos sitios de la ed. C"ando "na seie de datos se
Bases de Datos Disti!"idas (=-ina << de 41
Bases de Datos II
asi-nanB Cstos 2"eden e2li#ase 2aa .antene "na #o2ia. Las a5ones 2aa la C2li#a -ian en tono a la
se-"idad / a la e3i#ien#ia de las #ons"ltas de le#t"a. Si eEisten ."#@as e2od"##iones de "n ele.ento
de datosB en #aso de 3allo en el siste.a se 2od0a a##ede a esos datos "!i#ados en sitios distintos.
Ade.=sB las #ons"ltas 6"e a##eden a los .is.os datos 2"eden eje#"tase en 2aaleloB /a 6"e @a!= #o2ias
en di3eentes sitios. (o ota 2ateB la eje#"#i$n de #ons"ltas de a#t"ali5a#i$nB de es#it"aB i.2li#a0a la
a#t"ali5a#i$n de todas las #o2ias 6"e eEistan en la edB #"/o 2o#eso 2"ede es"lta 2o!le.=ti#o /
#o.2li#ado. (o tantoB "n !"en 2a=.eto 2aa a3onta el -ado de C2li#a #onsisti0a en so2esa la
#antidad de #ons"ltas de le#t"a 6"e se e3e#t"a=nB as0 #o.o el nD.eo de #ons"ltas de es#it"a 6"e se
lle&a=n a #a!o. En "na ed donde las #ons"ltas 6"e se 2o#esen sean .a/oitaia.ente de le#t"aB se
2od0a al#an5a "n alto -ado de C2li#aB no as0 en el #aso #ontaio. Una !ase de datos 3a-.entada es
a6"ella donde no eEiste C2li#a al-"na. Los 3a-.entos se alojan en sitios donde Dni#a.ente eEiste "na
#o2ia de #ada "no de ellos a lo la-o de toda la ed. En #aso de C2li#aB 2ode.os #onsidea "na !ase de
datos total.ente e2li#adaB donde eEiste "na #o2ia de todo el !an#o de datos en #ada sitioB o #onsidea
"na !ase de datos 2a#ial.ente e2li#ada donde eEistan #o2ias de los 3a-.entos "!i#ados en di3eentes
sitios. El nD.eo de #o2ias de "n 3a-.ento se= "na de las 2osi!les entadas a los al-oit.os de
asi-na#i$nB o "na &aia!le de de#isi$n #"/o &alo lo dete.ine el al-oit.o. La 3i-"a % #o.2aa las tes
altenati&as de C2li#a #on es2e#to a distintas 3"n#iones de "n siste.a de !ase de datos disti!"ido.
R2*lica ttal
R2*lica
*arcial
"articin
"rcesa'ient de cnsultas fcil dificultad similar
Gestin del directri fcil o ine!istente dificultad similar
Cntrl de cncurrencia moderado dif"cil fcil
Bases de Datos Disti!"idas (=-ina <3 de 41
Bases de Datos II
Se&uridad mu# alta alta ba$a
3Realidad posible aplicacin realista posible aplicacin
In+r'acin necesaria
Un as2e#to i.2otante en el dise:o de la disti!"#i$n es la #antidad de 3a#toes 6"e #onti!"/en a
"n dise:o $2ti.o. La o-ani5a#i$n l$-i#a de la !ase de datosB la lo#ali5a#i$n de las a2li#a#ionesB las
#aa#te0sti#as de a##eso de las a2li#a#iones a la !ase de datos / las #aa#te0sti#as del siste.a en #ada
sitioB tienen "na de#isi&a in3l"en#ia so!e la disti!"#i$n. La in3o.a#i$n ne#esaia 2aa el dise:o de la
disti!"#i$n 2"ede di&idise en #"ato #ate-o0as: la in3o.a#i$n del !an#o de datosB la in3o.a#i$n de la
a2li#a#i$nB la in3o.a#i$n so!e la ed de odenadoes / la in3o.a#i$n so!e los odenadoes en s0. Las
dos Dlti.as son de #a=#te #"antitati&o / se&i=nB 2in#i2al.enteB 2aa desaolla el 2o#eso de
asi-na#i$n. Se enta= en detalle so!e la in3o.a#i$n e.2leada #"ando se a!oden los distintos
al-oit.os de 3a-.enta#i$n / asi-na#i$n.
1RAG$ENTACI/N 4ORI5ONTAL:
Co.o se @a eE2li#ada anteio.enteB la 3a-.enta#i$n @oi5ontal se eali5a so!e las t"2las de la
ela#i$n. Cada 3a-.ento se= "n s"!#onj"nto de las t"2las de la ela#i$n. EEisten dos &aiantes de la
3a-.enta#i$n @oi5ontal: la 2i.aia / la dei&ada. La 3a-.enta#i$n @oi5ontal 2i.aia de "na ela#i$n
se desaolla e.2leando los 2edi#ados de3inidos en esa ela#i$n. (o el #ontaioB la 3a-.enta#i$n
@oi5ontal dei&ada #onsiste en di&idi "na ela#i$n 2atiendo de los 2edi#ados de3inidos so!e al-"na
ota.
Bases de Datos Disti!"idas (=-ina <4 de 41
Bases de Datos II
In+r'acin necesaria *ara la +ra&'entacin 6ri,ntal
Inormacin sobre la base de datos.
Esta in3o.a#i$n i.2li#a al es6"e.a #on#e2t"al -lo!al. Es i.2otante se:ala #$.o las ela#iones
de la !ase de datos se #one#tan #on otas. En "na #oneEi$n de ela#iones no.al.ente se deno.ina
ela#i$n 2o2ietaia a a6"ella sit"ada en la #ola del enla#eB .ientas 6"e se lla.a ela#i$n .ie.!o a la
"!i#ada en la #a!e#ea del &0n#"lo. Di#@o de ota 3o.a 2ode.os 2ensa en ela#iones de oi-en #"ando
nos e3ia.os a las 2o2ietaias / ela#iones destino #"ando lo @a-a.os #on las .ie.!o. De3inie.os
dos 3"n#iones: 2o2ietaia / .ie.!oB las #"ales 2o/e#ta=n "n #onj"nto de enla#es so!e "n #onj"nto de
ela#iones. Ade.=sB dado "n enla#eB de&ol&e=n el .ie.!o / el 2o2ietaio de la ela#i$nB
es2e#ti&a.ente. La in3o.a#i$n #"antitati&a ne#esaia -ia en tono a la #adinalidad de #ada ela#i$nB
notada #o.o cardFRG.
Inormacin sobre la aplicacin.
Ne#esitae.os tanto in3o.a#i$n #"alitati&a #o.o #"antitati&a. La in3o.a#i$n #"alitati&a -"ia= la
3a-.enta#i$nB .ientas 6"e la #"antitati&a se ne#esita= en los .odelos de asi-na#i$n. La 2in#i2al
in3o.a#i$n de #a=#te #"alitati&o son los 2edi#ados e.2leados en las #ons"ltas de "s"aio. Si no 3"ese
2osi!le in&esti-a todas las a2li#a#iones 2aa dete.ina estos 2edi#adosB al .enos se de!e0an in&esti-a
las .=s i.2otantes. (ode.os 2ensa en la e-la N17O<7N 2aa -"ianos en n"esto an=lisisB esta e-la di#e
6"e el <7P de las #ons"ltas eEistentes a##eden al 17P de los datos. Lle-ados a este 2"ntoB se0a
inteesante dete.ina los 2edi#ados si.2les.
A 2ate de los 2edi#ados si.2lesB las #ons"ltas e.2lean 2edi#ados .=s #o.2lejos es"ltado de
#o.!ina#iones l$-i#as de los si.2les. Una #o.!ina#i$n es2e#ial.ente inteesante es la #onj"n#i$n de
Bases de Datos Disti!"idas (=-ina <% de 41
Bases de Datos II
2edi#ados si.2lesB al 2edi#ado es"ltante se le deno.ina 2edi#ado .intC.ino. (atiendo de 6"e
sie.2e es 2osi!le tans3o.a "na eE2esi$n l$-i#a en s" 3o.a no.al #onj"nti&aB "sae.os los
2edi#ados .intC.ino en los al-oit.os 2aa no #a"sa nin-"na 2Cdida de -enealidad.
So!e la in3o.a#i$n #"antitati&a ne#esaia elati&a a las a2li#a#ionesB ne#esitae.os de3ini dos
#onj"ntos de datos.
1. Sele#ti&idad .intC.ino. Es el nD.eo de t"2las de "na ela#i$n a las 6"e a##ede "na #ons"lta de
a#"edo a "n 2edi#ado .intC.ino dado. (o eje.2loB en el eje.2lo anteioB la sele#ti&idad de .!
es 7 /a 6"e no eEiste nin-"na t"2la 6"e satis3a-a las #ondi#ionesH en #a.!ioB la sele#ti&idad de m1 es
<. Notae.os la sele#ti&idad de "n .intC.ino .i #o.o selFmiG.
<. ;e#"en#ia de a##eso. Es la 3e#"en#ia #on la 6"e "n "s"aio a##ede a los datos. Si " Q R#1, #2, ...,
##S es "n #onj"nto de #ons"ltas de "s"aioB accF#iG indi#a la 3e#"en#ia de a##eso a la #ons"lta #i en
"n 2eiodo dado.
1ra&'entacin 6ri,ntal *ri'aria
Antes de 2esenta "n al-oit.o 3o.al 6"e lle&e a #a!o la 3a-.enta#i$n @oi5ontalB intentae.os
eE2li#a de .anea int"iti&a los 2o#esos de 3a-.enta#i$n @oi5ontal 2i.aia / dei&ada. La
3a-.enta#i$n @oi5ontal 2i.aia se de3ine #o.o "na o2ea#i$n de sele##i$n de las ela#iones
2o2ietaias del es6"e.a de la !ase de datos
A@oa de3inie.os la 3a-.enta#i$n @oi5ontal .=s 3o.al.ente. Un 3a-.ento @oi5ontal Ri de
"na ela#i$n R #ontiene todas las t"2las de R 6"e satis3a#en "n 2edi#ado .intC.ino mi. (o tantoB dado
"n #onj"nto de 2edi#ados .intC.ino $B eEisten tantos 3a-.entos @oi5ontales de la ela#i$n R #o.o
2edi#ados .intC.ino. Este #onj"nto de 3a-.entos @oi5ontales ta.!iCn se #ono#en #o.o #onj"ntos de
3a-.entos .intC.ino. En los 2=a3os si-"ientes se as".i= 6"e la de3ini#i$n de 3a-.entos
Bases de Datos Disti!"idas (=-ina <' de 41
Bases de Datos II
@oi5ontales se !asa en los 2edi#ados .intC.ino. Ade.=sB el 2i.e 2aso 2aa el al-oit.o de
3a-.enta#i$n #onsiste en esta!le#e "n #onj"nto de 2edi#ados #on #ietas 2o2iedades.
Un as2e#to i.2otante de los 2edi#ados si.2les es s" #o.2le#i$nB as0 #o.o s" .ini.alidad. Un
#onj"nto de 2edi#ados si.2les %r se di#e 6"e es #o.2leto si / solo si eEiste "na 2o!a!ilidad idCnti#a de
a##ede 2o #ada a2li#a#i$n a #"al6"ie 2a de t"2las 2etene#ientes a #"al6"ie 3a-.ento .intC.ino
6"e se de3ine de a#"edo #on %r. Se 2"ede a2e#ia #o.o la de3ini#i$n de #o.2le#i$n de "n #onj"nto de
2edi#ados si.2les di3iee de la e-la de #o.2le#i$n de la 3a-.enta#i$n.
El se-"ndo 2aso en el 2o#eso de 3a-.enta#i$n 2i.aia #onsiste en dei&a el #onj"nto de
2edi#ados .intC.ino 6"e 2"eden de3inise so!e los 2edi#ados del #onj"nto %r&. Estos 2edi#ados
.intC.ino esta!le#en los 3a-.entos #andidatos 2aa el 2o#eso de asi-na#i$n. El esta!le#i.iento de los
2edi#ados .intC.ino es ti&ialH la di3i#"ltad adi#a en el ta.a:o del #onj"nto de 2edi#ados .intC.inoB
6"e 2"ede se ."/ -ande Fde @e#@oB eE2onen#ial es2e#to al nD.eo de 2edi#ados si.2lesG. En el 2aso
si-"iente se 2esenta=n 3o.as de ed"#i el nD.eo de 2edi#ados .intC.ino ne#esaios 2aa la
3a-.enta#i$n.
El te#e 2aso a!odaB #o.o /a se @a #itadoB la eli.ina#i$n de al-"nos 3a-.entos .intC.ino 6"e
2"edan se ed"ndantes. Esta eli.ina#i$n se desaolla identi3i#ando a6"ellos .intC.inos 6"e 2"edan
es"lta #ontadi#toios so!e "n #onj"nto de i.2li#a#iones.
1ra&'entacin 6ri,ntal deri!ada
Una 3a-.enta#i$n @oi5ontal dei&ada se de3ine so!e "na ela#i$n .ie.!o de a#"edo a "na
o2ea#i$n de sele##i$n es2e#i3i#ada so!e s" 2o2ietaia. Se de!en deja #laos dos 2"ntos. (i.eoB el
enla#e ente las ela#iones 2o2ietaia / .ie.!o se de3ine #o.o "n e6"iJ/"nto. Se-"ndoB "n e6"iJ/"nto
2"ede desaollase a ta&Cs de se.i/"ntos. Este se-"ndo 2"nto es es2e#ial.ente i.2otante 2aa
Bases de Datos Disti!"idas (=-ina <, de 41
Bases de Datos II
n"estos 2o2$sitosB /a 6"e desea.os 3a##iona "na ela#i$n .ie.!o se-Dn la 3a-.enta#i$n de s"
2o2ietaiaB ade.=s es ne#esaio 6"e el 3a-.ento es"ltante se de3ina Dni#a.ente so!e los ati!"tos de
la ela#i$n .ie.!o.
Las tes entadas ne#esaias 2aa desaolla la 3a-.enta#i$n @oi5ontal dei&ada son las
si-"ientes: el #onj"nto de 2ati#iones de la ela#i$n 2o2ietaiaB la ela#i$n .ie.!o / el #onj"nto se
2edi#ados es"ltados de a2li#a el se.iJ/"nto ente la 2o2ietaia / la .ie.!o. El al-oit.o de
3a-.enta#i$n es"lta tan ti&ial 6"e no se &e la ne#esidad de enta en detalles.
EEiste "na 2osi!le #o.2li#a#i$n 6"e ne#esita n"esto est"dio. En "n es6"e.a de !ase de datosB
es"lta 3e#"ente 6"e eEistan .=s de dos enla#es so!e "na ela#i$n R. En este #asoB a2ae#en .=s de "na
2osi!ilidad de 3a-.enta#i$n @oi5ontal dei&ada. La de#isi$n 2aa ele-i "na " ota se !asa en dos
#iteios: UnoB la 3a-.enta#i$n #on .ejoes #aa#te0sti#as de /"nto. DosB la 3a-.enta#i$n e.2leada en
.=s a2li#a#iones.
Dis#"ta.os el se-"ndo #iteio 2i.eo. Res"lta sen#illo de esta!le#e si to.a.os en #onsidea#i$n
la 3e#"en#ia #on la 6"e #ada a2li#a#i$n a##ede a los datos. Si es 2osi!leB de!e0a.os intenta 3a#ilita el
a##eso a los "s"aios 6"e @a-an .a/o "so de los datos 2aaB de esta .aneaB .ini.i5a el i.2a#to total
del endi.iento del siste.a.
Figura %. &rafo de #untos entre fragmentos.
Bases de Datos Disti!"idas (=-ina <1 de 41
Bases de Datos II
El 2i.e #iteioB sin e.!a-oB no es tan sen#illo. ConsideeB 2o eje.2loB la 3a-.enta#i$n
eE2"esta en el eje.2lo 1. El o!jeti&o de esta 3a-.enta#i$n #onsiste en !ene3i#ia a la #ons"lta 6"e @a-a
"so de las dos ela#iones al 2ode eali5ase el /"nto de CLIENTES / (ROVINC so!e ela#iones .=s
2e6"e:as Fes de#iB 3a-.entosGB / 2osi!ilita la #on3e##i$n de /"ntos de .anea disti!"ida. El 2i.e
as2e#to es"lta o!&io. Los 3a-.entos de CLIENTES son .=s 2e6"e:os 6"e la 2o2ia ela#i$n
CLIENTES. (o tantoB es"lta= .=s =2ido lle&a a #a!o el /"nto de "n 3a-.ento de (ROVINC #on oto
de CLIENTES 6"e ta!aja #on las 2o2ias ela#iones. El se-"ndo 2"ntoB sin e.!a-oB es .=s i.2otante
/a 6"e es la esen#ia de las !ases de datos disti!"idas. SiB ade.=s de esta eje#"tando "n nD.eo de
#ons"ltas en di3eentes sitiosB 2ode.os eje#"ta "na #ons"lta en 2aaleloB se es2ea 6"e el tie.2o de
es2"esta del siste.a a".ente. En el #aso de /"ntosB esto es 2osi!le !ajo #ietas #i#"nstan#ias.
ConsideeB 2o eje.2loB el -a3o de /"nto Flos enla#esG ente los 3a-.entos de CLIENTES / la dei&ada
(ROVINC. >a/ Dni#a.ente "n enla#e entando o saliendo de "n 3a-.ento. De a@0B 6"e se deno.ine a
este -a3oB -a3o si.2le. La &entaja de este dise:o donde la ela#i$n de /"nto ente los 3a-.entos es
si.2leB adi#a en la asi-na#i$n a "n sitio tanto de la 2o2ietaia #o.o de la .ie.!o / los /"ntos ente
2aes di3eentes de 3a-.entos 2"eden eali5ase inde2endiente.ente / en 2aalelo. Des-a#iada.enteB la
o!ten#i$n de -a3os de /"nto si.2les no sie.2e es 2osi!le. En tal #asoB la .ejo altenati&a se0a eali5a
"n dise:o 6"e 2o&o6"e "n -a3o de /"ntos 3a-.entados. Un -a3o 3a-.entado #onsiste en dos o .=s
s"!-a3os 6"e no est=n enla5ados ente ellos. (o tantoB los 3a-.entos 6"e se o!ten-an no se disti!"i=n
2aa eje#"#iones 2aalelas de "n .odo tan 3=#il #o.o a6"ellos o!tenidos a ta&Cs de -a3os si.2lesB 2eo
s" asi-na#i$n aDn se= 2osi!le.
(o#edee.os a@oa a 2o!a la #oe##i$n de los al-oit.os 2esentados #on es2e#to a los tes
#iteios en"n#iados 2=-inas at=s.
1. Complecin. La #o.2le#i$n de "na 3a-.enta#i$n @oi5ontal 2i.aia se !asa en la sele##i$n de los
2edi#ados a "sa. En la .edida 6"e los 2edi#ados sele##ionados sean #o.2letosB se -aanti5a= 6"e
el es"ltado de la 3a-.enta#i$n ta.!iCn lo se=. (atiendo de la !ase 6"e el al-oit.o de
3a-.enta#i$n es "n #onj"nto de 2edi#ados #o.2letos / .0ni.os %r&B se -aanti5a la #o.2le#i$n
Bases de Datos Disti!"idas (=-ina <4 de 41
Bases de Datos II
sie.2e 6"e no a2ae5#an eoes al eali5a la de3ini#i$n de %r&. La #o.2le#i$n de "na 3a-.enta#i$n
@oi5ontal dei&ada es al-o .=s di30#il de de3ini. La di3i#"ltad &iene dada 2o el @e#@o de 6"e los
2edi#ados 6"e inte&ienen en la 3a-.enta#i$n 3o.an 2ate de dos ela#iones. De3ina.os la e-la de
#o.2le#i$n 3o.al.ente. Sea R la ela#i$n .ie.!o de "n enla#e #"/a 2o2ietaia es la ela#i$n 'B la
#"al est= 3a-.entada #o.o F' Q R'1, '2, ..., '(S. Ade.=sB sea A el ati!"to de /"nto ente R / '.
Enton#es 2aa #ada t"2la t de RB eEisti= "na t"2la t& de ' tal 6"e tTAU Q t&TAU.
<. Reconstruccin. La e#onst"##i$n de "na ela#i$n -lo!al a 2ati de s"s 3a-.entos se desaolla
#on el o2eado de "ni$n tanto 2aa la 3a-.enta#i$n @oi5ontal 2i.aia #o.o 2aa la dei&ada.
3. Disyuncin. Res"lta sen#illo esta!le#e la dis/"n#i$n de la 3a-.enta#i$n tanto 2aa la 2i.aia
#o.o 2aa la dei&ada. En el 2i.e #asoB la dis/"n#i$n se -aanti5a en la .edida en 6"e los
2edi#ados .intC.ino 6"e dete.inan la 3a-.enta#i$n son ."t"a.ente eE#l"si&os. En la
3a-.enta#i$n dei&adaB sin e.!a-oB i.2li#a "n se.iJ/"nto 6"e a:ade #o.2lejidad al as"nto. La
dis/"n#i$n 2"ede -aanti5ase si el -a3o de /"nto es si.2le. Si no es si.2leB se= ne#esaio
in&esti-a los &aloes de las t"2las. En -enealB no se desea j"nta "na t"2la de "na ela#i$n .ie.!o
#on dos o .=s t"2las de "na ela#i$n 2o2ietaia #"ando estas t"2las se en#"entan en 3a-.entos
di3eentes a los de la 2o2ietaia. Esto no es 3=#il de esta!le#eB e il"sta 2o 6"C los es6"e.as de la
3a-.enta#i$n dei&ada 6"e -enean "n -a3o de /"nto si.2le son sie.2e .=s ata#ti&os.
1RAG$ENTACI/N VERTICAL:
Intrduccin
Re#"Cdese 6"e la 3a-.enta#i$n &eti#al de "na ela#i$n R 2od"#e "na seie de 3a-.entos R1,
R2, ..., RrB #ada "no de los #"ales #ontiene "n s"!#onj"nto de los ati!"tos de R as0 #o.o la #la&e
2i.aia de R. El o!jeti&o de la 3a-.enta#i$n &eti#al #onsiste en di&idi la ela#i$n en "n #onj"nto de
Bases de Datos Disti!"idas (=-ina 37 de 41
Bases de Datos II
ela#iones .=s 2e6"e:as tal 6"e al-"nas de las a2li#a#iones de "s"aio s$lo @a-an "so de "n 3a-.ento.
So!e este .a#oB "na 3a-.enta#i$n $2ti.a es a6"ella 6"e 2od"#e "n es6"e.a de di&isi$n 6"e
.ini.i5a el tie.2o de eje#"#i$n de las a2li#a#iones 6"e e.2lean esos 3a-.entos.
La 2ati#i$n &eti#al es"lta .=s #o.2li#ada 6"e la @oi5ontal. Esto se de!e al a".ento del nD.eo
total de altenati&as 6"e tene.os dis2oni!les. (o eje.2loB en la 2ati#i$n @oi5ontalB si el nD.eo total de
2edi#ados si.2les de %r es nB eEisten <n 2edi#ados .intC.inos 2osi!les 6"e 2"edan de3inise. Ade.=sB
sa!e.os 6"e al-"nos de estos 2edi#ados es"lta=n #ontadi#toios #on al-"nas de las a2li#a#iones
eEistentesB 2o lo 6"e 2ode.os ed"#i el nD.eo ini#ial. En el #aso &eti#alB si "na ela#i$n tiene m
ati!"tos #la&e no 2i.aiosB el nD.eo de 2osi!les 3a-.entos es i-"al a )FmGB es de#i el .JCsi.o
nD.eo de Bell T3U. (aa &aloes -andes de mB )FmG m
m
H 2o eje.2loB 2aa m Q 17B )FmG 11%.777B 2aa m
Q 1%B )FmG 174B 2aa m Q 37B )FmG Q 17<3.
Estos &aloes indi#an 6"e la o!ten#i$n de "na sol"#i$n $2ti.a de la 3a-.enta#i$n &eti#al
es"lta= "na taea inDtilB sino nos a2o/a.os en el "so de @e"0sti#os. EEisten dos en3o6"es @e"0sti#os
2aa la 3a-.enta#i$n &eti#al de ela#iones:
1. Agrupacin. Co.ien5a asi-nando #ada ati!"to a "n 3a-.entoB / en #ada 2asoB j"nta al-"nos de los
3a-.entos @asta 6"e satis3a#e "n dete.inado #iteio. La a-"2a#i$n s"-ii$ en 2in#i2io 2aa !ases
de datos #entali5adas / se "s$ 2osteio.ente 2aa las !ases de datos disti!"idas.
<. Escisin. A 2ati de la ela#i$n se de#iden 6"e 3a-.entos es"ltan .ejoesB !as=ndose en las
#aa#te0sti#as de a##eso de las a2li#a#iones a los ati!"tos. Esta tC#ni#a se 2esent$B ta.!iCnB 2aa
!ases de datos #entali5adas. (osteio.enteB se eEtendi$ al entono disti!"ido.
En este do#".ento se tata= Dni#a.ente la tC#ni#a de es#isi$nB /a 6"e es .=s a2o2iada 2aa la
estate-ia des#endente / 2o6"e es"lta .=s 2o!a!le en#onta la sol"#i$n 2aa la ela#i$n entea 6"e a
2ati de "n #onj"nto de 3a-.entos #on "n Dni#o ati!"to. Ade.=sB la es#isi$n -enea 3a-.entos no
sola2ados .ientas 6"e la a-"2a#i$n no.al.ente 2od"#e 3a-.entos sola2ados. Dento del #onteEto
Bases de Datos Disti!"idas (=-ina 31 de 41
Bases de Datos II
de los siste.as de !ases de datos disti!"idosB son 2e3ei!les los 3a-.entos no sola2ados 2o a5ones
o!&ias. E&idente.enteB los 3a-.entos no sola2ados se e3ieen Dni#a.ente a ati!"tos #la&e no
2i.aios.
Antes de #o.en5aB &a.os a a#laa "n 2o!le.a: la C2li#a de las #la&es de la ela#i$n en los
3a-.entos. Esta es "na #aa#te0sti#a de la 3a-.enta#i$n &eti#al 6"e 2e.ite la e#onst"##i$n de la
ela#i$n -lo!al. (o tantoB la es#isi$n #onsidea Dni#a.ente a6"ellos ati!"tos 6"e no son 2ate de la #la&e
2i.aia.
La C2li#a de los ati!"tos #la&e s"2one "na -an &entajaB a 2esa de los 2o!le.as 6"e 2"eda
#a"sa. La &entaja est= ela#ionada #on el es3"e5o 2aa .antene la inte-idad se.=nti#a. Ten-a en
#"enta 6"e #ada de2enden#ia F3"n#ionalB ."lti&al"ada ...G esB de @e#@oB "na esti##i$n 6"e in3l"/e so!e
el &alo de los ati!"tos de las es2e#ti&as ela#iones en todo .o.ento. Ta.!iCn ."#@as de estas
de2enden#ias i.2li#an a los ati!"tos #la&e de "na ela#i$n. Si 6"ee.os dise:a "na !ase de datos tal
6"e los ati!"tos #la&e sean 2ate de "na 3a-.ento 6"e est= "!i#ado en "n sitioB / los ati!"tos
ela#ionados sean 2ate de oto 3a-.ento asi-nado a "n se-"ndo sitioB #ada 2eti#i$n de a#t"ali5a#i$n
2o&o#a= la &ei3i#a#i$n de inte-idad 6"e ne#esita= de "na #o."ni#a#i$n ente esos sitios. La C2li#a de
los ati!"tos #la&e de #ada 3a-.ento ed"#e esta 2o!le.=ti#aB 2eo no eli.ina toda s" #o.2lejidadB /a
6"e la #o."ni#a#i$n 2"ede se ne#esaia 2aa las esti##iones de inte-idad 6"e i.2li#an a las #la&es
2i.aiasB as0 #o.o 2aa el #ontol de #on#"en#ia.
Una 2osi!le altenati&a a la C2li#a de los ati!"tos #la&e es el e.2leo de identi3i#adoes de t"2lasB
6"e son &aloes Dni#os asi-nados 2o el siste.a a las t"2las de "na ela#i$n. *ientas el siste.a
.anten-a los identi3i#adoesB los 3a-.entos 2e.ane#e=n disj"ntos.
In+r'acin necesaria *ara la +ra&'entacin !ertical
Bases de Datos Disti!"idas (=-ina 3< de 41
Bases de Datos II
La 2in#i2al in3o.a#i$n 6"e ne#esitae.os se e3ei= a las a2li#a#iones. (o tantoB este 2"nto
tata= de es2e#i3i#a la in3o.a#i$n 6"e de "na a2li#a#i$n 6"e 3"n#iona so!e la !ase de datos 2oda.os
eEtae. Teniendo en #"enta 6"e la 3a-.enta#i$n &eti#al #olo#a en "n 3a-.ento a6"ellos ati!"tos a los
6"e se a##ede de .anea si."lt=neaB ne#esitae.os al-"na .edida 6"e de3ina #on .=s 2e#isi$n el
#on#e2to de si."ltaneidad. Esta .edida es la a3inidad de los ati!"tosB 6"e indi#a la ela#i$n este#@a
eEistente ente los ati!"tos. Des-a#iada.enteB no es ."/ ealista es2ea 6"e el dise:ado o los "s"aios
2"edan es2e#i3i#a estos &aloes. (o elloB 2esentae.os "na 3o.a 2o la #"al o!ten-a.os esos &aloes
2atiendo de datos .=s !=si#os.
El 2in#i2al dato ne#esaio elati&o a las a2li#a#iones es la 3e#"en#ia de a##eso. Sea " Q R#1,
#2, ..., ##S el #onj"nto de #ons"ltas de "s"aio Fa2li#a#ionesG 6"e 3"n#ionan so!e "na ela#i$n R*A1,
A2, ..., AnG.
Los &e#toes "soF6iBG 2"eden de3inise ."/ 3=#il.ente 2aa #ada a2li#a#i$n sie.2e 6"e el
dise:ado #ono5#a las a2li#a#iones eEistentes en el siste.a. La e-la 17O<7 eE2"esta 2=-inas at=s 2od0a
es"lta Dtil 2aa el desaollo de esta taea.
Los &aloes del "so de los ati!"tos en -eneal no son s"3i#ientes 2aa desaolla la !ase de la
es#isi$n / la 3a-.enta#i$n de los ati!"tosB /a 6"e estos &aloes no e2esentan el 2eso de las 3e#"en#ias
de la a2li#a#i$n. La di.ensi$n de esta 3e#"en#ia 2"ede in#l"ise en la de3ini#i$n de la .edida de los
ati!"tos a3ines adFAi, AjGB la #"al .ide el l0.ite ente dos ati!"tos de "na ela#i$n de a#"edo a #$.o las
a2li#a#iones a##eden a ellos.
1RAG$ENTACI/N $I7TA O 4%BRIDA:
Bases de Datos Disti!"idas (=-ina 33 de 41
Bases de Datos II
En ."#@os #asos la 3a-.enta#i$n &eti#al " @oi5ontal del es6"e.a de la !ase de datos no se=
s"3i#iente 2aa satis3a#e los e6"isitos de las a2li#a#iones. Co.o /a se #it$ al #o.ien5o de este
do#".ento 2ode.os #o.!ina a.!asB "tili5ando 2o ello la deno.inada 3a-.enta#i$n .iEta. C"ando al
2o#eso de 3a-.enta#i$n &eti#al le si-"e "na @oi5ontalB es de#iB se 3a-.entan @oi5ontal.ente los
3a-.entos &eti#ales es"ltantesB se @a!la de la 3a-.enta#i$n .iEta >V. En el #aso #ontaioB estae.os
ante "na 3a-.enta#i$n V>. Una #aa#te0sti#a #o.Dn a a.!as es la -enea#i$n de =!oles 6"e
e2esentan la est"#t"a de 3a-.enta#i$n F&ea la 3i-"a 1G.
ConsideeB 2o eje.2loB la ela#i$n (ROVINC. Re#oda= 6"e se le a2li#$ "na 3a-.enta#i$n
@oi5ontal de a#"edo al &alo del ati!"to CCOD?ONA es"ltando #"ato 3a-.entos @oi5ontales.
(od0a.os 2ensa en a2li#ale "na n"e&a 3a-.enta#i$n de #a=#te &eti#al. Enton#es es"lta0an #"ato
3a-.entos @oi5ontales di&ididosB 2o eje.2loB en dos 3a-.entos &eti#ales. En este #aso el nD.eo
total de 3a-.entos as#ende0aB l$-i#a.enteB a o#@o.
Bases de Datos Disti!"idas (=-ina 34 de 41
Bases de Datos II
Figura '. Estructura arbrea de fragmentacin mi!ta.
No se desea enta en eE#esi&os detalles so!e las e-las / #ondi#iones 2aa e3e#t"a la
3a-.enta#i$n .iEta. Ente otas a5ones 2o6"eB tanto a la 3a-.enta#i$n >V #o.o la 3a-.enta#i$n
V>B se le 2"eden a2li#a los .is.os #iteios / e-las 6"e a la 3a-.enta#i$n @oi5ontal / &eti#al. Es
de#iB &ol&iendo al eje.2lo anteioB al #"al le 2a#ti#a.os la 3a-.enta#i$n >VB al eali5a la
3a-.enta#i$n @oi5ontal tal #o.o se @a eE2"estoB lo 6"e se o!tienen no son .=s 6"e s"!ela#ionesB la
"ni$n de las #"ales da l"-a a la ela#i$n (ROVINC. (o tantoB 2aa 3a-.enta #ada s"!ela#i$n se0a
2e3e#ta.ente &ia!le a2li#ale el .Ctodo de 3a-.enta#i$n &eti#al 6"e se @a desaollado. Co.oB en este
#asoB se @an 6"eido -enea dos 3a-.entos &eti#ales 2o #ada "no @oi5ontalB si.2le.ente de!e0a.os
#on3e##iona la .ati5 de -"2os a3ines Fa ta&Cs del al-oit.o )+AG 2aa #ada 3a-.ento @oi5ontal /
a2li#aleB 2osteio.enteB el al-oit.o de 3a-.enta#i$n !inaia (ARTICI9N.
Ta.!iCn de!e tenese en #"enta el nD.eo de ni&eles a!$eos 6"e se -eneenB es de#iB nadie
i.2ide 6"e tas eali5a "na 3a-.enta#i$n V>B 2oda.os a2li#a a los 3a-.entos es"ltantes "na n"e&a
3a-.enta#i$n &eti#alB / a estos Dlti.os "na n"e&a 3a-.enta#i$n @oi5ontalB et#. Di#@o nD.eo 2"ede
se -andeB 2eo ta.!iCn se= #ieta.ente 3inito. En el #aso @oi5ontalB el ni&el .=Ei.o de 2o3"ndidad se
al#an5a= #"ando #ada 3a-.ento al!e-"e "na Dni#a t"2laB .ientas 6"e en el #aso &eti#al el 3inal lle-a=
#"ando #ada 3a-.ento #onten-a "n Dni#o ati!"to. Sin e.!a-oB a"n6"e no de!a to.ase #o.o do-.aB
el nD.eo de ni&eles no de!e0a s"2ea el 2a FV> / >VG. El 2o6"C de esta a3i.a#i$n es !ien sen#illoB
2ienseB 2o eje.2loB en el #oste 6"e s"2ond0a eali5a la "ni$n o el /"nto de "na ela#i$n #on
3a-.enta#i$n ni&el ,. E&idente.enteB el #oste se0a ."/ ele&ado / ese a".ento de endi.iento 6"e se
2esi-"e al a2li#a estas tC#ni#asB 6"i5=sB no se 2od"5#a.
Antes de 2asa a est"dia el 2o!le.a de la asi-na#i$n se desea #o.enta la tC#ni#a de
3a-.enta#i$n .iEta !asada en #eldas T<U. Esta tC#ni#a se !asa en la -enea#i$n de #eldas de ejilla. V"C
es "na #elda de ejillaB 2od0a.os de3inila #o.o "n 3a-.ento @oi5ontal / &eti#al si."lt=neo. La
Bases de Datos Disti!"idas (=-ina 3% de 41
Bases de Datos II
tC#ni#a a2li#a "n al-oit.o de 3a-.enta#i$n &eti#al / oto @oi5ontal de .anea #on#"ente so!e la
ela#i$n. Los al-oit.os eali5an "na 3a-.enta#i$n .=Ei.aB es de#iB se 2esi-"e 6"e en #ada #elda
Dni#a.ente @a/a "n ati!"to / "na t"2la. V"i5= el le#to 2"eda en#onta el .Ctodo #ontadi#toio #on lo
#itado anteio.ente es2e#to a la e3i#ien#iaB dada la -an #antidad de 3a-.entos -eneadosB el nD.eo
esB e3e#ti&a.enteB el .=Ei.o. Sin e.!a-oB este s$lo es el 2i.e 2aso del 2o#eso. Una &e5 -eneadas las
#eldas se a2li#a "n .Ctodo 2aa o2ti.i5a la ejilla .ediante 3"si$n o des3a-.enta#i$nB de a#"edoB
3"nda.ental.enteB a las a2li#a#iones 6"e a#tDen so!e esos 3a-.entos. El .CtodoB 2o tantoB 2esi-"e
"na 3a-.enta#i$n los .=s es2e#03i#a 2osi!le a#ode #on las a2li#a#iones / los sitios eEistentes en la ed.
In+r'acin necesaria
En esta eta2a de la asi-na#i$nB ne#esitae.os datos #"antitati&os so!e la !ase de datosB las
a2li#a#iones 6"e 3"n#ionan so!e ellaB la ed de #o."ni#a#ionesB las #aa#te0sti#as de 2o#esoB / el l0.ite
de al.a#ena.iento de #ada sitio de la ed. (o#edee.os a dis#"tilos en detalle.
Informacin de la base de datos. (aa desaolla la 3a-.enta#i$n @oi5ontalB de3ini.os la
sele#ti&idad de los .intC.inos. A@oaB ne#esita.os eEtende esta de3ini#i$n a los 3a-.entos / de3ini la
sele#ti&idad de "n 3a-.ento Fj #on es2e#to a "na #ons"lta #i. Es el nD.eo de t"2las de Fj a las 6"e se
ne#esita a##ede 2aa 2o#esa #i. Este &alo lo notae.os #o.o seliFFjG. Oto ele.ento in3o.ati&o de los
3a-.entos de la !ase de datos es s" ta.a:o. El ta.a:o de "n 3a-.ento Fj &iene dado 2o tama,oFFjG Q
cardFFjGWlongFFjGB donde lon-F;jG es la lon-it"d Fen o#tetosG de "na t"2la del 3a-.ento ;j.
Informacin de los sitios. So!e #ada odenado ne#esita.os #ono#e s"s #a2a#idades de
2o#esa.iento / al.a#ena.iento. O!&ia.enteB estos &aloes 2"eden #al#"lase a ta&Cs de 3"n#iones
ela!oadas o 2o si.2les esti.a#iones. La "nidad de #oste de al.a#ena datos en el sitio 'k se= denotada
#o.o U-Ak. As0 .is.oB es2e#i3i#ae.os #o.o .edida de #oste U%.k al #oste de 2o#esa "na "nidad de
Bases de Datos Disti!"idas (=-ina 3' de 41
Bases de Datos II
ta!ajo en el sitio 'k. La "nidad de ta!ajo de!e0a se idCnti#a a a6"ella "tili5ada en las .edidas RR /
UR.
Informacin sobre la red. En n"esto .odelo as".ie.os la eEisten#ia de "na ed si.2le donde el
#oste de #o."ni#a#iones se de3ine es2e#to a "na ta.a de datos. Enton#es gij nota el #oste de
#o."ni#a#i$n 2o ta.a ente los sitios 'i / 'j. (aa 2e.iti el #=l#"lo del nD.eo de .ensajesB
"sae.os tama,o #o.o el ta.a:o Fen o#tetosG de "na ta.a. Es e&idente 6"e eEisten .odelos de ed
."#@o .=s ela!oados 6"e to.an en #"enta las #a2a#idades del #analB las distan#ias ente sitiosB las
#aa#te0sti#as del 2oto#oloB et#. Sin e.!a-oB se #ee 6"e la dei&a#i$n de estas e#"a#iones se sale 3"ea
de este do#".ento.
"ROCESA$IENTO DISTRIBUIDO DE CONSULTAS
EEisten &aios .edios 2aa #al#"la la es2"esta a "na #ons"lta. En el #aso de siste.as
#entali5adoB el #iteio 2in#i2al 2aa dete.ina el #osto de "na estate-ia es2e#i3i#a es el nD.eo de
a##esos al dis#o. En "n siste.a disti!"ido es 2e#iso tene en #"enta otos 3a#toesB #o.o son:
El #osto de tans.isi$n de datos en la ed.
El !ene3i#io 2oten#ial 6"e s"2ond0a en la eje#"#i$n el 6"e &aias lo#alidades 2o#esaan en 2aalelo
2ates de la #ons"lta.
El #osto elati&o de la tans3een#ia de datos en la ed / la tans3een#ia de datos ente la .e.oia
/ el dis#o &aia en 3o.a #onsidea!leB de2endiendo del ti2o de ed / de la &elo#idad de los dis#os. (o
tantoB en "n #aso -enealB no 2ode.os tene en #"enta solo los #ostos del dis#o o los de la ed. es
ne#esaio lle-a a "n e6"ili!io ade#"ado ente los dos.
Bases de Datos Disti!"idas (=-ina 3, de 41
Bases de Datos II
Re*eticin ( +ra&'entacin
Considee "na #ons"lta ."/ sen#illa: en#onta todas las t"2las de la ela#i$n de2$sito. A"n6"e la
#ons"lta es ."/ si.2leB de @e#@o es ti&ialH s" 2o#esa.iento no es ti&ialB /a 6"e es 2osi!le 6"e la
ela#i$n de2$sito estC 3a-.entadaB e2etido o las dos #osasB #o.o /a se &io. Si la ela#i$n de2osito est=
e2etidaB es 2e#iso de#idi 6"C #o2ia se &a a "tili5a. Si nin-"na de las #o2ias est= 3a-.entadaB se eli-e
la #o2ia 6"e i.2li6"e #ostos de tans.isi$n .=s ed"#idos. (eo si "na #o2ia est= 3a-.entadaB la
ele##i$n no se tan sen#illaB /a 6"e es 2e#iso #al#"la &aios 2od"#tos o "niones 2aa e#onst"i la
ela#i$n de2$sito. En tal #asoB el nD.eo de estate-ias 2aa este eje.2lo sen#illo 2"ede se -ande. De
@e#@oB la ele##i$n de "na estate-ia 2"ede se "na taea tan #o.2leja #o.o @a#e "na #ons"lta a!itaia.
"rcesa'ient de interseccin si'*le
Considee la eE2esi$n en =l-e!a ela#ional:
#liente E de2osito E s"#"sal
S"2one.os 6"e nin-"na de las tes ela#iones est= e2etida o 3a-.entada / 6"e #liente est=
al.a#enada en la lo#alidad L#B de2osito en la Ld / s"#"sal en la L!. Sea Li la lo#alidad donde se oi-in$ la
#ons"lta. El siste.a de!e 2od"#i el es"ltado en la lo#alidad Li. Ente las 2osi!les estate-ias 2aa
2o#esa esta #ons"lta se en#"entan las si-"ientes:
En&ia #o2ias de las tes ela#iones a la lo#alidad Li. Al e.2lea las tC#ni#as de 2o#esa.iento de
#ons"ltaB es#o-e "na estate-ia 2aa 2o#esa en 3o.a lo#al la #ons"lta #o.2leta en Li.
En&ia "na #o2ia de la ela#i$n #liente a la lo#alidad Li / #al#"la #liente E de2$sito de Ld. En&ia
#liente E de2$sito de Ld a L!B donde se #al#"la F#liente E de2$sitoG E s"#"sal. El es"ltado de esta
o2ea#i$n es en&iado a Li.
Bases de Datos Disti!"idas (=-ina 31 de 41
Bases de Datos II
("eden ela!oase estate-ias si.ilaes a la anteio al inte#a.!ia los 2a2eles de L#B Ld / L!.
No 2"ede -aanti5ase 6"e "na estate-ia sea la .ejo en todos los #asos. ente los 3a#toes 6"e
de!en to.ase en #"enta est=n la #antidad de datos 6"e de!e tans.itiseB el #osto de tans.iti "n !lo6"e
de datos ente dos lo#alidades dete.inadas / la &elo#idad de 2o#esa.iento elati&a en #ada lo#alidad.
Estrate&ias de interseccin utili,and el *aralelis'
Considee "n 2od"#to de #"ato ela#iones:
1 E < 3 4
donde la ela#i$n 1 est= al.a#enada en la lo#alidad Li. S"2one.os 6"e el es"ltado @a de
2esentase en la lo#alidad Li. EEistenB 2o s"2"esto ."#@as estate-ias 6"e se 2"eden #onsidea. Un
.Ctodo ata#ti&o se0a "tili5a la estate-ia de intese##i$n en#a"5ada. (o eje.2loB se 2"ede en&ia 1 a
L< / #al#"la 1 E < en L<. al .is.o tie.2o se 2"ede en&ia 3 a L4 / #al#"la 3 E 4 en L4.
La lo#alidad L< 2"ede en&ia t"2las de F1 E <G a Li #on3o.e se &a/an 2od"#iendoB en &e5 de
es2ea a 6"e se #al#"le el 2od"#to #o.2leto. De 3o.a si.ilaB L4 2"de en&ia t"2las de F3 E 4G a Li.
Una &e5 6"e las t"2las de F1 E <G / F3 E 4G lle-"en a LiB esta lo#alidad 2od= e.2e5a el #=l#"lo de F1
E <G E F3 E 4G en 2aalelo #on el #=l#"lo de F1 E <G en L< / de F3 E 4G en L4.
Estrate&ia de se'interseccin
S"2one 6"e desea.os #al#"la la eE2esi$n 1 E <B donde 1 / < est=n al.a#enados en las
lo#alidades L1 / L< es2e#ti&a.ente. Sean R1 / R< los es6"e.as de 1 / <. S"2one 6"e 6"ee.os o!tene
el es"ltado en L1. Si @a/ ."#@as t"2las de < 6"e no intese##ionan #on nin-"na de 1B enton#es el en&0o
Bases de Datos Disti!"idas (=-ina 34 de 41
Bases de Datos II
de < a S1 e6"iee el en&0o de t"2las 6"e no #onti!"/en al es"ltado. Es #on&eniente !oa tales t"2las
antes de en&ia los datos a L1B 2ati#"la.ente si los #ostos de la ed son ."/ ele&ados.
(aa @a#elo &e.os la si-"iente estate-ia:
1. Cal#"la te.21 1 < F1G en L1.
<. en&ia te.21 de L1 a L<.
3. Cal#"la te.2< < E te.21 en L<.
4. En&ia te.2< de L< a L1.
%. Cal#"la 1 E te.2< en L1.
La estate-ia anteio es &entajosa 2ati#"la.ente #"ando en el 2od"#to 2ati#i2an elati&a.ente
2o#as t"2las de <. Es 2o!a!le 6"e s"#eda esta sit"a#i$n si 1 es el es"ltado de "na eE2esi$n de =l-e!a
ela#ional 6"e #onten-a la sele##i$n.
Esta estate-ia es #ono#ida #o.o "na estate-ia de se.i2od"#toB des2"Cs del o2eado de
se.i2od"#toB indi#ado 2o EB de =l-e!a ela#ional.
CONCLUSIONES # CONSIDERACIONES:
A lo la-o de este do#".ento se @a intentado da "na &isi$n -lo!al / -enCi#a de los 2o!le.as /
#aa#te0sti#as 6"e #ontiene el dise:o de "na !ase de datos disti!"ida. Se @a @e#@o es2e#ial @in#a2iC en
las tC#ni#as de 3a-.enta#i$n @oi5ontal / &eti#al a ta&Cs de .Ctodos / al-oit.os ."/ 3e#"entes en la
liteat"a e3eida al te.a. Se es2ea 6"e el le#to no @a/a tenido de.asiados 2o!le.as 2aa s"
Bases de Datos Disti!"idas (=-ina 47 de 41
Bases de Datos II
#o.2ensi$nB las tC#ni#as son sen#illas / se @a 2o#"ado in#l"i distintos eje.2los 2aa 3a#ilita el
entendi.iento. I-"al.enteB la 2"esta en 2=#ti#a de los al-oit.osB es de#iB s" #odi3i#a#i$nB no es "n
2o#eso #o.2li#ado si se 2oseen no#iones en el desaollo de al-oit.os. (ienseB 2o eje.2loB 6"e los dos
al-oit.os de 2ati#i$n &eti#al 2esentadosB no @a#en .=s 6"e .ani2"la .ati#es.
Ta.!iCn de!e0a tenese 2esente la eEisten#ia de en3o6"es de 3a-.enta#i$n distintos /B
2osi!le.enteB .=s #o.2lejosB 2eo se de!e 2ensa 6"e .=s e3i#ientes. SeanB 2o eje.2loB las tC#ni#as de
3a-.enta#i$n &eti#al !asadas en -a3osB #o.o el al-oit.o de Na&at@e / Ra 6"e -enea en "n solo 2aso
3a-.entos &eti#ales. Ade.=sB est=n a2ae#iendo .Ctodos de 3a-.enta#i$n .iEta #o.o el 6"e se @a
#o.entado. Si !ienB estos .Ctodos son en3o6"es 3o.ales .=s 6"e 2=#ti#osB desaollados 2o insi-nes
in&esti-adoes en "ni&esidadesB 2o tantoB lejos toda&0a de s" desaollo #o.e#ial.
(ese a la a2ai#i$n de los .Ctodos de !ases de datos disti!"idas @a#e /a a:osB 2ae#e 6"e el salto
de lo #entali5ado a lo disti!"ido a es#ala #o.e#ial est= 2o &eni. Toda&0a no se @a eEtendido
s"3i#iente.ente el es6"e.a disti!"idoB 2eo se es2ea 6"e 2$Ei.a.ente se 2od"5#a el a&an#e
de3initi&o. Considee los dos #o.2onentes !=si#os de los siste.as de !ases de datos disti!"idos Fla
2o2ia !ase de datos / la ed de odenadoesG / 2iense en la sit"a#i$n a#t"al de la in3o.=ti#a. Si las !ases
de datos es "na de las a.as .=s anti-"as e i.2otantes de la in3o.=ti#aB ."#@as e.2esas #o.2an
odenadoes 2aa dedi#alos eE#l"si&a.ente a la -esti$n de s"s datos F2ienso 6"eB 2=#ti#a.enteB en el
177P de las ()*ES se 2od"#e este @e#@oG /B #o.o 2ae#e se 6"e se @a as".ido 2o 2ate de todo ti2o
de e.2esaios los !ene3i#ios 6"e a#aea la #oneEi$n de los odenadoesB la instala#i$n de "na edB se
2"ede #on#l"i di#iendo 6"e el teeno /a est= a!onado 2aa s" eEtensi$n #o.e#ial. S$lo 3alta 6"e
dete.inadas ."ltina#ionales de#idan a2osta .=s 3"ete 2o este en3o6"e a ta&Cs de s"s 3a.osos
siste.as -estoes de !ases de datos / 6"e se 2od"5#a la #onsolida#i$n de la esol"#i$n de los 2o!le.as
6"e el en3o6"e disti!"ido a#aea.
Bases de Datos Disti!"idas (=-ina 41 de 41

Anda mungkin juga menyukai