Anda di halaman 1dari 40

1.

RECONOCIMIENTO DE LAS CARACTERSTICAS DE


LOS LENGUAJES DE MARCAS
1.1

CONCEPTO, ORIGEN Y CARACTERSTICAS DE LOS


LENGUAJES DE MARCAS

1.2

CLASIFICACIN DE LOS LENGUAJES DE MARCAS

1.3

XML: ESTRUCTURA Y SINTAXIS

1.4

HERRAMIENTAS BSICAS EN XML

1.5

ELABORACIN DE DOCUMENTOS XML BIEN FORMADOS

1.6

UTILIZACIN DE ESPACIOS DE NOMBRES EN XML

1. Reconocimiento de las caractersticas de los lenguajes de marcas.


1.1 Concepto, Origen y Caractersticas de los lenguajes de marcas.

Un "lenguaje de marcas" es un modo de codificar un documento donde,


junto con el texto, se incorporan etiquetas, marcas o anotaciones con
informacin adicional relativa a la estructura del texto o su formato de
presentacin. Permiten hacer explcita la estructura de un documento, su
contenido semntico o cualquier otra informacin lingstica o
extralingstica que se quiera hacer patente.
Ejemplo :
<carta>
<fecha>20/09/2013</fecha>
<presentacion>Estimado cliente:</presentacion>
<contenido>bla bla bla bla </contenido>
<firma>Don Juan Carlos Prez Martn</firma>
</carta>

1. Reconocimiento de las caractersticas de los lenguajes de marcas.


1.1 Concepto, Origen y Caractersticas de los lenguajes de marcas.
Evolucin de los lenguajes de marcas.
Ejemplo con etiquetas inventadas:
<times 18><color verde><centrado> Este texto es un ejemplo para mostrar la
utilizacin primitiva de las marcas.</centrado></color></times 18>
<color granate><times 14><cursiva> Las etiquetas son inventadas. </cursiva> Las
partes importantes del texto pueden resaltarse usando la <negrita>negrita</negrita>,
o el <subrayar>subrayado</subrayar></times 14></color>
Al imprimirlo se obtendra:
Este texto es un ejemplo para mostrar la utilizacin primitiva de las marcas.
Las etiquetas son inventadas. Las partes importantes del texto pueden r esaltarse usando la negrita, o el subrayado

Posteriormente, se aadieron como medio de presentacin a la pantalla. Los cdigos de estilo


de visualizacin anteriores ya no aparecen, y se emplean otros medios para marcados,
distintos de la inclusin a mano de cadenas formateadoras, ahora ese proceso se automatiza y
basta pulsar una combinacin de teclas, o pulsar un botn, para lograr los resultados
requeridos. Aunque sto es slo una abstraccin, para su uso interno las aplicaciones siguen
utilizando marcas para delimitar aquellas partes del texto que tienen un formato especial.

1. Reconocimiento de las caractersticas de los lenguajes de marcas.


1.1 Concepto, Origen y Caractersticas de los lenguajes de marcas.
Evolucin de los lenguajes de marcas.
Este marcado estaba exclusivamente orientado a la presentacin de la informaci

GML (Generalizaed Markup Language): IBM encarg la construccin de un

sistema de edicin, almacenamiento y bsqueda de documentos legales. Llegaron


a la conclusin de que para realizar uos de tal modo que el resultado fuese
independiente de la plataforma y la aplicacin utilizada.

SGML (Standard Generalized Markup Language): El formato GML


evolucion hasta que en 1986 dio lugar al estndar ISO 8879 q

HTML (HyperText Markup Language): ue se de

XML (eXtensible Markup Language): nomin SGML. ste era un lenguaje muy
complejo y requera de unas herramientas de software caras. Por ello su uso ha
quedado relegado a grandes aplicaciones industriales.

1. Reconocimiento de las caractersticas de los lenguajes de marcas.


1.1 Concepto, Origen y Caractersticas de los lenguajes de marcas.
Evolucin de los lenguajes de marcas.
Ejemplo de documento SGML sencillo:

<email>
<remitente>
<persona>
<nombre> Isabel </nombre>
<apellido> Plaza</apellido>
</persona>
</remitente>
<destinatario>
<direccion> aurora@gmail.com </direccion>
</destinatario>
<asunto>quedamos?</asunto>
<mensaje> El lunes a las 7 en la Plaza Mayor</mensaje>
</email>

1. Reconocimiento de las caractersticas de los lenguajes de marcas.


1.1 Concepto, Origen y Caractersticas de los lenguajes de marcas.
Evolucin de los lenguajes de marcas.
Ejemplo de documento HTML sencillo:
<html>
<head>
<title> Ejemplo de cdigo HTML</title>
</head>
<body bgcolor="#ffffff">
<p></p>
<p>
<b>20 de septiembre de 2013</b>
</p>
<p><b> Bienvenido al modulo de Lenguajes de Marcas y Sistemas de Gestin de Informacin </b>
</p>
<p> En este curso aprender&aacute;s, entre otras cosas:<br/>
<ul>
<li> Reconocer las caracter&iacute;sticas de lenguajes de marcas. </li>
<li> Analizar e interpretar fragmentos de c&oacute;digo </li>
</ul>
</p>
</body>
</html>

1. Reconocimiento de las caractersticas de los lenguajes de marcas.


1.1 Concepto, Origen y Caractersticas de los lenguajes de marcas.
Evolucin de los lenguajes de marcas.
Ejercicio 1:
Edita el ejemplo anterior gurdalo con extensin html. Observa la salida al
publicarlo con un navegador.

1. Reconocimiento de las caractersticas de los lenguajes de marcas.


1.1 Concepto, Origen y Caractersticas de los lenguajes de marcas.
Caractersticas de los lenguajes de marcas
Los lenguajes de marcas o lenguajes de marcado combinan la informacin textual de
un documento con marcas o anotaciones relativas a la estructura del texto o a la
forma de presentarlo.
El lenguaje de marcas especifica etiquetas posibles, donde se colocan y su significado.
Las etiquetas o marcas no se suelen presentar al usuario final que slo est interesado
en el contenido.

Ejemplo:
<noticia>
<lugar> Madrid </lugar>
<fecha> 27/08/2010 </fecha>
<desc>Se ha inaugurado una estacin de tren</desc>
</noticia>
Los lenguajes de marcas a diferencia de los lenguajes de programacin no tienen
variables ni funciones aritmticas.

1. Reconocimiento de las caractersticas de los lenguajes de marcas.


1.1 Concepto, Origen y Caractersticas de los lenguajes de marcas.
Caractersticas de los lenguajes de marcas
Fichero XML
<?xml version="1.0" encoding="iso-8859-1"?>

<libro>
<titulo>XML practico </titulo>
<autor>Sebastien Lecomte</autor>
<autor>Thierry Boulanger</autor>
<editorial>Ediciones Eni</editorial>
<isbn>978-2-7460-4958-1</isbn>
<edicion>1</edicion>
<paginas>347</paginas>
</libro>

Fichero HTML
<html>
<head>
<title>Libro</title>
</head>
<body>
<h3>XML practico</h3><br>
<p>autores: Sebastien Lecomte,
Thierry Boulanger</p>
<ul>
<li>editorial: Ediciones Eni</li>
<li>isbn:978-2-7460-4958-1</li>
<li>edicion: 1 </li>
<li>paginas: 347</li>
</ul>
</body>
</html>

1. Reconocimiento de las caractersticas de los lenguajes de marcas.


1.1 Concepto, Origen y Caractersticas de los lenguajes de marcas.
Caractersticas de los lenguajes de marcas
Ejercicio 2:
Editar los ejemplos anteriores
guardarlos
correspondiente y observar la salida con un navegador.

con

la

extensin

1. Reconocimiento de las caractersticas de los lenguajes de marcas.


1.1 Concepto, Origen y Caractersticas de los lenguajes de marcas.
Etiquetas.

Las etiquetas se escriben encerradas entre ngulos, es decir < y >.


Normalmente, se utilizan dos etiquetas: una de inicio y otra de fin para indicar que ha
terminado el efecto que queramos presentar. La nica diferencia entre ambas es que
la de cierre lleva una barra inclinada "/" antes del cdigo.
<etiqueta>texto que sufrir las consecuencias de la etiqueta</etiqueta>
Las ltimas especificaciones emitidas por el W3C indican las etiquetas que vayan
escritas siempre en minsculas para considerar que el documento est correctamente
creado.

1. Reconocimiento de las caractersticas de los lenguajes de marcas.


1.1 Concepto, Origen y Caractersticas de los lenguajes de marcas.

Elementos y Atributos

Elementos: Estructuras que permiten organizar el contenido del

documento o las acciones que se desencadenan cuando el


navegador interpreta el documento. Estn delimitados por una
etiqueta de inicio y una de fin. Los elementos vacios no tienen
contenido y no llevan etiqueta de fin.

Atributos: Par nombre valor que se encuentra dentro de la


etiqueta de inicio de un elemento. Indican las propiedades que
pueden llevar asociadas los elementos.

Ejemplo:
<elem1 atrib1=val1>Valor</elem1>

1. Reconocimiento de las caractersticas de los lenguajes de marcas.


1.1 Concepto, Origen y Caractersticas de los lenguajes de marcas.
Ejercicio 3:
Dado el texto siguiente:
<noticia>
<lugar></lugar>
<fecha></fecha>
<desc></desc>
</noticia>
Indicar el nombre de una etiqueta y de dos elementos. Aadir al texto, ms elementos y
algn atributo.
Ejercicio 4:
Buscar informacin en Internet sobre las organizaciones ISO y WC3, de forma que se
contesten las siguientes preguntas:
Qu significan las siglas.
Cundo fue creada.
Cul es su objetivo o funcin principal.
Qu relacin hay entre estas organizaciones y los lenguajes de marcas.

1. Reconocimiento de las caractersticas de los lenguajes de marcas.


1. 2 Clasificacin de los lenguajes de marcas
Tipos o clases de lenguajes de marcas.

Lenguajes orientados a la presentacin: Las marcas indican el formato marco del texto.
Utilizados tradicionalmente por los procesadores de texto como Microsoft Word. No son
lenguajes flexibles ni reusables.

Lenguajes procedurales o de procedimientos: Las marcas utilizan para la presentacin del


texto. Las marcas se interpretan en el orden en el que aparecen. Por ej.: LaTeX (utilizado en
documentos cientficos, artculos de investigacin o libros tcnicos que utilizan frmulas
matemticas) y PostScript (lenguaje de descripcin de pginas utilizado en muchas
impresoras), HTML (lenguaje predominante en la elaboracin de pginas web).

Lenguajes descriptivos: Las marcas describen la informacin, fragmentos de texto, sin


especificar como deben representarse. Por ej.: SGML y XML

XML (estructura) + XSLT (formato)


XHTML (estructura) + CSS (formato)
En HTML estos conceptos se mezclan.

1. Reconocimiento de las caractersticas de los lenguajes de marcas.


1. 2 Clasificacin de los lenguajes de marcas

Tipos de lenguajes de marcas.


Ejercicio 5

Abrir la pgina www.google.es en el explorador, pulsar el


botn derecho del ratn y seleccionar la opcin Ver cdigo
fuente.
Ejercicio 6
Consultar los Lenguajes de descripcin en la web de
wikipedia.

1. Reconocimiento de las caractersticas de los lenguajes de marcas.


1.3 XML: Estructura y sintaxis
En realidad XML es un conjunto de estndares relacionados entre s:
XSL, eXtensible Style Language. Permite definir hojas de estilo para los
documentos XML e incluye capacidad para la transformacin de
documentos.
XML Linking Language, incluye Xpath, Xlink y Xpointer. Determinan
aspectos sobre los enlaces entre documentos XML.
XML Namespaces. Proveen un contexto al que se aplican las marcas de
un documento de XML y que sirve para diferenciarlas de otras con
idntico nombre vlidas en otros contextos.
XML Schemas. Permiten definir restricciones que se aplicarn a un
documento XML. Actualmente los ms usados son las DTD

1. Reconocimiento de las caractersticas de los lenguajes de marcas.


1.3 XML: Estructura y sintaxis

Ejemplo de documento XML:


<?xml version="1.0" encoding="iso-8859-1"?>
<biblioteca>
<ejemplar tipo_ejem="libro" titulo="XML practico" editorial="Ediciones Eni">
<tipo> <libro isbn="978-2-7460-4958-1" edicion="1" paginas="347"></libro> </tipo>
<autor nombre="Sebastien Lecomte"></autor>
<autor nombre="Thierry Boulanger"></autor>
<autor nombre="ngel Belinchon Calleja" funcion="traductor"></autor>
<prestado lector="Paco Prez">
<fecha_pres dia="13" mes=sep" ao="2013"></fecha_pres>
<fecha_devol dia="21" mes="jun" ao="2003"></fecha_devol>
</prestado>
</ejemplar>

1. Reconocimiento de las caractersticas de los lenguajes de marcas.


1.3 XML: Estructura y sintaxis
Ejemplo de documento XML (continuacin):
<ejemplar tipo_ejem="revista" titulo="Todo Linux 101. Virtualizacin en GNU/Linux"
editorial="Studio Press">
<tipo>
<revista>
<fecha_publicacion mes="abr" ao="2009"></fecha_publicacion>
</revista>
</tipo>
<autor nombre="Varios"></autor>
<prestado lector="Pedro Pacheco">
<fecha_pres dia="12" mes="ene" ao="2013"></fecha_pres>
</prestado>
</ejemplar>
</biblioteca>

Ejercicio 7
Probar en el navegador el documento anterior y realizar otra versin en que la
informacin textual no est contenida en las etiquetas como atributos.

1. Reconocimiento de las caractersticas de los lenguajes de marcas.


1. 3 XML: estructura y sintaxis.
El XML, o Lenguaje de Etiquetas Extendido, es un lenguaje de etiquetas
creadas por el programador, que estructuran y guardan de forma ordenada la
informacin. No representa datos por s mismo, solamente organiza la
estructura.
El XML ahorra tiempos de desarrollo y proporciona ventajas, dotando a
webs y a aplicaciones de una forma realmente potente de guardar la
informacin. Adems, se ha convertido en un formato universal que ha sido
asimilado por todo tipo de sistemas operativos y dispositivos mviles.
Al igual que en HTML un documento XML es un documento de texto, en
este caso con extensin ".xml", compuesto de parejas de etiquetas,
estructuradas en rbol, que describen una funcin en la organizacin del
documento, que puede editarse con cualquier editor de texto y que es
interpretado por los navegadores Web.

1. Reconocimiento de las caractersticas de los lenguajes de marcas.


1.3 XML: Estructura y sintaxis

Ejercicio 8:

Edita el ejemplo anterior gurdalo con extensin xml. Observa la salida al


publicarlo con un navegador.
Para saber ms la recomendacin de XML publicada por el W3C es
pblica y accesible en:
http://www.w3.org/TR/2000/REC-xml-20001006

1. Reconocimiento de las caractersticas de los lenguajes de marcas.


1. 3 XML: estructura y sintaxis.
El marcado en XML son etiquetas que se aaden a un texto para estructurar el
contenido del documento. Esta informacin extra permite a los ordenadores
"interpretar" los textos. El marcado es todo lo que se sita entre los caracteres "<" y
">" o "&" y ";
Los datos carcter son los que forman la verdadera informacin del documento
XML.
El marcado puede ser tan rico como se quiera. Puede ser interesante detectar
necesidades futuras y crear documentos con una estructura fcilmente actualizables.
Los documentos XML pueden estar formados por una parte opcional llamada
prlogo y otra parte obligatoria llamada ejemplar.
Los documentos XML pueden tener comentarios, que no son interpretados por el
interprete XML. Estos se incluyen entre las cadenas "<!--" y "-->", pueden estar en
cualquier posicin en el documento salvo:
Antes del prlogo.
Dentro de una etiqueta.

1. Reconocimiento de las caractersticas de los lenguajes de marcas.


1.3 XML: estructura y sintaxis.
El prlogo.
Si se incluye, el prlogo debe preceder al ejemplar del documento. Su inclusin
facilita el procesado de la informacin del ejemplar.
El prlogo est dividido en dos partes:
La declaracin XML: En caso de
incluirse ha de ser la primera lnea del
documento, de no ser as se genera un
error que impide que el documento sea
procesado.
El hecho de que sea opcional permite
el procesamiento de documentos HTML
y SGML como si fueran XML, si fuera
obligatoria stos deberan incluir una
declaracin de versin XML que no
tienen.

La declaracin del tipo de documento,


define qu tipo de documento estamos
creando para ser procesado correctamente.
Toda declaracin de tipo de documento
comienza por la cadena:
<!DOCTYPE Nombre_tipo ...>

1. Reconocimiento de las caractersticas de los lenguajes de marcas.


1. 3 XML: estructura y sintaxis.
El prlogo.
El prlogo puede tener tres funciones:
Declaracin la versin de XML usada para elaborar el documento.
Para ello se utiliza la etiqueta:
<?xml versin= 1.0 ?>
En este caso indica que el documento fue creado para la versin 1.0 de XML.
Declaracin de la codificacin empleada para representar los caracteres. (Ver tabla
siguiente)
Determina el conjunto de caracteres que se utiliza en el documento.
Para ello se escribe: <?xml version="1.0" encoding="iso-8859-1"?>
En este caso se usa el cdigo iso-8859-1 (Latin-1) que permite el uso de acentos o
caracteres como la .

Declaracin de la autonoma del documento.


Informa de si el documento necesita de otro para su interpretacin. Para declararlo hay
que definir el prlogo completo: <?xml versin= 1.0 encoding=iso-8859-1
standalone=no ?>
En este caso, el documento es independiente, de no ser as el atributo standalone hubiese
tomado el valor "yes".

1. Reconocimiento de las caractersticas de los lenguajes de marcas.


1.3 XML: estructura y sintaxis.
El prlogo.
Los cdigos ms importantes son:

Estndar ISO

Cdigo de pas

UTF-8 (Unicode)

Conjunto de caracteres universal

ISO -8859-1 (Latin-1)

Europa occidental, Latinoamrica

ISO -8859-2 (Latin-2)

Europa central y oriental

ISO -8859-3 (Latin-3)

Sudoeste de Europa

ISO -8859-4 (Latin-4)

Pases Escandinavos, Blticos

ISO -8859-5

Cirlico

ISO -8859-6

rabe

ISO -8859-7

Griego

ISO -8859-8

Hebreo

ISO -8859-9

Turco

ISO-8859-10

Lapn. Nrdico, esquimal

EUC-JP oder Shitf_JIS

Japons

1. Reconocimiento de las caractersticas de los lenguajes de marcas.


1.3 XML: estructura y sintaxis.
El ejemplar. Los elementos.
Es la parte ms importante del documento XML, ya que contiene los datos reales del
documento. Est formado por elementos anidados.
Los elementos son los distintos bloques de informacin que permiten definir la estructura de
un documento XML. Est, delimitados por una etiqueta de apertura y una etiqueta de cierre. A su
vez los elementos pueden estar formados por otros elementos y/o por atributos.
<?xml version="1.0" encoding="iso-8859-1"?>
Ejemplo: Sea el siguiente cdigo XML
<!DOCTYPE libro>
<libro>
<titulo>XML practico </titulo>
<autor>Sebastien Lecomte</autor>
<autor>Thierry Boulanger</autor>
<editorial>Ediciones Eni</editorial>
<isbn>978-2-7460-4958-1</isbn>
<edicion>1</edicion>
<paginas>347</paginas>
<libro>
El ejemplar es el elemento <libro>, que a su vez est compuesto de los elementos <ttulo>
<autor>, <editorial>, <isbn>, <edicion> y <paginas>.

1. Reconocimiento de las caractersticas de los lenguajes de marcas.


1. 3 XML: estructura y sintaxis.
El ejemplar. Los elementos.
En realidad, el ejemplar es el elemento raz de un documento XML. Todos los datos de un documento
XML han de pertenecer a un elemento del mismo.
Los nombres de las etiquetas han de ser autodescriptivos, lo que facilita el trabajo que se hace con ellas.
La formacin de elementos ha de cumplir ciertas normas para que queden perfectamente definidos y que
el documento XML al que pertenecen pueda ser interpretado por los procesadores XML sin generar ningn
error fatal. Dichas reglas son:

En todo documento XML debe existir un elemento raz, y slo uno.


Todos los elementos tienen una etiqueta de inicio y otra de cierre. En el caso de que en el documento
existan elementos vacos, se pueden sustituir las etiquetas de inicio y cierre por una de elemento
vaco. sta se construye como la etiqueta de inicio, pero sustituyendo el carcter ">" por "/>. Es decir,
<elemento></elemento> puede sustituirse por: <elemento/>
Estructura y jerarqua. Al anidar elementos hay que tener en cuenta que no puede cerrarse un
elemento que contenga algn otro elemento que an no se haya cerrado.
Los nombres de las etiquetas de inicio y de cierre de un mismo elemento han de ser idnticos,
respetando las maysculas y minsculas. Pueden ser cualquier cadena alfanumrica que no contenga
espacios y no comience ni por el carcter dos puntos, ":", ni por la cadena "xml" ni ninguna de sus
versiones en que se cambien maysculas y minsculas ("XML", "XmL", "xML",...).

1. Reconocimiento de las caractersticas de los lenguajes de marcas.


1. 3 XML: estructura y sintaxis.
El ejemplar. Los elementos.
El contenido de los elementos no puede contener la cadena "]]>" por compatibilidad con SGML. Adems
no se pueden utilizar directamente los caracteres mayor que, >, menor que, <, ampersand, &, dobles comillas,
", y apostrofe, . En el caso de tener que utilizar estos caracteres se sustituyen por las siguientes cadenas:

Carcter

Cadena

>

&gt;

<

&lt;

&

&amp;

&quot;

&apos;

Para utilizar caracteres especiales, como , , ,... hay que usar las expresiones &#D; o &#H; donde D y H
se corresponden respectivamente con el nmero decimal o hexadecimal correspondiente al carcter que se
quiere representar en el cdigo UNICODE. Por ejemplo, para incluir el carcter de Euro, , se usaran las
cadenas &#8364; o &#x20AC;
En el siguiente enlace encontrars una tabla con los caracteres ASCII, el nombre HTML, y el nmero HTML
de cada uno de ellos que te ser imprescindible a la hora de realizar documentos en HTML y XML.
http://ascii.cl/es/codigos-html.htm

1. Reconocimiento de las caractersticas de los lenguajes de marcas.


1. 3 XML: estructura y sintaxis.
Atributos.
Permiten aadir propiedades a los elementos de un documento. Los atributos no pueden
organizarse en ninguna jerarqua, no pueden contener ningn otro elemento o atributo y no
reflejan ninguna estructura lgica.
No se debe utilizar un atributo para contener informacin susceptible de ser dividida.
Ejemplo:
<?xml version="1.0" encoding="iso-8859-1" standalone="yes"?>
<!DOCTYPE biblioteca >
<biblioteca>
<ejemplar tipo_ejem="libro" titulo="XML practico" editorial="Ediciones Eni">
<tipo>
<libro isbn="978-2-7460-4958-1" edicion="1" paginas="347"></libro>
</tipo>
<autor nombre="Sebastien Lecomte"></autor>
<autor nombre="Thierry Boulanger"></autor>
<autor nombre="ngel Belinchon Calleja" funcion="traductor"></autor>
<prestado lector="Paco Prez">
<fecha_pres dia="13" mes="mar" ao="2013"></fecha_pres>
<fecha_devol dia="21" mes="jun" ao="2013"></fecha_devol>
</prestado>
</ejemplar>
</biblioteca>

1. Reconocimiento de las caractersticas de los lenguajes de marcas.


1. 3 XML: estructura y sintaxis.
Atributos.

Se observa que los atributos se definen y dan valor dentro de una etiqueta
de inicio o de elemento vacio, a continuacin del nombre del elemento o
de la definicin de otro atributo siempre separado de ellos por un espacio.
Los valores del atributo van precedidos de un igual que sigue al nombre
del mismo y tienen que definirse entre comillas simples o dobles.

Los nombres de los atributos han de cumplir las mismas reglas que los de
los elementos, y no pueden contener el carcter menor que, <.

Si un documento xml cumple con todas estas normas para sus elementos
y atributos ser un documento bien formado y cualquier intrprete de
XML (parser) lo aceptar como correcto y lo interpretar.

1. Reconocimiento de las caractersticas de los lenguajes de marcas.


1. 3 XML: estructura y sintaxis.
Ejercicio 9:
Realizar un documento xml cuyo elemento raz contenga el texto
siguiente:
En el contenido de los elementos XML no se pueden utilizar directamente los
caracteres mayor que, >, menor que, <, ampersand, &, dobles comillas, ", y apostrofe,
. En el caso de tener que utilizar estos caracteres se sustituyen por las siguientes
cadenas: &gt; &lt; &amp; &quot; &apos; respectivamente.
Ejercicio 10:

Crear un documento xml con informacin referente a dos pelculas, de


cada una de ellas se almacenar la calificacin (n del 1 al 10), el tipo (drama,
comedia, musical) y la fecha de realizacin que sern almacenadas como
atributos adems del ttulo, el director, guionistas, actores, productores y un
comentario a cerca de la pelcula.

1. Reconocimiento de las caractersticas de los lenguajes de marcas.


1. 4 Herramientas bsicas de Lenguajes de Marcas.
Para trabajar con lenguajes de marcas es necesario editar los documentos y luego procesarlos, por
tanto tenemos dos tipos de herramientas:

Editores
Una caracterstica de los lenguajes de marcas es que se basan en la utilizacin de ficheros de texto
plano por lo que basta utilizar un procesador de texto normal y corriente para construir un documento
HTML o XML.
Para crear documentos XML o HTML complejos e ir aadiendo datos es conveniente usar algn
editor especfico. Estos nos ayudan a crear estructuras y etiquetas de los elementos usados en los
documentos, adems algunos incluyen ayuda para la creacin de otros elementos como DTD, hojas de
estilo CSS o XSL, ...
El W3C ha desarrollado un editor de HTML, XHTML, CSS y XML gratuito cuyo nombre es Amaya.
Las principales herramientas de edicin para lenguajes de marcas son:
Adobe Dreamweaver:
para HTML
Altova XML Spy:
para XML
Ambas requieren licencia aunque existe una versin de prueba.

1. Reconocimiento de las caractersticas de los lenguajes de marcas.


1. 4 Herramientas bsicas de XML.

Procesadores XML
Para interpretar cdigo XML se puede utilizar cualquier
navegador. Los procesadores de XML permiten leer los
documentos XML y acceder a su contenido y estructura. Un
procesador es un conjunto de mdulos de software entre los que
se encuentra un parser o analizador de XML que comprueba
que el documento cumple las normas establecidas para que
pueda abrirse. Estas normas pueden corresponderse con las
necesarias para trabajar slo con documentos de tipo vlido o
slo exigir que el documento est bien formado, los primeros se
conocen como validadores y los segundos como no validadores.
El modo en que los procesadores deben leer los datos XML est
descrito en la recomendacin de XML establecida por W3C.

1. Reconocimiento de las caractersticas de los lenguajes de marcas.


1. 5 Elaboracin de documentos XML bien formados.
Todos los documentos XML deben verificar las reglas sintcticas que
define la recomendacin del W3C para el estndar XML. Esas normas bsicas
son:
El documento ha de tener definido un prlogo con la declaracin xml.
Estructura jerrquica de elementos: un nico elemento raz para cada
documento en el que todos los dems elementos y contenidos se
encuentran anidados.
Hay que cumplir las reglas sintcticas del lenguaje XML para definir los
distintos elementos y atributos del documento: nomenclatura de los
identificadores, valores de los atributos, en xml a diferencia de HTML,
siempre han de estar encerrados entre comillas simples o dobles.

1. Reconocimiento de las caractersticas de los lenguajes de marcas.


1. 5 Elaboracin de documentos XML bien formados.

Ejercicio 9:

Est "bien formado" el siguiente documento XML?


<?xml version="1.0"?>
<mensaje>
<destinatario>Tomas</ destinatario>
<remitente>Juan</ remitente>
<asunto>
<contenido> No olvides ir a recogerme al aeropuerto maana por la
maana!</contenido>
</mensaje>

1. Reconocimiento de las caractersticas de los lenguajes de marcas.


1. 6 Utilizacin de espacios de nombres en XML.
Ejercicio 10: (Ej 1.6.10)
Crear un XML para una orden de
pedido que se contendr un id, la
fecha y un id de cliente. Dicha orden
tendr una factura que vendr
marcada por su id. La factura tendr el
nombre de la empresa, la direccin, el
nombre de la ciudad y el cdigo postal.
A su vez la orden de pedido tendr un
elemento envo cuyo atributo href ser
el id de la factura. Para finalizar la
orden de pedido tendr dos pedidos
cada uno de los cuales tendr una
descripcin. Adems cada pedido
vendr marcado por su referencia y la
cantidad de unidades que se piden de
ese producto.

1. Reconocimiento de las caractersticas de los lenguajes de marcas.


1. 6 Utilizacin de espacios de nombres en XML.
Ejemplo:
<? xml version=1.0?>
<centros>
<nombre>IES Alonso de Madrigal</nombre>
<director>
<nombre>Juan</nombre>
</director>
</centros>
Cuando en un documento hay etiquetas ambiguas se sustituyen por otras en las que el nombre del
elemento est precedido de un prefijo que determina el contexto al que pertenece la etiqueta, seguido de dos
puntos:
<prefijo:nombre_etiqueta></prefijo:nombre_etiqueta>
Ejemplo:
<ce:centros xmlns:ce="http://prueba.com/cliente">
Declaracin del espacio de nombres
<ce:nombre>IES Alonso de Madrigal</ce:nombre>
<di:director xmlns:di="http://prueba.com/director">
<di:nombre>Juan</di:nombre>
</di:director>
</ce:centros>

1. Reconocimiento de las caractersticas de los lenguajes de marcas.


1. 6 Utilizacin de espacios de nombres en XML.
Los espacios de nombres en XML, tambin conocidos como namespaces, son un
conjunto de nombres identificados por una referencia URI (Uniform Resource
Identifiers) que permiten dar un nombre nico a elementos y atributos,
indexndolos segn el nombre del vocabulario adecuado definiendo as su
pertenencia a un contexto .
De este modo se resuelven las ambigedades que se pueden producir al unir dos
documentos distintos, de dos autores diferentes, que han utilizado el mismo nombre
de etiqueta para representar cosas distintas.
Esta etiqueta se denomina "nombre cualificado". Al definir el prefijo hay que
tener en cuenta que no se pueden utilizar espacios ni caracteres espaciales y que no
puede comenzar por un digito.
Aunque la URI de un namespace tenga el aspecto de una URL, no es necesario que
exista conexin Internet para declarar y usar namespaces ya que stos son
contenedores virtuales de vocabulario que se puede compartir en Internet.

1. Reconocimiento de las caractersticas de los lenguajes de marcas.


1. 6 Utilizacin de espacios de nombres en XML.
Antes de poder utilizar un prefijo de un espacio de nombres, para resolver la ambigedad
de dos o ms etiquetas, es necesario declarar el espacio de nombres, es decir, asociar un ndice
con el URI asignado al espacio de nombres, mediante un atributo especial xmlns. Su sintaxis es
la siguiente:
<prefijo:elemento xmlns:prefijo="http://prueba.com/pr">
<! contenido de la etiqueta elemento
</prefijo:elemento>
Ejemplo: Sean los documentos XML que organizan la informacin sobre los profesores y los
alumnos de un grupo:
<?xml version="1.0" encoding="iso-8859-1" standalone="yes" ?>
<!DOCTYPE profesores>
<profesores>
<nombre>Pilar Ruiz Prez</nombre>
<nombre>Toms Rodrguez Hernndez</nombre>
</profesores>
<?xml version="1.0" encoding="iso-8859-1" standalone="yes? >
<!DOCTYPE alumnos>
<alumnos>
<nombre>Fernando Fernndez Gonzlez</nombre>
<nombre>Isabel Gonzlez Fernndez</nombre>
<nombre>Ricardo Martnez Lpez</nombre>
</alumnos>

1. Reconocimiento de las caractersticas de los lenguajes de marcas.


1. 6 Utilizacin de espacios de nombres en XML.
Al hacer un documento sobre los miembros del grupo no se distinguiran los
profesores de los alumnos, para resolverlo definiremos un espacio de nombres para
cada contexto:
<asistentes>
<al:alumnos xmlns:al="http://CFGS/alumnos">
<al:nombre>Fernando Fernndez Gonzlez</al:nombre>
<al:nombre>Isabel Gonzlez Fernndez</al:nombre>
<al:nombre>Ricardo Martnez Lpez</al:nombre>
</al:alumnos>
<pr:profesores xmlns:pr="http://CFGS/profesores">
<pr:nombre>Pilar Ruiz Prez</pr:nombre>
<pr:nombre>Toms Rodrguez Hernndez</pr:nombre>
</pr:profesores>
</asistentes>
Para saber ms los espacios de nombres tienen una recomendacin en XML:
http://www.w3.org/TR/REC-xml-names/

1. Reconocimiento de las caractersticas de los lenguajes de marcas.


1. 6 Utilizacin de espacios de nombres en XML.
Ejercicio 11:

Ej 1.6.11

Crear un archivo XML que represente el mensaje de correo electrnico cuyo


contenido est en documento Ej 1.6.11.pdf. El mensaje debe de pertenecer a
un espacio de nombres que se llame msj En dicho elemento se declarar
otro espacio de nombres que se llamar po. El mensaje tendr como
atributos el emisor la fecha de envo y un destinatario.
El mensaje contendr un texto y una orden de pedido que estar bajo el
espacio de nombres po as como todos sus hijos.

Todos los elementos estarn clasificados por los prefijos correspondientes a


sus espacios de nombres.

Anda mungkin juga menyukai