Anda di halaman 1dari 208

1

ALMACENAMIENTO DE LA
INFORMACIÓN
EN LOS ORDENADORES

Antonio Salavert Casamor


2

Página en blanco
3

Índice
1. Introducción......................................................................................................................................6
2.Tipos de soporte.................................................................................................................................7
2.1.Nanotubos de carbono...............................................................................................................7
2.2.Efecto túnel magnético..............................................................................................................8
3.Memorias sólidas...............................................................................................................................9
3.1. Memoria RAM..........................................................................................................................9
3.2.Historia.......................................................................................................................................9
3.3.Tipos de RAM............................................................................................................................9
3.4.Dispositivos SSD (Solid-State Drive)......................................................................................11
3.5.Dispositivo flash USB.............................................................................................................14
3.6.Tarjeta MMC (MultiMedia Card)............................................................................................16
3.7.Tarjeta SD (Secure Digital)......................................................................................................16
4.Dispositivos magnéticos..................................................................................................................23
4.1. Discos duros............................................................................................................................23
4.2. Disquetes (Floppy disk)..........................................................................................................26
4.3.Cintas magnéticas....................................................................................................................28
5.Dispositivos ópticos.........................................................................................................................33
5.1. CD (Compact Disc)................................................................................................................33
5.2. DVD (Digital Versatile Disc / Digital Video Disc).................................................................34
5.3.Disco Blu-ray...........................................................................................................................36
5.4.Tecnología UDO (Ultra Density Optical)................................................................................40
6.Almacenamiento de datos: valores y texto......................................................................................42
6.1.Valores.....................................................................................................................................42
6.2.Texto........................................................................................................................................42
7.Tipos de interface de unidades de discos.........................................................................................45
7.1.Interfaz IDE (Integrated Device Electronics)..........................................................................45
7.2. Interfaz SATA (Serial Advanced Technology Attachment)....................................................46
7.3. Interfaz SCASI........................................................................................................................47
7.4. Interfaz iSCASI.......................................................................................................................48
7.5.Interfaz Fibre Channel.............................................................................................................49
7.6.Interfaz Firewire (IEEE 1394).................................................................................................50
7.7.Tecnología SAS (Serial Attached SCSI)..................................................................................51
7.8.Interfaz USB (Universal Serial Bus).......................................................................................52
8. Tipos de formateo de discos...........................................................................................................58
8.1.Formateo de bajo nivel de los disquetes..................................................................................58
8.2.Formateo de bajo nivel de los discos duros.............................................................................59
8.3.Reinicialización del disco........................................................................................................59
8.4.Formateo de alto nivel.............................................................................................................59
8.5.Formateo en DOS....................................................................................................................59
8.6.Recuperación de datos de un disco formateado.......................................................................60
9.Sistemas de ficheros........................................................................................................................61
9.1.Asignación del espacio de almacenamiento............................................................................63
9.2.Sistemas de ficheros especiales...............................................................................................64
9.3. Sistema de ficheros de Linux..................................................................................................67
9.4.Sistema de ficheros Ext (Extended File System).....................................................................71
9.5.Sistema de ficheros Ext2..........................................................................................................71
9.6.Sistema de ficheros Ext3..........................................................................................................75
9.7.Sistema de ficheros EXT4.......................................................................................................77
4

9.8.Sistema de ficheros FAT..........................................................................................................80


9.9. Sistema de ficheros HPFS (High Performance File System).................................................89
9.10.Sistema de ficheros NTFS (New Technology File System)..................................................90
9.11.Sistema de ficheros UFS (UNIX File System)......................................................................96
9.12.Sistema de ficheros Apple HFS Plus.....................................................................................97
9.13.Sistema de ficheros ISO9660/CDFS......................................................................................99
9.14.Sistema de ficheros Joliet....................................................................................................102
9.15.Sistema de ficheros UDF (Universal Disk Format).............................................................104
9.16.Sistema de ficheros JFFS (Journalling Flash File System)..................................................107
9.17.Sistema de ficheros JFFS2...................................................................................................108
9.18.Sistema de ficheros ReiserFS..............................................................................................109
9.19.Sistema de ficheros Reiser4.................................................................................................109
10. Formatos de imagen digital.........................................................................................................111
10.1.Sensores................................................................................................................................111
10.2.Tamaños de los ficheros de imágenes..................................................................................112
10.3.Compresión de los ficheros de imágenes.............................................................................112
10.4.Formato de mapa de bits o raster.........................................................................................112
10.5.Formatos vectoriales............................................................................................................115
10.6.Formatos 3D.........................................................................................................................117
10.7.Formato RAW......................................................................................................................118
10.8.Formato BMP......................................................................................................................120
10.9.Formato JPEG/JFIF.............................................................................................................122
10.10.Formato Exif......................................................................................................................125
10.11.Formato TIFF.....................................................................................................................126
10.12.Formato PNG.....................................................................................................................126
10.13.Formato GIF......................................................................................................................128
10.14.Formato CGM....................................................................................................................130
10.15.Formato SVG.....................................................................................................................130
11.Formatos de sonido digital...........................................................................................................133
11.1.Digitalización del sonido.....................................................................................................133
11.2.Tipos de formatos.................................................................................................................133
11.3.Formatos de audio sin compresión......................................................................................133
11.4.Formatos de audio con compresión sin pérdidas.................................................................134
11.5.Formatos de audio con compresión con pérdidas................................................................136
11.6.Codificadores.......................................................................................................................137
11.7.Descodificadores..................................................................................................................137
11.8.Formato MIDI......................................................................................................................137
11.9.Formato WAV......................................................................................................................139
11.10.Formato MP2/MP3............................................................................................................140
11.11.Formato WMA...................................................................................................................143
11.12.Formato APE......................................................................................................................145
11.13.Formato OGG....................................................................................................................145
11.14.Formato RA (Real Audio)..................................................................................................147
12. Formatos de vídeo digital...........................................................................................................149
12.1.Codificadores.......................................................................................................................150
12.2.Descodificadores..................................................................................................................150
12.3.Formato MOV......................................................................................................................150
12.4.Formato AVI........................................................................................................................153
12.5.Formato MPEG....................................................................................................................156
12.6.Formato MPEG-2................................................................................................................164
5

12.7.Formato MPEG-4................................................................................................................166
12.8.Formato WMV.....................................................................................................................167
12.9.Formato H.261.....................................................................................................................169
12.10.Formato H.262...................................................................................................................170
12.11.Formato H.263...................................................................................................................171
12.12.Formato H.264...................................................................................................................171
12.13.DivX...................................................................................................................................177
12.14.Formato MOD....................................................................................................................178
12.15.Formato ASF......................................................................................................................179
12.16.Formato 3G2/3GP..............................................................................................................180
13.RAID (Redundant Array of Independent Disks).........................................................................181
13.1.Funciones RAID .................................................................................................................181
13.2.Conjuntos de bandas sin paridad.........................................................................................181
13.3.Conjunto de bandas con paridad..........................................................................................182
13.4.Niveles RAID......................................................................................................................182
13.5.Disponibilidad de los datos .................................................................................................183
13.6.Características de rendimiento ............................................................................................183
13.7.Discos de repuesto en caliente ............................................................................................184
13.8.EDAP (Extended Data Availability & Protection) ..............................................................184
13.9.Nueva clasificación RAID...................................................................................................185
14.Clustering....................................................................................................................................187
14.1.Categorías de clusters..........................................................................................................187
14.2.Implementaciones................................................................................................................188
14.3.Historia.................................................................................................................................188
14.4.Tecnologías..........................................................................................................................189
15.NAS (Network Attached Storage)...............................................................................................191
15.1.Historia.................................................................................................................................191
15.2.Beneficios............................................................................................................................192
15.3.Inconvenientes.....................................................................................................................192
16.SAN (Storage Area Network)......................................................................................................194
16.1.Servidores SAN...................................................................................................................195
16.2.Almacenamiento SAN.........................................................................................................195
16.3.Aplicaciones SAN................................................................................................................195
16.4.Asociaciones y organizaciones relacionadas con las SAN..................................................197
6

1. Introducción
El objetivo de este libro es dar una versión global y resumida de los principales temas sobre el
almacenamiento de datos en los sistemas de información. A partir de esta información, se puede
ampliar su conocimiento de algunos temas en otras fuentes como puede ser Internet y si son
estándares se pueden consultar en el organismo de estandarización que se menciona en el libro.
Así en este libro se desarrollan los siguientes temas:
– Primero, se explican los distintos tipos de medios de almacenamiento de información
agrupados en memoria electrónica, electromagnética y óptica.
– Luego se explican los distintos tipos de interfaces de los medios y los sistemas de ficheros
que se utilizan.
– A continuación se explican los distintos formatos de ficheros que soportan imagen, audio y
vídeo.
– Finalmente se desarrollan distintas técnicas globales de almacenamiento como son RAID,
Clustering, NAS y SAN

En cuanto al término en inglés de clúster, no lo he traducido con el fin de cuando se lean


documentos y libros en inglés, sea más fácil su comprensión. Básicamente hay dos usos:
– a nivel de fichero, se trata de un conjunto de bits u octetos donde se almacena un fichero.
Así un fichero se almacena en uno o más clusters, que pueden ser o no adyacentes.
– a nivel de sistema de almacenamiento, un clúster es un conjunto de medios de
almacenamiento que desde el punto de vista del usuario lo ve como un todo, aunque
geográficamente sus distintos elementos del sistema estén más o menos dispersos.

Para ampliar conocimientos de alguno de los temas aquí presentados, es especialmente útil hacerlo
por Internet. De forma general es muy recomendable la web Wikipedia (http://www.wikipedia.org)
en su versión inglesa.
7

2. Tipos de soporte
Básicamente los tipos de soporte, desde el punto de vista del hardware, de los dispositivos para el
almacenamiento de datos en los ordenadores es
- Memorias sólidas
- Dispositivos magnéticos
- Dispositivos ópticos

El detalle de cada uno de estos soportes se explican a continuación. También se explican otras
tecnologías como:
– Los nanotubos de carbono, con un prometedor futuro a muy corto plazo, e integrados dentro
de las nuevas nanotecnologías
– El efecto túnel magnético
– La UDO (Ultra Density Optical) que es una variante de las actuales tecnologías ópticas

2.1. Nanotubos de carbono


Los nanotubos de carbono (CNT) son alótropos de carbono con una nanoestructura que puede tener
una relación longitud/diámetro mayor de 1.000.000. Estas moléculas cilíndricas de carbono tienen
unas propiedades originales que las hace potencialmente útiles en muchas aplicaciones de
nanotecnología, electrónica, óptica y otros campos de la ciencia de los materiales, así como un
amplio uso en los campos de la arquitectura. Exhiben extraordinarias propiedades de fuerza y
eléctricas y son eficientes conductores del calor. También han sido sintetizados los nanotubos
inorgánicos.
Los nanotubos es una nano-estructura compuesta de 60 átomos de carbono, su nombre químico es
C60, estructurados en un espacio cerrado y perfectamente simétrico. Normalmente el nanotubo
cilíndrico tiene al menos un extremo acabado en una semiesfera. El diámetro de un nanotubo es del
orden de unos pocos nanómetros, mientras que pueden tener varios milímetros de longitud.
La naturaleza de la unión de un nanotubo se describe mediante la aplicación de la química cuántica,
específicamente, la hibridación orbital. La unión química de los nanotubos se compone enteramente
de sp2bonds, similar a los del grafito. Esta estructura de unión, que es más fuerte que la sp3bonds
encontrada en el diamante, suministra una fuerza única a las moléculas. Normalmente los nanotubos
se alinean en cuerdas mantenidas juntas por las fuerza de Van der Waals. Bajo una alta presión, los
nanotubos pueden emerger juntos, pasando algunos sp² bonds a sp³ bonds, dando la posibilidad de
producir alambres fuertes de longitud ilimitada a través del enlazado de nanotubos con alta presión.

Descubrimiento
Un editorial del año 2006 escrito por Marc Monthioux y Vladimir Kuznetsov en la revista Carbon
ha descrito el interesante y a menudo poco explicado origen del nanotubo de carbono.
En el año 1952, L. V. Radushkevich y V. M. Lukyanovich publicaron claras imágenes de tubos de
50 nanómetros de diámetro de carbono en la revista rusa Journal of Physical Chemistry. Este
descubrimiento tuvo un escaso impacto dado que este artículo fue publicado en ruso y el acceso de
los científicos occidentales a la prensa soviética era limitado durante la Guerra Fría. Es probable
que los nanotubos de carbono fueron producidos antes de esta fecha, pero el invento del
microscocpio electrónico permitió la visualización directa de estas estructuras.
Los nanotubos de carbono han sido producidos y observados bajo distintas condiciones antes de
8

1991. Un documento de Oberlin, Endo y Koyama publicado en 1976 mostraba claramente fibras de
carbono huecas usando una técnica de crecimiento mediante vapor.
Más adelante en 1979, John Abrahamson presentó la evidencia de los nanotubos de carbono en la
14th Biennial Conference of Carbon en la Penn State University. El documento describía los
nanotubos de carbono como fibras de carbono que se producían en los ánodos de carbono durante la
descarga del arco. Se hizo una caracterización de estas fibras así como las hipótesis de su
crecimiento en una atmósfera de nitrógeno a baja presión.
En 1987, Howard G. Tennent of Hyperion Catalysis patentó en Estados Unidos la producción de
fibras cilíndricas de carbono con un diámetro constante entre aproximadamente 3,5 y 70
nanómetros de longitud.
El descubrimiento de los nanotubos es una cuestión poco clara, especialmente porque varios
científicos implicados en su investigación, podrían ser posibles candidatos a Premio Nobel. Muchos
creen que el informe de Iijima de 1991 es de particular importancia porque trajo los nanotubos de
carbono a la conciencia del conjunto de la comunidad científica. En el año 2000, el profesor Tang
Zikang y Wang Ning crearon satisfactoriamente los nanotubos de carbono estables más pequeños
del mundo, midiendo solo 0,4 nanómetros de diámetro.
Debido a la estructura electrónica simétrica y única del grafeno, la estructura de un nanotubo afecta
fuertemente a sus propiedades eléctricas. Para un determinado nanotubo (n,m), si n − m es un
múltiplo de 3, el nanotubo es metálico, de otra forma es un semiconductor. Así todos los nanotubos
con n=m son metálicos y los nanotubos (5,0), (6,4), (9,1), etc. son semiconductores. En teoría, los
nanotubos metálicos pueden tener una densidad de corriente eléctrica 1.000 veces más que los
metales como la plata y el cobre.

2.2. Efecto túnel magnético


En física, el efecto del túnel magnetoresistente (TMR) ocurre cuando dos materiales magnéticos
están separados por un aislante delgado, es decir, con un grosor aproximado de 1 nm. A
continuación la resistencia de la corriente del túnel cambia según la orientación relativa de las dos
capas magnéticas. Normalmente la resistencia es más alta en el caso antiparalelo. Este efecto fue
descubierto en el año 1975 por Michel Julliere, usando hierro como capa magnética y el germanio
como aislante.
El efecto túnel magnético a temperatura ambiente fue descubierto por primera vez en el año 1995
por Terunobu Miyazaki e independientemente por Moodera y otros siguieron un renovado interés en
este campo impulsado por el descubrimiento del efecto de la magnetorresistencia gigante. Ahora es
la base de la MRAM (magnetic random access memory) y lee los sensores en las unidades de disco
duro.
En el año 2001, los equipos de Butler y de Mathon hicieron de forma separada la predicción teórica
del uso del hierro como ferromagneto y del MgO como aislante. En el año 2004, los equipos de
Parkin y Yuasa fueron capaces de hacer uniones Fe/MgO/Fe que llegan a más de 200% TMR a
temperatura ambiente. En el año 2007, los dispositivos TMR basados en MgO desplazaron
completamente los dispositivos GMR en el mercado de los dispositivos de almacenamiento
magnético.
9

3. Memorias sólidas

3.1. Memoria RAM


RAM (Random Access Memory) es un tipo de almacenamiento de datos en los ordenadores que
está formada por circuitos electrónicos integrados que permiten que los datos almacenados se
puedan acceder en cualquier orden, es decir, de forma aleatoria. La palabra aleatoria se refiere al
hecho de que cualquier trozo de los datos se puede extraer en un tiempo fijo, sin reparar en su
localización física o si está relacionado o no con el trozo previo de datos extraídos.
Esto contrasta con los mecanismos de almacenamiento como las cintas magnéticas, los discos
magnéticos y los discos ópticos, en que el tiempo de acceso de los datos depende del movimiento
físico de la cabeza de grabación o de lectura. En estos dispositivos, el movimiento de estos
cabezales es fundamental para establecer el tiempo de transferencia de datos y el tiempo de
extracción depende de la localización física del trozo siguiente.
La palabra RAM está asociada principalmente con los tipos volátiles de memoria, como los
módulos de memoria DRAM, donde la información se pierde si falla la alimentación eléctrica.

3.2. Historia
Los tipos más antiguos de RAM eran las memorias magnéticas, desarrolladas en los años 1949-
1951, y por lo tanto usadas en la mayoría de ordenadores hasta el desarrollo de las RAM actuales
constituidas por circuitos electrónicos integrados, estáticos y dinámicos a finales de los años 1960 y
principios de los años 1970. Antes los ordenadores usaban relés, lineas de retardo o distintas
disposiciones de válvulas electrónicas para la realización de las principales funciones de memoria,
algunos de los cuales eran del tipo RAM y otras no. Antes del desarrollo de las ROM con circuitos
integrados, la memoria tipo RAM se construyó usando matrices de diodos semiconductores con
descodificadores de direcciones.

3.3. Tipos de RAM


Generalmente los tipos modernos de RAM, con funcionalidad regrabable, almacenan un bit de
datos en cada estado de un flip-flop, como en la SRAM (Static RAM) con la carga de un
condensador o la puerta de un transistor, o como en la DRAM (Dynamic RAM), EPROM,
EEPROM y Flash. Algunos tipos de RAM tienen circuitos para detectar y/o corregir los fallos
conocidos como errores de memoria de los datos almacenados, usando bits de paridad o códigos de
corrección de errores. La ROM (Read Only Memory), RAM del tipo solo lectura, usa una máscara
metálica que deja permanentemente activado/desactivado los transistores seleccionados, en vez de
almacenar una carga en ellos.
Tanto la SRAM como la DRAM son volátiles, es decir, pierden los datos almacenados si falla la
alimentación eléctrica.
Hay dos tipos básicos de memoria flash: el tipo NOR, que es capaz de un verdadero acceso
aleatorio y el tipo NAND, que no lo es.
Los sistemas operativos pueden particionar la RAM del ordenador como en los discos duros, lo que
le permite actuar como un disco duro más rápido de aquí que se le llame disco RAM.
Las últimas tecnologías de RAM no volátil, es decir, las que no pierden los datos si falla la
alimentación eléctrica, son las que usan nanotubos de carbono y se aprovechan del efecto túnel
magnético. En verano del año 2003, se introdujo un chip de RAM magnético de 128 kb con
10

tecnología de 0,18 µm. La tecnología de MRAM se basa en el efecto túnel magnético. En Junio del
año 2004, Infineon Technologies desveló un prototipo de 16 Mb basado en la tecnología de 0,18
µm. Nantero construyó en el año 2004 un prototipo de nanotubo de carbono de 10 Gb.
A diferencia de los modelos simples, los contenidos de los modernos módulos SDRAM no se
pierden inmediatamente cuando falla la alimentación eléctrica; su contenido pierde paulatinamente
según un proceso que dura varios segundos en función de la temperatura ambiente, pero que se
puede alargar a varios minutos con bajas temperaturas.

3.3.1.DRAM
Las memorias DRAM (Dynamic RAM) fueron las utilizadas en los primeros módulos RAM, tanto
en los SIMM como en los primeros DIMM. Es un tipo de memoria más barata que la SDRAM, pero
también bastante más lenta, por lo que con el paso del tiempo ha dejado de utilizarse. Esta memoria
es del tipo asíncrono, es decir, que iba a diferente velocidad que el sistema, y sus tiempos de
actualización eran bastante altos, del orden de entre 70 y 80 ns, alcanzando en sus últimas
versiones, las memorias EDO-RAM a unos tiempos de actualización de entre 30 y 40 ns.

3.3.2.SDRAM
Las memorias SDRAM (Synchronous Dynamic RAM) son las utilizadas actualmente, aunque por
SDRAM se suele identificar a un tipo concreto de módulos.
Son un tipo de memorias síncronas, es decir, que van a la misma velocidad del sistema, con unos
tiempos de acceso inferiores a los 10 ns, llegando incluso a los 5 ns en los módulos más rápidos.
Las memorias SDRAM se dividen en varios tipos:
– Los módulos SDR (Single Data Rate) son los conocidos normalmente como SDRAM. Se
trata de módulos del tipo DIMM, de 168 contactos, y con una velocidad de bus de memoria
que va desde los 66 MHz a los 133MHz. Estos módulos realizan un acceso por ciclo de
reloj. Se empezaron a utilizar con los Pentium II y su utilización llega hasta la salida de los
Pentium 4 de Intel y los procesadores Athlon XP de AMD. Este tipo de módulos se
denominan por su frecuencia de funcionamiento, es decir, PC66, PC100 o PC133.
– Los módulos DDR (Double Data Rate) son una evolución de los módulos SDR. Se trata de
módulos del tipo DIMM, de 184 contactos y 64 bits, con una velocidad de bus de memoria
de entre 100 MHz y 200 MHz, pero al realizar dos accesos por ciclo de reloj, las velocidades
efectivas de trabajo se sitúan entre los 200 MHz y los 400 MHz. Este es un punto que a
veces lleva a una cierta confusión, ya que tanto las placas base como los programas de
información de sistemas las reconocen unas veces por su velocidad nominal y otras por su
velocidad efectiva. Se han hecho pruebas con módulos a mayores velocidades, pero por
encima de los 200MHz (400MHz efectivos) suele bajar su efectividad. Esto junto al coste y
a la salida de los módulos del tipo DDR2, ha hecho que en la práctica sólo se comercialicen
módulos DDR de hasta 400MHz efectivos.
– Los módulos DDR2 son una evolución de los módulos DDR. Se trata de módulos del tipo
DIMM, en este caso de 240 contactos y 64 bits. Tienen unas velocidades de bus de memoria
real de entre 100 MHz y 266 MHz. La principal característica de estos módulos es que son
capaces de realizar cuatro accesos por ciclo de reloj, dos de ida y dos de vuelta, lo que hace
que su velocidad de bus de memoria efectiva sea el resultado de multiplicar su velocidad de
bus de memoria real por 4. Esto duplica la velocidad en relación a una memoria del tipo
DDR, pero también hace que los tiempos de latencia sean bastante más altos, ya que pueden
llegar a ser el doble que en una memoria DDR. Tanto las memorias DDR como las
memorias DDR2 se suelen denominar de dos formas diferentes, o bien en base a su
velocidad de bus de memoria efectiva (DDR-266, DDR-333, DDR-400, DDR2-533, DDR2-
11

667, DDR2-800) o bien por su ancho de banda teórico, es decir, por su máxima capacidad de
transferencia (PC-2100, PC-2700 y PC-3200 en el caso de los módulos DDR y PC-4200,
PC-5300 y PC-6400 en el caso de los módulos DDR2). El ancho de banda de los módulos
DDR y DDR2 se puede calcular multiplicando su velocidad de bus de memoria efectiva por
8 (DDR-400 por 8 = PC-3200).
– Los módulos DDR3 son también memorias del tipo SDRAM DIMM, de 64 bits y 240
contactos, pero no son compatibles con las memorias DDR2, ya que se trata de otra
tecnología y además físicamente llevan la muesca de posicionamiento en otra situación. Se
trata de memorias con una velocidad de bus de memoria real de entre 100 MHz y 250 MHz,
lo que da una velocidad de bus de memoria efectiva de entre 800 MHz y 2000 MHz, el
doble que una memoria DDR2 a la misma velocidad de bus de memoria real. Su máxima de
transferencia de datos de 15 Gbps.

3.4. Dispositivos SSD (Solid-State Drive)


Un SSD (Solid-State Drive) es un dispositivo de almacenamiento de datos que usa memoria en
estado sólido para almacenar datos de forma persistente. A diferencia de las tarjetas de memoria
basadas en flash, los SSD emulan un disco duro, lo que le reemplaza fácilmente en la mayoría de las
aplicaciones. Un SSD usa tecnología SRAM o DRAM, por lo que frecuentemente se dice que es un
dispositivo RAM.
El uso original de la terminología estado sólido se refiere al uso de dispositivos semiconductores en
vez de válvulas electrónicas, pero en este contexto se ha adaptado para distinguir la electrónica de
estado sólido de los dispositivos electromecánicos. Debido a la ausencia de partes móviles, los
dispositivos de estado sólido son menos frágiles que los discos duros y por lo tanto más silenciosos,
si no usan ventiladores; como no hay retardos mecánicos, normalmente tienen menor tiempo de
acceso y menor latencia.

3.4.1.Historia
Los primeros dispositivos SSD de memoria de ferrita aparecieron en la época de los ordenadores
con válvulas electrónicas. Sin embargo la introducción de las unidades de disco disminuyó su uso
por su alto precio. A finales de los años 1980, esta idea fue implementada en memoria de
semiconductor en los primeros supercomputadores de IBM, Amdahl y Cray, pero otra vez su alto
precio lo hicieron comercialmente poco viable.
En 1978 Storage Tek desarrolló el primer dispositivo de estado sólido. A mediados de los años 1980
Santa Clara Systems introdujo BatRam, una matriz de 1 Mb DIP RAM Chips y una tarjeta
controladora que emulaba un disco duro. El paquete incluía una batería recargable para mantener
los datos del chip de memoria cuando no había alimentación eléctrica. El Sharp PC-5000,
introducido en 1983, usaba cajas de 128k octetos de almacenamiento en estado sólido, con una
tecnología de memoria de burbujas.
Los discos RAM se popularizaron como medio de arranque en los años 1980 cuando los discos
duros eran caros y los discos flexibles eran lentos. Así los incorporaron a algunos sistemas como los
Amiga, los Apple Iigs y más tarde los Macintosh Portable. El sistema podría ser arrancado con
software y volver al sistema operativo en cuestión de segundos en lugar de minutos. Algunos
sistemas tenían respaldo con batería de forma que se mantenía el contenido aún cuando el sistema
estuviera apagado.
En ek año 1995 M-Systems introdujo mecanismos de estado sólido basados en flash. Desde
entonces las SSD se han usado satisfactoriamente como discos duros en la industria militar y la
aeroespacial, así como en otras aplicaciones de misión crítica. Estas aplicaciones requieren tasas de
12

indisponibilidad que se consiguen con los dispositivos de estado sólido.


El Gigabyte i-RAM utiliza los módulos estándar DDR y se conecta a su dispositivo a través de una
conexión del tipo Serial ATA. Esta tarjeta puede usar una toma de alimentación eléctrica para
mantener el contenido de la RAM incluso con el sistema apagado, e incluye una batería que puede
conservar los datos cuando el sistema está completamente desconectado.
En el año 2008, se introdujo una nueva clase de dispositivos de estado sólido: los EFD (Enterprise
Flash Drives). Los EFDs están diseñados específicamente para su uso en entornos de empresas y
centros de datos que requieren de altas prestaciones en cuanto al número de operaciones de entrada/
salida por segundo, al rendimiento, a la fiabilidad y a la eficiencia energética. Originalmente los
EFDs fueron introducidos por EMC Corporation en Enero de 2008 con el anuncio de las matrices
DMX-4 de Symmetrix.

3.4.2.Arquitectura y función
Normalmente un SSD está compuesto o por memoria volátil DRAM o por memoria no volátil flash
NAND.

Basada en DRAM
Los SSD basadas en memoria volátil como la DRAM se caracteriza por el acceso ultrarápido de los
datos, generalmente menos de 0,01 milisegundos, y se usan principalmente para acelerar las
aplicaciones que de otra manera se ralentizan debido a la latencia de los SSD Flash o los discos
duros tradicionales. Los SSD basados en DRAM suelen incorporar la batería interna y los sistemas
de almacenamiento de copia de seguridad para garantizar la persistencia de datos. Si se pierde la
energía eléctrica, la batería mantiene la energía necesaria durante el tiempo suficiente para permitir
la copia de todos los datos de la memoria de acceso aleatorio (RAM) al almacenamiento de respaldo
o para permitir la transferencia de los datos a otro equipo. Cuando se restaura la alimentación
eléctrica, los datos se copian de nuevo a la RAM desde la copia de seguridad, y el SSD reanuda su
funcionamiento normal.
Los SSD basados en DRAM también puede funcionar como un mecanismo de caché del buffer.
Cuando los datos se escriben en la memoria, se marca el bloque correspondiente en la memoria
como pendiente de enviar, y todos los bloques marcados se pueden enviar al disco duro real basado
en los siguientes dos criterios:
1.Por tiempo, por ejemplo, cada 10 segundos enviar todos los datos pendientes;
2.Por umbral. Se envían los datos cuando la relación de los datos pendientes de enviar con respecto
al tamaño del SSD excede un valor predeterminado.

Basada en flash
La mayoría de los fabricantes de SSD usan memoria flash no volátil para crear dispositivos más
robustos y más compactos. Estos SSD basados en memoria flash no requieren baterías. A menudo
están empaquetados con la forma estándar de una unidad de disco, es decir, 1,8, 2,5 y 3,5 pulgadas.
Además, al ser no volátil, permite a los SSD basados en flash mantener su memoria incluso durante
los cortes de energía eléctrica, asegurando así la recuperación de los datos. Aunque los SSD basados
en flash son significativamente más lentos que los basados en DRAM, por lo general tienen mejores
prestaciones que los tradicionales discos duros, al menos en lo que respecta a la lectura, debido a su
tiempo de búsqueda, en que en el SSD es muy pequeño dado que no tiene partes móviles.

3.4.3.Comparación con los discos duros


Sus ventajas son las siguientes:
13

• Arranque más rápido, dado que no hay piezas móviles.


• Acceso aleatorio más rápido en la lectura ya que no hay que mover cabezales de
lectura/escritura.
• Tiempo de latencia extremadamente bajo, dado que los tiempos de búsqueda de los SSD son
del orden de magnitud menor que los mejores discos duros.
• Escritura extremadamente rápida.
• Sin ruido: la falta de partes móviles en los SSD los hace completamente silenciosos, excepto
en los de gran capacidad dado que en este caso requieren ventiladores para su refrigeración.
• Los SSD basados en flash de baja capacidad tienen un consumo muy bajo cuando están
activos, a diferencia de los SSD basados en DRAM que tienen mayores consumos de
energía.
• Alta fiabilidad mecánica ante la falta de partes móviles que elimina el riesgo de fallo
mecánico.
• Capacidad para soportar choques extremos, vibración y temperaturas extremas: una vez más
porque no hay partes móviles. Esto hace que los SSD sean útiles para los equipos portátiles,
los equipos móviles y los dispositivos que operan en condiciones extremas.
• Mayor gama de temperaturas de funcionamiento. Los discos duros normales tienen un rango
de operación de 5-55° C. La mayoría de las unidades flash pueden funcionar hasta 70° C, y
en algunas unidades de tipo industrial pueden operar en un rango de temperatura aún mayor.
• El rendimiento de la lectura es relativamente determinista: a diferencia de las unidades de
disco duro, el rendimiento de los SSD es casi constante y determinista. Esto es porque el
tiempo de búsqueda es casi constante y no depende de la ubicación física de los datos, y así
la fragmentación de ficheros casi no tiene impacto en la lectura.
• Para los SSD de baja capacidad, el tamaño y el peso por unidad de almacenamiento son aún
mejores que los tradicionales discos duros permitiendo llegar hasta una capacidad de 20 GB
en un CompactFlash de 42,8×36,4×5 mm.
Sus inconvenientes son los siguientes:
• Precio. A partir de mediados de 2008, los precios de los SSD son todavía considerablemente
más costosos en comparación con los discos duros convencionales.
• Capacidad. Actualmente es mucho menor que la de los discos duros convencionales.
• Mayor vulnerabilidad a determinados tipos de efectos tales como la pérdida súbita de
energía eléctrica especialmente en los SSD basadas en DRAM, los campos magnéticos y las
cargas eléctricas estáticas, en comparación con los discos duros normales que almacenan los
datos dentro de una jaula de Faraday.
• Ciclos de escritura limitados. A menudo las células de memoria flash se desgastan después
de 10.000-100.000 ciclos de escritura, mientras que las células de alta resistencia pueden
tener una autonomía de 1-5 millones de ciclos de escritura.
• Velocidad de escritura más lenta. En general borrar bloques en los SSD basadas en flash
lleva bastante tiempo. Son mucho más lentas que los discos convencionales para escrituras
aleatorias y por tanto vulnerables a la fragmentación, y en algunos casos a las escrituras
secuenciales. Los SSD basados en DRAM no sufren de este problema.
• Baja densidad de almacenamiento. Los discos duros pueden almacenar más datos por unidad
de volumen que los SSD basados en DRAM o en flash, a excepción de la muy baja
capacidad de los dispositivos pequeños.
• Mayor consumo de energía en modo inactivo o bajo cargas de trabajo de bajo tiempo de
ejecución.
• Los SSD basados en RAM requieren más energía que los discos duros.
14

3.5. Dispositivo flash USB


Un dispositivo flash USB consiste en un dispositivo de almacenamiento de datos de memoria flash
del tipo NAND con una conexión USB. Normalmente los dispositivos flash USB son extraíbles y
regrabables, de un tamaño muy inferior a un disquete, así como tener un peso muy pequeño.
Normalmente sus capacidades de almacenamiento van de 64 MB hasta 64 GB con mejoras
continuas en cuanto al tamaño y al precio.
Las unidades flash USB ofrecen unas ventajas potenciales sobre otros dispositivos portátiles de
almacenamiento, dado que son más compactas, más rápidas, contienen muchos más datos, tienen un
diseño más duradero, y son más fiables por falta de piezas móviles. Por otro lado los puertos USB
aparecen en todos los ordenadores, tanto los de sobremesa como los portátiles.
Realmente nada se mueve en una unidad flash: se trata de un dispositivo diseñado para leer y
escribir datos utilizando los mismos comandos del sistema que una unidad de disco magnético,
apareciendo en el sistema operativo del ordenador y en la interfaz de usuario como una unidad más.
Una unidad flash se compone de una pequeña placa de circuito impreso protegida dentro por una
carcasa de plástico, metal, o de goma, lo suficientemente robusta que permite ser llevada sin
ninguna protección adicional, por ejemplo, en un bolsillo o en un llavero. El conector USB está
protegido por una tapa extraíble o de retracción en el cuerpo de la unidad, aunque si se expone no es
susceptible de ser dañado.
Para acceder a la unidad se debe conectar a un puerto USB, que alimenta el dispositivo y le permite
enviar y recibir datos. Algunas unidades flash, especialmente las unidades de alta velocidad, pueden
requerir una alimentación externa al ordenador, debido a la potencia limitada proporcionada por un
puerto USB.

Tecnología
Actualmente la memoria flash es una combinación de varias tecnologías antiguas de los
microprocesadores, a un menor coste, menor consumo y menor tamaño. Estas antiguas tecnologías
tales como las EPROM y las EEPROM, con una capacidad muy limitada, eran muy lentas en sus
funciones de lectura y escritura, requerían complejos circuitos y solamente permitían la escritura
previo el borrado del contenido existente.
Más tarde las EEPROM se desarrollaron de forma que la región de datos se subdividió en campos
más pequeños que podrían ser borrados de forma individual, sin afectar a los demás. Alterar el
contenido de una determinada posición de memoria, implicaba primero copiar todo el campo en una
memoria buffer fuera del chip, a continuación borrar el campo, y luego reescribir los datos en el
mismo campo. Esto requiere un importante control de estas operaciones por parte del ordenador y a
15

menudo los sistemas de memoria flash EEPROM llevaban su propio sistema de microprocesador
dedicado. Las unidades flash son más o menos una versión en miniatura de esto.
El desarrollo de las interfaces serie de datos de alta velocidad como las conexiones USB así como el
desarrollo de los pequeños sistemas de microprocesadores de alta velocidad y de bajo consumo, han
permitido una forma de gestión extremadamente compacta. También el acceso serie redujo el
número de conexiones eléctricas necesarias en los chips de memoria.
Los sistemas modernos de memoria flash acceden de forma muy parecida a las unidades de disco
duro, donde el controlador de sistema tiene el control total sobre el almacenamiento de la
información. Sin embargo los procesos actuales de escritura y borrado de las EEPROM siguen
siendo muy similares a los anteriores sistemas descritos anteriormente .

Historia
Trek Technology e IBM empezaron a vender los primeros dispositivos flash USB en el año 2000. El
dispositivo flash USB de IBM tenía una capacidad de 8 MB, cuatro veces la capacidad de un
disquete. En el año 2000 Lexar introdujo una tarjeta CF (Compact Flash) con conexión USB, y una
tarjeta de lectura/escritura asociada.
Los modernos dispositivos flash tienen conectividad USB 2.0. Sin embargo no usan actualmente
todo el ancho de banda de 480 Mbps de la especificación USB 2.0 Hi-Speed debido a limitaciones
técnicas inherentes al flash NAND. Los dispositivos más modernos usan un controlador de doble
canal, aunque todavía están muy por debajo de la tasa de transferencia posible de un disco duro de
la generación actual, o del máximo rendimiento de alta velocidad USB. Los dispositivos rápidos
normales dicen tener una velocidad de hasta 30 Mbps y escriben a la mitad de este ancho de banda.
Los dispositivos más antiguos de 12 Mbps están limitados a un máximo de alrededor de 1 Mbps.

Normalmente este dispositivo se compone de cuatro partes:


• El conector USB tipo-A macho para conexión a un ordenador.
• El controlador del almacenamiento que implementa el controlador USB. El controlador
contiene un pequeño procesador RISC y una pequeña cantidad de ROM y RAM.
• El chip de memoria flash NAND que almacena los datos.
• Un oscilador de cristal que genera una señal de reloj de 12 Mhz que controla la salida de los
datos del dispositivo.

Tamaño y tipo de empaquetado


Algunos fabricantes hacen unos encapsulados voluminosos que dificultan su uso en cuanto dificulta
la conexión con el puerto USB. Debido a que los conectores de puerto USB de un ordenador son a
menudo muy próximos entre sí, conectar una unidad flash en un puerto USB puede bloquear el
puerto adyacente.
Las unidades flash USB se han integrado en otros artículos de uso común tales como relojes,
bolígrafos, y hasta la navaja del ejército suizo, mientras que otros han sido equipados con otras
cosas curiosas, tales como coches de juguete o las piezas de LEGO. El pequeño tamaño, robustez y
bajo costo de las unidades flash USB las hace cada vez más populares.

Sistema de ficheros
La mayoría de las unidades flash tienen como sistemas de ficheros de fábrica FAT o FAT 32. Este
sistema de ficheros permite que la unidad se encuentre disponible en prácticamente cualquier
dispositivo con soporte USB. Además las utilidades estándares de mantenimiento de FAT, por
ejemplo ScanDisk y otros similares, se pueden utilizar para reparar o recuperar los datos dañados.
16

Las unidades flash se pueden desfragmentar, pero esto no comporta ninguna ventaja, ya que no hay
ninguna cabeza mecánica que ralentice la lectura o escritura; en todo caso se acorta la vida de la
unidad por hacer innecesarias muchas operaciones de escritura.

3.6. Tarjeta MMC (MultiMedia Card)


La tarjeta MultiMediaCard (MMC) es una tarjeta estándar de memoria flash presentada por
Siemens AG y SanDisk en 1997, que se basa en la memoria flash NAND de Toshiba, y por lo tanto
es mucho más pequeña que los sistemas anteriores basados en memoria NOR de Intel como la
CompactFlash. Tiene un tamaño aproximado de 24 mm × 32 mm × 1,4 mm. Originalmente MMC
utilizaba una interfaz serie de 1-bit, pero las nuevas versiones de la especificación permite
transferencias de 4 u 8 bits a la vez. Ha sido más o menos superada por las tarjetas Secure Digital
(SD), pero todavía tiene un uso significativo porque MMC se puede utilizar en la mayoría de los
dispositivos que soportan tarjetas SD.
Normalmente una tarjeta MMC se utiliza como un medio de almacenamiento para un dispositivo
portátil, en cuanto se puede quitar fácilmente de un acceso de un PC. Por ejemplo, una cámara
digital utilizaría una MMC para almacenar ficheros de imagen. Con un lector de MMC,
normalmente conectado a un puerto USB o alguna otra conexión de serie, un usuario puede copiar
las fotos hechas con la cámara digital.
Las tarjetas MMC están disponibles en tamaños de hasta 32 GB. Se utilizan en casi todos los
contextos en los que se utilizan tarjetas de memoria, como teléfonos celulares, reproductores de
audio digital, cámaras digitales y PDAs. Desde la introducción de la ranura de la tarjeta Secure
Digital y SDIO (Secure Digital Input / Output) , pocas empresas construyen ranuras MMC en sus
dispositivos, pero al ser ligeramente más delgada, las MMC pueden utilizar casi cualquier
dispositivo que soporte tarjetas SD si el software/firmware del dispositivo los soporta.
Esta tecnología es un estándar disponible para cualquier empresa que desee desarrollar productos
basados en MMC, excepto que se debe entrar a formar parte de la MMCA (MMC Association -
http://www.mmca.org/ ) para fabricar las propias tarjetas.
A partir de julio de 2009, las especificaciones de la última versión de Marzo de 2009 se pueden
solicitar a la MMCA, y después de registrarse, se pueden descargar de forma gratuita. Las versiones
anteriores de la norma, así como algunos accesorios opcionales a la norma como miCard y
SecureMMC, debe ser compradas por separado.
Samsung, patrocinador principal de MMC, proporciona una hoja de datos muy detallada, que
contiene gran parte de la información esencial para escribir un controlador de tarjeta MMC.
A partir del 23 de Septiembre 2008, MMCA ha entregado todas las especificaciones a la
organización JEDEC incuidos la e-MMC y la miCard. JEDEC es una organización dedicada a las
normas de la industria de estado sólido.

3.7. Tarjeta SD (Secure Digital)

3.7.1.Historia
En Agosto de 1999, Panasonic, SanDisk y Toshiba acordaron por primera vez desarrollar y
comercializar la tarjeta SD (Secure Digital). Con un tamaño de 24 mm × 32 mm × 2,1 mm, la nueva
tarjeta es compatible con los estándares DRM y SDMI.
El nuevo formato fue diseñado para competir con el formato Memory Stick de Sony que fue
lanzado el año anterior, y se denominaba MagicGate DRM, y era físicamente más grande. Se
pensaba que las características DRM se utilizarían de forma amplia debido a la presión de las
17

empresas multimedia para evitar la piratería.


En el CES 2000, Matsushita, SanDisk y Toshiba Corporation anunciaron la creación de la SD Card
Association para promover las tarjetas SD. Tiene su sede en California, y está compuesta por unos
30 ejecutivos de las principales empresas de alta tecnología y las grandes empresas de contenidos.
Las primeras muestras de la tarjeta SD estuvieron disponibles en el primer trimestre del año 2000,
con capacidades de 32 y 64 Mb.
En Abril del 2006, la SDA (Secure Digital Association - http://www.sdcard.org/) lanzó una detallada
especificación relativa a la seguridad con partes de la tarjeta de memoria estándar SD. Además
lanzaron las especificaciones para el SDIO (Secure Digital Input Output) y el controlador de las
tarjetas estándar SD. Durante el mismo año, se concluyeron las especificaciones para la pequeña
microSD y el SDHC, con capacidades de más de 2 GB y una mínima velocidad de lectura/escritura
de 2,2 Mbps.
La tarjeta SD no es solo la única tarjeta de memoria flash estándar ratificada por la Secure Digital
Association. Otros formatos de tarjeta de la SD Association son las tarjetas miniSD, microSD y
SDHC (Secure Digital High Capacity), con capacidades mayores de 4 GB. Hay algunos lectores de
tarjetas que no puede manejar más de 1 GB . La tarjeta SDHC no es totalmente compatible con el
formato ampliado, así los dispositivos SD que no soportan específicamente SDHC, no funcionan
con las nuevas tarjetas.

3.7.2.Diseño e implementación
Las tarjetas SD se basan en el antiguo formato MMC (MultiMediaCard) pero tiene las diferencias
siguientes:
• La tarjeta SD tiene forma asimétrica para que no se pueda insertar al revés, mientras que una
tarjeta MMC si se conecta al revés no hace contacto.
• La mayoría de las tarjetas SD son físicamente más gruesas que las MMC. En general las
tarjetas SD tiene un tamaño de 32 mm × 24 mm × 2,1 mm, pero puede llegar a tener un
grosor de 1,4 mm, al igual que las tarjetas MMC.
• Los contactos están empotrados debajo de la superficie de la tarjeta, protegiendo los
contactos del contacto con los dedos.
• Normalmente las tarjetas SD tienen tasas de transferencia en el rango de 10-20 Mbps

Los dispositivos con ranuras SD pueden utilizar las tarjetas MMC, pero las tarjetas SD no caben en
las ranuras MMC. Las tarjetas miniSD y microSD se pueden utilizar directamente en ranuras SD
con un adaptador pasivo simple, ya que difieren en tamaño y forma pero no en cuanto a la interfaz
eléctrica. Con un adaptador electrónico activo, las tarjetas SD se pueden utilizar en las ranuras para
tarjetas CompactFlash. Algunas tarjetas SD incluyen un conector USB para tener compatibilidad
con los ordenadores de sobremesa y los portátiles y los lectores de tarjetas SD permiten a estas
tarjetas SD acceder a través de puertos tales como USB, FireWire, y el puerto paralelo de la
impresora.

Lengüeta opcional de protección contra escritura


Al mirar la tarjeta desde la parte superior, hay una muesca en el lado derecho. En el lado izquierdo
por lo general hay una pestaña deslizante. Esta es la protección de escritura. La MMC no tiene ni
escotadura. La pestaña/muesca funciona de la misma manera que las muescas de los casetes
compactos de audio y vídeo, cuando el dispositivo detecta la muesca determina si la tarjeta está
protegida o no contra escritura. Cuando esta protección de escritura está en la posición hacia abajo,
entonces está protegida contra escritura y está en modo sólo lectura. Dado que esta muesca es
opcional, la tarjeta puede ser que la tenga o no.
18

Sistema de ficheros
Al igual que las demás tecnologías de tarjetas flash, la mayoría de las tarjetas SD vienen
preformateadas con el sistema de ficheros FAT o FAT 32. La ubicuidad de este sistema de ficheros
permite a la tarjeta acceder a prácticamente cualquier dispositivo con un lector de SD. Además las
utilidades estándares de mantenimiento de FAT, por ejemplo ScanDisk y similares, se pueden
utilizar para reparar o recuperar datos dañados. Sin embargo, dado que la tarjeta aparece como un
disco duro extraíble en el sistema, la tarjeta puede ser formateada para cualquier sistema de ficheros
soportado por el sistema operativo.

3.7.3.Velocidades
Hay diferentes velocidades disponibles que se miden basándose en las velocidades del sistema CD-
ROM, en múltiplos de 150 kBps (1x = 150 kBps). Las tarjetas básicas tienen una tasa de
transferencia de datos de hasta seis veces (6x) la tasa de datos de la velocidad estándar de CD-ROM
(900 kBps frente a 150 kBps). Las tarjetas de alta velocidad se fabrican con una transferencia de
datos de hasta 66x (10 MBps) e incluso se llega hasta 200x o más. Se ha de tener en cuenta que la
velocidad máxima de lectura y la velocidad máxima de escritura pueden ser diferentes, y siempre la
velocidad máxima de escritura suele ser inferior a la máxima velocidad de lectura. Algunas cámaras
digitales requieren tarjetas de alta velocidad de escritura para grabar vídeo sin problemas o capturar
múltiples fotografías en rápida sucesión. La especificación de tarjeta SD 1.01 permite una velocidad
máxima de 66x. Las tarjetas SD de velocidades hasta 200x son definidas por la especificación 2.0.

3.7.4.Estándares
Al igual que la mayoría de los formatos de las tarjetas de memoria, la tarjeta SD está cubierta por
numerosas patentes. Hay tres versiones de la especificación SD: 1.0, 1.1 y 2.0. Sin embargo la SD
Card Association (SDA - http://www.sdcard.org) ha dado acceso a una versión simplificada de la
especificación en virtud de una licencia menos restrictiva. Aunque la mayoría de controladores de
código abierto fueron escritos antes, esto les ha ayudado a resolver algunas cuestiones de
compatibilidad.

Para la mayoría, la falta de las especificaciones completas y abiertas de la tarjeta SD afectó


principalmente a los sistemas que incluían sus lectores, ya que en general los usuarios de los
ordenadores de sobremesa leen las tarjetas SD a través de los puertos USB. Estos lectores de
tarjetas presentan un interfaz estándar USB para las tarjetas de memoria, separando así el sistema
operativo de los detalles de la interfaz SD subyacente. Sin embargo los sistemas que los incluyen,
como los reproductores portátiles de música, acceden por lo general directamente a las tarjetas SD,
y por lo tanto es necesaria la información completa para su programación. Actualmente muchos
portátiles incluyen lectores de tarjetas SD que no se basa en los puertos USB.

Explicación técnica
Las tarjetas SD soportan al menos tres modos de transferencia:
– Modo SD de un bit y un formato de transferencia propietario.
– Modo SD de cuatro bits. Utilliza pins extra además de algunos pins reasignados.
– Modo SPI, un subconjunto más simple del protocolo SD para su uso con los
microcontroladores.
Todas las tarjetas SD deben soportar los tres modos, a excepción de la tarjeta microSD donde el
modo SPI es opcional. Las tarjetas también deben soportar frecuencias de reloj de hasta 25 MHz
19

para las tarjetas normales, y 50 MHz para las tarjetas de alta velocidad.

Características DRM (Digital Rights Management)


El esquema de gestión de los derechos digitales integrado en las tarjetas SD se define como CPRM
(Content Protection for Recordable Media) por la 4C Entity, y se centra en el uso del cifrado de
Cryptomeria, también conocido como C2. La especificación se mantiene en secreto y sólo es
accesible a los que tienen licencia. DVD-Audio utiliza un esquema muy similar conocido como
CPPM (Content Protection for Prerecorded Media). Este tipo de DRM se asocia con SDMI (Secure
Digital Music Initiative), una organización creada por la RIAA (Recording Industry Association of
America ) para promocionar los esquemas de protección de copias basado en hardware.

Compatibilidad con capacidad superior a 4 GB


Los dispositivos que utilizan las tarjetas SD la identifican con una etiqueta que consiste en una
cadena de 128 bits. Para las tarjetas SD de capacidad estándar, se usan 12 de estos bits para
identificar el número de clusters de memoria (de 1 a 4096) y 3 de los bits se utilizan para identificar
el número de bloques por cluster, que decodifica a 4, 8, 16, 32, 64, 128, 256 o 512 bloques por
cluster.
En las viejas implementaciones 1.x, el bloque estándar es de exactamente 512 octetos. Esto da
4096 x 512 x 512 = 1 GB de memoria de almacenamiento. Una posterior revisión de la norma 1.x
permite que con un campo de 4 bits se indique 1024 ó 2048 octetos por bloque, obteniéndose así
capacidades mayores de 1 gigabyte de almacenamiento de memoria. Los dispositivos diseñados con
anterioridad pueden identificar de forma incorrecta estas tarjetas, por lo general identificándolas con
menor capacidad.
Para la nueva implementación de la tarjeta SDHC de alta capacidad (versión 2.0), se usan 22 bits
para la cadena de identificación con un tamaño de memoria en incrementos de 512 Kbytes.
Actualmente se pueden utilizar 16 de los 22 bits, lo que da un tamaño máximo de 32 GB. Todas las
tarjetas SDHC de 4 GB y mayores deben tener la implementación 2.0. Dos bits que antes estaban
reservados y establecidos en 0, ahora se utilizan para identificar el tipo de tarjeta, 0 = normal, 1 =
HC, 2 = reservado, 3 = reservado. Los dispositivos no HC no están programados para leer este
código y por lo tanto no pueden leer correctamente la identificación de la tarjeta. Todos los lectores
SDHC funcionan con las tarjetas estándar SD.
Según la especificación de la SD Association: "Para hacer tarjetas de 2 Gbytes, la longitud del
bloque máximo (READ_BL_LEN = WRITE_BL_LEN) se fija en 1024 octetos. Sin embargo la
longitud del bloque, fijada por CMD16, será de 512 octetos para mantener la coherencia con las
tarjetas de longitud máxima de bloque de 512 octetos."
20

Tarjetas SD (non-SDHC) mayores de 1 GB


Las especificaciones actuales de la SD Card Association definen una tarjeta SD estándar (no SDHC)
con una capacidad máxima de 4 GB. Estas tarjetas deben poder ser leídas por cualquier dispositivo
de SD 1.01.
De acuerdo con la especificación, la capacidad máxima de una tarjeta SD estándar se define por el
par de valores (BLOCKNR x BLOCK_LEN), donde BLOCKNR puede ser (4096 x 512) y
BLOCK_LEN puede ser hasta 2048. Esto permite una capacidad de hasta 4 GB. El principal
problema es que algunos lectores de tarjetas sólo soportan tamaño de bloque de 512 octetos, por lo
que las tarjetas no SDHC mayores de 1GB pueden tener problemas de compatibilidad.

3.7.5.Tarjetas SDHC
SDHC (Secure Digital High Capacity, SD 2.0) es una extensión del estándar SD que apareció en
Junio de 2006. SDHC permite capacidades mayores de 2 GB cumpliendo el estándar. Normalmente
las tarjetas SDHC se formatean con el sistema de ficheros FAT32. Usan el mismo tamaño que las
tarjetas SD, pero el estándar 2.0 SD en SDHC utiliza un método de direccionamiento de memoria
diferente, un direccionamiento por sector en vez de un direccionamiento por octeto, lo que
teóricamente permite alcanzar una capacidad máxima de hasta 2 TB (2048 GB). Sin embargo, la SD
Card Association ha definido el límite máximo de la capacidad SDHC a 32 GB. Las tarjetas SDHC
sólo funcionan en los dispositivos compatibles con SDHC, mientras que las tarjetas SD estándar
funcionan tanto en los dispositivos SD como en los SDHC.

Las clases de las tarjetas SDHC han sido definidas por la SD Association en función de su
velocidad. Cada clase viene identificada por su velocidad mínima de escritura basada en el mejor
estado fragmentado donde no está ocupada ninguna unidad de memoria. Así las clases definidas
son:
• Clase 2: 2 MB/s
• Clase 4: 4 MB/s
• Clase 6: 6 MB/s
A menudo las tarjetas SDHC también anuncian una velocidad máxima como 133x o 150x, además
de esta velocidad mínima identificativa de la clase.

Cuestiones de compatibilidad SD y SDHC


Antes del año 2007, la disponibilidad simultánea de tarjetas SD de 4 GB y de tarjetas SDHC de 4
GB fue motivo de confusión para los usuarios. Las tarjetas SD cumplen con las revisiones
posteriores de la versión 1.x de la especificación SD, pero son incompatibles con los lectores
basados en las revisiones anteriores de la especificación.
Los dispositivos que soportan las tarjetas SD y las tarjetas SDHC tienen estos problemas de
21

compatibilidad:
• Los dispositivos que no soportan específicamente SDHC no reconocen las tarjetas SDHC.
• Algunos fabricantes han fabricado tarjetas SD de 4 GB que no cumplen la especificación SD
2.0/SDHC ni los dispositivos SD.
• Sistema de ficheros: Las tarjetas SD están normalmente formateadas con el sistema de
ficheros FAT16, mientras que las tarjetas SDHC están normalmente formateadas en FAT32.
Sin embargo, ambos tipos de tarjetas pueden soportar cualquier sistema de ficheros de
propósito general, como por ejemplo UFS2/ext2 o el propietario exFAT.

3.7.6.Tarjetas SDXC
El formato SDXC (Secure Digital Extended Capacity) fue presentado en el CES 2009. La capacidad
máxima definida para las tarjetas SDXC es de 2 TB (2048 GB), sin embargo están limitadas a 32
GB si cumplen con la especificación SD 2.0.
La tasa de transferencia máxima de SDXC anunciada es de 104 Mbps, con planes para aumentarla a
300 Mbps. La Asociación SDcard seleccionó el sistema propietario de ficheros exFAT de Microsoft
en las especificaciones oficiales de SDXC; sin embargo, las tarjetas SD y las SDHC tiene la
posibilidad de usar un particionamiento arbitrario y sistemas de ficheros como FAT32, NTFS o
ext2, etc.
El 7 de Enero de 2009, SanDisk y Sony anunciaron el desarrollo conjunto de la variante XC en el
Memory Stick, con la misma capacidad máxima de 2 TB de la SDXC, pero con tasas de
transferencia más lentas que la anterior generación de formato Memory Stick. El 8 de Enero de
2009, Panasonic anunció planes para la producción de tarjetas SDXC de 64 GB. El 6 de Marzo de
2009, Pretec introdujo la primera tarjeta SDXC con una capacidad de 32 GB y una velocidad de
lectura/escritura de 50 Mbps. El 3 de Agosto de 2009, Toshiba anunció el lanzamiento de la primera
tarjeta SDXC de 64 GB con una velocidad de lectura de 60 Mbps.

3.7.7.Tarjetas SDIO (Secure Digital Input/Output)


Los dispositivos que soportan SDIO, como PDAs, ordenadores portátiles o teléfonos móviles,
pueden usar dispositivos pequeños diseñados para el formato SD, como receptores GPS,
adaptadores Wi-Fi o Bluetooth, modems, adaptadores Ethernet, lectores de códigos de barras,
adaptadores IrDA, sintonizadores de radio FM, sintonizadores de televisión, lectores de RFID,
cámaras digitales, u otros medios de almacenamiento masivo, como discos duros.
Las tarjetas SDIO son totalmente compatibles con el controlador de la tarjeta de memoria SD,
incluidos los sistemas mecánicos, eléctricos, de energía, de señalización y software. Cuando una
tarjeta SDIO se inserta en un sitio que no es estándar SDIO, no causará ningún daño físico en el
dispositivo o en el controlador. Para SDIO es obligatorio la topología de bus SPI, a diferencia de la
memoria SD. La mayoría de los comandos de memoria SD no son compatibles con SDIO. Las
tarjetas SDIO puede contener hasta 8 tarjetas separadas lógicamente

3.7.8.Tarjetas SD con características especiales


Varios fabricantes han tratado de hacer sus tarjetas SD de formas diferentes:
• SD Plus es un tipo de tarjeta SD de SanDisk que dispone de un conector USB integrado para
que pueda ser conectado directamente a un puerto USB sin necesidad de ningún lector de
tarjetas especial. Este concepto se ha probado con éxito y otras empresas comenzaron a
introducir diseños con el nombre dúo SD.
• Capacity Display anunció en el año 2006 A-DATA, una tarjeta SD con su propia pantalla
22

digital que muestra el espacio libre de la tarjeta.


• Eye-Fi, Inc. fabricó una tarjeta SD con capacidad Wi-Fi 802.11g, 802.11y compatible con
versiones anteriores de redes inalámbricas 802.11n, soportando los estándares de seguridad
WEP 40/104/128, WPA-PSK y WPA2-PSK . La tarjeta funciona con cualquier cámara
digital con una ranura SD, y puede enviar de forma inalámbrica las imágenes capturadas
directamente a un ordenador. Cuando no se alcance una conexión de red inalámbrica, la
tarjeta hace uso de su capacidad de 2GB (EYE-FI-modelo de 2 GB), hasta que las imágenes
pueden ser transferidas.
23

4. Dispositivos magnéticos

4.1. Discos duros


El disco duro es un dispositivo de almacenamiento no volátil, es decir, conserva la información que
le ha sido almacenada de forma correcta aún con la falta de energía eléctrica. Emplea un sistema de
grabación digital magnética, donde en la mayoría de los casos se encuentra almacenado el sistema
operativo del ordenador. En este tipo de disco, dentro de la carcasa se encuentran una serie de platos
metálicos apilados girando a gran velocidad. Sobre estos platos se sitúan los cabezales encargados
de leer o escribir los impulsos magnéticos. Hay distintos estándares a la hora de comunicar un disco
duro con el ordenador. Estos estándares se corresponden a los siguientes tipos de interfaces más
habituales: Integrated Drive Electronics (IDE/ATA) , SCSI (Small Computers System Interface ),
SATA (Serial ATA) y Fibre Channel.
Tal y como sale de fábrica, el disco duro no puede ser utilizado por un sistema operativo. Primero se
tiene definir un formato de bajo nivel, luego una o más particiones y a continuación darle un
formato que pueda ser entendido por el sistema operativo del dispositivo donde está instalado el
disco.
También existe otro tipo de discos denominados de estado sólido que utilizan cierto tipo de
memorias construidas con semiconductores para almacenar la información. Generalmente el uso de
esta clase de discos se limita a las supercomputadoras, por su elevado precio, aunque hoy en día ya
se puede encontrar en el mercado unidades mucho más económicas de baja capacidad para el uso en
computadoras personales.

4.1.1.Historia
El primer disco duro, el IBM 3501, apareció en el año 1956. Entre el primer disco duro y los
minúsculos discos duros actuales, la evolución ha sido hasta más dramática que en el caso de la
densidad creciente de los transistores, gobernada por la ley de Moore.
El Ramac I o IBM 3501 pesaba una tonelada y su capacidad era de 5 MB. Más grande que una
nevera actual, este disco duro trabajaba todavía con válvulas al vacío y requería una cónsola
separada para su manejo. Su gran mérito consistía en el que el tiempo requerido para el acceso a un
dato no dependía de la ubicación física del mismo.
La tecnología inicial aplicada a los discos duros es relativamente simple, consiste en recubrir con
material magnético un disco de metal que está formateado en pistas concéntricas, que luego se
dividen en sectores. El cabezal magnético codifica la información magnetizando diminutas
secciones del disco duro, empleando un código binario de ceros y unos. Los bits o dígitos binarios
así grabados pueden permanecer intactos durante muchos años. Originalmente, cada bit tenía una
disposición horizontal en la superficie magnética del disco, pero luego se descubrió cómo registrar
la información de una manera más compacta.
El mérito del francés Albert Fert y al alemán Peter Grunberg, ambos premio Nobel de Física por sus
contribuciones en el campo del almacenamiento magnético, fue el descubrimiento del fenómeno
conocido como magnetorresistencia. Esta técnica permite construir cabezales de lectura y grabación
más sensibles, y compactar más los bits en la superficie del disco duro. A partir de estos
descubrimientos, realizados en forma independiente por estos investigadores, se disparó el
crecimiento en cuanto a la capacidad de almacenamiento en los discos duros, que se elevó al 60%
anual en la década de 1990.
En el año 1992, los discos duros de 3,5 pulgadas alojaban 250 MB, mientras que 10 años después
24

habían superado los 40.000 MB o 40 gigabytes (GB). En la actualidad, ya nos acercamos al uso
cotidiano de los discos duros con más de un terabyte (TB) o millón de megabytes.

4.1.2.Estructura física
Un disco duro suele constar de las piezas siguientes:
• Platos en donde se graban los datos.
• Cabezal de lectura/escritura.
• Motor que hace girar los platos.
• Electroimanes que mueven el cabezal.
• Circuito electrónico de control, que incluye: interfaz con la computadora, memoria caché,
etc.
• Bolsita desecante (gel de sílice) para evitar la humedad.
• Caja para proteger el disco de la suciedad.

Dentro de un disco duro hay varios platos, que son discos de aluminio o cristal concéntricos y que
giran todos a la vez. El cabezal, que es un dispositivo de lectura y escritura, es un conjunto de
brazos alineados verticalmente que se mueven todos a la vez hacia dentro o fuera según convenga.
En la punta de dichos brazos están las cabezas de lectura/escritura, que gracias al movimiento del
cabezal pueden leer tanto zonas interiores como exteriores del disco.
Cada plato tiene dos caras, y es necesaria una cabeza de lectura/escritura para cada cara, no es una
cabeza por plato, sino una por cara. Si se mira el esquema Cilindro-Cabeza-Sector, a primera vista
se ven 4 brazos, uno para cada plato. En realidad, cada uno de los brazos es doble, y contiene 2
25

cabezas: una para leer la cara superior del plato, y otra para leer la cara inferior. Por tanto, hay 8
cabezas para leer 4 platos. Las cabezas de lectura/escritura nunca tocan el disco, sino que pasan
muy cerca hasta a 3 nanómetros ó millonésimas de milímetro. Si alguna llega a tocarlo, causaría
muchos daños en el disco, rayándolo gravemente, debido a lo rápido que giran los platos. Un plato a
7.500 revoluciones por minuto, el borde va a 120 km/h.

4.1.3.Direccionamiento
Hay varios conceptos con referencia a las zonas del disco:
• Plato: Cada uno de los discos que hay dentro del disco duro.
• Cara: Cada uno de los dos lados de un plato
• Cabeza: Número de cabezales
• Pista: Una circunferencia dentro de una cara; la pista 0 está en el borde exterior.
• Cilindro: Conjunto de varias pistas. Son todas las circunferencias que están alineadas
verticalmente, una de cada cara.
• Sector : Cada una de las divisiones de una pista. El tamaño del sector no es fijo, siendo el
estándar actual 512 octetos. Antiguamente el número de sectores por pista era fijo, lo cual
desaprovechaba significativamente el espacio, ya que en las pistas exteriores pueden
almacenar más sectores que las interiores. Así, apareció la tecnología ZBR (grabación de
bits por zonas) que aumenta el número de sectores en las pistas exteriores, y usa más
eficientemente el disco duro.
El primer sistema de direccionamiento que se usó fue el cilindro-cabeza-sector (CHS-
Cylinder/Head/Sector), ya que con estos tres valores se puede situar un dato en el disco. Más
adelante se creó otro sistema más sencillo: el LBA (direccionamiento lógico de bloques), que
consiste en dividir el disco entero en sectores y asignar a cada uno de ellos un número único como
identificación. Este método es el que se usa actualmente.

4.1.4.Estructura lógica
En lo que se refiere la estructura lógica, dentro del disco se encuentra:
• El registro de arranque principal en el sector de arranque y que contiene la tabla de
particiones.
• Las particiones, necesarias para poder instalar los sistemas de ficheros.

4.1.5.Características de un disco duro


Las principales características que se deben tener en cuenta en un disco duro son:
• Tiempo medio de acceso: Tiempo medio que tarda el cabezal en situarse en la pista y el
sector deseado; es la suma del tiempo medio de búsqueda (situarse en la pista) y la latencia
media (situarse en el sector).
• Tiempo medio de búsqueda: Tiempo medio que tarda el cabezal en situarse en la pista
deseada; es la mitad del tiempo empleado por el cabezal en ir desde la pista más periférica
hasta la pista más interna del disco.
• Latencia media: Tiempo medio que tarda el cabezal en situarse en el sector deseado; es la
mitad del tiempo empleado en una rotación completa del disco.
• Velocidad de rotación: Revoluciones por minuto de los platos. A mayor velocidad de
rotación, menor latencia media.
• Tasa de transferencia: Velocidad a la que puede transferir la información a la computadora
una vez el cabezal está situado en la pista y sector deseados. Puede ser velocidad sostenida o
26

de pico.
Otras características son:
• Caché de pista: Es una memoria tipo RAM dentro del disco duro. Los discos duros de estado
sólido utilizan cierto tipo de memorias construidas con semiconductores para almacenar la
información. El uso de esta clase de discos generalmente se limita a las supercomputadoras,
por su elevado precio.
• Interfaz: Medio de comunicación entre el disco duro y la computadora. Puede ser IDE/ATA,
SCSI, SATA, USB, Firewire, SAS
• Landz: Zona sobre las que aterrizan las cabezas una vez apagada la computadora.

4.2. Disquetes (Floppy disk)


Un disquete es un medio de almacenamiento magnético de datos que se compone de un disco
delgado y flexible ( "floppy") encerrado en una carcasa de plástico cuadrada o rectangular. Los
discos flexibles son leídos y escritos por una unidad de disco (FDD). Inventado por IBM, con
formatos de 8 pulgadas (200 mm), 5 ¼ pulgadas (133,35 mm) y 3 ½ pulgadas (90 mm), ha gozado
durante muchos años de gran popularidad, para su uso en el almacenamiento e intercambio de datos
desde mediados de los años 1970 hasta finales de 1990. Ahora estos disquetes han sido ampliamente
superados por las unidades flash USB, los discos duros externos, los CDs, los DVDs y las tarjetas
de memoria.

El disquete revolucionó el almacenamiento en disco de los ordenadores en la década de los años


1970. Los disquetes, que llegaron a ser omnipresente en los años 1980 y 1990 en su uso en
ordenadores personales y equipos similares, como el Apple II, el Macintosh, el MSX/MSX 2/2
+/TurboR, el Amstrad CPC, el Sinclair ZX Spectrum +3, el Commodore 64/128, el Atari ST, el
Amiga y los PC compatibles IBM, sirvieron para distribuir el software, transferir datos, y crear
copias de seguridad.
Antes de que los discos duros fueran asequibles en cuanto a precio, los disquetes se usaban para
almacenar el sistema operativo de un ordenador, además del software de las aplicaciones y los
datos. La mayoría de los ordenadores tenían un sistema operativo principal almacenado
permanentemente en la tarjeta ROM, con la opción de cargar un sistema operativo más avanzado
desde un disquete, ya sea un sistema propietario, el CP/M, o más tarde, el DOS.

Los CDs grabables de bajo costo y gran capacidad, que también eran compatibles con una
infraestructura ya existente de unidades de CD-ROM, hicieron aflorar las nuevas tecnologías de
disco. La última ventaja de los discos, su reutilización, fue en gran parte contrarrestado por los CD
regrabables. Más tarde los avances en los dispositivos basados en memoria flash y la adopción
generalizada de la interfaz USB, ha hecho que el almacenamiento óptico sea obsoleto para algunos
fines.
Un intento de continuar con el disquete tradicional fue el SuperDisk (LS-120) a finales de los años
1990, con una capacidad de 120 MB, que fue compatible con el estándar de disquetes de 3 ½
pulgadas.

Historia
Los primeros disquetes, inventados por IBM, eran de 8 pulgadas de diámetro. Estuvieron
disponibles comercialmente en el año 1971. Los discos con este tamaño se fabricaron y mejoraron
en IBM y otras empresas, como Memorex, Shugart Associates, y Burroughs Corporation.
En el año 1976, Shugart Associates introdujo el primer disquete de 5 ¼ pulgadas y los medios de
comunicación asociados. En el año 1978 hubo más de 10 fabricantes de disquetes de 5 ¼ pulgadas,
27

compitiendo en los formatos físicos: sectorizados por harware (90 KB) y sectorizados por software
(110 KB). Los formatos de 5 ¼ pulgadas desplazaron rápidamente a los de 8 pulgadas para la
mayoría de las aplicaciones, y el formato sectorizado por hardware de 5 ¼ pulgadas desapreció
finalmente.
En el año 1984, IBM presentó el disquete de 1,2 MB de doble cara, junto con su ordenador personal
modelo AT. En el año 1986, IBM empezó a utilizar el disquete de doble densidad de 3,5 pulgadas y
720 kB en sus ordenadores personales. Introdujo la versión de alta densidad de 1,44 MB con los
ordenadores PS/2. En el año 1988, IBM presentó un disquete DSED de 2,88 MB en sus modelos
PS/2 de alta gama; fue un fracaso comercial.
A lo largo de la década de los años 1980 las limitaciones del formato de 5 ¼ pulgadas empezaban a
ser claras. Originalmente diseñado por ser más pequeño y más práctico que el formato de 8
pulgadas, el sistema de 5 ¼ pulgadas era por sí mismo demasiado grande, y como la calidad de los
medios de grabación fue creciendo, la misma cantidad de datos se podían colocar en una superficie
más pequeña.
Así se desarrollaron una serie de soluciones, con unidades de 2 pulgadas, 2 ½ pulgadas, 3 pulgadas
y de 3 ½ pulgadas (50, 60, 75 y 90 mm), todas ofrecidas por diversas empresas. Todos compartían
una serie de ventajas en comparación con el formato más antiguo, incluyendo su tamaño y un
envoltorio rígido con una pestaña deslizante de protección contra escritura. El uso casi universal del
formato de 5 ¼ pulgadas hizo muy difícil para cualquiera de estos nuevos formatos el obtener una
cuota de mercado significativa.
Sony presentó su propio pequeño formato de 90 mm x 94 mm. Sin embargo, este formato sufrió un
destino similar al de los otros nuevos formatos: el formato de 5 ¼ pulgadas simplemente tenía la
cuota de mercado demasiado alta. Una variante en el diseño de Sony, introducido en el año 1982
por un gran número de fabricantes, fue rápidamente adoptada. En el año 1988, el formato de 3 ½
pulgadas era superado por el de 5 ¼ pulgadas.

A finales de la década de los años 1980, los disquetes de 5 ¼ pulgadas fueron sustituidos por los
disquetes de 3 ½ pulgadas. A mediados de la década de los años 1990 los disquetes de 5 ¼ pulgadas
prácticamente habían desaparecido, siendo el disquete de 3 ½ pulgadas el que se convirtió en el
predominante. Una de las principales ventajas de los disquetes de 3 ½ pulgadas, además de su
menor tamaño, es que permitía caber en un bolsillo de la camisa, lo que le da una buena protección
contra el polvo, los líquidos, las huellas, los arañazos, la luz solar, la deformación, y otros riesgos
ambientales.

Estructura
El disquete de 5 ¼ pulgadas tenía un gran agujero circular en el centro para el eje de la unidad y una
abertura ovalada en ambos lados del plástico para permitir que las cabezas pudieran leer y escribir
los datos. Una pequeña muesca en el lado derecho del disco determinaba si el disco era de sólo
lectura o también permitía la escritura, detectada por un interruptor mecánico o un fototransistor
encima de ella. Otro fototransistor situado cerca del centro del disco puede detectar un pequeño
agujero, una vez por vuelta, llamado el agujero de índice, en el disquete magnético. Se utiliza para
detectar el inicio de cada pista, y si el disco gira a la velocidad correcta. Algunos sistemas
operativos, tales como Apple DOS, no utilizaron el índice de sincronización y, a menudo las
unidades diseñadas para tales sistemas carecían del sensor del agujero de índice. A estos disquetes
se les llamaba de sector de software. Muy pronto los disquetes de 8 pulgadas y de 5 ¼ pulgadas
también tuvieron el agujeros físico para cada sector, y se llamaban disquetes de sector de hardware.
Dentro del disco hay dos capas de tela diseñadas para reducir la fricción entre el medio y la
envoltura exterior; entre las dos capas de tela se coloca la capa magnética. El disco de 8 pulgadas es
muy similar en cuanto a estructura al disco de 5 ¼ pulgadas, con la excepción de que en modo solo
28

lectura es la inversa, es decir, la ranura tenía que ser tapada con cinta adhesiva para no permitir la
escritura.
El disco de 3 ½ pulgadas está hecho de dos piezas de plástico rígido, con un conjunto tela-medio-
tela en el medio para eliminar el polvo y la suciedad. Solo delante tiene una etiqueta y una pequeña
abertura para la lectura y la escritura de los datos, protegida por un muelle de metal o una cubierta
de plástico, que se retrotrae cuando se introduce el disquete en la ranura de la unidad.
Las unidades de 5 ¼ pulgadas y todas las unidades de 3 ½ pulgadas encajan de forma automática
cuando el usuario inserta un disquete, y se desengancha y se expulsa cuando se aprieta el botón de
expulsión. En los ordenadores Apple Macintosh con unidades de disquete de fábrica, el disquete se
expulsa con un motor en lugar de hacerlo manualmente; no hay botón de expulsión. El icono del
disco en el escritorio se arrastra hasta el icono de la papelera para expulsar un disquete.

4.3. Cintas magnéticas


La cinta magnética es un medio de almacenamiento magnético, constituído generalmente por una
capa delgada magnetizable encima de una larga y estrecha tira de plástico. Casi todas las cintas de
grabación son de este tipo, ya sean utilizadas para la grabación de audio o de vídeo o para el
almacenamiento de datos informáticos. Originalmente fueron desarrolladas en Alemania, basadas en
el concepto de grabación en alambre magnético. Un dispositivo que almacena datos de la
computadora en cinta magnética se puede llamar una unidad de cinta, o streamer.
La cinta magnética revolucionó las industrias de difusión y grabación. En una época en que la radio
y más tarde la televisión, estaban muy vivas, las cintas magnéticas permitieron que la programación
fuera pregrabada. En un momento en que los discos de gramófono solo se podían grabar una vez,
permitió que las grabaciones se crearan en varias etapas y fueran fácilmente mezcladas y editadas
con poca pérdida de calidad. Es también una de las tecnologías clave que permite el desarrollo de
los ordenadores modernos. La cinta magnética permitió que cantidades masivas de datos se
pudiesen almacenar en las computadoras durante largos períodos de tiempo y que se accediera con
rapidez cuando fuera necesario.

Sin embargo para el almacenamiento de datos a largo plazo, la cinta magnética puede sufrir el
deterioro llamado síndrome sticky-shed, causado por la absorción de humedad en la cinta, lo que la
puede hacer ilegible.

La utilización de cinta magnética para el almacenamiento de datos informáticos ha sido una de las
constantes de la industria informática. En todos los formatos, una unidad de cinta utiliza motores de
precisión que mueven la cinta de un carrete a otro, pasando por un cabezal de lectura/escritura.
La primera vez que se usó la cinta magnética para grabar datos informáticos fue en el año 1951 en
el Eckert-Mauchly UNIVAC I. El medio de grabación era una estrecha cinta de metal de 1,5
pulgadas. El metal, llamado Vicalloy, era una aleación de bronce con níquel. Grababa con una
densidad de 128 caracteres por pulgada en ocho pistas paralelas a la cinta.
Las primeras unidades de cinta de IBM estaban apoyadas en el suelo ya que utilizaban columnas de
vacío de forma de U largas donde colgaban las cintas. Cuando estaban activas, los dos carretes de la
cinta movían la cinta en las columnas de vacío de forma intermitente, girando en rápidas ráfagas
sincronizadas.
Los siguientes sistemas de cinta magnética utilizaban bobinas que son mucho más pequeñas que los
viejos carretes abiertos de 10,5 pulgadas y se fijaban dentro de un cartucho para proteger la cinta y
facilitar su manipulación. A finales de los años 1970 los ordenadores personales utilizaban cintas
compactas codificadas con el estándar Kansas City. Los formatos modernos de las cintas son LTO,
DLT y DDS.
29

En algunas situaciones la cinta magnética sigue siendo una alternativa viable al disco debido a su
menor costo por bit. Aunque la densidad real de la cinta es inferior a la de las unidades de disco, la
superficie disponible en una cinta es mucho mayor. La capacidad de una cinta es generalmente del
mismo orden que la mayor unidad de disco disponibles, cerca de 1 TB en el año 2007.
Históricamente la cinta ha ofrecido la ventaja en cuanto a coste sobre el almacenamiento en disco
haciéndole que sea un producto viable, sobre todo para copias de seguridad, donde se necesitan
medios removibles.

Así en la actualidad las cintas magnéticas se utilizan principalmente para hacer copias de seguridad
de los datos almacenados en los discos. Sin embargo, dado la disminución del coste de los discos en
contra de las cintas, así como el aumento del ancho de banda de las comunicaciones y sus precios,
hace que estas copias de seguridad se sustituyan por sistemas redundantes como los sistemas RAID
entre otros.

4.3.1.Tecnología LTO (Linear Tape-Open)


LTO (Linear Tape-Open) es una tecnología de almacenamiento de datos en cinta magnética
desarrollada a finales de los años 1990 como un estándar abierto alternativo a los formatos
propietarios que estaban disponibles en ese momento. Seagate, Hewlett-Packard, e IBM iniciaron el
LTO Consortium (http://www.ultrium.com/ ), que dirige el desarrollo, las licencias de gestión y la
certificación de los medios de comunicación y los fabricantes del mecanismo. La forma estándar de
la tecnología LTO recibe el nombre de Ultrium. Su versión original fue lanzada el año 2000 y
podría almacenar hasta 100 GB de datos en un solo cartucho. La versión más reciente fue lanzada
en el año 2007 y puede almacenar hasta 800 GB en un cartucho del mismo tamaño. Desde el año
2002, la tecnología LTO ha estado vendiendo el formato 'super tape' y es ampliamente utilizado por
los sistemas informáticos pequeños y grandes para hacer las copias de seguridad.

Pin guía
La cinta dentro de un cartucho LTO se enrolla alrededor de un solo carrete. El final de la cinta está
conectado a un pin guía que es utilizado por la unidad LTO de manera fiable para captar el final de
la cinta y montarla en una bobina recogedora dentro de la unidad. Cuando un cartucho no se
encuentra en una unidad, el pin hace que no se pueda abrir el cartucho.
La razón básica para que un cartucho no se puedan cargar en una unidad es la mala colocación del
pin guía. La ranura de plástico donde el pin normalmente se encuentra, se deforma y el pin guía ya
no está en la posición de que la unidad espera que esté.
Las tecnologías antiguas de las cintas magnéticas usan diferentes medios para cargar la cinta en un
carrete. Los dispositivos de 9 pistas usan una ráfaga de aire contra el carrete para separarlo
automáticamente y enganchar el extremo suelto de la cinta. Esto ha funcionado sin un pin guía.

LTO-CM
Cada cartucho LTO tiene un chip Cartridge Memory en su interior. Se compone de 128 bloques de
memoria, donde cada bloque tiene 32 octetos para un total de 4096 octetos. Esta memoria puede
leer y/o escribir 1 bloque a la vez, a través de una interfaz RF pasivo sin contactos. Esta memoria se
utiliza para identificar las cintas y ayuda a los dispositivos a discriminar entre las diferentes
generaciones de la tecnología.
Cada unidad LTO tiene un lector CM (Cartridge Memory). También hay disponibles lectores
externos. La interfaz tiene un tamaño de 20 mm.
30

Disposición de la cinta
La unidad de cinta LTO Ultrium se presenta con 4 bandas de datos intercaladas entre 5 bandas de
arrastre. Las bandas de datos están numerados como 3,1,0,2 a través de la cinta y se llenan de forma
individualizada en orden numérico. La cabeza principal arrastra las 2 bandas de arrastre de cada
lado de la banda de datos que se escribe o lee. Las bandas de arrastre se utilizan para mantener la
cabeza alineada con precisión dentro de la banda de datos.
Las pistas de datos se escriben en pasadas hacia adelante y hacia atrás, también llamadas 'wraps'. Se
necesitan varios wraps para llenar completamente una banda de datos. Todos los elementos de
escritura de la cabeza escriben en el mismo instante que la cabeza pasa por encima de la banda de
datos desde el principio físico de la cinta hasta el final físico. Esto corresponde a un wrap hacia
adelante. Al final, la cabeza se desplaza a la banda siguiente para escribir los elementos con un
nuevo conjunto de pistas dentro de la banda de datos. Ahora está preparada para hacer un wrap
inverso. Todas las pistas escritas por el mismo elemento de escritura en la misma dirección se
encuentran agrupadas. Para determinar el número de pasos necesarios para llenar una cinta, se tiene
que dividir el número total de pistas por el número de elementos de escritura. Por ejemplo, una cinta
LTO-2 requiere 64 pases.
La estructura del bloque de la cinta es lógica así los espacios entre bloques, las marcas de fichero,
las marcas de la cinta, etc. ocupan sólo unos pocos octetos cada uno. En LTO-1, a esta estructura
lógica se añaden los códigos CRC y la compresión para crear bloques de 403.884 octetos. También
se añade otros 468 octetos de información, que incluyen los datos estadísticos y de información
sobre la unidad que escribió los datos y cuando fue escrito. Por último se añaden los octetos de
corrección de errores con lo que el tamaño total del conjunto de datos es de 491.520 octetos. Los
formatos para LTO-2 y LTO-3 son similares.

WORM
La capacidad WORM (Write Once Read Many) se incorpora en la tecnología LTO-3. Normalmente
sólo es útil para su registro legal de mantenimiento. Una unidad de cinta LTO-3 no borrará o
sobreescribirá datos en un cartucho WORM, pero lo leerá. Un cartucho WORM LTO-3 es idéntico a
un cartucho normal LTO-3, excepto que su chip lo identifica como WORM y la pista de arrastre es
ligeramente diferente para permitir la verificación de que los datos no han sido modificados. Las
unidades WORM son capaces de reconocer inmediatamente los cartuchos WORM e incluir una
identificación única para cada conjunto de datos escritos en la cinta.

Compresión
La especificación LTO describe un método de compresión de datos LTO-DC, llamado también
SLDC (Streaming Lossless Data Compression). Es muy similar al algoritmo ALDC, que es una
variante del LZS.
La principal diferencia entre el ALDC y el SLDC es que el SLDC no aplica el algoritmo de
compresión a los datos sin comprimir, es decir, los datos ya están comprimidos o son lo
suficientemente aleatorios para desechar el algoritmo de compresión. Cada bloque de datos escrito
en la cinta tiene un bit de cabecera que indica si el bloque está comprimido o no. De cada bloque de
datos que el algoritmo trabaja, se guarda una copia de los datos sin comprimir. Después de aplicar la
función de compresión a los datos, el algoritmo compara el bloque de datos comprimido con el
bloque de datos sin comprimir y escribe el menor de los dos en la cinta. El bit extra utilizado por
SLDC para diferenciar entre los bloques comprimidos de los que no lo son, se coloca en la parte
superior de esta expansión de datos.
El LTO-DC consigue un ratio de compresión de 2:1 aproximadamente cuando se aplica al Calgary
31

Corpus. Esto es inferior a los algoritmos más lentos como el asgzip, pero similar al lzop y a los
algoritmos de alta velocidad integrados en otras unidades de cinta. Cabe señalar que los ficheros de
texto plano, de las imágenes en bruto, y de las base de datos (TXT, ASCII, BMP, DBF, etc)
normalmente se comprimen mucho mejor que otros tipos de datos almacenados en sistemas
informáticos. Por el contrario, los datos cifrados y precomprimidos (PGP, ZIP, JPEG, MPEG, MP3,
etc) normalmente aumentan de tamaño si se aplica la compresión de datos. En algunos casos esta
expansión de datos podría ser de hasta un 15%. Con el algoritmo SLDC, esta expansión se evita.

Encriptación
La especificación LTO-4 añade esta característica que permite a las unidades LTO-4 encriptar los
datos antes de que se graben en cinta. Todas las unidades LTO-4 debe disponer de cintas
codificadas, pero no requieren soporte al proceso de encriptado. El algoritmo usado por LTO-4 es el
AES-GCM, que es un encriptado autenticado simétrico de bloques. La misma clave se utiliza para
encriptar y desencriptar los datos, y el algoritmo puede detectar la manipulación de los datos.

Detección y corrección de errores


Las unidades de cinta utilizan un fuerte algoritmo de corrección de errores que hace posible la
recuperación de los datos cuando se pierden los que están dentro de una pista. Cuando se escriben
los datos en la cinta, se comprueba leyéndolos de nuevo, utilizando los cabezales de lectura que se
encuentra justo detrás de los cabezales de escritura. Esto permite a la unidad escribir una segunda
copia de los datos si falla la verificación.

4.3.2.Tecnología DLT (Digital Linear Tape)


La tecnología DLT (Digital Linear Tape), llamada anteriormente CompacTape, es una tecnología de
almacenamiento de datos en cinta magnética desarrollada por Digital Equipment Corporation
(DEC) a partir del año 1984. En el año 1994, la tecnología fue adquirida por Quantum Corporation,
que actualmente fabrica unidades con esta licencia. Una variante con mayor capacidad se llama
Super DLT (SDLT). Se fabricó inicialmente una línea más barata por Benchmark Storage
Innovations bajo licencia de Quantum. Quantum adquirió Benchmark en el año 2002.
Sus especificaciones técnicas están estandarizadas en ECMA (European Computer Manufacturers
Association ) (http://www.ecma-international.org) y son las siguientes:
• ECMA 197. Especificación del DLT 2.
• ECMA 209. Especificación del DLT 3.
• ECMA 231. Especificación del DLT 4.
• ECMA 258. Especificación del DLT 3-XT.
• ECMA 259. Especificación del DLT 5.
• ECMA 286. Especificación del DLT 6.
• ECMA 320. Especificación del SDLT-1.

Tecnología
La tecnología DLT usa la grabación lineal con múltiples pistas en cintas de media pulgada (12,7
mm) de ancho. Los cartuchos contienen una sola bobina y la cinta sale del cartucho por medio de
una cinta guía adjunta a la bobina de recogida dentro de la unidad. La cinta guía de la unidad está
sujeta al cartucho guía durante el proceso de carga. La velocidad de la cinta y la tensión se controlan
electrónicamente a través de los motores del carrete. La cinta está guiada por rodillos, en número de
4 a 6, que sólo tocan la parte de atrás de la cinta. El material de la cinta es MP/AMP (Metal
Particle).
32

La tecnología SDLT añade un sistema servo-óptico que lee los patrones de alineación en la parte
posterior de la cinta, a fin de mantener las pistas de datos en la parte frontal de la cinta
correctamente alineadas con las cabezas de lectura/escritura. Esto es importante para los medios de
cinta más recientes, que tienen una mayor densidad de datos; es habitual densidades de 256, 384 y
768 pistas de datos en una cinta de media pulgada de ancho.
Las DLT7000 y DLT8000 inclinan la cabeza hacia adelante y hacia atrás para reducir la
interferencia entre las pistas adyacentes a través del azimut. A esto se le llama grabación simétrica
de fase.
Todas las unidades DLT soportan la compresión de datos por hardware. El factor de compresión
habitual es de 2:1 y, en general sólo se obtiene para los datos de texto. Un factor más realista de un
sistema de ficheros es de 1,3:1 a 1,5:1. Tener en cuenta que la compresión de la unidad aplicada a
los datos precomprimidos actualmente puede hacer que los datos grabados tengan un tamaño mayor.
Una nueva convención entró en vigor en el año 2005 con la DLT-S de mayor rendimiento y la DLT-
V. DLT incluye la capacidad WORM (Write Once Read Many).
En Febrero de 2007, Quantum dejó de desarrollar las próximas generaciones de unidades DLT (S5 y
V5) después de la baja aceptación del mercado de las unidades S4 y V4, pasándose a la tecnología
LTO.

4.3.3.Tecnología DDS (Digital Data Storage)


La tecnología DDS (Digital Data Storage) es una tecnología para almacenar y realizar copias de
seguridad de datos informáticos en cinta magnética. Es una evolución del DAT (Digital Audio
Tape), tecnología que se creó originalmente para la grabación de calidad de los CDs de audio. En el
año 1989, Sony y Hewlett Packard definieron el formato DDS para el almacenamiento de datos
utilizando cartuchos de cinta DAT. Las cintas que se ajuste al formato DDS inicial, pueden ser
leídas por unidades DAT o DDS. Sin embargo, la mayoría de las unidades de cinta DDS no pueden
recuperar el audio almacenado en un cartucho DAT.
La tecnología DDS utiliza una cinta de una ancho de 3,8 mm, con la excepción del último formato
DAT 160, que es de 8 mm de ancho. En un principio, la cinta era de 60 ó 90 metros de largo, a pesar
de que los avances en la tecnología de materiales hubieron permitido que la longitud fuera
sensiblemente mayor. Una unidad de cinta DDS utiliza el escaneado helicoidal para la grabación, el
mismo proceso usado por una grabadora de vídeo (VCR). Hay dos cabezales de lectura y dos
cabezales de escritura. Los cabezales de lectura verifican los datos que se han grabado. Si hay
errores, los cabezales de escritura reescriben los datos.
Un cartucho DDS debe ser retirado después de 2000 pasadas o 100 copias de seguridad completas.
Las unidades de cinta deben limpiarse con regularidad para mantenerse en buen estado de
funcionamiento. Las cintas DDS tienen una esperanza de vida de al menos 10 años.
Las especificaciones técnicas de este formato están desarrolladas bajo el estándar ECMA-139.
33

5. Dispositivos ópticos

5.1. CD (Compact Disc)


CD (Compact Disc) es un disco compacto, donde se almacenan los datos y que solo permite una
sola grabación en cada una de las partes del mismo.
Los CDs son popularmente utilizados para distribuir programas de ordenador, incluyendo juegos y
aplicaciones multimedia, y se puede almacenar cualquier tipo de datos hasta el límite de su
capacidad. Algunos CDs guardan los datos informáticos, y además también puede almacenar datos
multimedia, es decir, imágenes, vídeo y audio.
La diferencia entre los CDs de multimedia y de datos es la norma utilizada para almacenar la
información, pero fisicamente son idénticos. Los discos están hechos de un disco de espesor de 1,2
mm de policarbonato plástico, con una fina capa de aluminio que hace la superficie reflectante. El
tamaño más común de los CDs es de 120 mm de diámetro, aunque existe el estándar Mini CD con
un diámetro de 80 mm. Los datos se almacenan en el disco como una serie de hendiduras
microscópicas. Un láser enfocando en la superficie reflectante del disco lee las hendiduras. Debido
a la profundidad de los pozos que es aproximadamente de un cuarto a un sexto de la longitud de
onda de la luz láser que se utiliza para leer el disco, la fase del haz reflejado cambia en relación con
el haz incidente, provocando una interferencia destructiva, así como la reducción de la intensidad
del haz reflejado. Este patrón de cambios de intensidad del haz reflejado se convierte en datos
binarios.

Formatos
Hay varios formatos utilizados para los datos almacenados en los CDs, y todos ellos están
publicados en el Rainbow Books. Estos libros incluyen los estándares del original Red Book para
los CDs de audio, White Book y Yellow Book. El estándar ECMA-130 de ECMA (European
Computer Manufacturers Association ) (http://www.ecma-international.org), que da una descripción
detallada de la física y la capa física de la unidad del CD, incluye la codificación CIRC (Cross-
interleaved Reed-Solomon) y la modulación Eight-to-Fourteen.
La norma ISO 9660 de ISO (International Organization for Standardization) (http://www.iso.org)
define el sistema de ficheros estándar de un CD, aunque está previsto que se sustituya por la norma
ISO 13490. El formato UDF se usa en los CD-R y CD-RW. La especificación del CD de arranque,
para que un CD emule un disco duro o disquetes, se llama El Torito.
Las unidades de CD se han valorado con un factor relativo de velocidad en relación con la
velocidad de los CD de música. Así la referencia 1x equivale a una velocidad de transferencia de
datos de 150 kbps. Las unidades CAV (Constant Angular Velocity) dan velocidades de hasta 20x,
pero debido a la naturaleza de las CAV, el aumento de rendimiento real sobre 12x es inferior a
20/12.
Cada sector del CD contiene 2352 octetos, dividido en 98 grupos de 24 octetos. A diferencia de un
CD de música, un CD de datos requiere de una mayor fiabilidad en cuanto a la extracción de los
datos. Con el fin de lograr una mejora en la corrección y detección de errores, un CD de datos tiene
un tercer nivel de corrección de errores con el método Reed-Solomon. La tasa de transferencia de
un CD Modo-1, basada en la comparación con los estándares de audio CDDA, es de 153,6 kB/s. La
capacidad es de 74 minutos, o 4440 segundos, de modo que la capacidad neta de un CD Modo-1 es
de 682 MB. La velocidad 1x de un CD permite leer 75 sectores consecutivos por segundo.
34

Contenido de un sector del CD


– El CD estándar de 74 min contiene 333.000 bloques o sectores.
– Cada sector tiene 2352 octetos. En Modo 1 solo se disponen de 2048 octetos de datos, y en
Modo 2, 2336 octetos de PSX/VCD de datos, o 2352 octetos de audio.
– La diferencia entre el tamaño del sector y el contenido de los datos es la información de las
cabeceras y los códigos de corrección de errores, que son grandes para los datos, ya que se
requiere alta precisión, pequeño para vídeo y ninguno para el audio.
– La extracción del disco en formato virgen (raw) es siempre de 2352 bytes por sector. Este
hecho tiene dos consecuencias principales:
– La grabación de los CD de datos a muy alta velocidad (40x) se puede hacer sin
perder información. Sin embargo, como los CD de audio no contienen un nivel de
códigos de corrección de errores, el registro del audio a alta velocidad puede tener
errores irrecuperables.
– En el CD de 74 minutos, se puede encajar las imágenes más grandes con el modo
RAW, de hasta 333.000 × 2352 = 783.216.000 octetos, aproximadamente 747 MB.
Este es el límite superior de las imágenes RAW creados en un CD de 74 min. Si se
eliminan los códigos de corrección de errores, se puede incrementar en un 14,8% su
capacidad, pero si hay errores, la información es irrecuperable.
– El patrón de sincronización del CD Modo 1 es 0xff00ffffffffffffffff00ff
– Tener en cuenta que cuando se extrae una imagen en modo RAW, el tamaño de la imagen es
siempre un múltiplo de 2352 bytes, es decir, el tamaño de un bloque.

5.2. DVD (Digital Versatile Disc / Digital Video Disc)


El DVD, también conocido como Digital Versatile Disc o Digital Video Disc, es un formato de
disco óptico para el almacenamiento de datos, que fue desarrollado e inventado por Sony y Philips
en el año 1995. Sus principales usos son el almacenamiento de datos y de vídeo. Los DVD son de
las mismas dimensiones que los discos compactos (CD), pero con una capacidad seis veces mayor.
Los DVD son discos ópticos de igual estructura que los CD, pero de mayor capacidad. La longitud
de onda utilizada por láser estándar de DVD es de 650 nm, es decir, la luz tiene un color rojo. Los
láseres que se usan en ambos casos son iguales, lo que hace que un dispositivo DVD acepte también
CDs.
Los discos DVD-Video y DVD-Audio se formatean de acuerdo a los contenidos de vídeo y audio,
respectivamente. Otros tipos de DVD, incluidos los de contenido de vídeo, puede ser formateados
como discos DVD de datos.
Los DVD tienen un tamaño de 12 cm de diámetro y su capacidad se mide en gigabytes. Hay otro
formato de 8 cm de diámetro y otras variantes híbridas. La variedad de 8 cm se denomina
MiniDVD. La capacidad por superficie (MiB/cm2) varía desde 6,92 MiB/cm2 en el DVD-1 a 18
MiB/cm2 en el DVD-18.
Cada sector del DVD contiene 2418 octetos de datos, de los que 2048 octetos son para datos del
usuario.

Tipos de DVD
• Un lado, una capa. Este es el formato más simple y se conoce como DVD-5. Su capacidad
es de 4,7 GB de datos, siete veces más que la capacidad de un CD. DVD-5 puede contener
35

hasta 120 minutos de vídeo y audio digital (DVD-video) o 74 minutos de música de alta
resolución (DVD-audio). El '5' de DVD-5 significa que casi caben 5 GB de datos con este
tipo de DVD.
• Un lado, dos capas. Estos DVD tienen grabación en dos niveles, de aquí su nombre en inglés
'dual-layered'. A este tipo de DVD se les conoce como DVD-9, porque tiene una capacidad
de 8,5 GB. La ventaja de este tipo de DVD es que el reproductor conmuta automáticamente
al otro nivel de datos, reenfocando el láser. De esta forma nunca tenemos que dar la vuelta al
DVD. Este tipo de formato se usa a menudo comercialmente para añadir opciones a una
película en un solo disco. En un DVD-9 caben hasta 4 horas de vídeo.
• Dos lados, una capa. Conocido como DVD-10, este formato tiene una capacidad de 9,4 GB.
Graba los datos en las dos caras del DVD, por lo que requiere una intervención manual para
acceder a las dos caras. También caben hasta 4 horas de vídeo.
• Dos lados, dos capas. Es el DVD de mayor capacidad ya que soporta hasta 17 GB de datos.
También es conocido como DVD-18 y dobla la capacidad del formato una cara y dos capas.
Caben en él hasta 8 horas de DVD-video. Normalmente estos discos no se usan de forma
comercial. Observar también que en este caso se requiere una intervención manual para
acceder a la otra cara.

Los formatos posibles de los DVD son : DVD-R, DVD-RW, DVD+R, DVD+RW y DVD-RAM.
Los DVD-R y DVD+R pueden grabar datos solo una vez, como los CD-R. Por el contrario, los
DVD-RAM, DVD-RW y DVD+RW se pueden grabar miles de veces como los CD-RW. DVD-
RAM es un dispositivo de almacenamiento extraíble para los ordenadores y los grabadores de
vídeo. Por esta razón se usa mucho en los grabadores de DVD debido a su flexibilidad en cuanto a
la edición.

5.2.1. DVD+R / DVD-R


Este tipo de formato solo permite una sola grabación del DVD. Tiene una capacidad de 4.7GB de
datos o vídeo. Normalmente caben 2 horas de vídeo con formato MPEG-2 a la velocidad estándar
(SP).
Las diferencias entre ambos son las siguientes:
• El DVD-R es un formato aprobado por el grupo de estándares del DVD Forum. El DVD
Forum fue fundado por Mitsubishi, Sony, Hitachi y Time Warner, por lo que tiene un gran
apoyo de la industria.
• El DVD + R está soportado por la DVD Alliance. La DVD Alliance está compuesta por
Sony, Yamaha, Philips, Dell, y JP, por lo que también tiene un gran apoyo de la industria.

De acuerdo con las especificaciones de la DVD Alliance, si se usa un DVD+R/+RW le permite


hacer lo siguiente:
• Expulsar el DVD al instante sin tener que esperar a que finalice el formateo.
• Posibilidad de grabar parcialmente un disco de DVD en un ordenador y el resto en un
grabador de vídeo.
• Mientras se formatea el disco, se puede grabar simultáneamente en aquellas partes ya
formateadas.
• Aumento de la capacidad para editar los nombres de fichero, películas y títulos de canciones
y listas de reproducción.

El formato apoyado por el DVD Forum (http://www.dvdforum.org ), es decir el DVD-R, incorpora


la tecnología CLV (Constant Linear Velocity) o velocidad lineal constante, garantizando un flujo
constante de datos. Sus características fundamentales son:
– La grabación en este formato necesita de un proceso de inicialización y otro de finalización.
36

– Es necesario formatear el disco en su totalidad (inicialización) antes de comenzar a usarlo.


– Es necesario cerrarlo al terminar (finalización), de lo contrario no podrá ser leído por el
reproductor.
– Aunque implementa sistemas de seguridad como el CLV contra el 'Buffer Underrun', no
puede detener la grabación para reanudarla de nuevo cuando recibe más datos.

5.2.2. DVD+RW / DVD-RW


El DVD+RW/DVD-RW es la versión regrabable de DVD+R/DVD-R. Permite aproximadamente
1000 reescrituras. En general, los discos regrabables son ligeramente menos compatibles que los
normales. Solo se puede usar en grabadores DVD que soporten grabación regrabable o grabación
multiformato. También tienen una capacidad de 4,7GB de datos o vídeo.
Notar que en estos DVDs regrabables, su capacidad disminuye cuando se elimina un fichero, es
decir, a diferencia de los soportes mágnéticos, la eliminación de un fichero no comporta que el
espacio que ocupaba, se pueda reutilizar para volver a grabar datos. Todo soporte óptico solo se
puede grabar una sola vez en la misma zona.

5.2.3. DVD-RAM (DVD-Random Access Memory)


DVD-RAM (DVD-Random Access Memory) es una especificación de disco presentado en el año
1996 por el DVD Forum, que especifica los DVD-RAM regrabables.
El DVD-RAM tiene formato con y sin cartucho y son de uno o dos lados. Ofrecido por unos pocos
fabricantes como Panasonic, Toshiba y otros más pequeños, DVD-RAM es útil si se usa como un
disco duro. Dado que soporta hasta 100.000 reescrituras, el disco se puede usar para grabar
programas de TV, viéndolos y a continuación reescribiéndolos muchas veces. Los discos de una
cara tiene una capacidad de 4,7 GB, y los de doble cara 9,4 GB.

5.3. Disco Blu-ray


El disco Blu-ray (Blu-ray Disc) es un medio de almacenamiento de disco óptico diseñado para
reemplazar el formato estándar DVD. Sus principales usos son para el almacenamiento de vídeo de
alta definición, los juegos de vídeo de la PlayStation 3, y otros datos, hasta 25 GB por capa, y 50
GB en discos de doble capa. El disco tiene las mismas dimensiones físicas que los estándar CD y
DVD.
El nombre Blu-ray Disc deriva del láser azul-violeta utilizado para leer el disco. Mientras que un
DVD estándar utiliza un láser rojo de 650 nm, el disco Blu-ray utiliza un láser de una longitud de
onda más corta, un láser azul-violeta de 405 nm, lo que permite el almacenamiento de casi seis
veces más datos que un DVD.
Durante la guerra de formatos en discos de alta definición óptica, el disco Blu-ray compitió con el
formato HD DVD. Toshiba, la empresa principal que soporta el HD DVD, cedió en Febrero de
2008, y terminó la guerra de formatos en Julio de 2009, cuando Toshiba anunció sus planes para
poner fin a su propio dispositivo Blu-ray.
El disco Blu-ray ha sido desarrollado por la Blu-ray Disc Association (http://www.blu-raydisc.com),
un grupo que representa a los principales fabricantes de electrónica de consumo, de hardware de
ordenador, y de películas.

5.3.1.Historia
Los televisores comerciales de alta definición comenzaron a aparecer en el mercado de consumo
alrededor del año 1998, pero no había una forma barata de grabar y reproducir el contenido de la
37

alta definición. De hecho, no hubo ningún medio con el almacenamiento necesario para dar cabida a
los codecs de alta definición, con excepción de Digital VHS de JVC y HDCAM de Sony. Sin
embargo, era bien sabido que el uso de láseres con longitudes de onda más cortas permitían un
almacenamiento óptico de mayor densidad. Shuji Nakamura inventó el diodo de láser azul. Pero
debido a una larga demanda en cuanto a las patentes, se retrasó su introducción comercial.

Orígenes
Sony empezó dos proyectos aplicando los nuevos diodos: UDO (Ultra Density Optical), y el DVR
Blue con Pioneer, un formato de discos regrabables que eventualmente se convertiría en el Blu-ray
Disc, más específicamente, el BD-RE. Las tecnologías básicas de ambos formatos son
esencialmente similares.
Los primeros prototipos DVR Blue fueron presentados en la exposición CEATEC en Octubre del
año 2000. El 19 de Febrero de 2002, el proyecto fue oficialmente anunciado como Blu-ray y se
fundó inicialmente el Blu-ray Disc Founders con nueve miembros.
El primer dispositivo de consumo se comercializó el 10 de Abril de 2003. Este dispositivo fue el
Sony BDZ-S77, una grabadora BD-RE que solo estuvo disponible en el Japón. No había ninguna
norma para la grabación del vídeo y no hubo películas para este dispositivo. El 4 de Octubre de
2004, el Blu-ray Disc Founders cambió de nombre a Blu-ray Disc Association (BDA), y la 20th
Century Fox se unió a la Junta Directiva de la BDA.

Especificaciones físicas
Las especificaciones físicas del disco Blu-ray se completaron el año 2004. En Enero del 2005, TDK
anunció que ellos habían desarrollado un recubrimiento de polímero duro para los discos Blu-ray.
Ya no eran necesarios los cartuchos. Las especificaciones del Blu-ray Disc finalizaron a principios
del año 2006. AACS (Advanced Access Content System), un consorcio fundado en el año 2004,
había estado desarrollando la plataforma DRM que se podría utilizar para distribuir películas de
forma segura a los consumidores. Sin embargo, la norma definitiva AACS se retrasó, y después se
retrasó de nuevo cuando un miembro importante del grupo Blu-ray Disc expresó sus discrepancias.
A petición de los iniciales fabricantes de hardware, incluyendo Toshiba, Pioneer y Samsung, se
publicó una norma provisional en la que no se incluían algunas características tales como la copia
controlada.

Lanzamientos y desarrollos
Los primeros reproductores Blu-ray Disc se comercializaron a mediados de Junio del 2006, aunque
los reproductores HD DVD aparecieron poco después. Los primeros títulos Blu-ray Disc
aparecieron el 20 de Junio del 2006. Las primeras versiones usaban la compresión de vídeo MPEG-
2, el mismo método usado por el DVD estándar. Los primeros lanzamientos usando los nuevos
codecs VC-1 y AVC aparecieron en Setiembre del 2006. Las primeras películas usando disco de
doble capa, de capacidad 50 GB, aparecieron en Octubre del 2006. Los primeros lanzamientos de
solo audio fueron en Marzo del 2008.

Competencia con los DVD


El DVD Forum, presidido por Toshiba, estaba profundamente dividido sobre si desarrollar o no la
tecnología más cara del láser azul. En Marzo del 2002, el DVD Forum votó a favor de aprobar una
propuesta apoyada por la Warner Bros. y los estudios de películas inplicados en el contenido
comprimido de alta definición en los discos estándar DVD-9 de doble capa. Sin embargo a pesar de
esta decisión el Steering Committee del DVD Forum anunció en Abril que estaba buscando su
propia solución de alta definición con láser azul. En Agosto, Toshiba y NEC anunciaron su estándar
Advanced Optical Disc. Finalmente fue aprobado por el DVD Forum y renombrado HD DVD al
38

año siguiente, después de haber sido rechazado dos veces por los miembros del DVD Forum que
también eran miembros de la Blu-ray Disc Association.
El HD DVD tenía la ventaja en el mercado de vídeo de alta definición de que ya estaba implantado,
dado que las ventas del Blu-ray eran escasas. El primer reproductor de Blu-ray Disc era caro y se
disponían de pocos títulos. Esto cambió cuando se lanzó la PlayStation 3, ya que cada unidad de
PS3 también funciona como un reproductor de Blu-ray Disc. En el CES 2007, Warner propuso Total
Hi Def, un disco híbrido que contiene Blu-ray en una cara y HD DVD por el otro, pero nunca fue
comercializado. En Enero de 2007, los discos Blu-ray sacaron del mercado a los HD DVD. El 28 de
Junio del 2007, la Twentieth Century Fox anunció la adopción del Blu-ray Disc con el sistema de
anticopia BD +. En Febrero del 2008, Toshiba retiró su soporte al formato HD DVD, dejando al
Blu-ray como el vencedor.
Algunos analistas creen que la consola de videojuegos PlayStation 3 de Sony desempeñó un papel
importante en la guerra de formatos, por considerar que ha actuado como catalizador del Blu-ray
Disc, dado que la PlayStation 3 utiliza un controlador de Blu-ray Disc como su principal medio de
almacenamiento de la información.

5.3.2.Especificaciones técnicas

Laser y óptica
Blu-ray Disc utiliza un láser azul, técnicamente violeta, que opera en una longitud de onda de 405
nm, para leer y escribir datos. Los diodos que utiliza son láseres de InGaN (nitruro de indio galio)
que producen fotones de 405 nm directamente, es decir, sin duplicación de frecuencia ni otros
mecanismos ópticos no lineales. Los DVDs y CDs convencionales utilizan láseres rojos a 650 nm y
780 nm, respectivamente.
La longitud de onda más corta del láser azul-violeta permite almacenar más información en un CD/
DVD de 12 cm. El mínimo tamaño de la mancha en la que un láser puede ser enfocado, está
limitado por la difracción, y depende de la longitud de onda de la luz y la apertura numérica de las
lentes utilizadas para enfocarla. Disminuyendo la longitud de onda, aumentando la apertura
numérica de 0,60 a 0,85, y haciendo la cubierta de la capa más delgada para evitar los efectos
ópticos no deseados, se puede enfocar el haz de láser en un punto más pequeño. Esto permite que se
almacene más información en la misma zona. Para los discos Blu-ray, el tamaño de la mancha es de
580 nm. Además de las mejoras ópticas, las mejoras de los discos Blu-ray en la codificación de
datos aumentan aún más la capacidad.

La tecnología del recubrimento duro


Dado que la capa de datos del Blu-ray Disc es la más cercana de la superficie del disco en
comparación con el DVD estándar, es la más vulnerables a los arañazos. Los primeros discos fueron
alojados en unos cartuchos de protección, parecidos a los discos profesionales introducidos por
Sony en 2003.
El uso de un cartucho incrementaba los precios de este medio ya caro de por si, por lo que se
decidió por un revestimiento duro de la superficie. TDK fue la primera empresa en desarrollar un
recubrimiento de protección para discos Blu-ray. Fue nombrado Durabis. Los discos grabables y
regrabables de Verbatim utilizan su propia tecnología patentada de recubrimiento duro llamado
ScratchGuard.
Todos los discos Blu-ray requieren por especificación que sean resistentes a los arañazos. Los
DVDs no están obligados a ser resistentes a los arañazos, pero debido al desarrollo de la tecnología,
algunas empresas como Verbatim aplican el recubrimiento duro para los DVD grabables más caros.
39

5.3.3.Estándares del software

Codecs de vídeo
Para vídeo, todos los reproductores requieren soportar MPEG-2 Part 2, H.264/MPEG-4 AVC, y
SMPTE VC-1. MPEG-2 es el códec utilizado en los DVD normales, que permite la compatibilidad
hacia atrás. MPEG-4 AVC ha sido desarrollado por el MPEG y el VCEG. VC-1 es un códec que fue
desarrollado principalmente por Microsoft. Cada título de vídeo de Blue-ray Disc debe almacenar el
vídeo utilizando uno de los tres códecs obligatoriamente; se admiten múltiples codecs en un solo
título.
La elección de los codecs afecta a los costes de licencias/patentes del fabricante así como el tiempo
de ejecución máximo del título, debido a las diferencias en la eficiencia de la compresión.
Normalmente los discos codificados en formato vídeo MPEG-2 limitan el contenido a unas dos
horas de contenido de alta definición en una sola capa (25 GB) de Blue-ray Disc. Normalmente los
códecs de vídeo más avanzados como los VC-1 y los MPEG-4 AVC, suelen tener un tiempo de
ejecución de vídeo doble que con MPEG-2 con una calidad comparable.

El MPEG-2 fue utilizado por muchos estudios, incluido Paramount Pictures, que inicialmente
utilizó el códec VC-1 para las versiones HD DVD de la primera serie de discos Blu-ray, que se
lanzaron durante el año 2006. Ahora los lanzamientos modernos son a menudo codificados en
MPEG-4 AVC o VC-1, permitiendo a los estudios de cine, colocar todo el contenido en un solo
disco, reduciendo costos y mejorando la facilidad de uso. El uso de estos códecs también libera una
gran cantidad de espacio para el almacenamiento de contenido adicional en HD (1080i/p), en
contraposición a la tarjeta SD (480i/p) utilizada habitualmente para la mayoría de los títulos.
Algunos estudios, como Warner Bros., han publicado el contenido extra en los discos codificados en
un códec diferente del usado para el título principal.

Codecs de audio
Para audio, los reproductores de Blue-ray Disc requieren soportar Dolby Digital (AC-3), DTS y
PCM lineal. Opcionalmente los reproductores pueden soportar Dolby Digital Plus y DTS-HD High
Resolution Audio, así como los formatos sin pérdidas Dolby TrueHD y DTS-HD Master Audio. Los
títulos de Blue-Disc deben utilizar uno de los esquemas obligatorios para la banda sonora principal.
Si hay una banda sonora secundaria, se puede utilizar cualquiera de los codecs obligatorios u
opcionales para ella.

Velocidades
Para los usuarios que graban programas de televisión digital, la velocidad inicial de datos del
estándar grabable Blu-ray Disc es de 36 Mbps, más que suficiente para grabar transmisiones de alta
definición de cualquier fuente (IPTV, cable/satélite o terrestre). Las películas de vídeo en Blue-ray
Disc tienen una velocidad máxima de transferencia de datos de 54 Mbps, una velocidad máxima AV
de 48 Mbps, tanto para los datos de audio y como los de vídeo, y una tasa de vídeo máxima de 40
Mbps. Esto en comparación con las películas en HD DVD, que tienen una tasa máxima de
transferencia de datos de 36 Mbps, una velocidad máxima de AV de 30,24 Mbps, y una tasa de
vídeo máxima de 29,4 Mbps.

Formato del contenedor


Los flujos de audio, vídeo y otros son multiplexados y almacenados en discos Blu-ray en el formato
de un contenedor basado en el flujo de transporte MPEG. También es conocido como flujo de
transporte MPEG-2 BDAV y puede usar como extensión de fichero m2ts. Los títulos de vídeo de
40

Blu-ray Disc que dan soporte al menú, son de formato BDMV (Blu-ray Disc Movie) y contiene los
flujos de audio, vídeo y otros en el contenedor BDAV (Blu-ray Audio/Visual). También existe el
formato de disco BDAV, una alternativa a los discos BDMV. El formato de disco BDAV se utiliza
en los discos BD-RE y BD-R para grabar discos de audio/vídeo. Blu-ray emplea el método de
grabación de flujo de transporte MPEG que permite que los flujos de transporte de las emisiones
digitales se puedan grabar tal como son, es decir, sin alterar su formato. También permite la edición
flexible de una emisión digital que se registra como es y donde los datos pueden ser editados sólo
volviendo a escribir la secuencia de reproducción. También se construye una función de
recuperación para la alta velocidad fácil de usar. Blu-ray Disc Video usa los flujos de transporte
MPEG, en vez de los flujos de MPEG de DVD. Esto permite que varios programas de vídeo sean
almacenados en el mismo fichero para que puedan ser reproducidos de forma simultánea.

5.4. Tecnología UDO (Ultra Density Optical)


Ultra Density Optical (UDO) es un formato de disco óptico diseñado para el almacenamiento de
alta densidad del vídeo de alta definición y de datos. Un disco Ultra Density Optical es un disco
óptico de 133,35 mm que puede almacenar hasta 30 GB de datos. La segunda generación UDO2 se
introdujo en Abril de 2007 y tiene una capacidad de hasta 60GBs. Utiliza un diseño basado en un
disco magneto-óptico, pero usando la tecnología Phase Change combinada con un láser azul violeta.
Un disco UDO/UDO2 puede almacenar muchos más datos que un disco magneto-óptico MO,
debido a la menor longitud de onda (405 nm) del láser de color violeta empleado. Los MO utilizan
un láser de 650 nm, es decir, luz roja. Debido a que su anchura del haz es menor cuando se graba en
un disco de un láser rojo (MO), un láser azul-violeta permite almacenar más información digital en
la misma cantidad del espacio.

5.4.1.Historia
La tecnología UDO fue desarrollada como una alternativa del almacenamiento magneto-óptico
digital con capacidad de 9,1GB. El primer anuncio comercial de UDO fue hecho por Sony el 1 de
Noviembre de 2000. Más tarde fue adoptado con una fuerte inversión por Plasmon, una empresa
inglesa con una amplia experiencia en sistemas y soluciones de respaldo de ficheros informáticos.
Actualmente la tecnología UDO/UDO2 está siendo defendida por sus asociados en el desarrollo
como Plasmon, Asahi Pentax, Mitsubishi Chemical, la empresa matriz de la marca Verbatim y otras.
El 13 de Enero de 2009 ASTI, un VAR y proveedor de servicios de Colorado Springs, adquirió los
activos de Plasmon, incluyendo la tecnología UDO y UDO2, en una venta de liquidación.
Actualmente ASTI vende y soporta las tecnologías UDO vendidas bajo la marca Plasmon.

5.4.2.Especificaciones
El formato de UDO regrabable utiliza una superficie de grabación Phase Change que permite que
los datos grabados se puedan eliminar y modificar. En la práctica, el UDO regrabable funciona
como un disco magnético estándar. Los ficheros pueden ser escritos, borrados y reescritos,
reasignando dinámicamente la capacidad del disco. Normalmente los medios regrabables se suelen
utilizar en aplicaciones de fichero donde la estabilidad y la longevidad de los soportes ópticos es
importante
Hay tres versiones de UDO/UDO: una True WORM (Write Once Read Many), una R/W (Re-
Writable), y la Compliant WORM.
El formato TWO (True WORM) de UDO utiliza una superficie diferente de grabación Phase
Change que un UDO regrabable. A diferencia del UDO regrabable, la superficie del formato TWO
41

no puede ser borrada o alterada, lo que la hace más estable en términos de integridad de los datos,
porque la superficie de grabación se mantiene intacta.
El UDO CWO (Compliant Write Once) tiene las mismas propiedades de funcionamiento que el
UDO TWO pero con una diferencia clara e importante. A través de la utilización de una operación
especialmente diseñada 'shred', los registros individuales escritos en un UDO CWO pueden ser
destruidos solamente una vez que expire su período de retención. La función 'shred' es controlada a
nivel de aplicación y opera sólo en UDO CWO.

5.4.3.Características
La tecnología básica de UDO es esencialmente similar a la tecnología Blu-ray, así como las PDDs
de Sony, aunque hay algunas diferencias clave que son las siguientes:

Autenticidad e integridad de los datos


UDO ofrece absoluta autenticidad de los datos para aplicaciones donde la información archivada
debe permanecer sin cambios, por ejemplo, en bancos e instituciones jurídicas. UDO utiliza un
proceso de grabación Phase Change que altera de forma permanente la estructura molecular del
medio, lo que garantiza la integridad de los datos.

Retención de los datos a largo plazo


El diseño UDO hace que los datos almacenados tengan una duración mínima de 50 años. Esto
reduce al mínimo la frecuencia de migración de datos y de gestión para empresas que requieren el
almacenamiento de grandes cantidades de datos importantes. El diseño del disco UDO es un diseño
robusto y reduce el potencial de contaminación del medio.

Alta capacidad y escalabilidad


La tecnología de láser azul da al disco UDO una capacidad de 30 GB, más de tres veces la
capacidad de las tecnologías MO y DVD. Al ser los cartuchos de UDO extraíbles, permite que la
tecnología UDO sea mucho más escalable. Rara vez los datos utilizados se pueden eliminar de una
biblioteca, liberando la capacidad de gestión.

Rápido acceso a la información


La tecnología UDO tiene un rápida capacidad de acceso aleatorio del orden de 35 milisegundos. Un
tamaño de sector de 8 KB ayuda al rendimiento de las operaciones de lectura/escritura a través de
una amplia gama de tamaños de fichero. La tecnología UDO es ligeramente más rápida, ya que
opera a velocidad angular constante (CAV); durante las lecturas y las escrituras, el disco gira
constantemente a una velocidad muy alta. En las aplicaciones regrabables, una regrabación es muy
rápida porque no requiere una operación de borrado previa.

Coste de propiedad bajo


El costo del UDO es más bajo que las soluciones MO o DVD y tiene una mayor capacidad. El
cartucho estándar de 5,25 pulgadas permite el uso de unidades MO y UDO en la misma biblioteca,
si es soportado por el software y la aplicación de control.
42

6. Almacenamiento de datos: valores y texto

6.1. Valores

Binario
La unidad básica de lor odenadores es el bit, un dígito binario que como tal solo puede tener dos
valores, el 0 y el 1.
La agrupación mínima de bits es el octeto, en inglés byte, y es un conjunto de 8 bits.
Dependiendo del sistema operativo empleado, o el lenguaje y la aplicación de que se trate, hay otras
agrupaciones de bits u octetos como la palabra, en inglés word, incluso múltiplos de ésta.
Los valores binarios se consideran que son valores enteros y sin signo.

Decimal entero: con/sin signo


En cuanto a los valores en base decimal, la representación de los valores enteros necesitan de un
número determinado de octetos en función de la representación del mayor valor entero que se desee.
Además se necesita de un bit adicional, para indicar si se trata de un valor positivo o negativo.

Decimal flotante
En cuanto a los valores en base decimal con decimales, se usa la notación científica, es decir, un
valor entero y un exponente correspondiente a la base 10, que también es un valor entero con signo.
El valor entero se representa como se ha explicado antes con el decimal entero y el exponente igual,
dado que también es un decimal entero.
Así en esta representación llamada flotante, se especifican dos valores enteros decimales con signo.

6.2. Texto
Los textos están formados por cadenas de caracteres, los cuales varían de acuerdo con el lenguaje
de que se trate. Históricamente, en el alfabeto inglés y similar, cada carácter se representa por un
valor de 0 a 127, por lo que son suficientes 7 bits para su representación. Los estándares más
utilizados para la codificación de los caracteres son el EBCDIC y el ASCII. Los idiomas como el
chino, el japonés y el coreano que tienen más de 256 caracteres o signos, necesitan más de un octeto
(8 bits) para la codificación de sus caracteres o signos.
Unicode ha simplificado el panorama. La mayoría de los lenguajes de programación tienen un tipo
de datos para las cadenas Unicode, por lo general, UTF-16. La codificación Unicode UTF-8 es la
preferida. Ambos el UTF-8 y el UTF-16 requieren que el programador conozca que unidades de
código de tamaño fijo son diferentes para cada conjunto de caracteres.

6.2.1.EBCDIC
La codificación EBCDIC (Extended Binary Coded Decimal Interchange Code) fue ideado en los
años 1963 y 1964 por IBM y se anunció con el lanzamiento de la línea de computadoras IBM
S/360. Fue creado para ampliar la codificación binaria que existía en ese momento.
EBCDIC es una codificación de caracteres, donde se usan 8 bits por cada carácter, utilizados en
los sistemas operativos IBM mainframe como z/OS, OS/390, VM y VSE, así como los sistemas
informáticos de IBM de gama media, tales como i5/OS y OS/400.También se emplea en diversas
plataformas no IBM, como BS2000/OSD de Fujitsu-Siemens, HP MPE/iX, y Unisys MCP.
Existen muchas versiones ("codepages") de EBCDIC con caracteres diferentes para poder incluir
43

todos los caracteres de cada uno de los idiomas occidentales que no existen en inglés, como son los
caracteres con acentos. Por ejemplo al menos hay 9 versiones nacionales de EBCDIC con caracteres
Latín 1.

6.2.2.ASCII
ASCII (American Standard Code for Information Interchange) es una codificación de caracteres
basado en el idioma inglés. Históricamente, fue desarrollado como un código telegráfico. Su
primera utilización comercial fue como un código de siete bits para teleimpresora promovido por
los servicios de Bell. El trabajo en ASCII comenzó formalmente el 6 de Octubre 1960, con la
primera reunión de la ASA (American Standards Association) Subcomité X3.2. La primera edición
de la norma se publicó en el año 1963, una importante revisión en el año 1967, y la actualización
más reciente en el año 1986.
ASCII incluye las definiciones de 128 caracteres con la utilización de 7 bits. De estos 128
caracteres, 33 son de control, hoy casi en desuso, que afectan a cómo se procesa el texto y el
espacio en blanco; 94 caracteres son imprimibles, y el espacio se considera un carácter invisible.
Como la tecnología informática se difundió en todo el mundo, los diferentes estándares y las
empresas desarrollaron muchas variaciones del código ASCII para facilitar la expresión de los
idiomas distintos del inglés que también utilizan alfabetos latinos. Para ello se amplió a 8 bits, y así
los nuevos 128 valores, se utilizan para los nuevos caracteres. Se pueden encontrar algunas de estas
variaciones como "ASCII Extendido", que codifican los valores a partir del 128 hasta el 255.

6.2.3.Unicode
Unicode es un estándar de la industria informática para la representación y la manipulación
expresada en la mayoría de los sistemas de escritura del mundo. Desarrollado en colaboración con
el estándar de UCS (Universal Character Set) y publicado en forma de libro como El estándar
Unicode, la última versión de Unicode se compone de un repertorio de más de 107.000 caracteres o
signos que cubren 90 scripts, un conjunto de tablas de código para la referencia visual, un método
de codificación y un conjunto de codificaciones estándar de caracteres, una enumeración de las
propiedades de los caracteres tales como mayúsculas y minúsculas, un conjunto de ficheros
informáticos de datos de referencia, y una serie de temas relacionados, tales como propiedades de
los caracteres, las normas para la normalización, la descomposición, y la visualización
bidireccional, tanto si la escritura es de derecha a izquierda, como el árabe o el hebreo, o de
izquierda a derecha.
El Unicode Consortium (http://unicode.org) , una organización sin fines de lucro que coordina el
desarrollo de Unicode, tiene el ambicioso objetivo de sustituir eventualmente los actuales esquemas
de codificación de caracteres por Unicode y sus esquemas UTF (Unicode Transformation Format)
ya que muchos de los sistemas existentes están limitados en tamaño y alcance, y son incompatibles
con entornos multilingües.
El éxito de Unicode en la unificación de los conjuntos de caracteres ha llevado a su uso
generalizado y dominante en la internacionalización y la localización de los programas
informáticos. El estándar se ha aplicado en muchas tecnologías recientes, incluyendo XML, el
lenguaje de programación Java, el Microsoft NET Framework, y los sistemas operativos modernos.
Unicode puede ser implementado por las diferentes codificaciones de caracteres. Las codificaciones
más utilizadas son UTF-8, que utiliza 1 octeto para los caracteres ASCII, que tienen el mismo
código de valores que la codificación ASCII, y hasta 4 octetos para otros caracteres. El ahora
obsoleto UCS-2, que utiliza 2 octetos para todos los caracteres, no incluye todos los caracteres del
estándar Unicode. El UTF-16 extiende el UCS-2, utilizando 4 octetos para codificar los caracteres
44

que faltan de UCS-2.

6.2.4.Unificación Han
La unificación Han es un esfuerzo de los autores de Unicode y UCS (Universal Character Set) para
asignar múltiples conjuntos de caracteres de las lenguas llamadas CJK en un único conjunto
unificado. Los caracteres Han son una característica común de los escritos chinos (hanzi), japoneses
(kanji), coreano (hanja), y el chino tradicional en Hong Kong y Taiwán, y otros idiomas del este y el
sudeste asiático.
Normalmente los caracteres chino, coreano, y japonés suelen utilizar las variantes regionales o
históricas de un determinado carácter Han. En la formulación del Unicode, se hizo un intento de
unificar estas variantes considerando los diferentes glifos en representación del mismo grafema o
unidad ortográfica.
También nos podemos referir como Unihan a la base de datos Unihan mantenida por Unicode
Consortium, que proporciona información sobre todos los caracteres Han unificados codificados en
el estándar Unicode, incluidas las asignaciones a varios estándares nacionales y de la industria, los
índices en los diccionarios estándar, las variantes codificadas y las pronunciaciones en varios
idiomas, y una definición en inglés. La base de datos está disponible para el público como un
fichero de texto y a través de un sitio Web interactivo. Esta última también incluye glifos
representativos y definiciones para las palabras compuestas extraídas de los proyectos gratuitos
EDICT japonés y CEDICT chino.
45

7. Tipos de interface de unidades de discos


Se entiende como unidades de disco, no solo los discos magnéticos, sino también los discos ópticos
(CD y DVD) así como los obsoletas dispositivos de disquetes.
Los tipos más habituales de interfaces son : IDE, SATA, SCASI, iSCASI, Fibre Channel
Sin embargo también se explica la interfaz USB, dada la amplia existencia de discos duros externos
y grabadoras de DVD externas, que se conectan habitualmente a los ordenadores mediante
interfaces USB.

7.1. Interfaz IDE (Integrated Device Electronics)


La interfaz IDE (Integrated Device Electronics) o ATA (Advanced Technology Attachment) controla
los dispositivos de almacenamiento masivo de datos, como los discos duros de interfaz ATAPI
(Advanced Technology Attachment Packet Interface). Esta interfaz fue estandarizada en el año 1994
como el estándar X3.221-1994, AT Attachment Interface for Disk Drives de ANSI (American
National Standards Institute) (http://www.ansi.org).
En el sistema IDE, el controlador del dispositivo se encuentra integrado en la electrónica del
dispositivo. Las diversas versiones de sistemas ATA son:
• Paralell ATA. Algunos están utilizando la sigla PATA.
• ATA-1
• ATA-2, soporta transferencias rápidas en bloque y multipalabra DMA.
• ATA-3, es el ATA-2 revisado.
• ATA-4, conocido como Ultra-DMA o ATA-33, soporta transferencias de hasta 33 Mbps.
• ATA-5 o Ultra ATA/66, originalmente propuesta por Quantum para transferencias de 66
Mbps.
• ATA-6 o Ultra ATA/100, soporte para velocidades de 100 Mbps.
• ATA-7 o Ultra ATA/133, soporte para velocidades de 133 Mbps.
• Serial ATA, remodelación de ATA con nuevos conectores, cables, tensión de alimentación y
conocida por algunos como SATA.
Las controladoras IDE casi siempre están incluidas en la placa base, normalmente dos conectores
para dos dispositivos cada uno, es decir, el cable que se conecta a cada conexión puede contener dos
dispositivos IDE. De los dos dispositivos IDE, uno tiene que estar configurado como maestro y el
otro como esclavo para que la controladora distinga cada uno de ellos y así saber a/de qué
dispositivo IDE mandar/recibir los datos. La configuración se realiza mediante jumpers en los
propios dispositivos. Habitualmente, un dispositivo IDE puede estar configurado de una de estas
tres formas:
• Como maestro ('master'). Si es el único dispositivo IDE en el cable, debe tener esta
configuración, aunque a veces también funciona si está como esclavo. Si hay otro
dispositivo IDE, el otro debe estar configurado como esclavo.
• Como esclavo ('slave'). Debe haber otro dispositivo IDE que sea maestro.
• Selección por cable (cable select). El dispositivo IDE será maestro o esclavo en función de
su posición en el cable. En este caso todos los dispositivos IDE de un mismo cable deben
estar configurado como selección por cable. Para distinguir el conector en el que se
conectará el primer bus IDE (IDE 1) se utilizan distintos colores.
46

Este diseño de dos dispositivos a un mismo bus tiene el inconveniente de que mientras se accede a
un dispositivo, no se puede usar el otro dispositivo del mismo conector IDE. En algunos chipset,
por ejemplo el Intel FX Triton, no se puede usar ni siquiera el otro dispositivo IDE a la vez. Este
inconveniente está resuelto en las interfaces S-ATA y SCSI, que pueden usar dos dispositivos por
canal.
Los dispositivos IDE están mucho más extendidos que los SCSI debido a su menor coste. El
rendimiento de la interfaz IDE es menor que la interfaz SCSI pero se están reduciendo las
diferencias. El protocolo UDMA hace la función del Bus Mastering en SCSI con lo que se reduce la
carga de la CPU y aumenta la velocidad y el Serial ATA permite que cada dispositivo trabaje sin
interferir a los demás.
De todos modos aunque la interfaz SCSI es superior, se empieza a considerar la alternativa S-ATA
para los sistemas informáticos de gama alta, ya que su rendimiento no es mucho menor y su
diferencia de precio sí resulta más ventajosa.

7.2. Interfaz SATA (Serial Advanced Technology Attachment)


Serial ATA o S-ATA (Serial Advanced Technology Attachment) es una interfaz para la transferencia
de datos entre la placa base y algunos dispositivos de almacenamiento como puede ser el disco duro
o similares. Serial ATA sustituye al tradicional Parallel ATA o P-ATA. El S-ATA proporciona mayor
velocidad, mejor aprovechamiento cuando hay varios discos, mayor longitud del cable de
transmisión de datos y la capacidad de conexión de dispositivos en caliente.
Actualmente es una interfaz ampliamente aceptada y estandarizada en las placas base de los
ordenadores. La Serial ATA International Organization (SATA-IO) (http://www.serialata.org) es el
grupo responsable de desarrollar, de manejar y de conducir la adopción de especificaciones
estandarizadas de Serial ATA.

Velocidades
SATA 1.33 Gbps - La primera generación especifica en velocidades de 1,33 Gbps, también
conocida por SATA 1,33 Gbps o Serial ATA-133 .
SATA 3 Gbps - Esta interfaz funciona a 3 Gbps y es conocida por SATA 3 Gbps o Serial ATA-300 .
SATA 6 Gbps – Esta interfaz funciona a una velocidad de 6 Gbps.

SATA Externo
Fue estandarizado a mediados del año 2004, con definiciones específicas de cables, conectores y
requisitos de la señal para unidades eSATA externas. eSATA se caracteriza por:
• La velocidad de SATA en los discos externos, Se han medido 115 MBps con RAID externos.
• Sin conversión de protocolos de PATA/SATA a USB/Firewire.
• La longitud de cable se restringe a 2 metros; las interfaces USB y Firewire permiten
distancias mayores.
• Se aumentó el voltaje de transmisión mínimo y máximo a 500mV - 600mV (de 400mV -
600mV)
• Voltaje recibido disminuido a 240mV - 600mV (de 325 mV - 600 mV)
Actualmente la mayoría de las placas bases no tienen un conector para eSATA, pero es posible usar
adaptadores de bus o tarjetas PC-Card y CardBus.
47

Ventajas de SATA
• Velocidades de transferencias de datos más rápidas.
• Mayor ancho de banda.
• Más potencial para los aumentos de velocidad en generaciones futuras.
• Mejor integridad de datos gracias al nuevo conjunto avanzado de comandos.
• Cables más compactos que facilitan la ventilación interna de las cabinas.
• Longitud máxima del cable de hasta 1 metro.
• Diseño de conector que permite la conexión en caliente.
• Compatibilidad de software y de los controladores existentes de Parallel ATA.

Alternativas
También en SCSIW (SCASI Wide) se está preparando un sistema en serie, que además sea
compatible con SATA, es decir, se podrán conectar discos SATA en una controladora SAS (Serial
Attached SCSI). El Serial ATA transfiere los datos por un bus de 7 hilos mucho más delgado y fino
que el anterior Parallel ATA, que lo hacía por uno de 80 hilos, lo que permite una mayor circulación
de aire en la ventilación dentro del equipo, disminuyendo así su calentamiento interno.

7.3. Interfaz SCASI


SCSI (Small Computer System Interface) es un interfaz estándar para la transferencia de datos entre
distintos dispositivos del bus del ordenador. Es un éstandar de ANSI (American National Standards
Institute) (http://www.ansi.org), con el nombre ANSI SCSI Standard, X3.131 del año 1986.
Para montar un dispositivo SCSI en un ordenador es necesario que tanto el dispositivo como la
placa madre dispongan de un controlador SCSI. Se utiliza habitualmente en los discos duros y los
dispositivos de almacenamiento sobre cintas, pero también interconecta una amplia gama de
dispositivos, incluyendo escaneadores, unidades CD-ROM, grabadoras de CD y unidades DVD. De
hecho, el estándar SCSI promueve la independencia de los dispositivos, lo que significa que
teóricamente cualquier cosa puede ser conectada mediante una interfaz SCSI, incluso impresoras.
Actualmente sigue siendo popular en lugares de trabajo de alto rendimiento, servidores, y
periféricos de gama alta. Los ordenadores de sobremesa y los portátiles utilizan habitualmente las
interfaces más lentos para los discos duros y las interfaces USB como consecuencia de la diferencia
de coste entre estas interfaces.
Se está preparando un sistema SCSI en serie, denominado Serial Attached SCSI o SAS, que además
sea compatible con SATA utilizando el mismo conector, por lo tanto se podrán conectar unidades
SATA en una controladora SAS.

Tipos de interfaz SCSI


• SCSI 1. Bus de 8 bits. Velocidad de transmisión de datos a 5 Mbps. Su conector genérico es
el conector Centronics de 50 pins y de baja densidad. La longitud máxima del cable es de 6
metros. Permite hasta 8 dispositivos, incluida la controladora, identificados por las
direcciones de 0 a 7.
• SCSI 2.
• Fast. Con un bus de 8 bits, dobla la velocidad de transmisión de 5 Mbps a 10 Mbps.
Su conector genérico es el conector Centronics de 50 pins y de alta densidad. La
longitud máxima del cable es de 3 metros. Permite hasta 8 dispositivos, incluida la
controladora, identificados por las direcciones de 0 a 7.
• Wide. Dobla el tamaño del bus, ya que pasa de 8 a 16 bits. Su conector genérico es
de 68 pins y de alta densidad. La longitud máxima del cable es de 3 metros. Permite
48

hasta 16 dispositivos, incluida la controladora, identificados por las direcciones de 0


a 15.
• SCSI 3.
• SCASI 3.1 o SPI (Parallel Interface o Ultra SCSI).
• Ultra. Bus de 8 bits con velocidad de 20 Mbps. Su conector genérico es de 50
pins y de alta densidad. La longitud máxima del cable es de 3 metros. Admite
un máximo de 8 dispositivos. También se conoce como Fast 20 o SCSI-3.
• Ultra Wide. Bus de 16 bits con velocidad de 40 Mbps. Su conector genérico
es de 68 pins y de alta densidad. La longitud máxima del cable es de 1,5
metros. Admite un máximo de 15 dispositivos. También se conoce como Fast
SCSI-3.
• Ultra 2. Bus de 16 bits con velocidad de 80 Mbps. Su conector genérico es de
68 pines y de alta densidad. La longitud máxima del cable es de 12 metros.
Admite un máximo de 15 dispositivos. También se conoce como Fast 40.
• SCASI 3.2 o Firewire (IEEE 1394).
• SCASI 3.3 o SSA (Serial Storage Arquitecture). De IBM. Usa transmisión full-
duplex con canales separados.
• SCASI 3.4 o FC-AL (Fibre Channel Arbitrated Loop). Usa cables de fibra óptica de
longitud hasta 10 km o cable coaxial de hasta 24 m. Velocidad máxima de 100 Mbps.

Características
Utilizan un conjunto de comandos CCS (Command Common Set) para acceder a los dispositivos
que los hacen más o menos compatibles.
SCSI 1, SCSI2 y SCSI 3.1(SPI) conectan los dispositivos en paralelo. SCSI 3.2 (Firewire), SCSI
3.3(SSA) y SCSI 3.4(FC-AL) conectan los dispositivos en serie.
Hacen falta terminadores (jumpers, por BIOS, físicos) en el inicio y fin de la cadena.

7.4. Interfaz iSCASI


La Internet SCSI (iSCSI) es un estándar ratificado el 11 de Febrero de 2003 por la IETF (Internet
Engineering Task Force) (http://www.ietf.org) que permite el uso del protocolo SCSI sobre redes
TCP/IP. iSCSI es un protocolo de la capa de transporte definido en las especificaciones SCSI-3.
Otros protocolos en la capa de transporte son SCSI Parallel Interface y Fibre Channel.
La adopción del iSCSI en entornos de producción corporativos se ha acelerado en estos momentos
gracias a la implementación del Gigabit Ethernet. La fabricación de almacenamientos basados en
iSCSI es menos costosa que el SCSI y es una alternativa a las soluciones SAN basadas en Fibre
Channel.

Funcionalidad
El protocolo iSCSI utiliza TCP/IP para sus transferencias de datos, al contrario que otros protocolos
de red diseñados para almacenamiento, como por ejemplo el Fibre Channel, El TCP/IP es la base de
la mayor parte de las redes de almacenamiento, ya que solamente requiere para funcionar un simple
y sencilla interfaz Ethernet o cualquier otra red compatible TCP/IP. Esto permite una solución de
almacenamiento centralizada de bajo coste sin la necesidad de realizar inversiones costosas ni sufrir
las habituales incompatibilidades asociadas a las soluciones Fibre Channel para redes de
almacenamiento.
Los críticos de la iSCSI argumentan que este protocolo tiene un peor rendimiento que el Fibre
49

Channel ya que se ve afectado por la sobrecarga que generan las transmisiones TCP/IP, por ejemplo,
con las cabeceras de los paquetes. Sin embargo las pruebas que se han realizado muestran un
excelente rendimiento de las soluciones iSCSI SAN, cuando se utilizan enlaces Gigabit Ethernet.

Dispositivos de almacenamiento
En el contexto del almacenamiento, iSCSI permite a un ordenador utilizar un iniciador iSCSI para
conectarse a un dispositivo SCSI como puede ser un disco duro o una cabina de cintas en una red IP.
Desde el punto de vista de los controladores y las aplicaciones de software, los dispositivos parecen
estar conectados realmente como dispositivos SCSI locales.
Los dispositivos iSCSI no deben ser confundidos con los dispositivos NAS (Network Attached
Storage), los cuales incluyen software en el servidor para controlar las peticiones de acceso
simultáneo desde los diferentes dispositivos. Permitir que múltiples dispositivos tengan acceso
simultáneo a un dispositivo único es una tarea dificultosa pero muy común en los dispositivos
SCSI. Sin la comunicación dispositivo a dispositivo, cada uno de ellos desconoce cuales son las
intenciones del resto de los dispositivos.

7.5. Interfaz Fibre Channel


La interfaz Fibre Channel es un estándar del Technical Comitee T11, anteriormente conocido como
X3T9.3, del INCITS (InterNational Committee for Information Technology Standards)
(http://www.incits.org). También para información detallada se debe acudir a Fibre Channel
Industry Association (http://www.fibrechannel.org).
Las señales eléctricas de Fibre Channel se envían a través de una interfaz diferencial dúplex.
Generalmente esta interfaz consiste en cables de par trenzado con una impedancia nominal de 75
ohmios (de una sola terminal) o de 150 ohmios (diferencial). Se trata de un auténtico sistema de
señalización diferencial. El objetivo BER (Bit-Error Rate) de los sistemas de Fibre Channel es de 1
en 1012 (1 bit en 1.000.000.000.000 bits). A la velocidad de 2 Gbps, esto equivale a siete errores por
hora.

7.5.1.Topologías
Un enlace de Fibre Channel consiste en dos fibras unidireccionales que transmiten en direcciones
opuestas. Cada fibra está unida a un puerto transmisor (TX) y a un puerto receptor (RX).
Dependiendo de las conexiones entre los diferentes elementos, podemos distinguir tres tipos de
topologías principales:
• Punto a punto (FC-P2P). Dos dispositivos se conectan el uno al otro directamente. Es la
topología más simple, con conectividad limitada a dos elementos.
• En anillo (FC-AL). En este diseño, todos los dispositivos están en un bucle o anillo, similar
a una red Token Ring. El añadir o quitar un elemento del anillo hace que se interrumpa la
actividad en el mismo. El fallo de un dispositivo hace que se interrumpa el anillo. Existen
concentradores de Fibre Channel que conectan múltiples dispositivos entre sí y que pueden
puentear los dispositivos que han fallado. Un anillo también se puede hacer conectando cada
puerto al elemento siguiente formando el anillo. A menudo, un anillo entre dos dispositivos
funcionará como conexión P2P, pero ese comportamiento no es requerido por el estándar.
• Medio conmutado (FC-SW). Todos los dispositivos o bucles de dispositivos se conectan a
un conmutador de Fibre Channel. Los conmutadores controlan el estado del medio físico,
proporcionando interconexiones optimizadas.
50

7.5.2.Capas
El Fibre Channel es un protocolo con 5 capas, llamadas:
• FC0 - Capa física. Incluye los cables, la óptica de la fibra, conectores, etc.
• FC1 - Capa de enlace de datos. Implementa la codificación y la decodificación de las
señales.
• FC2 - Capa de red, definida por el estándar FC-PI-2, que constituye el núcleo de Fibre
Channel y define los protocolos principales.
• FC3 - Capa de servicios comunes, que puede implementar funciones como el cifrado o el
RAID.
• FC4 - Capa de mapeo de protocolo, en la que otros protocolos, como SCSI, se encapsulan en
unidades de información que se entregan a la capa de red FC2.
Las capas FC0, FC1 y FC2 también se conocen como FC-PH, capas físicas de fibre channel.
Las implementaciones de Fibre Channel están disponibles a las velocidades de 1, 2 y 4 Gbps. Está
en desarrollo un estándar a 8 Gbps. Un desarrollo a 10 Gbps ha sido ratificado, pero en este
momento sólo se usa para interconectar conmutadores. No existen todavía iniciadores ni
dispositivos de destino a 10 Gbps basados en el estándar. Los productos basados en los estándar a 1,
2, 4 y 8 Gbps deben ser interoperables, y compatibles hacia atrás; sin embargo el estándar a 10
Gbps no será compatible hacia atrás con ninguna de las implementaciones más lentas.

7.5.3.Puertos
En Fibre Channel se definen los siguientes puertos:
• E_port para la conexión entre dos conmutadores de Fibre Channel. También conocido como
puerto de expansión, cuando dos E_ports entre dos conmutadores forman un enlace, ese
enlace se denomina enlace de InterSwitch o ISL.
• EX_port para la conexión entre un enrutador de Fibre Channel y un conmutador de Fibre
Channel. En el extremo del conmutador, el puerto es como el de un E_port, pero en el
extremo del enrutador es un EX_port.
• F_port para una conexión de medios en una topología conmutada. Un puerto F_port no se
puede utilizar para un bucle de dispositivo.
• FL_port para la conexión de medios en un bucle de una topología de anillo. También
conocido como puerto de bucle. Nótese que un puerto de conmutador puede convertirse
automáticamente en un F_port o un FL_port, dependiendo a que esté conectado.
• G_port o puerto genérico. En un conmutador, puede operar como E_port o F_port.
• L_port es el término genérico utilizado para cualquier tipo de puerto de bucle, NL_port o
FL_port. También conocido como puerto de bucle.
• N_port para la conexión del nodo de los servidores o dispositivos de almacenamiento en una
topología conmutada. También se conoce como puerto de nodo.
• NL_port para la conexión del nodo de los servidores o dispositivos de almacenamiento en
una topología de anillo. También conocido como puerto de bucle de nodo.
• TE_port es un término utilizado para múltiples puertos E_ports unidos juntos para crear un
ancho de banda mayor entre conmutadores.

7.6. Interfaz Firewire (IEEE 1394)


La interfaz IEEE 1394 es una interfaz estándar del IEEE (Institute of Electrical and Electronics
Engineers ) (http://www.ieee.org) del tipo bus serie para comunicaciones de alta velocidad y
transferencias síncronas de datos en tiempo real frecuentemente utilizados por los ordenadores
51

personales, así como en las aplicaciones de audio digital, vídeo digital, automoción y aeronáutica.
La interfaz es también conocida por el nombre comercial de FireWire (Apple), i.LINK (Sony), y
Lynx (Texas Instruments). IEEE 1394 sustituye en muchas aplicaciones al SCSI paralelo, debido a
sus más bajos costos de implementación y un simplificado sistema de cableado muy adaptable.
El IEEE 1394 fue adoptado como el interfaz estándar de conexión de HANA (High-Definition
Audio-Video Network Alliance) para la comunicación y el control de los componentes
audiovisuales. FireWire también está disponible en las versiones inalámbricas, de fibra óptica y de
cable coaxial utilizando los protocolos isócronos.
Casi todas las cámaras de vídeo digitales han incluido una interfaz IEEE 1394, aunque esta
inclusión es cada vez menos común. Sigue siendo el principal mecanismo de transferencia de los
equipos de audio y vídeo digital de alta calidad profesional. Desde 2003 muchos ordenadores
destinados a uso doméstico o de audio/vídeo profesional han incorporado puertos FireWire/i.LINK,
especialmente los equipos de Sony y Apple.
Con la interfaz FireWire, se pueden conectar hasta 63 dispositivos periféricos en una topología de
árbol en oposición a la topología de bus. Permite que la comunicación puerto a puerto tenga lugar
sin necesidad de utilizar memoria del sistema o de la CPU. También la interfaz FireWire soporta
múltiples dispositivos por bus. Está diseñado para el soporte de la conexión/desconexión en caliente
(Plug and Play). El cable de cobre puede ser de hasta 4,5 metros de largo y es más flexible que la
mayoría de los cables paralelo SCSI. Puede suministrar hasta 45 vatios de potencia por puerto, lo
que permite alimentar los dispositivos de consumo moderado para funcionar sin una fuente de
alimentación externa e independiente.
Los dispositivos con interfaz FireWire implementan el modelo de configuración ROM ISO/IEC
13213 para la configuración y la identificación del dispositivo y para proporcionar la capacidad
plug-and-play. Todos los dispositivos con interfaz FireWire están identificados por un identificador
único IEEE EUI-64, además de los códigos conocidos indicando el tipo de dispositivo y los
protocolos que soporta.

7.7. Tecnología SAS (Serial Attached SCSI)


En informática, la tecnología SAS (Serial Attached SCSI) de transferencia de datos mueve los datos
entre los dispositivos de almacenamiento de datos tales como los discos duros y las unidades de
cinta. La tecnología SAS depende de un protocolo serie punto a punto que sustituye a la tecnología
bus SCSI paralela que apareció por primera vez a mediados de 1980 en los centros de datos y las
estaciones de trabajo, y utiliza el conjunto de comandos estándar SCSI. La tecnología SAS ofrece la
compatibilidad hacia atrás con los controladores SATA de segunda generación. Los controladores
SATA de 3 Gbps se pueden conectar a los buses SAS, pero los controladores SAS no se pueden
conectar a los buses SATA.
El comité técnico T10 del INCITS ( International Committee for Information Technology
Standards) (http://www.incits.org) desarrolla y mantiene el protocolo SAS; SCSITA (SCSI Trade
Association) promueve la tecnología.
La tecnología SAS se compone de tres protocolos de transporte:
• Serial SCSI Protocolo (SSP) – soporta las unidades de disco SAS.
• Serial ATA Tunneling Protocol (STP) – soporta los discos SATA.
• Serial Management Protocol (SMP) – gestiona los SAS Expanders.
Para las capas física y de enlace, la tecnología SAS define su propio protocolo. En la capa física, el
estándar SAS define los conectores y los niveles de tensión. Las características físicas de los cables
y la señalización compatibles con SATA de 6 Gbps, aunque la tecnología SAS define unas
especificaciones físicas de señalización más rigurosas, así como una mayor tensión diferencial
52

admisible para soportar el cableado. Mientras las especificaciones SAS-1.0/SAS-1.1 detallan las
características físicas de señalización de SATA de 1,5 y 3 Gbps, la especificación SAS-2.0 es la que
ha desarrollado el soporte de SATA a 6 Gbps.

7.8. Interfaz USB (Universal Serial Bus)


La interfaz USB (Universal Serial Bus) es una especificación para establecer la comunicación entre
los dispositivos periféricos y un controlador de un dispositivo principal, que normalmente es un
ordenador. La interfaz USB intenta sustituir distintas variedades de puertos serie y paralelo. La
interfaz USB puede conectar distintos periféricos del ordenador como ratones, teclados, cámaras
digitales, impresoras, reproductores de audio/vídeo, tarjetas flash y discos duros externos. Para la
mayoría de estos dispositivos, la interfaz USB es el mejor método estándar de conexión. La interfaz
USB fue diseñada para los ordenadores, pero también se está usando en otros dispositivos como
teléfonos móviles, PDAs y cónsolas de videojuegos.
El diseño de la interfaz USB fue estandarizado por el USB Implementers Forum (USB-IF)
(http://www.usb.org), una organización industrial de estándares donde están las principales
empresas del sector del ordenador y la electrónica. Entre ellos podemos citar a Agere (en la
actualidad en LSI Corporation), Apple Inc., Hewlett-Packard, Intel, Microsoft y NEC.

7.8.1.Historia
La especificación USB 1.0 se introdujo en el año 1996. Se intentó sustituir la multitud de conectores
en la parte posterior de los ordenadores por una nueva interfaz, así como simplificar la
configuración del software de los dispositivos de comunicación. La especificación original USB 1.0
tenía una tasa de transferencia de datos de 12 Mbps.
La interfaz USB fue creada por un grupo de empresas como Compaq, Digital, IBM, Intel, Northern
Telecom, Microsoft e Intel, que promovieron el controlador UHCI y el software asociado;
Microsoft elaboró otro software de USB para Windows y es coautor de la especificación de la
controladora OHCI con National Semiconductor y Compaq.
La especificación USB 2.0 se liberó en Abril del año 2000 y fue estandarizado por el USB-IF a
finales del año 2001. Hewlett-Packard, Intel, Lucent Technologies, Microsoft, NEC, y Philips se
unieron a la iniciativa de desarrollarla con una tasa de transferencia de datos de 480 Mbps como
contraposición de los 12 Mbs de la especificación 1.0.
La especificación USB 3.0 fue liberada el 12 de Noviembre del año 2008 por el USB 3.0 Promoter
Group. Su máxima velocidad de transferencia de datos es 10 veces más que la de la versión 2.0. Se
ha denominado USB SuperSpeed. Se procura que sea compatible con las versiones anteriores.

7.8.2.Visión global
La interfaz USB tiene un diseño asimétrico, que consiste en un dispositivo principal con varios
puertos USB, y varios dispositivos periféricos conectados en una topología en estrella con niveles.
Los concentradores adicionales USB pueden incluir niveles, lo que permite la ramificación de una
estructura de árbol de hasta cinco niveles. El dispositivo principal USB puede tener varias
controladoras y cada una de ellas puede proporcionar uno o más puertos USB. Un dispositivo
principal puede tener conectados hasta 127 dispositivos periféricos, incluidos los concentradores.
Los dispositivos USB están enlazados en serie a través de los concentradores. Siempre existe un
concentrador principal conocido como raíz, que está integrado en el controlador del dispositivo
principal. Los concentradores compartidos, que permiten que varios equipos tengan acceso a los
mismos periféricos, también trabajan por acceso de conmutación entre los ordenadores, ya sea
automática o manualmente.
53

Un dispositivo físico USB puede disponer de varios subdispositivos lógicos que se denominan
funciones del dispositivo. Un solo dispositivo puede proporcionar varias funciones, por ejemplo,
una cámara web con una función de dispositivo de vídeo, un dispositivo de audio con una función
de micrófono. A este tipo de dispositivo con subdispositivos se llama un dispositivo compuesto en
el que cada dispositivo lógico se le asigna una dirección distintiva por el dispositivo principal y
todos los dispositivos lógicos están conectados a un concentrador mediante un cable físico
específico de la interfaz USB. Un dispositivo principal asigna una única dirección del dispositivo a
una función.
La comunicación entre dispositivos USB se basa en canales lógicos. Los canales lógicos son las
conexiones del controlador del dispositivo principal a un extremo final que corresponde a la entidad
lógica del dispositivo periférico. El término extremo final se utiliza ocasionalmente de forma
incorrecta cuando se refiere al canal lógico porque, si bien existe un extremo final de manera
permanente en el dispositivo, un canal lógico sólo se crea cuando el dispositivo principal realiza una
conexión con el extremo final. Un dispositivo con interfaz USB puede tener hasta 32 canales
lógicos activos, 16 hacia el controlador del dispositivo principal y 16 de salida del controlador.
Hay dos tipos de canales lógicos: canales de flujo y canales de mensaje. Un canal de flujo es un
canal isócrono unidireccional conectado a un extremo final de forma unidireccional que se utiliza
como flujo de datos. Un canal de mensaje es un canal bidireccional conectado a un extremo final
bidireccional que se utiliza exclusivamente para el control del flujo de datos. Un extremo final de
un canal lógico es direccionable con una tupla (dirección del dispositivo, número del extremo final)
como se especifica en un paquete TOKEN que el dispositivo principal envía cuando quiere iniciar
una sesión de transferencia de datos. Si la dirección de la transferencia de datos es desde el
dispositivo principal al extremo final, este dispositivo principal envía un paquete OUT, que es una
especialización de un paquete TOKEN que tiene la dirección del dispositivo deseado y el número
del extremo final. Si la dirección de la transferencia de datos es desde el extremo final al dispositivo
principal, ahora este dispositivo principal envía un paquete IN. Si el extremo final de destino es un
extremo final unidireccional, cuya dirección diseñada por el fabricante no coincide con el paquete
TOKEN, por ejemplo, la dirección designada por el fabricante es IN mientras que el paquete
TOKEN es un paquete OUT, el paquete TOKEN será ignorado. De lo contrario, será aceptado y la
transacción de datos puede comenzar. Por otro lado, un extremo final bidireccional de punto final
acepta tanto los paquetes IN como los paquetes OUT.

Los extremos finales se agrupan en interfaces y cada interfaz se asocia con una única función de
dispositivo. Una excepción a esto es el extremo final cero, que se utiliza para la configuración del
dispositivo y que no está asociado a ninguna interfaz. Una única función de dispositivo consta de
interfaces controladas de forma independiente que se llama dispositivo compuesto. Un dispositivo
compuesto sólo tiene una dirección de dispositivo único, ya que el dispositivo principal sólo asigna
una dirección de dispositivo a una función.

Cuando un dispositivo USB se conecta por primera vez a un dispositivo principal, se inicia el
proceso de enumeración de dispositivos USB. La enumeración comienza con el envío de una señal
RESET al dispositivo USB. La velocidad del dispositivo USB se determina durante la señalización
RESET. Después del RESET, la información del dispositivo USB es leída por el dispositivo
principal, y a continuación se le asigna al dispositivo una única dirección de 7 bits. Si el dispositivo
es soportado por el dispositivo principal, los controladores de dispositivos que necesitan
comunicarse con el dispositivo, se cargan y el dispositivo se fija a un estado configurado. Si se
reinicia el dispositivo principal, el proceso de enumeración se repite para todos los dispositivos
conectados.
54

La controladora de dispositivo principal dirige el flujo de tráfico a los dispositivos USB, por lo que
ningún dispositivo USB puede transferir datos en el bus sin una solicitud explícita del controlador
de dispositivo principal. En USB 2.0, el controlador de dispositivo principal sondea el bus en cuanto
a tráfico, por lo general con un algoritmo round-robin. El dispositivo más lento conectado a un
controlador establece la velocidad de la interfaz. Los dispositivos USB 3.0 transmitirán y recibirán a
velocidades de USB 3.0, independientemente de que dispositivos USB 2.0 o USB.1 estén
conectados al dispositivo principal.

7.8.3.Tipos de conector
Existen varios tipos de conectores USB, incluyendo algunos que se han añadido mientras que la
especificación progresaba. La especificación original USB detalla los conectores machos y hembras
Standard-A y Standard-B. Con la especificación USB 2.0 se añaden los conectores Mini-B.
Los conectores de datos en el A-Plug en realidad están empotrados en el enchufe en comparación
con los conectores de alimentación externa. Esto permite la posibilidad de conectar primero la
alimentación eléctrica lo que evita errores de datos, permitiendo que el dispositivo se encienda y
luego transferir los datos. Algunos dispositivos funcionan en modo diferente, dependiendo de si se
realiza la conexión de datos. Esta diferencia en la conexión puede ser explotada por insertar el
conector sólo parcialmente. Por ejemplo, algunos reproductores de MP3 con pilas cambian el modo
de transferencia de ficheros y no pueden reproducir ficheros MP3 mientras que un conector USB no
está insertado totalmente, pero pueden estar operando en modo de reproducción MP3 utilizando la
alimentación USB mediante la inserción de la clavija sólo una parte para que la ranuras de potencia
entren en contacto, mientras que las ranuras de los datos no. Esto permite a los dispositivos operar
en modo de reproducción de MP3.

USB-A
El conector Standard-A de USB es un rectángulo aplanado que se inserta en un receptáculo
adecuado del dispositivo o en un hub, y tiene conexiones para alimentación y para datos. Este
conector se ve con frecuencia en los cables que están unidos permanentemente a un dispositivo,
como una conexión de un teclado o el ratón para el ordenador.

USB-B
Un conector Standard-B, que tiene forma cuadrada con las esquinas biseladas, se conecta
normalmente a un conector aguas arriba de un dispositivo que usa un cable removible, p.e. una
impresora. Un conector Standard-B también tiene conexiones para alimentación y para datos. En
algunos dispositivos, el conector Standard-B no tiene conexiones de datos, y solo se usa para
alimentar el dispositivo aguas arriba.
Este esquema A/B previene de que un usuario cree accidentalmente un bucle eléctrico
potencialmente peligroso.

Mini y Micro
Varios conectores han sido utilizados para dispositivos más
pequeños como PDAs, teléfonos móviles o cámaras digitales.
Estos incluyen el ya obsoleto pero estandarizado Mini-A y los
conectores actualmente estándar Mini-B, Micro-A, y Micro-B.
Los conectores Mini-A y Mini-B tienen un tamaño aproximado
de 3x7 mm, mientras que los conectores Micro tienen una
anchura similar, pero aproximadamente la mitad de espesor, lo
que permite su integración en dispositivos portátiles más
55

delgados.

El conector Micro-USB fue anunciado por el USB-IF el 4 de Enero de 2007 y al mismo tiempo se
declararon obsoletos los conectores USB Mini-A y Mini-B. En Febrero de 2009, muchos de los
dispositivos y cables actualmente disponibles siguen utilizando conectores Mini, pero los nuevos
conectores Micro están siendo ampliamente adoptados. Los conectores Micro más delgados están
destinados a sustituir los conectores Mini en los nuevos dispositivos como teléfonos inteligentes y
PDAs. La Universal Serial Bus Micro-USB Cables and Connectors Specification detalla las
características mecánicas de los conectores Micro-A, Micro-AB, y Micro-B, junto con un conector
Standard-A a un adaptador Micro-A.

El operador de telefonía celular, Open Mobile Terminal Platform (OMTP), ha aprobado


recientemente el micro-USB como el conector estándar para datos y potencia en los dispositivos
móviles. Estos incluyen varios tipos de cargadores de batería, permitiendo que el Micro-USB sea el
único enlace de cable externo necesario para algunos dispositivos. A partir del 30 de Enero de 2009
el Micro-USB ha sido aceptada por casi todos los fabricantes de teléfonos celulares como el puerto
de carga estándar, incluyendo Apple, Motorola, Nokia, LG, RIM, Samsung y Sony Ericsson en la
UE y la mayor parte del mundo.

Micro-AB Socket OTG


Un dispositivo OTG requiere tener uno y sólo un conector USB del tipo Micro-AB tal como se
define en Micro-USB1.01. Este conector es capaz de aceptar un conector Micro-A o Micro-B
conectado a cualquiera de los cables y adaptadores definidos en Micro-USB1.01.
El dispositivo OTG con conector A se llama dispositivo-A y se encarga de alimentar la interfaz USB
en caso necesario y por defecto asume el papel de dispositivo principal. El dispositivo OTG con
conector B se llama dispositivo-B y por defecto asume el papel de dispositivo periférico. Un
dispositivo OTG sin conector actúa por defecto como un dispositivo-B. Si una aplicación en un
dispositivo-B requiere el papel de dispositivo principal, a continuación el protocolo de HNP se
utiliza para transferir temporalmente el papel de dispositivo prinicpal al dispositivo-B.
Los dispositivos OTG fijados ya sea a un periférico dispositivo-B o un dispositivo prinicpal
estándar tendrán su papel fijado por el cable, ya que en estos escenarios sólo es posible conectar el
cable de forma unidireccional.

7.8.4.Cables
La longitud máxima de un cable estándar USB hasta la versión 2.0 es de 5 metros. La principal
razón para este límite es el máximo retardo de ida y vuelta permitido de aproximadamente 1,5 ns.
Si los comandos del dispositivo principal USB no son contestados por el dispositivo periférico USB
dentro del tiempo establecido, el dispositivo prinicpal da el mensaje por perdido. Cuando se añade
un dispositivo periférico USB, el tiempo de respuesta, los retardos del máximo número de
concentradores añadido a los retardos de la conexión por cable, el máximo retado aceptable por
cable debe ser de 26 ns. La especificación USB 2.0 requiere que el retardo del cable sea menor de
5,2 ns por metro. Como 192.000 km/s es la velocidad máxima que se alcanza con el cable de cobre
estándar, esto da una longitud máxima de 5 metros de cable. El estándar USB 3.0 no especifica
directamente la longitud máxima del cable, solo requiere que todos los cables cumplan una
especificación eléctrica. Para los cables de cobre, algunos cálculos han sugerido una longitud
máxima de unos 3 m.
Los cables de datos para USB 1.x y USB 2.x usan un par trenzado para reducir el ruido y la
diafonía. Los cables USB 3.0 son más complejos y emplean el blindaje para algunas de las líneas de
56

datos agregados (2 pares); se añade un blindaje alrededor de cada pareja de hilos.


Dado que las interfaces del dispositivo principal USB requieren suministrar energía a los
dispositivos conectados a ellos, fue creado un tipo especial de cable extensor USB, consistente en
un mini-hub USB de un puerto moldeado en un extremo de un cable de 5 metros. Estos mini-hubs
son totalmente autónomos dentro del cable, sin necesidad de disponer de un concentrador externo y
sin alimentación externa. Son tan fácil de usar como conectar cables, con cada concentrador
alimentádose a través de todos los concentradores anteriores de la cadena. Debido a que el bus de
alimentación es limitado, la disposición más práctica consta de cuatro cables de un solo extensor
Port Hub, un cable de 5 metros commo máximo y, al final, un concentrador multipuerto para
soportar múltiples dispositivos USB.
Otro método de Extending USB más allá de 5 metros es el uso de cable de baja resistencia. El costo
más elevado de cables USB 2.0 Cat 5 ha instado a algunos fabricantes a utilizar otros métodos para
ampliar USB,el como por ejemplo utilizando concentradores USB y cables de baja resistencia. Es
importante señalar que los dispositivos que utilizan la energía de los buses, como los discos duros
USB y los escáneres USB, requerirán el uso de un concentrador USB con alimentación al final de la
extensión. Si la alimentación y los datos no tiene suficiente potencia, pueden haber problemas por la
existencia de conexiones intermitentes durante su uso.

7.8.5.USB 3.0
Con la especificación USB 3.0, las velocidad de transferencia de una interfaz USB puede ser de
hasta 4,8 Gbps en comparación con los 480 Mbps de la USB 2.0. Esto significa que USB 3.0 puede
ser hasta 10 veces más rápido que su predecesor. Esto se logra a través de la tecnología SuperSpeed
que permite múltiples flujos de transferencia de datos.
Sin embargo, los dispositivos USB 2.0 más rápidos sólo son capaces de alcanzar un 50% de su
ancho de banda teórico, que es en torno a 250 Mbps. Los primeros dispositivos USB 3.0
probablemente funcionarán a sólo 1.4 Gbps, muy por debajo de los 4.8 Gbps teóricos, pero todavía
sustancialmente más rápidos que cualquier dispositivo USB 2.0. Se espera que la segunda
generación de dispositivos USB 3.0 supere el rendimiento de SATA-II que actualmente tiene
velocidades de transferencia de hasta 2 Gbps.
La interfaz USB 2.0 tiene 4 hilos: dos líneas de datos, potencia y tierra. La interfaz USB 3.0 utiliza
5 hilos más, dos líneas de transmisión, dos líneas de recepción y un tierra adicional, en total 9 hilos.
Los cables extra constituyen un bus adicional que funciona en paralelo con el puerto USB 2.0.

Esta arquitectura permite que el puerto USB 2.0 sea plenamente funcional para los dispositivos
USB 2.0, mientras que se soporta el modo de transferencia SuperSpeed para dispositivos USB 3.0.
Logra plena compatibilidad hacia atrás y hacia adelante. A diferencia del USB 2.0, USB
SuperSpeed 3.0 puede enviar y recibir datos simultáneamente. Esto se llama señalización dual
simplex.
Un cambio importante es que el USB 3.0 es asíncrono. En lugar de enviar paquetes de broadcast a
todos los dispositivos USB, el controlador envía asíncronamente paquetes punto a punto,
directamente al dispositivo que utiliza la información contenida en la cabecera del paquete de datos.
Esto elimina la necesidad de interrogar de forma constante si hay dispositivos que tienen que tienen
datos para recibir.
57

Nuevas características
▪ Mayor ancho de banda (de hasta 4,8 Gbps)
▪ Aumento de la potencia máxima para el bus y aumentar el soporte los dispositivos USB que
requieren más potencia.
▪ Mejora de los aspectos de administración de energía para reducir los requerimientos de potencia
en los períodos de inactividad
▪ Transferencias de datos full-duplex y soporte para los nuevos métodos de transferencia de datos
▪ Nueva cables y conectores compatibles para soportar velocidades de transferencia de datos más
altas.
58

8. Tipos de formateo de discos


Formatear un disco es el proceso de preparación para el uso de un disco duro u otro medio de
almacenamiento incluyendo un sistema de ficheros vacío. Para hacer esto hay muchos programas en
el mercado.
Los grandes discos pueden ser particionados, es decir, divididos en secciones lógicas que se
formatean con sus propios sistemas de ficheros.
Un sistema operativo corrompido se puede arreglar mediante el formateo del disco y reinstalando el
sistema operativo. Obviamente en este caso los datos que habían en el disco se pierden.
El formateo de un disco consta de dos procesos completamente diferentes conocidos como formateo
a bajo nivel y formateo de alto nivel. El formateo a bajo nivel consta del formateo de las superficies
de los discos y la instalación de sus características como los números de los sectores que hay y
utiliza el hardware del controlador del disco y el formateo de alto nivel está relacionado con la
información específica al sistema de ficheros que corresponde al sistema operativo que se emplee.

8.1. Formateo de bajo nivel de los disquetes


El formateo de bajo nivel de los disquetes y de los discos duros antiguos es realizado por el
hardware del disco. El proceso se describe más fácilmente pensando en un disquete estándar de 1,44
MB. Normalmente el formateo de bajo nivel escribe 18 sectores de 512 octetos cada uno en cada
una de las 160 pistas (80 en cada lado) del disquete, suministrando 1.474.560 octetos de
almacenamiento en el disquete.
Actualmente los sectores son físicamente mayores de 512 octetos ya que incluyen los números del
sector, los octetos del CRC y otra información requerida con el fin de identificar y verificar el sector
durante la lectura y la escritura. Estos octetos adicionales son parte de la capacidad de
almacenamiento total del disco.
Para complicar el asunto, se pueden usar distintos formatos de bajo nivel en el mismo dispositivo;
por ejemplo, se pueden usar registros de mayor tamaño con el fin de reducir el tamaño de los
espacios entre registros.
Varios programas de software, (p.e. GParted, FDFORMAT, NFORMAT y 2M) permiten
considerablemente más control en cuanto al formateo, permitiendo discos de 3 1/2" de alta densidad
con hasta capacidades de 2 MB.
Las técnicas usadas son:
• mover la numeración ascendente de los sectores en el lado del cambio y así reducir el
retardo mecánico.
• intercalado de sectores, minimizando la separación entre sectores y por lo tanto
incrementando el número de sectores por pista.
• incrementando el número de sectores por pista, mientras que un formato de 1,44 MB usa 18
sectores por pista, es posible incrementar esto hasta un máximo de 21.
• incrementar el número de pistas ya que la mayoría de los dispositivos podrían tolerar la
ampliación a 82 pistas.
Linux soporta distintos tamaños de sectores y DOS y Windows soportan un formato de disquete
DMF de un tamaño mayor.
59

8.2. Formateo de bajo nivel de los discos duros


En los años 1980 lo habitual era que el usuario se hiciera el formateo a bajo nivel de los discos
duros. Normalmente esto implicaba usar el patrón MFM (Modified Frequency Modulation) del
disco, de forma que los sectores de octetos se escribían de forma sucesiva. Con la llegada de la
codificación RLL (Run Length Limited) , el formateo a bajo nivel se fue haciendo menos común y
la mayoría de discos duros son sistemas embebidos, cuyo formateo a bajo nivel nivel se hace en
fábrica con las dimensiones geométricas y físicas y de esta forma no está sujeto a la intervención
del usuario.
Al principio los discos duros eran muy similares a los disquetes, pero generalmente el formateo a
bajo nivel era hecho por la BIOS más que por el sistema operativo.
Así desde primeros de los años 1990, el formateo de bajo nivel de de los discos duros se hizo más
complejo a medida que mejoraba la tecnología:
• se usaba la codificación RLL,
• se almacenaba un mayor número de sectores en las pistas más exteriores, normalmente todas
las pistas tenían el mismo número de sectores como sucede con los disquetes,
• se codificaba los números de las pistas en la superficie del disco para simplificar el
hardware, y
• se incrementaba las velocidades mecánicas de los discos.
Para evitar los cada día mayores problemas con las versiones de las BIOS, los fabricantes de discos
duros empezaron a hacer el formateo a bajo nivel en fábrica. Actualmente en la mayoría de los
casos el usuario final no ha de hacer nunca el formateo a bajo nivel de un disco duro IDE o ATA, e
incluso no es posible hacerlo fuera de fábrica.

8.3. Reinicialización del disco


Mientras que es imposible realizar un formateo de bajo nivel en los modernos discos duros fuera del
fabricante, aún se usa el término formateo de bajo nivel para llamar la reinicialización de un disco
duro IDE o ATA en su configuración de fábrica. La reinicialización deberá incluir la identificación
de los sectores en los que no se puede escribir y devolver lo leído al dispositivo correctamente.
Una forma de inicializar el disco es llenarlo con ceros. Esto se puede hacer con la utilidad Unix dd y
de forma similar con los demás sistemas operativos.

8.4. Formateo de alto nivel


El formateo de alto nivel es el proceso de establecer un sistema de ficheros vacío en el disco e
instalar un sector de arranque. Esto solo lleva poco tiempo y a veces se le llama formateo rápido.
Además opcionalmente se puede escanear todo el disco para verificar los defectos, lo que lleva
mucho tiempo, hasta varias horas en los discos más grandes.

8.5. Formateo en DOS


En MS-DOS y PC-DOS, el formateo del disco se realiza con el programa FORMAT. Generalmente
FORMAT solicita la confirmación de antemano para evitar la eliminación accidental de datos, pero
algunas versiones de DOS tenían una opción AUTOTEST sin documentar: si se usa, la
confirmación se omite y el formateo comienza de inmediato. Hay también el parámetro /U sin
documentar que lleva a cabo un formato incondicional que sobrescribe toda la partición, y la
60

prevención de la recuperación de datos se hace a través de software.

8.6. Recuperación de datos de un disco formateado


Al igual que con el borrado regular, los datos en un disco no se destruyen totalmente durante un
formateo de alto nivel. Lo que hace el programa es que el área del disco que contiene los datos, se
marca meramente como disponible, con lo que en cualquier estructura del sistema, se conservan los
viejos datos hasta que se sobrescriben. Si se hace un reformateo con un sistema de fichero diferente
del que existía previamente en la partición, algunos datos pueden ser sobrescritos aunque no se
utilizara el mismo sistema de ficheros. Sin embargo, en algunos sistemas de ficheros, por ejemplo
NTFS, pero no FAT, los índices de fichero, como $MFT bajo NTFS, los inodos en ext2/3, etc, no se
pueden escribir en los mismos lugares exactos. Y si se aumenta el tamaño de la partición, incluso
los sistemas de ficheros FAT sobrescribirán más datos al comienzo de esta nueva partición.
Desde la perspectiva de la prevención de la recuperación de los datos sensibles a través de las
herramientas de recuperación, los datos o bien deben ser sobreescritos totalmente, todos los
sectores, con datos aleatorios antes del formateo, o el propio programa de formateo debe realizar
esta sobrescritura, como el comando de DOS FORMAT hizo con disquetes flexibles, llenando todos
los datos del sector con octetos F6h.
61

9. Sistemas de ficheros
Cuando decimos un sistema de ficheros, pensamos en un dispositivo de almacenamiento, siendo el
disco duro el más representativo. Los ficheros a almacenar en él, tienen distintos tamaños, desde
muy pequeños a muy grandes. Las técnicas de almacenamiento de estos ficheros recomiendan
definir un bloque como elemento básico de almacenamiento. Así un fichero se almacenará en uno o
más bloques, y estos bloques son de tamaño fijo en número de octetos.
Por esta razón, primero un dispositivo de almacenamiento se divide en una o más particiones, y
cada una de ellas deberá disponer de la información de como están almacenados los ficheros de esta
partición. Esta zona de almacenamiento de los datos de almacenamiento ocupan varios bloques y
los restantes sirven para almacenar los ficheros propiamente dichos.
Los distintos sistemas de ficheros se diferencian en principio por el diseño de la zona de los datos
de almacenamiento de los ficheros. También en donde se ubica fisicamente esta zona, ya que esto
redunda en su rendimiento.
Otros aspectos a tener en cuenta son:
– Si la zona de los datos de almacenamiento de ficheros es distribuida o no, y su grado de
redundancia.
– El tamaño de los bloques es otro factor de aprovechamiento del espacio. Si los bloques son
muy grandes, se desaprovecha mucho espacio pero sus operaciones de lectura/escritura son
más rápidas y viceversa.
– Las técnicas de recuperación ante fallos. Si hay un fallo entre la grabación de los datos de
almacenamiento del fichero y la grabación del propio fichero, y dado que estas dos
operaciones son secuenciales, el sistema de ficheros dirá donde están los datos del fichero,
lo que es erróneo ya que este no se ha grabado y en consecuencia, ¿donde está?
– El tamaño del nombre del fichero y el número de características de los ficheros como
atributos, marcas de tiempo, etc.
– Como almacenar fisicamente los distintos bloques de un mismo fichero. En principio, lo
mejor es almacenarlos de forma consecutiva, pero no siempre se encuentran libres un
número seguido de bloques libres para este almacenamiento. Esto provoca el fenómeno de la
fragmentación de los ficheros en el dispositivo de almacenamiento, y es otra cuestión
importante en el rendimiento, cuanto más fragmentación, menos rendimiento.

A continuación se relacionan los más conocidos:


• ADFS (Acorn's Advanced Disc File System), sucesor del DFS.

• AFS (Acer Fast Filesystem), usado por SCO OpenServer


• AthFS (AtheOS File System), también llamado AFS
• BFS (Be File System) usado por BeOS
• Btrfs - Un sistema de ficheros basado en B-Trees y creado por Oracle.
• DTFS (Desktop File System), usado por SCO OpenServer
• EAFS (Extended Acer Fast Filesystem), usado por SCO OpenServer
• EFS (Extent File System), un antiguo sistema de ficheros por bloques con IRIX.
• Ext (Extended file system), diseñado para los sistemas Linux
• Ext2 (Second extended file system), diseñado para los sistemas Linux.
• Ext3 - Una ampliación del ext2.
• Ext4 - Una nueva versión del ext3.
62

• FAT (File Allocation Table), usado en DOS y Microsoft Windows, con tablas de 12, 16 y 32
bits.
• VFAT - Versión del sistema FAT de Microsoft Windows con extensión a los nombres largos
de hasta 255 caracteres.
• FATX - Una versión modificada del sistema FAT de Microsoft Windows que se usa en la
cónsola original Xbox.
• FFS (Amiga) (Fast File System) usado en sistemas Amiga. Hay las evoluciones FFS1, FFS
Intl, FFS DCache, FFS2.
• FFS (Fast File System), usado en los sistemas BSD
• Files-11 OpenVMS, también usado en los viejos sistemas PDP-11
• HFS (Hierarchical File System), usado en los sistemas más antiguos Mac OS
• HFS Plus – Versión actualizada de HFS, usada en los nuevos sistemas Mac OS.
• HPFS (High Performance File System), usado en el sistema operativo OS/2
• HTFS (High Throughput Filesystem), usado en SCO OpenServer
• ISO 9660 usado en los discos CD y DVD
• JFS – Sistema de ficheros de IBM suministrado para los sistemas operativos Linux, OS/2 y
AIX.
• LFS 4.4, una implementación para BSD
• MFS (Macintosh File System), usado en los antiguos sistemas Mac OS
• Minix para el sistema operativo UNIX
• NILFS – Una implementación en Linux de un sistema de ficheros estructurado en logs
• NTFS (New Technology File System) usado en los sistemas Windows NT, Windows 2000,
Windows XP, Windows Server 2003 y Windows Vista
• NetWare File System – El sistema de ficheros original de NetWare 2.x - 5.x.
• NSS (Novell Storage Services). Este es un nuevo sistema de ficheros de 64 bits utilizando
un algoritmo de árbol equilibrado. Utilizado en las versiones de NetWare 5.0 y
recientemente portado a Linux.
• OFS (Old File System) de Amiga.
• PFS y PFS2, PFS3, etc - Sistema de ficheros utilizado por Amiga.
• Qnx4fs – Sistema de ficheros para el sistema operativo UNIX.
• ReiserFS – Sistema de ficheros del periodismo
• Reiser4 – Versión más reciente de ReiserFS
• S51K AT&T UNIX System V 1KB Filesystem, usado por SCO OpenServer
• SFS (Smart File System) de Amiga.
• SkyFS – Desarrollado para SkyOS con el fin de sustituir el BFS.
• UDF – Sistema de ficheros basado en paquetes para los dispositivos WORM/RW como los
CD-RW y DVD-RW.
• UFS (Unix File System), usado en los viejos sistemas BSD
63

• UFS2 ( Unix File System), versión más nueva del UFS


• VxFS (Veritas File System)
• VLIR (Variable Length Indexed Record) – Extensión añadida al CBMFS hecha por Berkeley
Softworks, que permite operaciones aleatorias de lectura y escritura para los ordenadores
con el sistema operativo GEOS.
• WinFS (Windows Future Storage)
• WAFL (Write Anywhere File Layout). Sistema de fichero de alto rendimiento y estructurado
en logs. WAFL soporta RAID 4 y NVRAM
• XFS - Usado en los sistemas SGI IRIX y Linux
• ZFS - Usado en Solaris 10 y OpenSolaris, siendo transportado a FreeBSD 7.0 y FUSE

9.1. Asignación del espacio de almacenamiento


El sistema de ficheros se debe encargar de localizar espacio libre en los medios de almacenamiento
para guardar los ficheros y para después borrarlos, renombrarlos o modificarlos. Para ello se vale de
las localizaciones especiales que contienen la lista de ficheros creados y por cada fichero una serie
de direcciones que contienen los datos de los mismos. Esas localizaciones especiales se llaman
directorios. Para asignarle espacio a los ficheros, existen tres criterios generales que se describen a
continuación.

Asignación contigua : Cada directorio contiene los nombres de ficheros y la dirección del bloque
inicial de cada fichero, así como el tamaño total de los mismos. Por ejemplo, si un fichero comienza
en el sector 17 y mide 10 bloques, cuando se accede al fichero, el brazo del disco se moverá
inicialmente al bloque 17 y de ahí hasta el 27. Si el fichero es borrado y luego se crea otro más
pequeño con el mismo nombre, quedarán huecos inútiles entre ficheros útiles, lo cual se llama
fragmentación externa. Las principales ventajas son: la facilidad de implantación, ya que solo se
precisa el número del bloque de inicio para localizar un fichero, y el excelente rendimiento en
cuanto a las entradas/salidas. Los principales defectos son: que se debe conocer el tamaño máximo
del fichero al crearlo y que produce una gran fragmentación de los discos.

Asignación encadenada : Con este criterio los directorios contienen los nombres de ficheros y por
cada uno de ellos la dirección del bloque inicial que compone al fichero. Cuando un fichero es
leído, el brazo va a esa dirección inicial y encuentra los datos iniciales junto con la dirección del
siguiente bloque y así sucesivamente. Con este criterio no es necesario que los bloques estén
contiguos y no existe la fragmentación externa, pero en cada eslabón de la cadena se desperdicia el
espacio necesario para guardar la información de las direcciones del bloque siguiente. En otras
palabras, lo que se crea en el disco es una lista encadenada.

Asignación con índices: En este esquema se guarda en el directorio un bloque de índices para cada
fichero, con apuntadores hacia todos sus bloques constituyentes, de manera que el acceso directo se
agiliza notablemente, a cambio de sacrificar varios bloques para almacenar dichos apuntadores.
Cuando se quiere leer un fichero o cualquiera de sus partes, se hacen dos accesos: uno al bloque de
índices y otro a la dirección deseada. Este es un esquema excelente para ficheros grandes pero no
para pequeños, porque la relación entre bloques destinados para índices respecto a los asignados
para datos es muy alta. La gran ventaja es que la búsqueda puede realizarse en los propios bloques
de índices y la principal desventaja es que las inserciones pueden requerir la reconstrucción
completa de los bloques de índices.
64

9.2. Sistemas de ficheros especiales

9.2.1. Sistema de ficheros orientados al registro


En los sistemas de ficheros orientados al registro, los ficheros están almacenados como una
colección de registros. Se asocian con viejos sistemas operativos de ordenadores grandes y
pequeños. Los programas leen y escriben registros completos, en lugar de octetos o arbitrarios
rangos de octetos, y pueden buscar en los límites del registro, pero no dentro de los registros.
Los sistemas más característicos son:
• Ficheros-11 - Las primeras versiones fueron orientados al registro, más tarde se dio soporte
a los flujos.
• Virtual Storage Access Method (VSAM) - Utilizado en System/370 y MVS

9.2.2. Sistemas de ficheros de discos compartidos


Los sistemas de ficheros de discos compartidos, también llamados sistemas de ficheros de
almacenamiento compartido, sistemas de ficheros SAN o aún los sistemas de ficheros en clúster, se
usan principalmente en una SAN (Storage Area Network) donde todos los nodos acceden
directamente al almacén de datos donde se encuentra el sistema de ficheros. Los sistemas de
ficheros compartidos de disco se utilizan normalmente en un clúster de alta disponibilidad, junto
con el almacenamiento con RAID por hardware.
Los sistemas de ficheros compartidos del disco pueden ser
• simétricos donde los metadatos están distribuidos entre los nodos o
• asimétricos con servidores centralizados de metadatos.
Los sistemas de ficheros de discos compartidos más característicos son:
• CXFS (Clustered XFS) de Silicon Graphics (SGI). Disponible para AIX, IRIX, Linux,
Solaris y Windows. Asimétrico.
• EMC Celerra HighRoad de EMC. Disponible for AIX, HP-UX, IRIX, Solaris y Windows.
Asimétrico.
• Files-11 sobre VMSclusters, realizado por DEC en 1983 y ahora HP. Simétrico.
• GFS (Global File System) de Red Hat. Disponible para Linux con GPL. Simétrico (GDLM)
o asimétrico (GULM).
• GPFS (General Parallel File System) de IBM. Soporta la replicación entre bloques seguidos.
Disponible para AIX y Linux. Simétrico.
• HP CFS (Cluster File System) (TruCluster) de HP. Disponible para HP-UX y Tru64 UNIX.
• Melio FS de Sanbolic. Simétrico.
• Nasan File System de DataPlow. Disponible para Linux y Solaris. Asimétrico.
• OCFS2 (Oracle Cluster File System) de Oracle Corporation. Disponible para Linux bajo
GPL. Simétrico.
• PSFS (PolyServe File System) de PolyServe. Se usa en su PolyServe Matrix Server que se
65

centra en su exportación a los clientes sobre CIFS o NFS así como Microsoft SQL Server y
Oracle 9i RAC y 10g. Disponible para Linux y Windows. Simétrico.
• Sistema de ficheros SAN de DataPlow. Disponible para IRIX, Linux, Solaris y Windows.
Simétrico.
• StorNext File System de Quantum. Asimétrico. Disponible para AIX, HP-UX, IRIX, Linux,
Mac OS, Solaris y Windows. Interoperable con Xsan.
• QFS de Sun Microsystems. Disponible para Linux y Solaris. Asimétrico.
• Veritas Storage Foundation Cluster File System (CFS) de Symantec. Disponible para AIX,
HP-UX, Linux y Solaris. Asimétrico.
• Xsan de Apple Computer. Disponible para Mac OS. Asimétrico. Interoperable con ADIC
StorNext File System.
• VMFS de VMware/EMC Corporation. Disponible para VMware ESX Server. Simétrico.

9.2.3. Sistemas de ficheros distribuidos


Los sistemas de ficheros distribuidos son también llamados sistemas de ficheros en red.
Normalmente se han hecho muchas implementaciones, que son dependientes de la ubicación y en
general disponen de listas de control de acceso (ACL) para controlar la seguridad de los ficheros.
Los sistemas de ficheros distribuídos más característicos son:
• 9P - El Plan 9 es un protocolo de sistemas de ficheros distribuido de Bell Labs y Inferno.
Una implementación es v9fs. Sin listas de control de acceso.
• AFS (Andrew File System) es escalable e independiente de la localización, tiene una cache
grande y usa Kerberos para la autenticación. Las implementaciones incluyen el original de
IBM (antes Transarc), Arla y OpenAFS.
• AFP (Apple Filing Protocol) de Apple Computer.
• DCE Distributed File System (DCE/DFS) de IBM (antes Transarc) es similar al AFS y se
basa en la alta disponibilidad del sistema de ficheros POSIX. Disponible para AIX y Solaris
con licencia propietaria de software.
• NFS (Network File System) originalmente de Sun Microsystems. Es el estándar de las redes
basadas en UNIX. NFS puede usar la autenticación Kerberos y un caché cliente.
• SFS (Self-certifying File System) - Un sistema de ficheros global de red diseñado para
permitir el acceso seguro a los sistemas de ficheros con dominios administrativos separados.

9.2.4. Sistemas de ficheros distribuidos tolerantes a fallos


Se trata de sistemas de ficheros distribuidos tolerantes a fallos entre nodos, o entre servidores o
entre servidores y clientes, para una alta disponibilidad.
Los sistemas de ficheros distribuidos tolerantes a fallos más característicos son:
• Coda de Carnegie Mellon University. Se centra en la operación con ancho de banda
adaptable, usando caché en el lado cliente para la computación móvil. Se trata de un
evolución del AFS-2. Está disponible para Linux bajo licencia GPL.
• DFS (Distributed File System) de Microsoft. Se centra en la transparencia de la localización
y la alta disponibilidad. Disponible para Windows bajo una licencia de software propietaria.
66

• Intermezzo de Cluster File Systems. Utiliza la sincronización sobre HTTP. Disponible para
Linux bajo licencia GPL.

9.2.5. Sistemas de ficheros paralelos distribuidos


Se trata de sistemas de ficheros paralelos distribuidos en bandas sobre múltiples servidores de alto
rendimiento. Normalmente se utilizan en la computación de alto rendimiento (HPC). Algunos de los
sistemas de ficheros paralelos distribuidos usan OSD (Object Storage Device) para los fragmentos
de datos junto con servidores centralizados de metadatos.
Los sistemas de ficheros paralelos distrbuídos más característicos son:
• Ceph - Disponible para Linux bajo la LGPL de Sourceforge.
• Lustre de Cluster File Systems. Disponible para Linux bajo licencia GPL, y para Microsoft
Windows bajo una licencia propietaria.
• PVFS2 (Parallel Virtual File System). Disponible para Linux bajo licencia GPL.
• Starfish es un sistema de ficheros compatible con POSIX, y redundante de N formas creado
por Digital Bazaar Inc. y publicado bajo una licencia pseudo-licencia de código abierto.
Disponible para Linux y Mac OS. El soporte de Windows está disponible a través de Samba.

9.2.6. Sistemas de ficheros tolerante a fallos paralelamente distribuidos


Se trata de sistemas de ficheros distribuidos, que también son paralelos y tolerantes a fallos, con
datos en bandas y replicados sobre múltiples servidores de alto rendimiento y con el objetivo de
mantener la integridad de los datos. Aunque un servidor falle, no se pierden los datos. Los sistemas
de ficheros usan HPC (High-performance Computing) o clusters de alta disponibilidad.
Todos los sistemas de ficheros listados aquí se centran en la alta disponibilidad, la escalabilidad y el
alto rendimiento a menos que se especifique otra cosa.
Los más característicos son:
• dCache por Fermilab y DESY
• ExaFS. Sistema distribuido de ficheros de Exanet.
• Gfarm. Sistema de ficheros que usa OpenLDAP o PostgreSQL para los metadatos y FUSE o
LUFS para su montaje. Disponible para Linux, FreeBSD, NetBSD y Solaris bajo X11
License.
• GlusterFS. Un sistema de ficheros en clúster configurable y de alto rendimiento que es parte
de GNU Clustering Platform. Disponible en cualquier sistema operativo bajo GPL.
• GFS (Google File System) de Google se centra en la tolerancia a fallos, alto transferencia de
datos y escalabilidad.
• IBRIX Fusion de IBRIX. Disponible para Linux pero con licencia propietaria.
• MogileFS de Danga Interactive. No es compatible con POSIX. Usa un sencillo espacio de
nombres a nivel de aplicación y también MySQL para los metadatos y HTTP para el
transporte. Disponible para Linux bajo GPL.
• OneFS. Sistema de ficheros distribuido de Isilon. Basado en BSD sobre hardware
compatible Intel.
• Panasas ActiveScale File System (PanFS) de Panasas. Usa dispositivos de almacenamiento
por objetos. Disponible para Linux con licencia propietaria.
67

• PeerFS de Radiant Data Corporation. Centrado en la alta disponibilidad y el alto


rendimiento. Usa replicación puerto a puerto con múltiples fuentes y múltiples destinos.
Disponible en Linux con licencia propietaria.
• TerraGrid Cluster File System de Terrascale Technologies Inc. Implementa a la demanda la
coherencia del cache y usa el estándar industrial iSCSI y una versión modificada del sistema
de ficheros XFS. Disponible en Linux con licencia propietaria.

9.2.7.Sistemas de ficheros encriptados


Se trata de sistemas de ficheros que permiten la encriptación de los mismos. Los más característicos
son:
• eCryptfs – Desarrolllado para Linux.
• SSHFS (Secure Shell File System)
• EncFS (Encrypted File System). Con licencia GPL.
• Rubberhose filesystem
• PhoneBookFS
• DolFS (Solid File System)
• EFS (Encrypted File System) Sistema de ficheros encriptados para los sistemas Microsoft
Windows. Es una extensión del NTFS
• FSFS (Fast Secure File System)
• TrueCrypt - Software de encriptación de uso libre para Windows Vista/XP/2000 y Linux

9.3. Sistema de ficheros de Linux


Cada sistema de ficheros de Linux implementa un conjunto básico de conceptos comunes derivados
de los ficheros del sistema operativo Unix que están representados por los llamados inodos. Los
directorios son simples ficheros que contienen una lista de entradas y de dispositivos a los que se
puede acceder mediante solicitudes de entrada y salida y que contienen a su vez otros directorios y
obviamente ficheros.

9.3.1.Inodos
Cada fichero está representado por una estructura, llamada inodo. Cada inodo contiene la
descripción del fichero: el tipo, los derechos de acceso, los propietarios, las fechas, el tamaño y los
apuntadores a los bloques de datos. Las direcciones de los bloques de datos asignados a un fichero
se almacenan en su inodo. Cuando un usuario solicita una operación de entrada/salida de un fichero,
el kernel convierte el offset actual a un número de bloque, usa este número como un índice en la
tabla de direcciones del bloque y lee o escribe el bloque físico. Esta figura representa la estructura
de un inodo:
68

9.3.2.Directorios
Los directorios están estructurados según un árbol jerárquico. Cada directorio puede contener
ficheros y directorios.
Los directorios están implementados como un tipo especial de ficheros. Actualmente, un directorio
es un fichero que contiene una lista de entradas. Cada entrada contiene un número de inodo y el
nombre del fichero. Cuando un proceso usa un camino, el kernel busca en los directorios hasta
encontrar el número del inodo correspondiente. Después de que el nombre se ha convertido en un
número de inodo, se carga el inodo a la memoria y se usa en las solicitudes siguientes.
Esta figura representa un directorio:

9.3.3.Enlaces
El sistema de ficheros de Linux implementa el concepto de enlace. Se pueden asociar varios
nombres a un inodo. El inodo contiene un campo que contiene el número asociado con el fichero.
Añadir un enlace consiste simplemente en crear una entrada de directorio, donde el número del
inodo apunta al inodo y en incrementar el contador de enlaces en el inodo. Cuando se elimina un
enlace, el kernel decrementa el contador de enlaces y elimina el inodo si el contador toma el valor
69

de cero.
Este tipo de enlace se llama enlace duro y solo se puede usar dentro de un único sistema de
ficheros; no se pueden crea enlaces duros a distintos sistemas de ficheros. Por otra parte los enlaces
duros solo pueden apuntar a los ficheros, es decir, no se puede crear un enlace duro de directorio.
Existe otra clase de enlaces en la mayoría de sistemas de ficheros de Linux. Los enlaces simbólicos
son simplemente ficheros que contienen un nombre de fichero. Cuando el kernel encuentra un
enlace simbólico en un camino en la conversión de un inodo, reemplaza el nombre del enlace por su
contenido. Dado que un enlace simbólico no apunta a un inodo, es posible crear enlaces simbólicos
que atraviesen distintos sistemas de ficheros. Los enlaces simbólicos pueden apuntar a cualquier
tipo de fichero, incluso a ficheros inexistentes. Los enlaces simbólicos son muy útiles porque no
tienen limitaciones asociadas a los enlaces duros. Sin embargo usan espacio de disco, con las
asignaciones a su inodo y a sus bloques de datos y también sobrecargan el kernel, porque este tiene
que hacer una conversión adicional.

9.3.4.Ficheros especiales de dispositivo


En los sistemas operativos tipo Linux, se accede a los dispositivos vía ficheros especiales. Un
fichero especial de dispositivo no usa ningún espacio en el sistema de ficheros, solo es un punto de
acceso al controlador del dispositivo.
Hay dos tipos de ficheros especiales: ficheros especiales de carácter y de bloque. Cuando se hace
una solicitud de entrada/salida a un fichero especial, se envía esta solicitud al controlador del
dispositivo. Un fichero especial se referencia por un número que identifica el tipo de dispositivo y
otro que identifica la unidad.

9.3.5.Sistema de ficheros VFS (Virtual File System)


El kernel de Linux dispone de un sistema virtual de ficheros llamado VFS (Virtual File System).
Durante las llamadas del sistema que actúan sobre los ficheros, el VFS es una capa intermedia que
maneja el sistema de ficheros orientado a llamadas de las funciones necesarias en el código del
sistema de ficheros físicos para realizar la entrada/salida. El mecanismo de indirección de esta capa
intermedia se utiliza frecuentemente en sistemas operativos como Unix o similares para facilitar la
integración y el uso de varios tipos de sistema de ficheros.
Cuando un proceso hace una llamada al sistema orientado al fichero, el kernel llama a una función
que figura en el VFS. Esta función se encarga de las manipulaciones independientes de la
estructura y redirige la llamada a una función contenida en el código físico del sistema de ficheros,
que es el responsable de manejar las operaciones dependientes de la estructura. El código del
sistema de ficheros utiliza las funciones de memoria cache para hacer las operaciones de
entrada/salida en los dispositivos. Este esquema se ilustra en esta figura:
70

El VFS define un conjunto de funciones que cada sistema de ficheros tiene que implementar. Esta
interfaz se compone de un conjunto de operaciones asociadas a tres tipos de objetos: sistemas de
ficheros, inodos, y los ficheros abiertos.
El VFS conoce los tipos de sistema de ficheros soportados en el kernel. Para ello, utiliza una tabla
definida en la configuración del kernel. Cada entrada de esta tabla describe un tipo de sistema de
ficheros: contiene el nombre del tipo de sistema de ficheros y un puntero a una función de llamada
durante la operación de montaje. Cuando se monta un sistema de ficheros, se llama a la adecuada
función de montaje. Esta función es la responsable de leer el superbloque del disco, inicializando
sus variables internas, y devolver un descriptor de sistema de ficheros montado en el VFS. Después
de que se ha montado el sistema de ficheros, las funciones VFS pueden usar este descriptor para
acceder a las rutinas físicas del sistema de ficheros.
Un descriptor del sistema de ficheros montado contiene varios tipos de datos: las informaciones que
son comunes a todos los tipos de sistema de ficheros, los punteros a las funciones suministradas por
código físico del kernel del sistema de ficheros, y los datos privados mantenidos por el código físico
del sistema de ficheros. Los punteros de la función contenidos en los descriptores del sistema de
71

ficheros permiten al VFS acceder a las rutinas internas del sistema de ficheros.
El VFS utiliza otros dos tipos de descriptores: un descriptor de inodo y un descriptor de fichero
abierto. Cada descriptor contiene las informaciones relacionadas con los ficheros en uso y un
conjunto de operaciones suministradas por el código físico del sistema de ficheros. Si bien el
descriptor de inodo contiene los punteros a las funciones que se pueden utilizar para actuar en
cualquier fichero, por ejemplo, las funciones de crear, desvincular, etc. Los descriptores de fichero
contienen el puntero a las funciones que sólo pueden actuar sobre los ficheros abiertos, por ejemplo,
leer, escribir.

9.4. Sistema de ficheros Ext (Extended File System)


El sistema de ficheros Ext se implementó en Abril de 1992 como el primer sistema de ficheros
creado específicamente para el sistema operativo Linux. Se inspiró en la estructura de metadatos del
tradicional UFS (Unix File System) y fue diseñado por Rémy Card para superar ciertas limitaciones
del sistema de ficheros Minix. Este sistema de ficheros Ext y sus versiones siguientes son sistemas
abiertos, y en las distribuciones de Linux se pueden ver los códigos correspondientes.
El primer sistema de ficheros de Linux fue Minixfs: un sistema de ficheros desarrollado
originalmente por el sistema operativo Minix. Este sistema de ficheros tenía muchos
inconvenientes. Entre ellos había un límite de 64MB en las particiones y otro límite de 14
caracteres para los nombres de los ficheros.
Para superar los problemas de los nombres largos, Rémy Card escribió extfs. Este sistema de
fichero se basó mayormente en el código y la implementación original del Minixfs. Sin embargo
eliminó el límite de tamaño de 64MB en las particiones e incrementó el límite del tamaño del
nombre del fichero a 255 caracteres.

9.5. Sistema de ficheros Ext2


El sistema de ficheros Ext2 o segundo Ext también fue diseñado por Rémy Card como la sustitución
del Ext. Este sistema de ficheros no solo tiene las ventajas del Ext sino que también suministra una
mejor gestión de gestión del espacio, permite el uso de flags especiales para la gestión de los
ficheros, el uso de listas de control de acceso y es extensible.

9.5.1.Características estándar
El sistema de ficheros Ext2fs soporta los tipos estándar de fichero Unix: fichero normal, directorio,
ficheros especiales de dispositivo y enlaces simbólicos.
El Ext2fs puede gestionar los sistemas de ficheros creados en grandes particiones. Mientras que el
código original del núcleo restringe el tamaño máximo del sistema de fichero a 2 GB, los trabajos
recientes en la capa VFS han subido este límite a 4 TB. Así ahora es posible utilizar grandes discos
sin la necesidad de crear muchas particiones.
El Ext2fs permite los nombres largos de fichero. Utiliza las entradas de directorio de longitud
variable. La longitud máxima del nombre de fichero es de 255 caracteres. Este límite se puede
ampliar a 1012 si es necesario.
El Ext2fs reserva algunos bloques para el superusuario (root). Normalmente se reserva el 5% de los
bloques. Esto permite que el administrador recupere fácilmente aquellas situaciones donde el
usuario podría llenar todo el sistema de ficheros.
72

9.5.2.Características avanzadas
Además de las características estándar Unix, el sistema de ficheros Ext2fs soporta algunas
extensiones que normalmente no están en los sistemas de ficheros de Unix.
Los atributos de fichero permite a los usuarios modificar el comportamiento del núcleo cuando
actúa sobre un conjunto de ficheros. Se pueden asignar atributos a un fichero o a un directorio. En
este último caso, los nuevos ficheros o directorios creados dentro del directorio heredan los
atributos del directorio.
Las semánticas del BSD o System V Release 4 se pueden seleccionar en el montaje. Una opción de
montaje permite al administrador elegir las semánticas de creación de fichero. En un sistema de
ficheros montado con semánticas BSD, los ficheros son creados con la misma identificación del
grupo que su directorio padre. Con la semántica System V, esto es un poco más complejo: si un
directorio tiene activado el bit setgid, los nuevos ficheros heredan la identificación del grupo del
directorio y los subdirectorios heredan la identificación del grupo y el bit setgid; en los demás
casos, los ficheros y subdirectorios son creados con la identificación del grupo primario del proceso
de llamada.
En el sistema de ficheros Extfs se puede utilizar las actualizaciones síncronas del tipo BSD. Una
opción de montaje permiten al administrador solicitar que los metadatos (inodes, mapa de los
bloques, bloques indirectos y bloques directorio) se graben síncronamente en el disco cuando son
modificados. Esto puede ser útil para mantener una consistencia estricta de los metadatos pero nos
lleva a rendimientos peores. Actualmente esta característica no se utiliza normalmente, ya que
además si se añade la pérdida de rendimiento asociada con el uso de las actualizaciones síncronas
de los metadatos, puede ser causa de corrupción de los datos del usuario que no estará marcado por
el verificador de sistema de ficheros.
El sistema de ficheros Ext2fs permite al administrador elegir el tamaño del bloque lógico cuando se
crea el sistema de ficheros. Normalmente los tamaños de los bloques pueden ser 1024, 2048 y 4096
octetos. La utilización de tamaños grandes de bloque acelera las entradas/salidas ya que se
requieren menos solicitudes de entrada/salida, y así menos búsquedas de las cabezas de los discos.
Por otro lado, los bloques grandes malgastan más espacio de disco: en promedio el último bloque
asignado a un fichero solo se llena la mitad, así cuanto mayores son los bloques, más espacio se
malgasta en el último bloque de cada fichero. Además la mayor parte de las ventajas de los mayores
tamaños de bloque se obtienen mediante las técnicas de preasignación del sistema de ficheros Ext2.
El Ext2fs implementa enlaces simbólicos rápidos. Un enlace simbólico rápido no utiliza ningún
bloque de datos del sistema de ficheros. El nombre de destino no se almacena en un bloque de
datos, sino en el propio inodo. Esta política puede ahorrar algo de espacio en disco porque no se dbe
asignar ningún bloque de datos y además acelera las operaciones de enlace ya que no es necesario
leer un bloque de datos cuando se accede a dicho enlace. Por supuesto el espacio disponible en el
inodo está limitado por lo que no todos los enlaces se puede implementar como un enlace simbólico
rápido. El tamaño máximo del nombre de destino en un enlace simbólico rápido es de 60 caracteres.

El Ext2fs realiza un seguimiento del estado del sistema de ficheros. El código del kernel utiliza un
campo especial en el superbloque para indicar el estado del sistema de ficheros. Cuando se monta
un sistema de ficheros en modo lectura/escritura, su estado se establece en 'Not Clean'. Cuando se
desmonta o vuelve a montar en modo de sólo lectura, su estado se pone a 'Clean'. En el momento
del arranque, el comprobador del sistema de ficheros utiliza esta información para decidir si es
ncesaria una verificación previa del sistema de ficheros. El código del kernel también registra los
errores en este campo. Cuando el código del kernel detecta una inconsistencia, el sistema de
ficheros se marca como 'Erroneous'. El comprobador del sistema de ficheros comprueba este estado
73

para saber si tiene que forzar la comprobación del sistema de ficheros independientemente de su
estado aparentemente limpio.
Saltarse siempre la verificación del sistema de ficheros puede a veces ser peligroso, por lo que el
sistema de ficheros Ext2fs proporciona dos formas de forzar las verificaciones a intervalos
regulares. Un contador de montajes se mantiene en el superbloque. Cada vez que se monta el
sistema de ficheros en modo lectura/escritura, se incrementa este contador. Cuando se alcanza un
valor máximo (también registrado en el superbloque), el comprobador del sistema de ficheros
fuerza la verificación, aunque el sistema de ficheros tenga el estado 'Clean'. También se mantiene en
el superbloque la fecha y hora de la última verificación y el intervalo máximo de verificación. Estos
dos campos permiten al administrador solicitar las verificaciones periódicas. Cuando se alcanza el
intervalo máximo de verificación, el comprobador ignora el estado de sistema de ficheros y fuerza
una verificación del sistema de ficheros. El Ext2fs ofrece herramientas para ajustar el
comportamiento de sistema de ficheros como el programa tune2fs, que se puede utilizar para
modificar:
• El comportamiento de error. Cuando se detecte una inconsistencia con el código del kernel,
el sistema de ficheros se marca como 'Erroneous' 'y se puede hacer una de las tres acciones
siguientes: continuar la ejecución normal, volver a montar el sistema de ficheros en modo de
sólo lectura para evitar la corrupción del sistema de ficheros, y reiniciar el sistema para
ejecutar el comprobador de sistema de ficheros.
• El valor máximo del contador de montajes.
• El intervalo máximo de verificación.
• El número de bloques lógicos reservado para el superusuario (root).
También se pueden utilizar las opciones del montaje para cambiar el comportamiento de error del
kernel. Un atributo permite a los usuarios solicitar la eliminación segura de ficheros. Cuando se
elimina este fichero, se escriben datos aleatorios en los bloques del disco asignados previamente al
fichero. Esto evita que usuarios maliciosos accedan al contenido anterior del fichero utilizando un
editor de disco.
Al final, se han añadido al Ext2fs los nuevos tipos de ficheros inspirado en el sistema de ficheros
BSD 4.4. Los ficheros inmutables sólo se puede leer: nadie puede escribir en ellos o borrarlos. Esto
se puede utilizar para proteger los sensibles ficheros de configuración. Los ficheros de solo anexar
se pueden abrir en modo de escritura, pero los datos siempre se anexan al final del fichero. Como
los ficheros inmutables, no puede ser borrados o renombrados. Esto es especialmente útil para los
ficheros de registro que sólo pueden crecer.

9.5.3.Estructura física
La estructura física de los sistemas de ficheros Ext2 ha estado fuertemente influenciada por el
diseño del sistema de ficheros BSD. Un sistema de ficheros está formado por grupos de bloques.
Los grupos de bloques son análogos a los grupos de cilindros del BSD FFS. Sin embargo los grupos
de bloques no están vinculados a la distribución física de los bloques en el disco, ya que las
unidades modernas tienden a estar optimizadas para el acceso secuencial y ocultan su geometría
física al sistema operativo.
La estructura física de un sistema de ficheros se representa en esta tabla:
Sector de Grupo de Grupo de ... Grupo de
arranque bloques 1 bloques 2 ... bloques N
Cada grupo de bloques contiene una copia redundante de las informaciones cruciales de control del
sistema de ficheros (el superbloque y los descriptores del sistema de ficheros) y también contiene
una parte del sistema de ficheros (el mapa de bloques, un mapa de inodos, un trozo de la tabla de
inodos y los bloques de datos). La estructura de un grupo de bloque se representa en esta tabla:
74

Descriptores
Super Mapa de Mapa de Tabla de Bloques
del sistema de
Bloque bloques inodos inodos de datos
ficheros
El uso de grupos de bloques es muy ventajoso en términos de fiabilidad: dado que las estructuras de
control se replican en cada grupo de bloques, es fácil recuperarlas en un sistema de ficheros donde
se ha dañado el superbloque. Esta estructura también ayuda a obtener buenos rendimientos debido a
la reducción de la distancia entre la tabla de inodos y los bloques de datos, ya que así es posible
reducir las búsquedas de la cabeza del disco durante las operaciones de entrada/salida.
En el sistema de ficheros Ext2fs, los directorios se gestionan como listas enlazadas de entradas de
longitud variable. Cada entrada contiene el número del inodo, la longitud de la entrada, el nombre
del fichero y su longitud. Mediante el uso de las entradas de longitud variable, es posible
implementar los nombres de fichero largos sin desperdiciar espacio en disco en los directorios. La
estructura de una entrada de directorio se muestra en esta tabla:
Número de Longitud de Longitud Nombre del
inode la entrada del nombre fichero
Como ejemplo, la tabla siguiente representa la estructura de un directorio que contiene tres ficheros:
file1, long_file_name, y f2:
i1 16 05 file1
i2 40 14 long_file_name
i3 12 02 f2

9.5.4.Optimizaciones de rendimiento
El código del kernel de Ext2fs contiene muchas optimizaciones de rendimiento, que tienden a
mejorar la velocidad de las entradas/salidas cuando lee y escribe en los ficheros.
El Ext2fs se aprovecha de la gestión de caché del búfer al realizar lecturas de las cabezas del disco:
cuando un bloque tiene que ser leído, el código del kernel solicita la entrada/salida de varios
bloques contiguos. De esta manera, se trata de asegurar que el siguiente bloque a leer ya estará
cargado en la caché del búfer. Las lecturas de las cabezas del disco normalmente realizan lecturas
secuenciales de los ficheros y el Ext2fs las amplia a la lectura de los directorios, ya sean lecturas
explícitas o implícitas.
El Ext2fs también contiene muchas optimizaciones de asignación. Los grupos de bloques se utilizan
para agrupar los inodos y los datos que están relacionados: el código del kernel siempre trata de
asignar los bloques de datos de un fichero en el mismo grupo que su inodo. Con ello se pretende
reducir las búsquedas de la cabeza del disco cuando el núcleo lee un inodo y sus bloques de datos.
Cuando se escriben datos en un fichero, el Ext2fs preasigna hasta 8 bloques adyacentes cuando se
asigna un nuevo bloque. Las tasas de éxito de la preasignación son alrededor del 75%, incluso en
sistemas de ficheros muy llenos. Esta preubicación logra buenos rendimientos de escritura con
bastante carga. También permite a los bloques contiguos ser asignados a los ficheros, por lo que
acelera las futuras lecturas secuenciales.
Estas dos optimizaciones de asignación permiten una muy buena localización de:
• los ficheros relacionados a través de grupos de bloques
• los bloques relacionados a través del clustering de 8 bits de las asignaciones de bloque.
75

9.5.5.La librería de Ext2fs


Para permitir que los programas de modo usuario manipulen las estructuras de control de un sistema
de ficheros Ext2, se desarrolló la librería libext2fs. Esta librería proporciona rutinas que se pueden
utilizar para examinar y modificar los datos de un sistema de ficheros Ext2, accediendo al sistema
de ficheros directamente a través del dispositivo físico.
La librería de Ext2fs fue diseñada para permitir la máxima reutilización de código a través de la
utilización de las técnicas de abstracción de software. Por ejemplo, se proporcionan varios
iteradores diferentes. Un programa puede pasar sencillamente en una función
toext2fs_block_interate(), que llamará a cada bloque de un inodo. Otra función de iteración permite
que una función suministrada por un usuario sea llamada para cada fichero en un directorio.
Muchas de las utilidades de Ext2fs (mke2fs, e2fsck, tune2fs, dumpe2fs, y debugfs) utilizan la
librería de Ext2fs. Esto simplifica enormemente el mantenimiento de estas utilidades, dado que
cualquier cambio para reflejar las nuevas características en el formato de sistema de ficheros Ext2
solo necesitan ser hechas en un solo lugar, en la librería de Ext2fs. Esta reutilización de código
también se traduce en programas más pequeños, ya que la librería de Ext2fs puede ser construida
como una imagen de la biblioteca compartida.
Debido a que las interfaces de la librería de Ext2fs son tan abstractas y generales, los nuevos
programas que requieren el acceso directo al sistema de ficheros Ext2fs pueden ser escritos
fácilmente. Por ejemplo, la librería de Ext2fs se utilizó durante el volcado del BSD 4.4 y la
restauración de las utilidades de copia de seguridad. Muy pocos fueron los cambios necesarios para
adaptar estas herramientas a Linux: sólo se han reemplazado muy pocas funciones dependientes del
sistema de ficheros por llamadas a la librería de Ext2fs.
La librería de Ext2fs proporciona el acceso a varias clases de operaciones. La primera clase son las
operaciones orientadas al sistema de ficheros. Un programa puede abrir y cerrar un sistema de
ficheros, leer y escribir los mapas de bits, y crear un nuevo sistema de ficheros en el disco. También
hay funciones disponibles para manipular las listas de bloques malos del sistema de ficheros.
La segunda clase de operaciones afectan a los directorios. Una llamada de la librería de Ext2fs
puede crear y ampliar los directorios, así como añadir y eliminar entradas del directorio. También
hay funciones para resolver un nombre de ruta a un número de inodo, y para determinar una ruta de
un inodo a partir de su número de inodo.
La última clase de operaciones se orientan en torno a los inodos. Es posible escanear la tabla de
inodos, leer y escribir inodos, y escanear a través de todos los bloques de un inodo. Las rutinas de
asignación y desasignación también están disponibles y permite a los programas en modo usuario
asignar y liberar bloques y inodos.

9.6. Sistema de ficheros Ext3


El sistema de ficheros Ext3 es un sistema de ficheros que normalmente se utiliza en el sistema
operativo Linux. Stephen Tweedie reveló por primera vez que estaba trabajando en la ampliación
del Ext2 en Febrero de 1999 y apareció en la versión 2.4.15 del kernel de Linux.

9.6.1.Ventajas
Aunque su rendimiento es menos atractivo que los sistemas de ficheros competidores en Linux,
como JFS, ReiserFS y XFS, tiene la importante ventaja de que permite las actualizaciones locales
del sistema de ficheros Ext2, sin tener necesidad de realizar una copia de seguridad y la consecuente
restauración de datos. Sus competidores ReiserFS y XFS consumen menos CPU pero para migrar
desde Ext2 necesitan hacer la copia de seguridad y restaurar los datos.
76

El sistema de ficheros Ext3 añade con respecto a su predecesor:


• Un diario y
• Un sistema de ficheros en línea de crecimiento
Los sistemas de ficheros Ext2 y Ext3 comparten el mismo conjunto estándar de utilidades,
e2fsprogs, que incluye la herramienta fsck. También es posible hacer la conversión directa entre los
dos sistemas de ficheros, tanto hacia adelante y como hacia atrás.
Hay tres niveles de diarios disponibles en la implementación de Linux de Ext3:
• Diario (de menor riesgo). Tanto los metadatos como el contenido de los ficheros se escriben
en el diario antes de ser enviados al sistema de ficheros principal. Debido a que el diario es
relativamente continuo en el disco, en algunas circunstancias esto puede mejorar el
rendimiento. En otros casos, el rendimiento empeora porque los datos deben ser escritos dos
veces, uno en el diario y luego en la parte principal del sistema de ficheros.
• Encargado (riesgo medio). Sólo los metadatos se envían al diario; el contenido del fichero
no se envía, pero se garantiza que el contenido del fichero se escriba en el disco antes de que
los metadatos asociados se marquen como enviados en el diario. Este es el defecto en
muchas distribuciones de Linux. Si hay un corte de energía o un fallo brusco del kernel
mientras un fichero está siendo escrito o se está añadiendo datos, el diario indicará que hay
el nuevo fichero o que los datos añadidos no habrán sido enviados, por lo que serán borrados
en el proceso de limpieza. Sin embargo, los ficheros reescritos pueden estar dañados porque
la versión original del fichero no se ha almacenado. Así es posible acabar con un fichero en
un estado intermedio entre nuevo y viejo, sin la suficiente información para restaurar uno o
el otro, dado que nunca los nuevos datos están completamente almacenados en el disco y los
datos anteriores no están almacenados en ningún lugar. Aún peor, el estado intermedio
pueden intercalar los datos antiguos y los nuevos, porque el orden de la escritura se deja al
hardware del disco.
• Reescritura (de mayor riesgo). Sólo los metadatos se graban en el diario; el contenido del
fichero no se graba en el diario. El contenido puede ser escrito antes o después de la
actualización del diario. Como resultado, los ficheros modificados justo antes de un fallo
pueden haberse dañado. Por ejemplo, un fichero que se está añadiendo, puede estar marcado
en el diario como más grande que lo que realmente es, lo que al final genera un
funcionamiento erróneo. Las versiones anteriores de los ficheros también puede aparecer
después de una inesperada recuperación del diario. XFS y JFS usan este nivel de diario, pero
se aseguran de no hay problemas debido a que los datos sin escribir aparezcan con ceros en
el reinicio.

Si bien en algunos contextos la falta de las características modernas del sistema de ficheros tales
como la asignación dinámica de inodos y el no soportar extensiones, se podría considerar un
inconveniente. Los metadatos del sistema de ficheros están todos en lugares fijos y bien conocidos,
y hay una cierta redundancia en las estructuras de datos que pueden permitir que Ext2 y Ext3 se
puedan recuperar cuando hay una corrupción significativa de datos, mientras que los sistemas de
ficheros basados en árboles no puede hacer esta recuperación.

9.6.2.Inconvenientes

Funcionalidad
Dado que el sistema de ficheros Ext3 es muy compatible con el Ext2, muchas de las estructuras en
el disco son similares a los sistemas de ficheros Ext2. Por eso, el Ext3 carece de una serie de
características de los diseños más recientes, tales como la asignación dinámica de los inodos y el
tamaño variable del bloque.
77

Un volcado del sistema de ficheros mientras se está montado como un dispositivo de lectura-
escritura, puede corromper datos en el fichero de volcado.
El sistema de ficheros Ext3 no soporta extensiones a diferencia de otros sistemas de ficheros como
JFS, Ext4 y XFS.

Desfragmentación
No hay ninguna herramienta de desfragmentación on-line trabajando a nivel de sistema de ficheros.
Existen herramientas de desfragmentación en el espacio del usuario como Shake y defrag, que
funcionan copiando cada fichero y esperando que su nueva ubicación no sea fragmentada. Sin
embargo, esto sólo funciona si el sistema de ficheros está bastante vacío; sin embargo estos sistemas
de ficheros no acostumbran a estar fragmentados.
Sin embargo, como dice la Guía del Administrador de Sistema de Linux, los modernos sistemas de
ficheros Linux mantienen la fragmentación bajo mínimos guardando todos los bloques de un
fichero juntos, incluso si no pueden almacenarse en sectores consecutivos. Algunos sistemas de
ficheros, como el Ext3, asignan de manera efectiva el bloque libre que está más cerca de los otros
bloques del mismo fichero. Por lo tanto, no es necesario preocuparse por la fragmentación en un
sistema Linux.

Recuperación de ficheros borrados


A diferencia del sistema de ficheos Ext2, el Ext3 pone ceros a los punteros de bloque en los inodos
de los ficheros eliminados. Hace esto para simplificar el acceso de lectura y escritura en el sistema
de ficheros cuando el diario se repite después de un montaje sucio. Sin embargo esto impide que los
ficheros sean recuperados. El único recurso del usuario es usar el comando grep al disco duro de los
datos conocidos para señalar el comienzo y el final del fichero. Esto proporciona ligeramente un
borrado más seguro que el Wxt2, lo que puede ser una ventaja o una desventaja.

Compresión
No tiene soporte a la compresión.

Límites de tamaño
El sistema de ficheros Ext3 tiene un tamaño máximo tanto a nivel de fichero como del sistema.
Estos límites dependen del tamaño del bloque del sistema de ficheros. El cuadro siguiente resume
los límites:
Tamaño Tamaño
Tamaño del
máximo máximo del
bloque
fichero sistema
1KiB 16GiB 2TiB
2KiB 256GiB 8TiB
4KiB 2TiB 16TiB
8KiB 2TiB 32TiB
Se debería observar que el tamaño de bloque de 8 KiB solo está disponible en arquitecturas que
permiten páginas de 8 KiB.

9.7. Sistema de ficheros EXT4


El sistema de ficheros Ext4 es un sistema de ficheros con diario desarrollado como el sucesor de
78

Ext3. Nació con una serie de extensiones compatibles con versiones anteriores para eliminar los
límites de almacenamiento de 64 bits y añadir mejoras de rendimiento al sistema de ficheros Ext3.
Sin embargo otros desarrolladores del kernel de Linux se opusieron a la aceptación de las
extensiones del Ext3 por razones de estabilidad, y propusieron renombrarlo como Ext4, y hacer
todo el desarrollo sin afectar a los actuales usuarios del sistema de ficheros Ext3. Esta propuesta fue
aceptada, y el 28 de Junio de 2006 Theodore Ts'o, el mantenedor de Ext3, anunció el nuevo plan de
desarrollo para Ext4.
Una instantánea del desarrollo preliminar de Ext4 se incluyó en la versión 2.6.19 del kernel de
Linux. A partir del 11 de Octubre del 2008, ya se incorporó el sistema de ficheros Ext4 como código
estable, lo que indica el final de la fase de desarrollo y se recomienda la adopción del Ext4.

9.7.1.Características

Grandes sistemas de ficheros


El sistema de ficheros Ext4 puede soportar volúmenes de hasta 1 Exbibyte y ficheros con tamaños
de hasta 16 Tebibytes.

Extensiones
Las extensiones se introducen para reemplazar el tradicional esquema de asignación de bloque
utilizado por los sistemas de ficheros Ext2/3. Una extensión es un conjunto de bloques físicos
contiguos lo que mejora el rendimiento de los ficheros de gran tamaño y reduce la fragmentación.
Una extensión única en Ext4 pueden asignar hasta 128 MB de espacio contiguo con un tamaño de
bloque de 4KB. Pueden haber hasta 4 extensiones almacenadas en el inodo. Cuando hay más de 4
extensiones en un fichero, el resto de las extensiones se indexan en un HTREE.

Compatibilidad con versiones anteriores


El sistema de ficheros Ext4 es compatible con el Ext3 y el Ext2, por lo que es posible montar
sistemas de ficheros Ext2 y Ext3 como Ext4. Esto mejora ligeramente el rendimiento, debido a
determinadas características nuevas del Ext4 como el nuevo algoritmo de asignación de bloque. El
sistema de ficheros Ext3 es parcialmente compatible con el Ext4, es decir, un sistema de ficheros
Ext4 se puede montar como una partición Ext3. Sin embargo si la partición Ext4 usa extensiones,
entonces se pierde la capacidad de montar el sistema de ficheros como Ext3.

Preasignación de espacio en disco


El sistema de ficheros Ext4 permite la presignación de espacio en disco para un fichero. La
metodología actual para esto en la mayoría de los sistemas de fichero es escribir el fichero completo
con ceros para reservar el espacio cuando se crea el fichero. Este método ya no es necesario para
Ext4. Para esto se ha añadido una nueva llamada del sistema fallocate () al kernel de Linux
incluidos los Ext4 y XFS, que tienen esta capacidad. Así se garantiza el espacio asignado a los
ficheros y probablemente serán contiguos.

Asignación retardada
El sistema de ficheros Ext4 utiliza una técnica de ejecución del sistema de ficheros llamada
'allocate-on-flush', también conocida como asignación retardada. Se trata de retrasar la asignación
de bloque hasta que los datos se vayan a escribir en el disco. Otros sistemas de ficheros asignan los
79

bloques necesarios antes de ese paso. Esto mejora el rendimiento y reduce la fragmentación
mediante la mejora de las decisiones de asignación de bloques de acuerdo sobre el tamaño real del
fichero.

Superar el límite de 32.000 subdirectorios


En el sistema de ficheros Ext3, el número de subdirectorios que un directorio puede contener, está
limitado a 32.000. Este límite se ha elevado a 64.000 en Ext4, y con la característica dir_nlink se
puede ir más allá. El mantenimiento del rendimiento permite la posibilidad de más subdirectorios y
para ello se activa Htree por defecto en Ext4. Esta característica se implementa en el kernel de
Linux 2.6.23. Htree también está disponible en Ext3 cuando se habilita la característica dir_index.

Comprobación de errores en el diario


El sistema de ficheros Ext4 utiliza la comprobación de errores en el diario para mejorar la
fiabilidad, ya que el diario es uno de los ficheros más utilizados del disco. Esta característica tiene
como beneficio colateral el que se puede evitar con seguridad una espera de entrada/salida del
disco durante el proceso de grabación en el diario, mejorando ligeramente el rendimiento.

Desfragmentación en línea
Hay una serie de propuestas para un desfragmentador en línea, pero este soporte aún no está
incluido en el núcleo principal. Incluso con las diversas técnicas utilizadas para evitar la
fragmentación, un sistema de ficheros de larga vida tiende a fragmentarse en el tiempo. El sistema
de ficheros Ext4 contará con una herramienta que puede desfragmentar los ficheros individuales o
los sistemas de fichero completo.

Comprobación más rápida del sistema de ficheros


En el sistema de ficheros Ext4, los grupos de bloques no asignados y las secciones de la tabla de
inodos están marcados como tales. Esto permite al programa e2fsck, omitirlos por completo en la
comprobación y reducir considerablemente el tiempo necesario para comprobar un sistema de
ficheros de Ext4. Esta característica se implementa en la versión 2.6.24 del kernel de Linux.

Asignador multibloque
El sistema de ficheros Ext4 asigna múltiples bloques a un fichero en una sola operación, lo que
reduce la fragmentación, ya que trata de elegir bloques contiguos en el disco. El asignador
multibloque está activo cuando se utiliza O_DIRECT o si está activa la asignación retardada. Esto
permite que el fichero tenga muchos bloques sucios cuando hay varias escrituras simultáneas, a
diferencia del mecanismo actual del núcleo de someter cada bloque a una asignación en el sistema
de ficheros de forma separada.

Marcas de tiempo mejorados


Dado que los ordenadores son más rápidos cada día, y como Linux se usa día más para aplicaciones
de misión crítica, la granularidad de las marcas de tiempo basadas en segundos se torna insuficiente.
Para solucionar esto, el sistema de ficheros Ext4 ofrece marcas de tiempo medidas en
80

nanosegundos. Además se añaden 2 bits del campo de fecha y hora ampliada a los bits más
significativos del campo en segundos de la marca de hora para alargar el número de años en cuanto
a su capacidad.

El sistema de ficheros Ext4 también añade soporte para las marcas de tiempo creadas por fecha.
Pero, como señala Theodore Ts'o, si bien es fácil agregar un campo más creado por fecha en el
inodo, lo que técnicamente ha permitido soportar las marcas de tiempo creadas por fecha en Ext4,
es más difícil de modificar o agregar las llamadas al sistema necesarias, como stat (), que
probablemente requeriría una nueva versión, y las distintas bibliotecas que dependen de ellas como
glibc. Estos cambios requieren la coordinación de numerosos proyectos. Así que, aunque los
desarrolladores de Ext4 implementan un soporte inicial para las marcas de tiempo creadas por
fecha, esta característica no estará disponible de momento para los programas de usuario.

9.7.2.Inconvenientes
La asignación retardada plantea algunos riesgos adicionales de pérdida de datos en los casos en que
el sistema se bloquea antes de que todos los datos hayan sido escritos en el disco. El escenario
típico en el que esto puede ocurrir, es un programa que sustituya los contenidos de un fichero sin
forzar una escritura en el disco con el programa fsync. Pueden surgir problemas si el sistema se
bloquea antes de que el proceso de grabación real se produzca. El código Ext4 en la versión 2.6.28
del kernel de Linux limpiará el contenido del fichero antes del accidente, pero nunca escribe la
nueva versión, perdiendo así el contenido del fichero completo.
La modificación de este comportamiento utilizando fsync más a menudo, puede dar lugar a
penalizaciones graves de rendimiento en sistemas de ficheros Ext3 montados con el flag
data=ordered, que es el valor predeterminado en la mayoría de las distribuciones de Linux. Dado
que ambos sistemas de ficheros Ext3 y Ext4 estarán en uso durante algún tiempo, esto complica las
cosas enormemente para los desarrolladores de aplicaciones de usuario final. Theodore Ts'o ha
escrito algunos parches para Ext4 que hacen que se limite su asignación retardada en los casos más
frecuentes. Por un pequeño costo en el rendimiento, esto aumentará considerablemente la
posibilidad de que alguna versión del fichero que sobrevivieron al accidente.

9.8. Sistema de ficheros FAT


File Allocation Table (FAT) es un sistema de fichero desarrollado por Microsoft para el sistema
operativo MS-DOS y es el sistema de fichero principal de la versión comercial de Microsoft
Windows hasta el Windows Me. El sistema de ficheros FAT que también se aplica a los discos
ópticos, así como a las memorias flash, se ha estandarizado como ECMA-107 de European
Computer Manufacturers Association (http://www.ecma-international.org) e ISO/IEC 9293. El
sistema de ficheros está patentado parcialmente.
El principal inconveniente de este sistema de ficheros es que cuando se borran ficheros y se
escriben nuevos ficheros, los fragmentos del directorio tienden a esparcirse por todo el disco,
ralentizando los procesos de lectura y escritura. La desfragmentación es una solución a esto, pero a
menudo es un proceso largo y tiene que llevarse a cabo con regularidad para mantener el sistema de
ficheros FAT limpio. La desfragmentación no se debe realizar en las tarjetas de memoria de estado
sólido.

9.8.1.Historia
El sistema de ficheros FAT fue creado para administrar los discos en los sistemas de un solo disco.
81

En Agosto de 1980, Tim Paterson incorporó FAT en su sistema operativo 86-DOS para las tarjetas
base S-100 8086; el sistema de ficheros fue la principal diferencia entre el 86-DOS y su predecesor
el CP/M.
El nombre proviene de la utilización de una tabla que centraliza la información sobre qué zonas
pertenecen a los ficheros, qué zonas están libres o posiblemente inutilizables, y donde cada fichero
se almacena en el disco. Para limitar el tamaño de la tabla, y el número de bits necesarios en las
entradas del directorio, el espacio en disco se asigna a los ficheros en grupos contiguos de sectores
de hardware llamado clusters. El número máximo posible de clusters ha aumentado dramáticamente
en el tiempo y también el número de bits necesarios para identificar un clúster que se utiliza para
nombrar las sucesivas versiones principales del formato. El FAT estándar también se ha ampliado en
otras formas que preserven la compatibilidad con el software existente.

9.8.2.Sistema de ficheros FAT12


La versión inicial de FAT se conoce como FAT12. Diseñado como un sistema de ficheros para
disquetes, tenía las siguientes limitaciones:
– Las direcciones de clúster sólo tenían 12 bits de largo, lo que limitaba el tamaño de clúster a
4078.
– El tamaño del disco se almacenaba en una cuenta de 16 bits de los sectores, lo que limitaba
el tamaño a 32 MiB. El sistema de ficheros FAT12 fue utilizado por varios fabricantes con
diferentes formatos físicos, así un disquete típico que en este momento era de 5,25 pulgadas,
de una sola cara, 40 pistas, con 8 sectores por pista, daba una capacidad de sólo 160 KB
tanto para las áreas de sistema como para los ficheros. Los límites fueron sucesivamente
aumentado en los años siguientes, lo que aumentó considerablemente la capacidad de
almacenamiento, pero finalmente el FAT12 se declaró obsoleto.
Por convención, todas las estructuras de control se organizaron para que cupieran dentro de la
primera pista, evitando así el movimiento de la cabeza durante las operaciones de lectura y
escritura, aunque esto varía dependiendo del fabricante y del formato físico del disco. Desde que se
introdujo el sistema de ficheros FAT12, el sistema operativo DOS no tenía el soporte jerárquico de
los directorios, y el número máximo de ficheros estaba limitado normalmente a unas pocas docenas.

Una limitación que no se trató hasta mucho más tarde, fue que cualquier sector defectuoso en el
área de estructuras de control, hacía que el disquete no se pudiera utilizar. La herramienta de
formateo de DOS rechazaba estos disquetes. Los sectores defectuosos sólo se permitían en el área
de los ficheros.

9.8.3.Directorios
En Marzo de 1983, IBM lanzó el ordenador PC XT, que incluyó un disco duro de 10 MB.
Simultáneamente se lanzó el sistema operativo MS-DOS/PC-DOS 2.0 que introdujo los directorios
jerárquicos para soportar adecuadamente la masiva capacidad del nuevo medio. Además de permitir
una mejor organización de los ficheros, los directorios permitían almacenar muchos más ficheros en
el disco duro, así el número máximo de ficheros no estaba limitado por el tamaño del directorio
raíz. Ahora este número podría ser igual al número de clusters, o incluso mayor, dado que los
ficheros de tamaño cero no usan ningún clúster en el sistema de ficheros FAT.
Los discos duros de 10 MB de los PC XT tenía clusters de 4 KB. Si se instalaba luego un disco duro
de 20 MB y se formateaba con el sistema operativo MS-DOS 2.0, el tamaño del clúster resultante
sería de 8 KB, con un límite de 15,9 MB.
82

9.8.4.Sistema de ficheros FAT16 inicial


En 1984, IBM lanzó el PC AT, que incluyó un disco duro de 20 MB. En paralelo Microsoft presentó
el sistema operativo MS-DOS 3.0. Las direcciones de clúster se incrementaron a 16 bits,
permitiendo un mayor número de clusters, hasta 65.517, y en consecuencia el tamaño del sistema de
fichero se hizo mucho mayor. Sin embargo el mayor número posible de sectores y el tamaño
máximo de la partición, en lugar de disco, de 32 MB no cambió. Un disco duro de 20 MB
formateado bajo MS-DOS 3.0 no era accesible por el más viejo MS-DOS 2.0. Por supuesto, MS-
DOS 3.0 aún puede acceder al estilo del MS-DOS 2.0 con particiones de clúster de 8 KB.
El sistema operativo MS-DOS 3.0 también introdujo el soporte para los disquetes de alta densidad
de 1,2 MB 5.25 ", que tenían 15 sectores por pista. Probablemente esto provocó una dudosa
optimización del tamaño del clúster, que bajó de 2 sectores a solo 1. El efecto neto fue que los
disquetes de alta densidad eran significativamente más lentos que los viejos de doble densidad.

9.8.5.Partición extendida y dispositivos lógicos


Además de mejorar la estructura del propio sistema de ficheros FAT, un desarrollo paralelo permitió
un incremento del máximo espacio posible de almacenamiento en FAT mediante la introducción de
múltiples particiones FAT. Originalmente se suponía que las particiones se utilizarían sólo para
compartir el disco entre los sistemas operativos, por lo general DOS y Xenix al mismo tiempo, así
el sistema operativo DOS sólo estaba preparado para manejar una partición FAT. No era posible
crear múltiples particiones de DOS usando las herramientas de DOS, y las herramientas de terceras
partes advirtieron que este esquema no sería compatible con el DOS.
Para permitir el uso de más particiones FAT en una forma compatible, se introdujo un nuevo tipo de
partición con el sistema operativo MS-DOS 3.2. Esto fue en Enero de 1986 y a la nueva partición se
le denominó partición extendida, que en realidad era sólo un contenedor para las particiones
adicionales llamados unidades lógicas. Originalmente sólo era posible 1 unidad lógica, lo que
permitía el uso de discos duros de hasta 64 MB. En el sistema operativo MS-DOS 3.3, este límite se
aumentó a 24 unidades lógicas; probablemente vino porque se usaba una letra para identificar cada
unidad lógica; las letras A y B se reservaron para las dos unidades de disquete. Las unidades lógicas
se describen en unas estructuras de disco que se parecen mucho al MBR (Master Boot Record) del
disco, que describe las particiones primarias, probablemente para simplificar la codificación.
Siempre estaban almacenados en el disco como una fila de bloques separados en un solo
contenedor. Sólo se permite una única partición extendida. Las unidades lógicas no son de arranque,
y la partición extendida sólo podría ser creada después de la partición FAT primaria, excepto con las
herramientas de terceras partes, que elimina toda ambigüedad, sino también la posibilidad de
arrancar con varias versiones de DOS desde el mismo disco duro.
Un útil efecto colateral del esquema de partición extendida fue incrementar significativamente el
número máximo de particiones posibles en un disco duro, más allá de las 4 que podían ser descritos
por el MBR(Master Boot Record).
Antes de la introducción de las particiones extendidas, algunos controladores de disco duro, que en
ese momento eran tarjetas separadas ya que el estándar IDE aún no existía, podían hacer que los
discos duros grandes aparecieran como dos discos separados.

9.8.6.Sistemas de ficheros FAT16 final


Por último, en Noviembre de 1987, el sistema operativo DOS 3.31 de Compaq introdujo lo que hoy
se llama el formato FAT16, con la expansión de los índices de sector de 16 a 32 bits. El resultado
fue llamado inicialmente el DOS 3.31 para los sistema grandes de ficheros. Aunque los cambios en
el disco eran aparentemente menores, todo el código del disco DOS tenía que ser convertido para
83

usar los números de sector de 32 bits, una tarea complicada por el hecho de que estaba escrito en
lenguaje ensamblador de 16 bits.
En el año 1988, la mejora se hizo más general con los sistemas operativos MS-DOS 4.0 y el OS/2
1.1. Ahora el límite del tamaño de la partición estaba dictado por los 8 bits de sectores por clúster.
Con el tamaño habitual del sector del disco duro de 512 octetos, lo que da clusters de 32 KB, se fija
el límite definitivo del tamaño de la partición FAT16 en 2 gigabytes. En los medios magneto-
ópticos, que pueden tener sectores de 1 ó 2 KiB, el límite es proporcionalmente mayor.
Mucho más tarde, el sistema operativo Windows NT aumentó el tamaño máximo de clúster a 64
KB, considerando que la cuenta de los sectores por clúster es un número entero sin signo. Sin
embargo, el formateo resultante no era compatible con cualquier otra implementación de FAT y a su
vez generaba una gran fragmentación interna. El sistema operativo Windows 98 también soporta la
lectura y escritura de esta variante, pero sus utilidades de disco no funcionan en él.
El número de entradas disponibles del directorio raíz se establece en el instante del formateo, y se
almacena en un campo de 16 bits con signo estableciendo un límite absoluto de 32.767 entradas.
Por razones históricas, los dispositivos con los sistemas de ficheros FAT12 y FAT16 usan
generalmente 512 entradas del directorio raíz en los dispositivos que no son disquetes, y otros
tamaños pueden ser incompatibles con algún software u otros dispositivos. Las entradas para los
nombres de fichero y/o carpeta se guardan en el antiguo formato 8.3, es decir, un nombre de 8
caracteres y una extensión de 3 caracteres.

9.8.7.Nombres largos de ficheros (VFAT, LFNs)


Una de los objetivos de la experiencia del usuario para los diseñadores del sistema operativo
Windows 95 fue la posibilidad de utilizar nombres de fichero largos (LFN) de hasta 255 caracteres
UTF-16, además del clásico nombre de fichero 8.3. La versión del sistema de ficheros con esta
extensión es generalmente conocido como VFAT después de que el controlador VxD de Windows
95 también se conoce como Virtual FAT en el antiguo documento de Microsoft.
Curiosamente el controlador VFAT apareció antes del Windows 95, en el sistema operativo
Windows para Trabajo en Grupo 3.11, pero sólo se utilizó para implementar el 32-bit File Access,
un método de acceso de ficheros de mayor rendimiento y modo protegido, cortocircuitando el DOS
y utilizando directamente o la BIOS, o, mejor , los controladores de disco nativos de Windows en
modo protegido.
En Windows NT, el soporte de nombres largos en FAT empezó en la versión 3.5.

9.8.8.Sistema de ficheros FAT32


A fin de superar el límite del tamaño del volumen con el sistema de ficheros FAT16, Microsoft
decidió implementar una nueva generación de FAT, conocido como FAT32, con cuentas de clúster
en un campo de 32 bits, de los cuales 28 bits se utilizan para contener el número del clúster, para un
máximo de aproximadamente 250 millones de clusters. Esto permitiría tamaños de disco de hasta 8
terabytes de clusters de 32K, pero el sector de arranque utiliza un campo de 32 bits para la cuenta
del sector, limitando el tamaño de volumen de hasta 2 TB en un disco duro con sectores de 512
octetos.
En el sistema operativo Windows 95/98, y debido a la versión de la utilidad ScanDisk de Microsoft
incluida con estos sistemas operativos y que es una aplicación de 16 bits, la estructura FAT no
permite crecer más allá de unos 4 millones de clusters, poniendo el límite del volumen a 127,53
gigabytes. Una limitación en las versiones originales del fdisk de Windows 98/98SE hace que
informen incorrectamente en el caso de tamaños de disco mayores de 64GB. Una versión corregida
84

está disponible en Microsoft. Estas limitaciones no se aplican a Windows 2000/XP, excepto durante
la instalación, en el que hay un límite de 32 GB. Windows Millennium Edition soporta el sistema de
ficheros FAT32 sin ningún límite.
El sistema de ficheros FAT32 fue introducido con el sistema operativo Windows 95 OSR2, aunque
era necesario su reformateo, y el DriveSpace 3, la versión que viene con Windows 95 OSR2 y que
Windows 98 nunca lo soporta. Windows 98 introdujo una utilidad para convertir los discos duros
existentes de FAT16 a FAT32 sin pérdida de datos. En la línea del Windows NT, el soporte nativo
para FAT32 llegó con el sistema operativo Windows 2000. Un controlador gratuito de FAT32 para
Windows NT 4.0 estuvo disponible en Winternals, una compañía adquirida posteriormente por
Microsoft.
Los sistemas operativos Windows 2000 y Windows XP pueden leer y escribir en los sistemas de
ficheros FAT32 de cualquier tamaño, pero el programa de formateo incluido en Windows 2000 y
posteriores sólo pueden crear sistemas de ficheros FAT32 de 32 GB o menos. Esta limitación es por
diseño, y se impuso porque muchas tareas en un gran sistema de ficheros FAT32 se ralentizan y por
lo tanto son poco eficientes. Esta limitación se puede evitar mediante el uso de las utilidades de
formateo de terceros.
El tamaño máximo posible para un fichero en un volumen FAT32 es de 4 GB menos 1 octeto. Las
aplicaciones de captura y edición de vídeo y otros programas pueden fácilmente exceder este límite.
Los ficheros más grandes requieren otro tipo de formateo como los sistemas de ficheros HFS+ o
NTFS. Hasta mediados del 2006, los que corren sistemas de arranque dual o mueven dispositivos de
datos externos entre ordenadores con distintos sistemas operativos no tienen otra opción que seguir
con el sistema de ficheros FAT32. Desde entonces el soporte completo para el sistema de ficheros
NTFS ha estado disponible en Linux y muchos otros sistemas operativos mediante la instalación de
la librería FUSE en Linux, junto con la aplicación NTFS-3G. El intercambio de datos también es
posible entre los sistemas operativos Windows y Linux usando los sistemas de ficheros ext2 o ext3
de Linux nativo mediante el uso de los controladores externos para Windows, como el ext2 IFS; sin
embargo, Windows no se puede arrancar desde particiones ext2 o ext3.

9.8.9.Fragmentación
El sistema de ficheros FAT no contiene mecanismos que impidan que la escritura de los nuevos
ficheros se disperse por la partición. Otros sistemas de fichero, como el HPFS, usan los mapas de
bits que indican el espacio libre y que indica los clusters usados y los clusters disponibles con el fin
de encontrar zonas contiguas libres. Otra solución es la vinculación de todos los clusters libres en
una o más listas como se hace en los sistemas de ficheros de Unix. En cambio la FAT tiene que ser
escaneada como una matriz con el fin de encontrar clusters libres, que pueden dar lugar a pérdidas
de rendimiento con los discos grandes actuales y por lo tanto sus grandes tamaños de FAT.
De hecho, la computación del espacio libre en disco de FAT es una de las operaciones más
intensivas en recursos, ya que requiere la lectura de toda la FAT linealmente. Una posible
justificación sugerida por Raymond Chen de Microsoft limitando el tamaño máximo de las
particiones FAT32 creadas en Windows, fue que el tiempo necesario para realizar una simple
operación DIR, siempre muestra el espacio libre en el disco en la última línea. Visualizar esta línea
toma más tiempo y más cuanto mayor es el número de clusters.
Algunos de los problemas que se observan con la fragmentación, provocan limitaciones del sistema
operativo y del hardware. Este problema es muy grave con el sistema operativo DOS, ya que no es
multitarea y la arquitectura del disco duro en un PC no contiene mecanismos que podrían aliviar la
fragmentación.
85

También después de la escritura, no se permitía a menudo por defecto con el software de Microsoft,
guardar los datos en una caché, lo que puede producir una pérdida de datos en caso de un fallo.
El sistema operatvo MS-DOS tampoco ofrece una llamada de sistema que permita que las
aplicaciones hicieran seguro un determinado fichero hasta que ha sido completamente escrito en el
disco en presencia de escrituras diferidas. Las caches del disco en MS-DOS operan a nivel de
bloque de disco y no eran conscientes de las estructuras de nivel superior del sistema de ficheros.
En esta situación, el engaño en relación con el progreso real de una operación de disco era más
peligroso.
Los sistemas operativos modernos han introducido estas optimizaciones para particiones FAT, pero
las optimizaciones todavía puede producir efectos no deseados en caso de un fallo del sistema. El
sistema operativo Windows NT asigna de antemano espacio a los ficheros de FAT, seleccionando
grandes áreas contiguas, pero en caso de fallo, los ficheros que están siendo añadidos, aparecerán
más grandes antes de que se escriban, con docenas de kilobytes al azar al final.
Con los tamaños grandes de clúster, 16 ó 32K, obligados por las particiones FAT32 más grandes, la
fragmentación externa se convierte en algo menos significativo, y la fragmentación interna
comienza a ser un problema y, sobre todo cuando hay un gran número de ficheros pequeños.

9.8.10. Otras consideraciones


Microsoft ha asegurado recientemente las patentes de VFAT y FAT32, pero no la FAT original. Para
la mayoría de los fines, el sistema de ficheros NTFS que ha sido desarrollado para la línea de
Windows NT, es superior al FAT desde los puntos de vista de la eficiencia, el rendimiento y la
fiabilidad. Sus principales inconvenientes son el sobredimensionamiento en el caso de ficheros
pequeños y el soporte muy limitado a versiones distintas del Windows NT, ya que la especificación
exacta es un secreto comercial de Microsoft. La disponibilidad de NTFS-3G desde mediados de
2006 ha provocado un mejor soporte del sistema de ficheros NTFS en los sistemas operativos tipo
UNIX. Todavía no es posible utilizar NTFS en los sistemas operativos DOS, que a su vez hace que
sea difícil de utilizar un disquete de DOS en cuanto a fines de recuperación. Microsoft proporcionó
una consola de recuperación para evitar este problema, pero por razones de seguridad está muy
limitado lo que puede hacerse a través de la consola de recuperación. El movimiento de las
utilidades de recuperación de CDs de arranque basado en BartPE o Linux (con NTFS-3G) está
erosionando finalmente este inconveniente.

El sistema de ficheros FAT todavía es el sistema de ficheros normal para los medios extraíbles, con
la excepción de los CDs y los DVDs, con FAT12 utilizado en los disquetes, y FAT16 en la mayoría
de los medios extraíbles, como tarjetas de memoria flash para cámaras digitales y unidades flash
USB. La mayoría de medios extraíbles no son todavía lo suficientemente grandes como para
beneficiarse del FAT32, aunque algunas unidades de flash más grandes, como SDHC, lo usan.
FAT16 se utiliza en estas unidades por razones de compatibilidad.
El soporte del formato FAT32 en los sistemas operativos Windows 2000 y Windows XP se limita a
volúmenes de 32 GB, lo que obliga a los usuarios de las modernas unidades de disco duro o bien a
utilizar NTFS para particionar el disco en volúmenes más pequeños, menores de 32 GB, o
formatear la unidad utilizando herramientas de otros fabricantes.

9.8.11. Sistema de ficheros exFAT


El exFAT no es compatible con los sistemas de ficheros FAT y se introdujo con el Windows
Embedded CE 6.0. Está destinado a ser utilizado en las unidades flash que hoy en día usan FAT. El
sistema de ficheros exFAT introduce un espacio libre de mapa de bits que permite la asignación de
espacio y la eliminación de forma más rápida, soporta ficheros de hasta 264 octetos, tamaños de
86

clúster de hasta 32 MB en la primera implementación y una estructura de directorio ampliable. No


tiene nombres cortos de ficheros 8.3. No parece tener listas de control de acceso o sistema de
ficheros de diario como el NTFS, aunque los fabricantes del dispositivo pueden optar por
implementar el soporte simplificado de las transacciones, la copia de seguridad de la tabla de
asignación de ficheros utilizado en las operaciones de escritura, la FAT primaria para almacenar la
última conocida y una buena tabla de asignación.

9.8.12. Diseño
El orden de estructuras en una partición FAT es la siguiente:
Sector de arranque
Sectores reservados (opcional)
File Allocation Table #1
File Allocation Table #2
Directorio raíz (solo FAT12/16)
Región de los datos hasta el final de la partición o del disco

Un sistema de ficheros FAT se compone de cuatro secciones:


1. Los sectores reservados situados en el comienzo. El primer sector reservado es el sector de
arranque, también conocido como Partition Boot Record. Incluye una área llamada el bloque
de parámetros de BIOS, con alguna información básica del sistema de ficheros, en
particular, su tipo y sus punteros a la ubicación de las otras secciones, y por lo general
contiene el código de arranque del sistema operativo. El recuento total de los sectores
reservados se indica mediante un campo dentro del sector de inicio. La información
importante del sector de inicio es accesible a través de una estructura del sistema operativo
llamado Drive Parameter Block en los sistemas operativos DOS y OS/2. En los sistemas de
ficheros FAT32, los sectores reservados incluyen una copia de seguridad del sector de
arranque en el sector 6.
2. La región FAT. Normalmente esta contiene dos copias de la tabla de asignación de ficheros
en aras de la comprobación de redundancia, aunque la copia extra se usa raramente, incluso
por los servicios de reparación de disco. Estas tablas son los mapas de la región de datos,
indicando que clusters se utilizan por los ficheros y los directorios.
3. La región Directorio. Es una tabla de directorio que almacena la información sobre los
ficheros y directorios localizados en el directorio raíz. Sólo se utiliza con los sistemas de
ficheros FAT12 y FAT16 y significa que el directorio raíz tiene un tamaño máximo fijo, que
es preasignado en la creación de este volumen. El FAT32 almacena el directorio raíz en la
región de datos junto con los ficheros y los directorios, lo que le permite crecer sin
restricciones.
4. La región de datos. Aquí es donde se almacenan los datos de los ficheros y los directorios y
se lleva la mayor parte de la partición. El tamaño de los ficheros y los directorios se puede
aumentar de manera arbitraria, mientras haya espacio libre, simplemente añadiendo más
enlaces a la cadena del fichero en la FAT. Obsérvese que los clusters son asignados en su
totalidad, y así si un fichero de 1 KB reside en un clúster de 32 KB, se desperdician 31 KB.

9.8.13. Tabla de asignación de ficheros


Una partición se divide en clusters de idéntico tamaño, es decir, pequeños bloques de espacio
87

contiguo. Los tamaños del clúster varían dependiendo del tipo de sistema de ficheros FAT que se
utiliza y el tamaño de la partición, pero por lo general los tamaños de clúster se sitúan entre 2 KB y
32 KB. Cada fichero puede ocupar uno o más clusters en función de su tamaño; así un fichero está
representado por una cadena de clusters que se conoce como lista ligada. Sin embargo estos clusters
no están necesariamente almacenados de forma adyacente en la superficie del disco sino que a
menudo están fragmentados en la región de datos.
La tabla de asignación de ficheros (FAT) es una lista de entradas que se asignan a cada clúster en la
partición. Cada entrada registra uno de los cinco contenidos siguientes:
– el número de clúster del siguiente clúster de la cadena
– una entrada especial EOC (End of clusterchain) que indica el final de una cadena
– una entrada especial para marcar un clúster no válido
– una entrada especial para marcar un clúster reservado
– un cero para señalar que el clúster no se utiliza
Cada versión del sistema de ficheros FAT utiliza un tamaño diferente para las entradas de la FAT. El
tamaño está indicado por el nombre, por ejemplo, el sistema de ficheros FAT16 utiliza 16 bits para
cada entrada, mientras que el sistema de ficheros FAT32 utiliza 32 bits. Sin embargo sólo se utilizan
realmente 28 de estos. Esta diferencia significa que la Tabla de Asignación de un sistema de
ficheros FAT32 puede asignar un mayor número de clusters que el FAT16, lo que permite un mayor
tamaño de la partición que con FAT32. Esto también permite un uso más eficiente del espacio que
FAT16, ya que en el mismo disco duro con FAT32 puede abordar pequeños clusters consumiendo
menos espacio.
Valores de las entradas FAT:
FAT12 FAT16 FAT32 Descripción
0x000 0x0000 0x?0000000 Cluster libre
0x001 0x0001 0x?0000001 Valor reservado. No se usa.
0x002 - 0x0002 - 0x?0000002 - Cluster usado; su valor indica el cluster
0xFEF 0xFFEF 0x?FFFFFEF siguiente en la cadena.
0xFF0 - 0xFFF0 - 0x?FFFFFF0 -
Valores reservados. No se usan.
0xFF6 0xFFF6 0x?FFFFFF6
Sector malo en el cluster o cluster
0xFF7 0xFFF7 0x?FFFFFF7
reservado
0xFF8 - 0xFFF8 - 0x?FFFFFF8 -
Último cluster del fichero
0xFFF 0xFFFF 0x?FFFFFFF

No olvidar que el sistema de ficheros FAT32 utiliza sólo 28 bits de los 32 bits posibles.
Normalmente los 4 primeros son cero, pero normalmente están reservados y se deben dejar intactos.
El primer cluster de la región de datos es el clúster # 2. Eso deja a las dos primeras entradas de la
FAT sin utilizar. En el primer octeto de la primera entrada, se almacena una copia del descriptor del
medio. Los restantes 8 bits (si es FAT16), o de 20 bits (si FAT32) de esta entrada se ponen a 1. En la
segunda entrada, se almacena la marca del clúster de final de la cadena. Los dos bits de orden alto
de la segunda entrada, a veces, en el caso de FAT16 y FAT32, se utilizan para la gestión de los
volúmenes.

9.8.14. Tabla de directorio


Una tabla del directorio es un tipo especial de fichero que representa un directorio conocido como
carpeta. Cada fichero o directorio almacenado en ella está representado por una entrada de 32
octetos en la tabla. Cada entrada registra el nombre, la extensión, los atributos (fichero, directorio,
oculto, de sólo lectura, sistema y volumen), la fecha y la hora de la creación, la dirección del primer
88

clúster de los datos del fichero/directorio y, finalmente, el tamaño del fichero/directorio. Aparte de
la tabla del directorio raíz en los sistemas de ficheros FAT12 y FAT16 que ocupa la ubicación
especial Región del Directorio Raíz, todos las tablas del directorio se almacenan en la región de
datos. El número actual de entradas en un directorio almacenado en la región de datos puede crecer
mediante la adición de otro clúster a la cadena ligada en la FAT.
Los caracteres legales para los nombres de los ficheros en el sistema operativo DOS son los
siguientes:
• Letras mayúsculas A–Z
• Números 0–9
• Espacio en blanco, aunque los espacios al final ya sea en el nombre o la extensión se
consideran que es relleno y no una parte del nombre del fichero, también los nombres de
fichero con espacios no se pueden utilizar en la línea de comandos de DOS a causa de la
falta de un adecuado sistema de escape.
• ! # $ % & ' ( ) - @ ^ _ ` { } ~
• (solo en FAT-32) + , . ; = [ ]
• Valores 128–255
Así quedan excluidos los caracteres ASCII siguientes:
• " * / : < > ? \ |
• Letras minúsculas a–z almacenadas como mayúsculas en FAT-12/16
• Caracteres de control 0–31
• Valor 127 (DEL)

Los nombres largos de fichero


Los nombres largos de fichero (LFN) se almacenan en un sistema de ficheros FAT utilizando un
truco que consiste en añadir varias entradas adicionales de directorio en la tabla de asignación de
ficheros antes de la entrada del fichero normal. Las entradas adicionales están marcadas con los
atributos Volume Label, System, Hiddeny Read Only, que es una combinación que no se encuentra
en el sistema operativo MS-DOS, y por lo tanto ignorado por los programas de MS-DOS y de
terceros. En particular, un directorio que contiene solo las etiquetas de volumen, se considera como
vacío y permite ser eliminado; esta situación aparece si los ficheros creados con nombres largos se
eliminan con los comandos del sistema operativo DOS.
La ejecución de la utilidad checksum permite la verificación de si un nombre largo de fichero
coincide con el nombre del tipo 8.3, cosa que puede ocurrir si se elimina o se vuelve a crear un
fichero utilizando los comandos de DOS en la posición de un mismo directorio. Tener en cuenta que
pFcbName es un puntero al nombre tal como aparece en una entrada de directorio ordinario, es
decir, los ocho primeros caracteres son el nombre del fichero, y los tres últimos son la extensión. El
punto es implícito. El espacio no utilizado en el nombre del fichero se rellena con espacios en
blanco.

Las versiones anteriores de PC-DOS no leían bien los nombres largos de los ficheros en el
directorio raíz de la etiqueta de volumen, y es probable que muestren una etiqueta incorrecta.
Cada entrada falsa puede contener hasta 13 caracteres UTF-16 (26 octetos) mediante el uso de
campos en el registro que contienen el tamaño del fichero o las fechas, pero no en el campo de
clúster de comienzo, así en las utilidades de disco, el campo de clúster de comienzo se establece en
un valor de 0. Hasta 20 de estas entradas de 13 caracteres pueden ser encadenadas, soportando una
longitud máxima de 255 caracteres UTF-16.
89

Las entradas de los nombres largos usan el formato siguiente:


Dirección Longitud Descripción
0x00 1 Número de secuencia
0x01 10 Nombre (cinco caracteres UTF-16)
0x0b 1 Atributo (siempre 0x0F)
0x0c 1 Reservado (siempre 0x00)
0x0d 1 Checksum del nombre del fichero DOS
0x0e 12 Nombre (seis caracteres UTF-16)
0x1a 2 Primer clúster (siempre 0x0000)
0x1c 4 Nombre (dos caracteres UTF-16)

Si un nombre de fichero contiene sólo letras minúsculas, o es una combinación de un nombre de


fichero con letras minúsculas y mayúsculas, y no tiene caracteres especiales, y encaja dentro de los
límites del tipo 8.3, no se crea una entrada de VFAT en el sistema operativo Windows NT y
versiones posteriores como XP. En cambio, se usan dos bits en el octeto 0x0c de la entrada de
directorio para indicar que el nombre del fichero debe ser considerado como total o parcialmente en
minúsculas. En concreto, el bit 4 significa minúsculas en la extensión y el bit 3 como minúsculas en
el nombre base, lo que permite combinaciones como "example.TXT" o "Hello.txt" pero no
"Mixed.txt". Esto crea un problema de compatibilidad con versiones anteriores de Windows (95, 98,
ME) que ven todos los nombres en mayúsculas, si esta ampliación se ha utilizado, y por lo tanto
puede cambiar el nombre de un fichero cuando se transporta, como por ejemplo en una unidad
USB.

9.9. Sistema de ficheros HPFS (High Performance File System)


HPFS (High Performance File System) es un sistema de ficheros creado específicamente para el
sistema operativo OS/2 para mejorar las limitaciones del sistema de ficheros FAT. Fue escrito por
Gordon Letwin y otros en Microsoft y se añadió a la versión 1.2 de OS/2, en el momento en que
todavía trabajaban conjuntamente en este proyecto Microsoft e IBM.
Entre sus mejoras, se pueden destacar la siguientes:
• soporte a los nombres de fichero con mayúsculas y minúsculas, y con páginas de códigos
diferentes
• soporte para nombres de fichero largos: 256 caracteres en lugar de los 8 +3 caracteres de
FAT
• un uso más eficiente del espacio en disco. Los ficheros no se almacenan utilizando clusters
en múltiples sectores, sino basados en cada sector.
• una arquitectura interna que mantiene los elementos relacionados cerca unos de otros en el
volumen de disco
• reducir la fragmentación de los datos
• asignación de espacio basado en su extensión
• se guarda la fecha y hora de la última modificación, del último acceso, y de su creación. A
diferencia del FAT, que solo guarda la fecha y hora de la última modificación.
• estructura de árbol de los directorios
• directorio raíz situado en el punto medio, en lugar de comienzo del disco, lo que hace más
rápido los accesos

El sistema de ficheros HPFS también puede guardar 64 KB de metadatos por fichero, lo que se
conoce como atributos extendidos.
90

IBM ofrece dos tipos de controladores IFS para este sistema de ficheros:
– el estándar con una caché limitado a 2 MB y
– el HPFS386 con las versiones de servidor de OS/2. El caché del HPFS386 está limitado por
la memoria disponible y se aplicó en el ensamblador. Por lo tanto, HPFS386 es más rápido,
pero IBM está obligado a pagar a Microsoft por cada copia vendida.

IBM tenía derechos sobre HPFS, pero no sobre HPFS386. Fue el resultado de la colaboración entre
Microsoft e IBM y tanto IBM como Microsoft tenían derecho a usar la tecnología Windows y
OS/2. Microsoft ha utilizado HPFS en el sistema operativo Windows NT.
Debido a la dependencia de Microsoft y a los largos tiempos de verificación, IBM ha sustituido sus
sistema de ficheros HPFS por el JFS en el sistema operativo OS/2.
Los sistemas operativos DOS y Linux soportan el sistema de ficheros HPFS a través de la
utilización de controladores de terceros.
Windows 95 y sus sucesores Windows 98, Windows Me pueden leer/escribir HPFS sólo cuando se
asignan a través de un recurso compartido de red, pero no puede leerlo desde un disco local. Se
enumeran las particiones NTFS de los ordenadores en red como HPFS, porque NTFS y HPFS
comparten el mismo número de identificación del sistema de ficheros en la tabla de particiones.
Windows NT 3.1 y 3.5 tienen soporte nativo de lectura/escritura para discos locales, e incluso puede
ser instalado en una partición HPFS.

Windows NT 3.51 también puede leer y escribir desde las unidades locales con formato HPFS. Sin
embargo, Microsoft no recomienda el uso del HPFS en Windows NT 4 y en las versiones
posteriores. Microsoft incluso eliminó la posibilidad de formatear con el sistema de ficheros HPFS
en el Windows NT 3.51. A partir de Windows NT 4, el controlador de sistema de ficheros
pinball.sys que permite la lectura/escritura del HPFS no está incluido en una instalación por defecto.
Pinball.sys se incluye en el disco de instalación para Windows 2000 y puede ser instalado
manualmente y utilizado con algunas limitaciones. Las versiones posteriores de Windows no
incluyen este controlador.

Microsoft retuvo los derechos de las tecnologías OS/2, incluyendo el sistema de ficheros HPFS,
después del cese de la colaboración. Puesto que Windows NT 3.1 fue diseñado para un uso más
riguroso que las versiones anteriores de Windows, incluyeron el soporte HPFS y NTFS, dándole
una mayor capacidad de almacenamiento que los sistemas de ficheros FAT. Sin embargo, dado que
HPFS carece de un diario, esto dificulta la recuperación después de un cierre inesperado. Así una
utilidad como CHKDSK tendría que escanear cada entrada en el sistema de ficheros para garantizar
que no hay ningún error.

9.10. Sistema de ficheros NTFS (New Technology File System)


NTFS es el sistema estándar de ficheros de Windows NT incluido en sus versiones posteriores de
Windows 2000, Windows XP, Windows Server 2003, Windows Server 2008, Windows Vista y
Windows 7.
NTFS reemplaza el sistema de ficheros FAT como sistema preferido de ficheros para los sistemas
operativos Windows de Microsoft. Como sistema propietario, no se dispone de información que no
sea de Microsoft. Por esta razón, sus características son las que nos dice Microsoft, pero no se
pueden evaluar.
El sistema de ficheros NTFS tiene varias mejoras sobre FAT y HPFS (High Performance File
System), como el soporte mejorado para los metadatos y el uso de estructuras avanzadas de datos
para mejorar el rendimiento, la fiabilidad y la utilización de espacio en disco, además de las
extensiones adicionales, tales como las listas de control de acceso (ACL).
91

9.10.1. Historia
A mediados de 1980, Microsoft e IBM formaron un proyecto conjunto para crear la próxima
generación del sistema operativo. El resultado del proyecto fue OS/2, pero finalmente Microsoft e
IBM no estuvieron de acuerdo en muchas cuestiones importantes y se separaron. OS/2 seguía
siendo un proyecto de IBM. Microsoft comenzó a trabajar en Windows NT. El sistema de ficheros
HPFS para OS/2 contenía varias características nuevas. Cuando Microsoft creó su nuevo sistema
operativo, tomaron prestado muchos de estos conceptos para NTFS. Probablemente como resultado
de este pasado común, HPFS y NTFS comparten el mismo código del tipo de identificación de la
partición (07). Compartir una ID es extraño, ya había decenas de códigos disponibles, y otros
sistemas de ficheros importantes tienen su propio código. FAT tiene más de nueve, uno para cada
FAT12, FAT16, FAT32, etc. Los algoritmos que identifican el sistema de ficheros en una partición
de tipo 07 deben realizar comprobaciones adicionales. También está claro que NTFS debe parte de
su diseño arquitectónico al Files-11 usado por VMS. Esto no es sorprendente ya que Dave Cutler
fue el líder principal tanto para VMS como para Windows NT.

9.10.2. Versiones
El sistema de ficheros NTFS tiene cinco versiones:
• v1.0 con Windows NT 3.1, liberada a mediados de 1993
• v1.1 con Windows NT 3.5, liberada en otoño de 1994
• v1.2 con Windows NT 3.51, liberada a mediados de 1995 y con Windows NT 4 a mediados
de 1996
• v3.0 con Windows 2000 ("NTFS V5.0")
• v3.1 con Windows XP (otoño 2001; "NTFS V5.1"), Windows Server 2003 (primavera 2003;
ocasionalmente "NTFS V5.2"), Windows Vista (mediados 2005) (ocasionalmente "NTFS
V6.0") y Windows Server 2008
Las versiones V1.0, V1.1 y posteriores son incompatibles, es decir, los volúmenes escritos por NT
3.5 no puede ser leídos por NT 3.1 hasta que se aplica una actualización al NT 3.1, que también
añade el soporte al FAT con nombres largos. La versión V1.2 soporta ficheros comprimidos, flujos
con nombre, seguridad basada en ACLs, etc. La versión V3.0 añadió las cuotas de disco, el cifrado,
los ficheros dispersos, los puntos de análisis, el diario con el número de secuencia de actualización
(USN), la carpeta $Extend y sus ficheros, y reorganizó los descriptores de seguridad para que varios
ficheros que utilizan la misma configuración de seguridad pueden compartir el mismo descriptor. La
versión V3.1 amplió las entradas de la MFT (Master Files Table) con el número de registro MFT
redundante, útil para la recuperación de ficheros dañados.
Windows Vista introduce el NTFS Transactional, los enlaces simbólicos NTFS, la reducción de la
partición y la funcionalidad 'self-healing' aunque estas características se deben más a la
funcionalidad adicional del sistema operativo que al propio sistema de ficheros.

9.10.3. Características
El sistema de ficheros NTFS v3.0 incluye varias características nuevas: el soporte de ficheros
dispersos, el uso de cuotas de disco, los puntos de análisis, el seguimiento de los enlaces
distribuidos, y la encriptación a nivel de fichero, también conocido como el EFS (Encrypting File
System).
USN Journal
El USN Journal es una característica de gestión del sistema que graba los cambios de todos los
ficheros, flujos y directorios del volumen, así como sus atributos y características de seguridad. Este
diario existe uno en cada volumen NTFS y empieza como un fichero vacío. Cuando se tiene que
92

hacer un cambio en el volumen, se añade un registro en este fichero. Cada registro se identifica por
un Update Sequence Number (USN) de 64 bits. Cada registro contiene su USN, el nombre del
fichero y la información relativa a los cambios a realizar.
Dada la sensibilidad en cuanto a la coherencia de las estructuras internas de datos, como son:
– el mapa de asignación de volumen
– los movimientos de datos realizados por el API de desfragmentación
– las modificaciones a los registros de la MFT tales como los movimientos de algunos
atributos de longitud variable almacenados en los registros de la MFT y las listas de
atributos
– las actualizaciones de los descriptores de seguridad compartidos
si se almacena la transacción USN ejecutada, los índices de los directorios y los descriptores de
seguridad permanecerán coherentes en caso de fallo del sistema y además permitirán deshacer los
cambios realizados en estas estructuras de datos críticos, cuando el volumen se vuelve a montar.
En versiones posteriores de Windows, el USN Journal se ha ampliado para almacenar el estado de
otras operaciones transaccionales en otras partes del sistema de ficheros NTFS.

Enlaces duros y nombres cortos de ficheros


Incluidos originalmente para soportar el subsistema POSIX en Windows NT, los enlaces duros son
similares a las uniones de directorio, pero usados por ficheros en lugar de directorios. Los enlaces
duros sólo se pueden aplicar a los ficheros del mismo volumen dado que un registro adicional de
nombre de fichero se agrega a la MFT. Los nombres cortos de fichero (8.3) también se implementan
como registros adicionales de los nombre de fichero que no tienen entradas separadas del directorio.

Ficheros dispersos
Los ficheros dispersos son ficheros que contienen regiones muy grandes todas con caracteres nulos,
por ejemplo, las aplicaciones de bases de datos. Debido a esto, Microsoft ha implementado el
soporte para el almacenamiento eficiente de los ficheros dispersos permitiendo a una aplicación
especificar las regiones de datos con nulos. Una aplicación que lee un fichero disperso, lo lee de la
manera normal con el sistema de ficheros calculando que datos deben ser devueltos. Al igual que
con los ficheros comprimidos, el tamaño real de los ficheros dispersos no se tiene en cuenta a la
hora de determinar los límites de cuota.

Compresión de ficheros
El sistema de ficheros NTFS puede comprimir ficheros usando una variante del algoritmo LZ77,
también usado en el popular formato de ficheros ZIP. Aunque el acceso lectura-escritura a los
ficheros comprimidos es transparente, Microsoft recomienda evitar la compresión de los sistemas
de fichero en el servidor y/o en las comparticiones de red, ya que carga considerablemente el
procesador.
Los sistemas de un solo usuario, con poco espacio de disco duro, probablemente usarán la
compresión de NTFS con éxito.

Servicio VSS (Volume Shadow Copy Service)


El servicio VSS (Volume Shadow Copy Service) mantiene las versiones históricas de los ficheros y
las carpetas en volúmenes NTFS copiando los datos viejos en una copia sombra (copy-on-write). El
fichero de datos antiguo se superpone sobre el nuevo cuando el usuario solicita volver a una versión
anterior. En sistemas muy cargados, Microsoft recomienda la creación de un volumen de copia
sombra en un disco independiente. Para asegurar la recuperación de los datos en el caso de una
caída del sistema, el servicio VSS también utiliza el USN Journal para realizar las transacciones
93

locales y garantizar que los cambios realizados en los ficheros del sistema serán efectivamente
recuperados tras reiniciar el sistema cuando el volumen NTFS se vuelve a montar, o se haga una
vuelta atrás segura a una versión anterior si la nueva versión no está plenamente registrada antes de
cerrar el fichero modificado. Sin embargo, los servicos VSS no se coordinan a nivel global en
varios ficheros o volúmenes, excepto cuando se utiliza un coordinador de transacciones. Sólo se
puede garantizar que las versiones anteriores seguirán siendo accesibles durante las operaciones de
copia de seguridad, si se obtienen imágenes consistentes del sistema en las copias de seguridad.

NTFS Transaccional
A partir del sistema operativo Windows Vista, las aplicaciones pueden utilizar NTFS Transaccional
para agrupar los cambios de los ficheros en una sola transacción. La transacción garantizará que
todos los cambios se hacen, o ninguno de ellos se hace y garantizará que las aplicaciones fuera de la
transacción no podrán ver los cambios hasta el preciso instante en que están realizados.
Utiliza técnicas similares a las usadas para el servicio VSS, es decir, garantiza que los datos
actualizados se puedan recuperar hacia atrás de forma segura, y el registro del USN Journal indica
las transacciones que aún no se han ejecutado, o aquellas que se han ejecutado, pero que todavía no
están aplicadas plenamente.
Sin embargo la técnica de copia sombra ( copy-on-write) es modificada a fin de permitir vueltas
atrás eficientes y evitar la fragmentación en el sistema de ficheros: los datos viejos no pueden ser
recuperados inmediatamente pero si guardados donde están, especialmente cuando normalmente
está bloqueado por otra persona debido a la existencia de las lecturas consistentes en sus propias
transacciones; en este caso, sólo los datos no ejecutados se guardan en una copia sombra temporal,
en lugar de la copia por escritura de los datos viejos, que serán finalmente aplicados mediante el uso
de una copia normal del servicio VSS. Además, estas copias sombra temporales de los nuevos
datos, sólo son vistas por los procesos de participación que tienen sus propios datos sin ejecutar, no
son necesariamente escritas de forma inmediata en el disco, sino que sólo se pueden mantener en la
memoria o guardadas para ejecuciones posteriores. La NTFS Transaction no restringe las
transacciones al volumen NTFS local, sino también incluye otras transacciones de datos y otras
operaciones en otros lugares, como los datos almacenados en volúmenes separados, el registro local
o las bases de datos SQL, o el estado actual de los servicios del sistema o de servicios remotos.
Estas transacciones están coordinadas en toda la red con todos los participantes mediante un
servicio determinado DTC (Distributed Transactions Coordinator), para garantizar que todos los
participantes recibirán el mismo estado de ejecución, y para transportar los cambios que han sido
validados por cualquier participante, de manera que los demás pueden invalidar sus cachés locales
de datos antiguos o deshacer sus cambios en curso no ejecutados. Por ejemplo NTFS Transactional
permite la creación de un sistema consistente de ficheros distribuido por toda la red, incluso con sus
cachés locales en vivo o sin conexión.

Encrypting File System (EFS)


EFS suministra una encriptación fuerte y transparente al usuario de cualquier fichero o carpeta en
un volumen NTFS. EFS funciona mediante la encriptación de un fichero con una clave simétrica,
también conocida como FEK (File Encryption Key), que se utiliza porque tiene una cantidad
relativamente pequeña de tiempo para cifrar y descifrar grandes cantidades de datos. La clave
simétrica que se utiliza para cifrar el fichero se cifra a continuación con una clave pública que está
asociada con el usuario que cifró el fichero. Para descifrar el fichero, el sistema de ficheros utiliza la
clave privada del usuario para descifrar la clave simétrica que se almacena en la cabecera del
fichero. A continuación utiliza la clave simétrica para descifrar el fichero. Debido a que esto se hace
a nivel de sistema de ficheros, es transparente al usuario. Además, en el caso de un usuario que
pierda el acceso a su clave, el soporte a las claves de descifrado adicionales se ha integrado en el
sistema EFS, de modo que un agente de recuperación pueda acceder a los ficheros si es necesario.
94

La encriptación y la compresión suministrada por el NTFS son mutuamente excluyentes.


El soporte de EFS no está disponible en las versiones Basic, Home y MediaCenter de Windows, y
debe ser activado después de la instalación de las versiones Professional, Ultimate y Server de
Windows o mediante el uso de herramientas de implementación de empresa dentro de los dominios
de Windows.

Cuotas
Las cuotas de disco fueron introducidos en NTFS v3. Permiten que el administrador de un
ordenador que ejecuta este sistema de ficheros NTFS pueda establecer un umbral de espacio en
disco para cada uno de los usuarios autorizados a almacenar datos en este disco. También permite a
los administradores mantener un registro de cuánto espacio en disco está utilizando cada usuario.
Un administrador puede especificar un determinado nivel de espacio en disco que un usuario puede
utilizar antes de recibir un aviso, y luego negar el acceso al usuario una vez que llegue a su límite
del espacio. Las cuotas de disco no tienen en cuenta la compresión transparente de ficheros de
NTFS. Las aplicaciones que consultan la cantidad de espacio libre, también verán la cantidad de
espacio libre que queda para el usuario que tiene una cuota aplicada.
El soporte de las cuotas de disco no está disponible en las versiones Basic, Home y MediaCenter de
Windows, y debe ser activado después de la instalación de las versiones Professional, Ultimate y
Server de Windows o mediante el uso de herramientas de implementación de empresa dentro de los
dominios de Windows.

Puntos de montaje del volumen


Esto consiste en algo similar a los puntos de montaje de los sistemas operativos UNIX o similares,
donde la raíz de otro sistema de ficheros se adjunta a un directorio. En el sistema de ficheros NTFS,
esto permite montar sistemas de ficheros adicionales sin necesidad de utilizar una letra de volumen
distinta para cada uno.
Una vez que se ha montado el volumen encima de un directorio existente de otro volumen, el
contenido anteriormente listado en el directorio se vuelve invisible y es sustituido por el contenido
del directorio raíz del volumen montado. El volumen montado todavía podría tener su propia letra
de unidad asignada separadamente. El sistema de ficheros NTFS no permite que los volúmenes sean
montados unos sobre otros. Los puntos de montaje de volumen se puede hacer persistentes, es decir,
a montar automáticamente después de reiniciar el sistema, o no.
Los volúmenes montados pueden utilizar otros sistemas de ficheros distintos del NTFS, en
particular pueden ser directorios compartidos remotos, posiblemente con su propia configuración de
seguridad y de reasignación de derechos de acceso según la política de sistema de ficheros remoto.

Uniones de directorio
Similar a los puntos de montaje de volumen, las uniones de directorio referencian otros directorios
en el sistema de ficheros de otros volúmenes. Por ejemplo, el directorio C:\exampledir con un
atributo de unión de directorio que contiene un enlace a D:\linkeddir, se referirá automáticamente al
directorio C:\linkeddir cuando se accede por una aplicación en modo usuario. Esta función es
conceptualmente similar a los enlaces simbólicos de los sistemas operativos Unix o similares,
excepto que el destino en NTFS debe ser siempre otro directorio.
Las uniones de directorio son persistentes, y resueltas en el lado del servidor, ya que comparten la
misma área de seguridad del sistema o dominio local en que está montado el volumen padre y las
mismas configuraciones de seguridad de sus contenidos, como el contenido del directorio de
destino. Sin embargo, la propia unión puede tener distintas configuraciones de seguridad. Deshacer
una unión de directorio, no borra los ficheros en el directorio de destino.
Las uniones de directorios son enlaces blandos, que se mantendrán incluso si se elimina el
95

directorio de destino, trabajando como una forma limitada de enlaces simbólicos.

Enlaces simbólicos
Los enlaces simbólicos se introdujeron en el sistema operativo Windows Vista. Los enlaces
simbólicos son resueltos en el lado del cliente. Así que cuando se comparte un enlace simbólico, el
objetivo está sujeto a las restricciones de acceso en el cliente, y no del servidor.
Los enlaces simbólicos pueden ser creados orientados a los ficheros o a los directorios, pero la
semántica del enlace debe ser suministrado con el vínculo creado. Sin embargo el objetivo es
necesario que no exista o esté disponible cuando se crea el enlace simbólico: cuando se accede al
enlace simbólico, se verificará que el objetivo esté disponible. El sistema de ficheros NTFS también
verificará si es del tipo correcto, fichero o directorio; devolverá un error de no encontrado si el
objetivo existente es de un tipo erróneo.
También puede referenciar directorios compartidos en máquinas remotas o ficheros y subdirectorios
dentro de directorios compartidos. Su definición es persistente en el volumen NTFS donde son
creados. Todos los tipos de enlaces simbólicos pueden ser eliminados como si fueran ficheros.

Hierarchical Storage Management (HSM)


Hierarchical Storage Management es una forma de transferir ficheros que no se utilicen durante un
período de tiempo a medios de almacenamiento menos costosos. Cuando se accede al fichero la
próxima vez, el punto de análisis de este fichero determina que es necesario recuperarlo de su
almacenamiento.

Compatibilidad con FAT


Actualmente Microsoft proporciona una herramienta para convertir HPFS (sólo en Windows NT 3),
FAT16 y, en Windows 2000 y posteriores, FAT32 a NTFS, pero no al revés. Diversas herramientas
de terceros son capaces de redimensionar las particiones NTFS de manera segura. Microsoft añadió
la posibilidad de contraer o expandir una partición con Windows Vista, pero esta capacidad está
limitada porque no va a reubicar los fragmentos del fichero de paginación o los ficheros que se han
marcado como inamovibles, lo que limita la capacidad de reducir una partición. Reiniciando sin un
fichero de paginación o utilizando una herramienta de terceros para desfragmentar, puede aliviar la
situación si el fichero de paginación es el fichero inamovible.

Metadatos
En el sistema de ficheros NTFS, todos los metadatos del fichero, es decir, el nombre, la fecha de
creación, los permisos de acceso y los contenidos, se almacenan como metadatos en la MFT. Esto
permite añadir fácilmente las características del sistema de ficheros durante el desarrollo de
Windows NT. NTFS permite cualquier secuencia de caracteres de 16 bits para codificar el nombre.
Esto significa que soporta el código UTF-16, pero el sistema no comprueba si la secuencia solo
tiene código UTF-16 válido.
Internamente, el sistema de ficheros NTFS usa árboles B+ para indexar los datos del sistema de
ficheros. Aunque la implementación es compleja, permite una búsqueda más rápida en la mayoría
de los casos. Se utiliza un diario del sistema de ficheros para garantizar la integridad de los
metadatos del sistema de ficheros y su contenido, pero no el contenido de los ficheros individuales.

Metaficheros
El sistema de ficheros NTFS contiene varios ficheros que lo definen y organizan. La mayoría de
estos ficheros están estructurados como cualquier fichero de usuario, pero no son de interés directo
para los clientes del sistema de fichero. Estos metaficheros definen los ficheros, hacen copias de
seguridad de los datos críticos del sistema de ficheros, guardan los cambios del sistema de ficheros,
96

gestionan la asignación de espacio libre, satisfacen las expectativas de la BIOS, hacen un


seguimiento de las malas asignaciones y almacenan la información de seguridad y el uso del
espacio de disco. Todo su contenido está en una zona de datos sin nombre, a menos que se indique
lo contrario.

9.10.4. Limitaciones
La limitaciones del sistema de ficheros NTFS son:
– Nombres de los ficheros. Los nombres de los ficheros están limitados a 255 caracteres UTF-
16. El kernel NT limita las rutas a 32.767 caracteres UTF-16.
– Tamaño máximo del volumen. En teoría, el tamaño máximo del volumen NTFS es 264−1
clusters. Sin embargo el tamaño máximo del volumen NTFS implementado en el sistema
operativo Windows XP Profesional es 232−1 clusters. Por ejemplo, si se usan clusters de 64
KiB, el tamaño máximo de volumen NTFS es 256 TiB menos 64 KiB. Usando el tamaño de
clúster por defecto de 4 KiB, el tamaño máximo de volumen NTFS es 16 TiB menos 4 KiB.
Debido a las tablas de partición del MBR (Master Boot Record) solo soporta tamaños de
partición de hasta 2 TiB.
– Tamaño máximo de fichero. Teóricamente es 16 EiB menos 1 KiB (264 − 210 o
18.446.744.073.709.550.592 octetos). La implementación es 16 TiB menos 64 KiB (244 −
216 o 17.592.185.978.880 octetos)
– Falta de redundancia. El sistema de ficheros NTFS no guarda ninguna copia de seguridad
del fichero MFT que contiene las referencias de cualquier fichero almacenado en la
partición. Si se daña el MFT debido a cualquier mal funcionamiento, se pueden perder todos
los datos. Dado que la única copia de seguridad de estos datos es un espejo de MFT, como
no contiene todas las entradas de la MFT, puede que no sea posible utilizarlo para recuperar
datos importantes.

9.11. Sistema de ficheros UFS (UNIX File System)


El sistema de ficheros UFS (UNIX File System) es un sistema de ficheros utilizado por los sistemas
operativos Unix y similares. También se le llama el Berkeley Fast File System o FFS. Se trata de un
descendiente lejano del original sistema de ficheros utilizado por la versión 7 de Unix.

Diseño
Un volumen UFS se compone de las partes siguientes:
• Unos pocos bloques al principio de la partición reservada para los bloques de arranque, que
deben ser inicializados separadamente del sistema de ficheros.
• Un superbloque, que contiene un número mágico que lo identifica como un sistema de
ficheros UFS, y algunos otros números vitales que describe la geometría y las estadísticas de
este sistema de ficheros y los parámetros de ajuste de comportamiento.
• Un conjunto de grupos de cilindros. Cada grupo de cilindros tiene los componentes
siguientes:
• Una copia de seguridad del superbloque.
• Un encabezado del grupo de cilindros, con estadísticas, listados libres, etc, acerca de
este grupo de cilindros, similares a los del superbloque.
• Una serie de inodos, cada uno conteniendo los atributos del fichero.
• Una serie de bloques de datos.
Los inodos son numerados secuencialmente. Los primeros inodos están reservados por razones
97

históricas, seguido por el inodo para el directorio raíz.


Los ficheros de directorio contienen sólo la lista de los nombres de los ficheros en el directorio y el
inodo asociado a cada fichero. Todos los metadatos de fichero se guardan en el inodo.

9.12. Sistema de ficheros Apple HFS Plus


El sistema de ficheros HFS Plus o HFS+ es un sistema de ficheros desarrollado por Apple Inc. para
reemplazar su sistema de ficheros HFS (Hierarchical File System) como el sistema de ficheros
primario utilizado en los ordenadores Macintosh u otros sistemas que usan el sistema operativo Mac
OS. También es uno de los formatos utilizados por el reproductor de música digital iPod. El sistema
de ficheros HFS Plus también es conocido como Mac OS Extended o, erróneamente, como HFS
extendido. Durante su desarrollo, Apple se refirió a este sistema de ficheros con el nombre clave de
Sequoia.
El sistema de ficheros HFS Plus es una versión mejorada del HFS, soportando ficheros mucho más
grandes, es decir, las direcciones de bloque son de 32 bits de longitud en vez de 16 bits y la
utilización de Unicode, en vez de Mac OS Roman o cualquiera de los otros conjuntos de caracteres
para la denominación de los elementos (ficheros, carpetas), nombres que también están formados
por caracteres codificados en UTF-16 y normalizados a una forma muy parecida al NFD (Unicode
Normalization Form D). Esto significa que los caracteres precompuestos como 'é' se descomponen
en el nombre de fichero HFS + y, por lo tanto cuentan como dos caracteres UTF-16 e implica que
los caracteres de fuera del Basic Multilingual Plane también cuenten como dos caracteres en un
nombre de fichero HFS+. El sistema de ficheros HFS Plus permite nombres de fichero de hasta 255
caracteres UTF-16 de longitud. HFS Plus también utiliza una tabla de asignación de 32 bits, en
lugar de los 16 bits de HFS. Esta fue una limitación seria del HFS, ya que significaba que ningún
disco podía soportar más de 65.536 bloques de asignación. Cuando los discos eran pequeños, esto
tenía poca importancia, pero cuando estuvieron disponibles dispositivos de gran capacidad,
significaba que la menor cantidad de espacio que podía ocupar cualquier fichero era excesivamente
grande, desperdiciando grandes cantidades de espacio. Por ejemplo, en un disco duro de 1 GB, el
tamaño de bloque de asignación en el sistema de ficheros HFS es 16 KB, por lo que incluso un
fichero de 1 octeto usaría 16 KB de espacio en disco.
Como el HFS, HFS Plus utiliza árboles B para almacenar los metadatos del volumen.

Diseño
Los volúmenes HFS Plus se dividen en sectores, llamados bloques lógicos en HFS, y suelen ser de
512 octetos de tamaño. A continuación estos sectores se agrupan en bloques de asignación que
pueden contener uno o más sectores; el número de bloques de asignación depende del tamaño total
del volumen. HFS Plus utiliza un valor para hacer frente a los bloques de asignación mayor que el
HFS, de 32 bits en lugar de 16 bits. Esto significa que se puede acceder a 4.294.967.296 (= 232)
bloques de asignación en lugar de los 65.536 (= 216) bloques de asignación disponibles para HFS.
Anteriormente los volúmenes HFS Plus estaban embebidos dentro de un sistema de ficheros
estándar HFS. Esto fue eliminado por la transición de Tiger a Intel Macs, donde el sistema de
ficheros HFS Plus no estaba embebido dentro de un contenedor. El contenedor fue diseñado con dos
fines: permitía a las computadoras Macintosh sin soporte para HFS Plus en su ROM, arrancar
volúmenes HFS Plus y también fue diseñado para ayudar a la transición de los usuarios a HFS Plus
mediante la inclusión de un volumen mínimo HFS con un fichero de sólo lectura llamado
“Where_have_all_my_files_gone?”, que explica a los usuarios con las versiones de Mac OS 8.0 y
anteriores sin HFS Plus, que el volumen requiere un sistema con soporte para HFS Plus. El
volumen original HFS contiene una firma y una dirección en el volumen embebido HFS Plus con su
98

cabecera de volumen. Todos los bloques de la asignación en el volumen HFS que contiene el
volumen embebido, son mapeados aparte del fichero de asignación HFS como bloques malos.
Hay nueve estructuras que conforman un volumen típico HFS Plus:
1. Los sectores 0 y 1 del volumen son los bloques de arranque HFS. Estos son idénticos a los
bloques de arranque en un volumen HFS. Ellos son parte del contenedor de HFS.
2. El sector 2 contiene el Volume Header equivalente al Master Directory Block en un volumen
HFS. El Volume Header almacena una amplia variedad de datos sobre el volumen, por ejemplo, el
tamaño de los bloques de la asignación, una marca de tiempo que indica cuando se creó el volumen
o la ubicación de otras estructuras de volumen, como el catálogo de ficheros o el Extent Overflow
File. El Volume Header siempre se encuentra en el mismo lugar.
3. El Allocation File que realiza un seguimiento de los bloques de asignación que están libres y de
los que están en uso. Es similar al Volume Bitmap en HFS donde cada bloque de asignación está
representado por un bit. Un cero significa que el bloque está libre y un uno significa que el bloque
está en uso. La principal diferencia con Volume Bitmap de HFS es que el Allocation File se guarda
como un fichero normal, no ocupa un espacio especial reservado cerca del principio del volumen.
El Allocation File también puede cambiar de tamaño y no tienen que ser almacenados de forma
contigua dentro del volumen.
4.El Catalog File es un árbol B que contiene los registros de todos los ficheros y directorios
almacenados en el volumen. El Catalog File de HFS Plus es muy similar al del HFS, siendo las
principales diferencias que los registros son más grandes para permitir más campos y que estos
campos sean más grandes, por ejemplo, permitir nombres de hasta 255 caracteres Unicode en el
sistema de ficheros HFS Plus. Un registro en el Catalog File de HFS es de 512 octetos de tamaño,
en cambio en HFS Plus es de 4KB en Mac OS y de 8KB en Mac OS X. Los campos en HFS son de
tamaño fijo, en HFS Plus el tamaño puede variar dependiendo del tamaño real de los datos que se
almacenan.
5. El Extents Overflow File es otro árbol B que registra los bloques de asignación que están
asignados a cada fichero como extensiones. Cada registro del fichero del Catalog File es capaz de
registrar ocho extensiones para cada fichero. Cuando se utilizan estas extensiones, se registran en el
Extents Overflow File. Los bloques malos también se registran como extensiones en el Extents
Overflow File. El tamaño predeterminado de un registro de extensiones es de 1 KB en Mac OS y de
4 MB en Mac OS X.
6. El Attributes File es un nuevo árbol B en HFS Plus que no tiene una estructura correspondiente
en HFS. El Attribute File puede almacenar tres tipos diferentes de registros de tamaño 4KB: los
registros Inline Data Attribute, Fork Data Attribute y Extension Attribute. Los registros Inline Data
Attribute almacena atributos pequeños que caben dentro del propio registro. Los registros Fork Data
Attribute contienen referencias a un máximo de ocho extensiones que pueden tener más atributos.
Los registros Extension Attribute se utilizan para extender un registro Fork Data Attribute cuando
sus ocho registros de medida ya se utilizan.
7. El Startup File está diseñado para sistemas no Mac OS que no tienen soporte HFS o HFS Plus. Es
similar al Boot Blocks de un volumen HFS.
8. Del segundo al último sector contiene el Alternate Volume Header equivalente al Alternate
Master Directory Block de HFS.
9. El último sector del volumen se reserva para el uso de Apple. Se utiliza durante el proceso de
fabricación de ordenadores.
99

9.13. Sistema de ficheros ISO9660/CDFS


El sistema de ficheros ISO 9660, también conocido como CDFS (Compact Disc File System), es un
sistema de ficheros estándar publicado por la ISO (International Standard Organization)
(http://www.iso.org) para el soporte de los discos ópticos en cualquier sistemas operativo como
Windows, Mac OS, y de tipo Unix, de modo que los datos pueden ser intercambiados.

El sistema de ficheros ISO 9660 tiene sus raíces en el sistema de ficheros High Sierra. High Sierra
dispone la información del fichero en una disposición densa, tiene soporte secuencial para
minimizar el acceso no secuencial mediante una estructura jerárquica en forma de árbol y ocho
niveles de profundidad en cuanto a directorios. Para facilitar la compatibilidad entre plataformas, se
definió un conjunto mínimo de atributos comunes de los ficheros, y el nombre de los atributos
(nombre, extensión, y versión), y la utilización de una área separada del sistema donde se pueda
especificar las futuras extensiones opcionales para cada fichero.
High Sierra se aprobó en Diciembre de 1986 como el estándar ECMA-119 de European Computer
Manufacturers Association (http://www.ecma-international.org) y presentado para la aprobación
rápida a la ISO, donde fue aceptado eventualmente como la norma ISO 9660:1988.

9.13.1. Especificaciones
Los primeros 32.768 octetos del disco no son utilizados por la estructura de datos de la norma ISO
9660, y por lo tanto están disponibles para otros usos. Por ejemplo, un CD-ROM puede contener un
descriptor de un sistema de ficheros alternativo en este ámbito, ya que a menudo es utilizado por los
Hybrid CDs para ofrecer el contenido específico de Mac OS.
La estructura de datos empieza después de este primer bloque de 32768 octetos con una serie de
descriptores de volumen, detallando el contenido y los tipos de información contenidos en el disco,
similar al bloque de parámetros de BIOS utilizado por los discos con los sistemas de ficheros FAT y
NTFS.
Un descriptor de volumen describe las características de la información del sistema de ficheros
presente en un determinado CD-ROM. Se divide en dos partes: el tipo de descriptor de volumen y
las características del descriptor.
El descriptor de volumen se construye de modo que si un programa que lee el disco no entiende un
determinado descriptor, puede saltárselo hasta que encuentra uno que lo pueda leer y entender, lo
que permite el uso de diferentes tipos de información en un mismo volumen.
Un disco compatible ISO 9660 contiene al menos un descriptor principal que describe el sistema de
ficheros ISO 9660 y un descriptor de terminación para indicar el final de la secuencia de
descriptores. Joliet y UDF son ejemplos de sistemas de ficheros que añaden más descriptores a esta
secuencia.
El descriptor de volumen primario actúa de forma parecida al superbloque del sistema de ficheros
de Unix, suministrando los detalles de la parte compatible de ISO 9660 del disco. El contenido
dentro del descriptor de volumen primario está en el registro del directorio raíz, describiendo la
ubicación del directorio raíz contiguo. Como en los sistemas operativos tipo UNIX, los directorios
aparecen como ficheros para su uso especial. Las entradas del directorio son almacenadas
sucesivamente dentro de esta región. La evaluación de los nombres de fichero ISO 9660 se inicia en
este lugar. El directorio raíz se almacena como una extensión, o una serie secuencial de sectores,
que contiene cada una de las entradas del directorio que aparecen en la raíz. Además, desde que la
norma ISO 9660 trabaja segmentando la unidad de CD-ROM en bloques lógicos, el tamaño de estos
bloques se encuentra también en el descriptor de volumen primario.
El primer campo en un Volume Descriptor es el Volume Descriptor Type, que puede tener los
valores siguientes:
• Número 0: Se entenderá que es un sector de arranque
100

• Número 1: Se entenderá que es un Primary Volume Descriptor


• Número 2: Se entenderá que es un Suplementary Volume Descriptor
• Número 3: Se entenderá que es un Volume Partition Descriptor
• Número 255: Se entenderá que un Volume Descriptor Set Terminator.
El segundo campo se llama Standard Identifier y se establece a CD001 para un CD-ROM
compatible con el estándar ISO 9660.
Otro campo interesante es el Volume Space Size, que contiene la cantidad de datos disponibles en el
CD-ROM.
Los atributos de fichero son muy simples en la norma ISO 9660. El atributo más importante de
fichero es determinar si el fichero es un directorio o un fichero normal. Los atributos de fichero para
el fichero descrito por la entrada de directorio se almacenan en la entrada del directorio y,
opcionalmente, en el registro extendido de atributo.
Hay dos maneras de localizar un fichero en un sistema de ficheros ISO 9660. Una manera es buscar
de forma sucesiva en los nombres de directorio y mirar a través de cada estructura de ficheros del
directorio si existe el fichero buscado. La otra forma es a través del uso de una tabla precompilada
de rutas, donde todas las entradas están enumeradas en los contenidos de un fichero con las entradas
correspondientes. Algunos sistemas no tienen un mecanismo para buscar a través de los directorios
y obtienen la coincidencia mediante la consulta de la tabla.
El uso de una tabla lineal grande puede ser de gran valor cuando uno puede buscar rápidamente por
todo el disco, lo que reduce el tiempo de búsqueda.
Todos los valores que emplean más de un octeto se almacenan dos veces, en little-endian y big-
endian, ya sea uno después de otro en lo que la especificación denomina formato both-endian, o en
estructuras de datos duplicadas tales como la tabla de ruta.

9.13.2. Restricciones en el nombre del fichero y del directorio


La norma tiene tres niveles diferentes:
• Nivel 1: Los nombres de fichero están limitados a ocho caracteres con una extensión de tres
caracteres, usando solo letras mayúsculas, números y guión. La profundidad máxima de
directorios es de ocho.
• Nivel 2: Los nombres de ficheros no están limitados a 11 caracteres, el formato 8.3, ya que
pueden tener hasta el máximo permitido por un contador de 1 octeto en la entrada del
directorio y el contador de la longitud del fichero en octetos. Normalmente es
aproximadamente de 180 caracteres, en función de cuantos atributos extendidos están
presentes.
• Nivel 3: Los ficheros pueden ser no contiguos, es decir, fragmentados, principalmente para
permitir la escritura de paquetes o la grabación incremental del CD.
La norma también especifica las siguientes restricciones en cuanto al nombre:
• Todos los niveles restringen los nombres de fichero a letras mayúsculas, números, guiones
bajos ("_"), y un punto. El sistema operativo Linux convierte las letras mayúsculas a
minúsculas, mientras se montan los sistemas de ficheros ISO 9660.
• Los nombres de fichero no incluirán espacios.
• Los nombres de fichero no podrán comenzar o terminar con el carácter de punto.
• Los nombres de fichero no tendrá más de un punto.
• Los nombres de directorio no utilizarán puntos.
Algunos aplicaciones de creación de CD permiten al usuario utilizar prácticamente cualquier
carácter. Aunque esto no se ajusta a la norma ISO 9660, la mayoría de sistemas operativos que
pueden leer según los sistemas de ficheros ISO 9660, no tienen ningún problema con los nombres
fuera de la especificación de los mismos. Sin embargo los nombres pueden ser visualizados mal al
usuario.
101

9.13.3. Límite en el tamaño del fichero 2/4 GiB


Todos los números en el sistema de ficheros ISO 9660 excepto el valor de un solo octeto utilizado
para la dirección GMT, son números sin signo. Como la extensión de la longitud de un fichero en el
disco se almacena en un valor de 32 bits, esto significa que permite una longitud máxima de 4 GiB.
Sobre esta base, a menudo se supone que un fichero en un disco con formato ISO 9660 no puede ser
mayor de 232 en cuanto a tamaño, ya que este se almacena en un valor sin signo de 32 bits, por lo
que 232 es el máximo.
Sin embargo es posible evitar esta limitación utilizando la característica multi-extensión
(fragmentación) del Nivel 3 de la norma ISO 9660. Con esto, los ficheros mayores de 4 GiB se
pueden dividir en múltiples extensiones, series secuenciales de sectores, cada una sin superar el
límite de 4 GiB. Por ejemplo, el software libre como infrarecorder y mkisofs, así como el Roxio
Toast son capaces de crear sistemas de ficheros ISO 9660 que usan ficheros con multi-extensión
para almacenar los ficheros de más de 4 GiB en medios apropiados, como los DVD grabables.
Las pruebas empíricas con un fichero de 4,2 MiB fragmentado en un DVD han demostrado que
Microsoft Windows XP es compatible con este, mientras que Mac OS X, a partir de 10.4.8, no lo
maneja correctamente. En el caso del Mac OS X, el controlador no parece soportar la fragmentación
de ficheros, es decir, que sólo es compatible con la norma ISO 9660 de nivel 2, pero no la de nivel
3. Linux soporta las extensiones múltiples. FreeBSD sólo muestra y lee la última extensión de un
fichero multi-extensión.

9.13.4. Límite en el número de directorios


Otra limitación, menos conocida, es el número de directorios. La imagen ISO tiene una estructura
llamada tabla de ruta. Para cada directorio de la imagen, la tabla de ruta proporciona el identificador
de su directorio padre. El problema es que el identificador del directorio es un número de 16 bits,
limitando su rango de 1 a 65.535. El contenido de cada directorio está escrito también en un lugar
diferente, haciendo la tabla de ruta redundante, y apta sólo para la búsqueda rápida. Algunos
sistemas operativos como Windows lo utilizan mientras que otros como Linux, no. Si una imagen
ISO del disco se compone de más de 65.535 directorios, se podrán leer en Linux, mientras que serán
visibles todos los ficheros del entorno de Windows de los directorios adicionales, pero se muestran
como vacíos, es decir, de longitud cero. La aplicación mkisfs aborta si existe un desbordamiento de
la tabla de rutas. Nero Burning ROM para Windows y Pinnacle Instant CD/DVD no comprueban si
el problema existe, y si lo hay, producirá un fichero ISO no válido.

9.13.5. Soporte multisesión


ISO 9660 es por diseño un sistema de ficheros de sólo lectura, pre-masterizado. Esto significa que
todos los datos tiene que ser escritos de una sola vez en el CD/DVD. Una vez escritos, no existe
ninguna posibilidad de modificar el contenido almacenado. Por lo tanto la norma ISO 9660 no es
apta para ser utilizada en los medios de escritura de acceso aleatorio, como los discos duros.
Los CD/DVD grabables soportan sesión múltiple. Esto significa que los datos pueden escribirse en
un disco y hacerlos accesibles, y más tarde se pueden añadir más datos al disco, siempre y cuando
haya espacio no utilizado a la izquierda en el disco.
La extensión multisesión en lugar de buscar el descriptor de volumen en la dirección 32.768, que es
el bloque 16 de un CD/DVD, desde el inicio del disco, se inicia la lectura en el bloque 16 en la
primera pista de la última sesión. Los números del bloque forman una secuencia contigua a partir de
la primera sesión, y continúan durante las demás sesiones.
Por lo tanto, si un programa quiere añadir un solo fichero, se ha de añadir una sesión que contenga
al menos una copia actualizada de todo el árbol de directorios, así como el nuevo fichero. Las
entradas duplicadas del directorio pueden seguir referenciando los ficheros de datos de la sesión
anterior.
102

De manera similar, los datos de fichero se pueden actualizar o incluso eliminar. Sin embargo la
eliminación solo es virtual: el contenido eliminado no aparece más en el directorio que se muestra al
usuario, pero físicamente está presente en el CD/DVD. Por lo tanto, se puede recuperar, y ocupa un
espacio.

9.14. Sistema de ficheros Joliet


Mientras que los CD/DVDs hacen que la distribución de software sea rentable, el actual sistema de
ficheros ISO 9660 contiene una serie de restricciones que interfieren con la distribución simple y
eficiente de los ficheros en un CD/DVD.
La naturaleza de sólo lectura de los CD/DVDs ha llevado a los autores de contenido a seguir
utilizando los medios magnéticos tradicionales como su almacenamiento principal para crear
aplicaciones. Cada uno de los sistemas de ficheros existentes para los medios magnéticos contienen
varias características que no pueden estar representadas en los CD/DVDs con una versión mejorada
del estándar ISO 9660.
Debido a que los CD/DVDs son principalmente un medio de distribución, en lugar de un medio
creativo (lectura/escritura), es necesario que el sistema de ficheros de CD/DVD soporte un
superconjunto de las funciones de los medios creativos. Este defecto fundamental en el diseño del
estándar ISO 9660 ha llevado a algunos fabricantes de sistemas operativos a extender el estándar
ISO 9660 de varias maneras. Algunos ejemplos son el Rock Ridge Interchange Protocol y el uso del
System Use Area de Apple para almacenar las marcas del buscador.
Algunos de los problemas del estándar ISO 9660 que son contemplados en esta especificación son:
• Limitaciones del conjunto de caracteres
• Limitaciones en la longitud del nombre del fichero
• Limitaciones de profundidad del árbol de directorio
• Limitaciones en el formato del nombre del directorio
• Ambigüedades en la anchura de los caracteres (caracteres de 16 bits)
El enfoque del diseño general que se utiliza en la especificación Joliet, que es propietaria de
Microsoft, es relajar las restricciones y resolver las ambigüedades en el estándar ISO 9660:1988
para los objetivos prácticos que pueden cumplirse.

9.14.1. Visión global


La especificación Joliet utiliza la característica SVD (Supplementary Volume Descriptor) del
estándar ISO 9660 para especificar un conjunto de ficheros grabados dentro del conjunto de
caracteres Unicode.
La especificación del conjunto de caracteres ISO 10646 puede ser identificado por una secuencia
de escape ISO 2022. Gracias al registro de esta secuencia de escape en un ISO 9660 SVD, esta
técnica para identificar el Unicode SVD es compatible con la especificación ISO 9660. También
mantiene el intercambio por no causar trastornos a los ficheros de referencia a través del PVD
(Primary Volume Descriptor).
Todo lo que queda es resolver las ambigüedades técnicas de menor importancia dentro de la ISO
9660 que surgen como resultado de la utilización del ancho de los caracteres.
Dado que el uso de esta secuencia de escape especial en un ISO 9660 SVD no tiene precedentes
hasta este momento, varias de las restricciones que impone la ISO 9660 puede ser flexibilizadas sin
alterar significativamente el intercambio de información entre los sistemas existentes desde un
punto de vista práctico.
Esta propuesta de diseño tiene varias ventajas. Por ejemplo, el uso del estándar actual ISO 9660
permite la integración directa con las extensiones existentes del estándar ISO 9660. Los diseños
para el System Use Sharing Protocol sobre distribución, las extensiones Rock Ridge para la
semántica POSIX, CD-XA System Use Area Semantics, Finder Flags y Resource Forks de Apple,
103

todos apuntan de una manera directa a la especificación Joliet.


Además el uso de un nuevo SVD elimina el peligro de romper la compatibilidad de software con los
sistemas existentes de ISO 9660. El software existente simplemente ignorará el Unicode SVD, y se
limitará a utilizar en su lugar el PVD.
La estrategia básica de reconocimiento del volumen del CD/DVD es la VRS (Volume Recognition
Sequence), que es una secuencia de descriptores de volumen, grabados una por sector, a partir del
sector 16 en la primera pista de la última sesión del disco. Un sistema receptor lee estos sectores y
elige un determinado descriptor de volumen de la secuencia. Este descriptor del volumen actúa
como una especie de ancla sobre la cual se construye el resto del volumen.

9.14.2. Especificación de grabación


La especificación Joliet resuelve las ambigüedades siguientes de la ISO 9660 para los volúmenes
UCS-2:
• Usar un SVD con una secuencia de escape UCS-2 (UNICODE).
• Las secuencias de escape UCS-2 utilizadas son: (25)(2F)(40), (25)(2F)(43), o (25)(2F)(45).
• El valor predeterminado del bit 0 del SVD "Volume Flags Field" es cero.
• Los caracteres anchos de Unicode se grabarán en formato "Big Endian" (Motorola).
• Los identificadores especiales de directorio se grabarán en nombres de un solo octeto que
contiene (00) o (01).
• El SEPARATOR 1 y el SEPARATOR 2 están codificados con un punto equivalente de
código de 16 bits.
• La ordenación de la clasificación no se cambia, excepto que todos los octetos de relleno sean
establecidos en (00).
La especificación Joliet recomienda que las distintas restricciones del estándar ISO 9660 se
resuelvan sobre los volúmenes UCS-2.
La especificación Joliet permite las siguientes reglas de intercambio:
• Los identificadores de fichero o directorio pueden tener hasta 128 octetos (64 caracteres
Unicode) de longitud.
• Los identificadores de directorio pueden contener las extensiones de los ficheros.
• La jerarquía de directorios se puede grabar hasta 8 niveles de profundidad.
• La secuencia de reconocimiento del volumen soporta multisesión. Esto es compatible con la
especificación CD-Bridge.
La especificación Joliet podrá ampliarse mediante el uso de las siguientes especificaciones:
• Las extensiones Modo 2 Form 2 y las extensiones CD-DA, ("System Description CD-ROM
XA")
• System Use Sharing Protocol
• RockRidge Interchange Protocol
• Otros futuros formatos de sistema de ficheros de CD/DVD

9.14.3. Orden de clasificación


El sistema de ficheros ISO 9660 especifica el orden de los registros de la tabla de rutas de acceso
dentro de una tabla de rutas, y especifica el orden de los registros de directorio dentro de un
directorio. Estos algoritmos de ordenación asumen que se usa un conjunto de caracteres de 8 bits.
Estos algoritmos de ordenación son ambiguos cuando se utiliza con caracteres anchos, es decir,
cuando son caracteres que usan más de 1 octeto.
Las secciones de ISO 9660:1988 en cuestión son las siguientes:
▪ 6.9.1 Orden de los registros de la tabla de rutas
▪ 9.3 Orden de Registros del Directorio
El único cambio necesario es redefinir el valor del octeto de relleno de justificación de la
104

clasificación a cero (00).


En pocas palabras, al comparar el contenido del octeto en todas las posiciones, sigue siendo un
algoritmo de ordenación adecuado para los campos de descriptor registrados en un UCS-2 SVD
Directory Hierarchy. Esta es una de las principales razones para seleccionar el formato Big Endian
para representar todos los caracteres UCS-2.

Clasificación Natural de idiomas


En un volumen de Unicode, los puntos de codificación UCS-2 de 16 bits se utilizan para determinar
los Order of Path Table Records y los Order of Directory Records.
No se intentará proporcionar la clasificación del lenguaje natural en los medios de comunicación.
La clasificación natural de idiomas puede ser suministrado opcionalmente por una aplicación de
visualización.

Octetos de relleno de la justificación


Los algoritmos de clasificación como se especifica en las secciones 6.9.1 y 9.3 de ISO 9660:1988
son aceptables excepto para el valor del octeto de relleno de la justificación.
El valor del octeto de relleno de la justificación como se especifica en la sección 6.9.1 de ISO
9660:1988 será (00). Esto se cambia desde un valor de (20) como se especifica en esa misma
sección.
El valor del octeto de relleno de la justificación como se especifica en la sección 9.3 subsecciones
(a) y (b) de ISO 9660:1988 será (00). Esto se cambia desde un valor de (20) como se especifica en
las mismas secciones.
El valor del octeto de relleno de la justificación como se especifica en la sección 9.3 subsecciones
(c) de ISO 9660:1988 será (00). Esto se cambia desde un valor de (30) como se especifica en las
mismas secciones.
En pocas palabras, el octeto de relleno de la justificación será cero para simplificar la clasificación.

Orden de clasificación obligatorio


La corrección del orden de clasificación es obligatorio en los volúmenes de UCS-2.

Campos de descriptor afectados por la secuencia de escape de UCS-2


Si una secuencia de escape de UCS-2 se detecta en un SVD, los campos siguientes del descriptor
del SVD deberá contener caracteres UCS-2.

9.15. Sistema de ficheros UDF (Universal Disk Format)


El sistema de ficheros UDF (Universal Disk Format) es una especificación de formato de un
sistema de ficheros para su almacenamiento en medios ópticos. Se trata de una implementación de
la norma ISO/IEC 13346, también conocida como ECMA-167 de European Computer
Manufacturers Association (http://www.ecma-international.org). Se considera que es una sustitución
de la norma ISO 9660, y es ampliamente utilizada en los medios ópticos.
El sistema de ficheros UDF es desarrollado y mantenido por la OSTA (Optical Storage Technology
Association) (http://www.osta.org). El objetivo es hacer un sistema de ficheros común para medios
de sólo lectura y de los medios ópticos que son regrabables. Este sigue siendo el principal objetivo
de la normalización UDF, aunque el soporte a los medios WORM es limitado, y no se puede añadir
el soporte a los medios no ópticos.
Cuando se estandarizó la primera vez, el sistema de ficheros UDF pretendía sustituir al ISO 9660,
permitiendo el soporte a los medios de sólo lectura y de escritura. Después de la liberación de la
primera versión de UDF, este fue adoptado por el DVD Consortium como el sistema de ficheros
oficial de los DVD, tanto de vídeo como de audio. Hoy en día, un sistema de ficheros UDF se puede
105

encontrar en la mayoría de los discos ópticos del mercado, y en casi todos los medios de DVD
grabables que se utilizan para la grabación de vídeo.
Como estaba previsto, inicialmente el sistema de ficheros UDF opera principalmente en los medios
ópticos. La mayoría de sistemas operativos necesitaban software especial de terceros para soportar
la lectura. Hoy en día, casi todos los sistemas operativos de forma nativa soportan al menos la
lectura de los sistemas de ficheros UDF, y muchos también soportan alguna forma de escritura.
Debido a este mayor soporte, UDF está ganando popularidad en los medios no ópticos que
principalmente deben ser intercambiables.

9.15.1. Restricciones y requerimientos básicos


La tabla siguiente resume varias restricciones y requerimientos básicos del sistema de ficheros
UDF.

Elemento Restricciones y requerimientos


Tamaño lógico del sector El tamaño lógico del sector para un volumen determinado será el
mismo que el tamaño físico del sector de este volumen.
Tamaño lógico del bloque El tamaño lógico del bloque para un volumen lógico será el tamaño
lógico del sector del volumen o conjunto de volúmenes en que reside
el volumen lógico en cuestión.
Volume Sets Todos los medios dentro del mismo Volume Set tendrá el mismo
tamaño físico de sector. Los medios regrabables y los medios
WORM no se mezclarán en el mismo Volume Set.
Primeros 32K del volumen Los primeros 32.768 octetos del espacio del volumen no se utilizarán
para la grabación de la estructura de ECMA 167. Esta zona no será
referenciada por el Unallocated Space Descriptor o cualquier otro
descriptor ECMA 167. Esto está pensado para su uso por el sistema
operativo nativo.
Secuencia de La secuencia de reconocimiento del volumen se describe en la parte
reconocimiento del volumen 2 del ECMA 167.
Marcas de tiempo Todas las marcas de tiempo se registrará en hora local. Las zonas
horarias se registrarán en los sistemas operativos que soportan el
concepto de una zona horaria.
Identificadores de la entidad Los identificadores se grabarán de acuerdo con lo especificado y si
no se indica lo contrario, contendrán un valor que los identifique de
forma única.
CRCs del descriptor Los CRCs serán soportados y calculados para todos los descriptores,
excepto el Space Bitmap Descriptor.
Longitud del nombre del Máximo 255 octetos
fichero
Longitud de la extensión La máxima longitud de la extensión será 230–1 redondeado por
abajo al valor más cercano múltiplo del tamaño lógico del bloque.
La máxima longitud de la extensión para las extensiones del espacio
virtual será el tamaño lógico del bloque.
Primary Volume Descriptor Será exactamente el Primary Volume Descriptor predominante y
106

registrado por volumen. Los dispositivos donde el Volume Sequence


Number de este descriptor es igual a 1, deben formar parte del
volumen lógico definido por el Logical Volume Descriptor
predominante.
Anchor Volume Descriptor Será grabado en al menos 2 de las 3 localizaciones siguientes: 256,
Pointer N-256, o N, donde N es el último sector direccionable de un
volumen.
Descriptor de la partición Soportará los tipos de solo lectura, regrabable, grabación
superpuesta y WORM. Habrá exactamente un descriptor de partición
predominante registrado por volumen, con una excepción. Para el
Volume Sets que consta de un solo volumen, este puede contener 2
particiones con 2 descriptores de partición predominantes solo si uno
tiene acceso del tipo solo lectura y el otro tiene acceso regrabable,
grabación superpuesta y WORM. El volumen lógico para este
volumen contiene los contenidos de ambas particiones.
Logical Volume Descriptor Habrá grabado exactamente un Logical Volume Descriptor
predominante por Volume Set.
El campo LogicalVolumeIdentifier no será nulo y debería contener
un identificador que ayude a la identificación del volumen lógico.
Especificamente, el software que genera los volúmenes conformes
con esta especificación no establecerá este campo a un valor fijo o
trivial. Los discos duplicados, que se quiere sean idénticos, pueden
tener el mismo valor en este campo. Este campo es extremadamente
importante en la identificación del volumen lógico cuando hay
varios dispositivos en un mismo hardware. Normalmente este
nombre es visualizado al usuario.
El Logical Volume Descriptor registrado en el volumen donde el
campo VolumeSequenceNumber del Primary VolumeDescriptor es
igual a 1, debe tener un valor NumberofPartitionMaps y la estructura
PartitionMaps que representa todo el volumen lógico. Por ejemplo,
si un conjunto de volúmenes se amplía añadiendo particiones, a
continuación el Logical Volume Descriptor actualizado escrito en el
último volumen también debe ser escrito en el primer volumen del
conjunto.
Logical Volume Integrity Se grabará. La extensión de LVID se puede terminar con la longitud
Descriptor de la extensión.
Unallocated Space Un único Unallocated Space Descriptor predominante se grabará por
Descriptor cada volumen.
File Set Descriptor Habrá exactamente un File Set Descriptor registrados por volumen
lógico. Para los medios WORM, se pueden registrar múltiples File
Sert Descriptor basados en determinadas restricciones.
La extensión FSD se puede terminar por la longitud de la extensión.
ICB Tag Solo se grabarán los tipos de estrategia 4 o 4096.
File Identifier Descriptor La longitud total del File Identifier Descriptor no excederá del
tamaño de un bloque lógico.
Entrada de fichero La longitud total de la entrada de fichero no excederá del tamaño de
107

un bloque lógico.
Allocation Descriptors Solo se grabarán el Short y el Long Allocation Descriptors.
Allocation Extent La longitud de cualquier extensión de los descriptores de asignación
Descriptors no podrá exceder el tamaño de bloque lógico.
Unallocated Space Entry La longitud total de una Unallocated Space Entry no será mayor que
el tamaño de un bloque lógico.
Space Bitmap Descriptor No requiere CRC.
Partition Integrity Entry No será grabada.
Volume Descriptor Tanto el Volume Descriptor Sequence principal como el de reserva
Sequence Extent tendrán cada uno una longitud mínima de 16 sectores lógicos. El
VDS Extent acabará con la longitud de la extensión.

9.16. Sistema de ficheros JFFS (Journalling Flash File System)


El JFFS (Journalling Flash File System) es un sistema de ficheros estructurado en registros para su
uso en dispositivos de memoria flash NOR en los sistemas operativos Linux.

9.16.1. Diseño
Las memorias flash tienen restricciones de acceso como los discos magnéticos. En particular, en
cuanto al borrado de la memoria flash:
• Es necesario hacerlo antes de escribir.
• Es lento.
• Se debe hacer en grandes segmentos, normalmente de 64 KiB o mayores.
• Solo puede hacerse un determinado número de veces, normalmente menos de un millón
Normalmente los sistemas de ficheros como ext2 actualizan sus estructuras de datos en el lugar
donde están, con las estructuras de datos como inodos y directorios actualizados en el disco después
de cada modificación. Esta falta de nivelación de uso hace que los sistemas de ficheros
convencionales no sean aptos para el uso de lectura y escritura de los dispositivos flash.
El sistema de ficheros JFFS fuerza esta nivelación de uso tratando el dispositivo de memoria flash
como un registro circular. Todos los cambios de los ficheros ylos directorios se escriben en el final
del registro en los inodos. En cada inodo, se escribe primero una cabecera que contiene los
metadatos, seguido por los datos del fichero, si los hubiere. Los inodos están encadenados con
punteros en la cabecera.
El espacio libre que queda en el sistema de ficheros es la diferencia entre la cola del registro y su
cabecera. Cuando el sistema de ficheros detecta que va lento, un programa recolector copia los
inodos válidos desde la cabecera a la cola y se salta los obsoletos, con lo que se recupera espacio.

9.16.2. Inconvenientes
En el momento del montaje, el controlador de sistema de ficheros JFFS debe leer toda la cadena del
inodo y guardarla en la memoria. Esto puede ser muy lento. El consumo de memoria del JFFS
también es proporcional al número de ficheros que contiene.
El diseño de registro circular significa que todos los datos en el sistema de ficheros se reescriben,
independientemente si son estáticos o no. Esto genera muchos ciclos de borrado innecesarios y
108

reduce la vida de la memoria flash.

9.17. Sistema de ficheros JFFS2


El JFFS2 (Journalling Flash File System), versión 2 del JFFS, es un sistema de ficheros de registro
estructurado para el uso en dispositivos de memoria flash. Es el sucesor del JFFS. El JFFS2 se ha
incluido en el kernel de Linux desde la versión 2.4.10.
El nuevo sistema de ficheros LogFS está destinado a sustituir al JFFS2 para la mayoría de los usos,
pero se centra más en los dispositivos de gran tamaño (> 64 MB - 512 MB).

9.17.1. Características
El sistema de ficheros JFFS2 introduce las siguientes características:
• Soporte para dispositivos de memoria flash NAND. Esto implica una cantidad considerable
de trabajo ya que los dispositivos NAND tienen una interfaz secuencial de entrada/salida y
no se puede mapear la memoria para la lectura.
• Soporte de los enlaces duros. Esto no fue posible en JFFS debido a las limitaciones del
formato en disco.
• Compresión. Están disponibles los tres algoritmos: zlib, Rubin y rtime.
• Mejor rendimiento. JFFS trataba el disco como un registro puramente circular. Esto generó
una gran cantidad de entrada/salida innecesaria.

9.17.2. Diseño
Al igual que con el JFFS, los cambios en los ficheros y los directorios son registrados en los inodos,
de los cuales hay dos tipos:
• Inodos normales: un encabezado con los metadatos del fichero, seguido del contenido de los
datos del fichero, si los hubiera. Los datos comprimidos se limitan a una sola página.
• Inodos dirent: las entradas de directorio contienen un nombre y un número de inodo. Los
enlaces duros se representan como nombres diferentes con el mismo número de inodo. El
número de inodo especial 0 representa un no vínculo.
Al igual que con el sistema de ficheros JFFS, los inodos comienzan como válidos cuando se crean,
y se consideran obsoletos cuando se ha creado una versión más reciente.
Sin embargo a diferencia del JFFS, es que no hay registro circular. En su lugar, el sistema de
ficheros JFFS2 negocia por bloques, es decir, maneja una unidad del mismo tamaño que el
segmento borrado del medio flash. Los bloques se llenan, uno cada vez, con inodos de abajo hacia
arriba. Un bloque limpio es el que contiene sólo inodos válidos. Un bloque sucio contiene al menos
un inodo obsoleto. Un bloque libre no contiene inodos.
El programa recolector se ejecuta en segundo plano, convirtiendo los bloques sucios en bloques
libres. Para ello, copia los inodos válidos a un nuevo bloque y elimina los obsoletos. Una vez hecho
esto, se borra el bloque sucio y se etiqueta con un marca especial que le designe como un bloque
libre. Para realizar la nivelación más uniforme, el programa recolector de vez en cuando también
consume bloques limpios.

9.17.3. Inconvenientes
• Todos los inodos deben ser escaneados en el momento del montaje. Esto es lento y se está
109

convirtiendo en un problema cada vez más grave a medida que aumenta la capacidad de los
dispositivos flash.
• Incluso escribiendo muchos pequeños bloques de datos, puede llevar a tasas de compresión
negativas, por lo que es esencial para las aplicaciones, el uso de buffers para la escritura.
• No hay forma práctica de saber cuánto espacio libre queda utilizable en un dispositivo, ya
que esto depende del grado de compresión de los datos adicionales y de la secuencia de la
escritura.

9.18. Sistema de ficheros ReiserFS


El ReiserFS es un sistema de ficheros de propósito general con diario diseñado e implementado por
un equipo dirigido por Hans Reiser de Namesys. El ReiserFS está actualmente soportado en Linux.
Introducido en la versión 2.4.1 del kernel de Linux, fue el primer sistema de ficheros con diario que
se incluirá en el núcleo. El ReiserFS fue el sistema de ficheros por defecto en SUSE Enterprise
Linux de Novell Novell hasta que se decidió cambiarlo por el sistema de ficheros Ext3 el 12 de
Octubre de 2006.
Namesys considera al sistema de ficheros ReiserFS estable y completo y, con la excepción de las
actualizaciones de seguridad y las correcciones de errores críticos. Sin embargo ya tiene sucesor, el
Reiser4.
Características
En el momento de su introducción, el sistema de ficheros ReiserFS ofreció las características que no
habían estado disponibles en los actuales sistemas de ficheros de Linux:
– Metadatos, solo en el diario.
– Cambiar el tamaño de línea, sólo en crecimiento, con o sin un gestor de volúmenes
subyacentes, como el LVM (Logical Volume Manager). Desde entonces, Namesys también
ha proporcionado las herramientas para cambiar el tamaño del sistema de ficheros ReiserFS
offline.
– Empaquetado de colas, un esquema para reducir la fragmentación interna. Sin embargo el
empaquetado de colas puede tener un impacto significativo en el rendimiento. El sistema de
ficheros Reiser4 parece haber mejorado esto donde no perjudica el rendimiento.

9.19. Sistema de ficheros Reiser4


El Reiser4 es un sistema de ficheros sucesor del ReiserFS, desarrollado por Namesys y patrocinado
por DARPA, así como por Linspire.
Características
Algunos de los objetivos del sistema de ficheros Reiser4 son:
• Diario más eficiente.
• Soporte más eficiente de los ficheros pequeños, en términos del espacio de disco y velocidad
a través de una subasignación de bloques.
• Manejo más rápido de los directorios con un gran número de ficheros.
• Infraestructura de plugins más flexible a través de los tipos especiales de metadatos.
• Soporte de encriptación y compresión.
• Estructura del disco optimizada dinámicamente a través de la asignación sobre la marcha.
También se le denomina asignación retardada de XFS.
• Soporte a la transacción.
110

Algunas de las características más avanzadas del sistema de ficheros Reiser4 como las
transacciones definidas por el usuario, no se encuentran disponibles debido a la falta de una API
VFS para ellos.
Actualmente, el Reiser4 carece de algunas características del sistema de fichero estándar, como un
empaquetador, similar a las utilidades de desfragmentación de los sistema de fichero estándar.
111

10. Formatos de imagen digital


La historia de los formatos de imagen digital ha seguido un camino paralelo al de los programas
utilizados: inicialmente la búsqueda de eficacia en una aplicación determinada para la cual ha sido
creado. Después un reagrupamiento de funciones para algunas aplicaciones del mismo proveedor, y
finalmente una aproximación mucho más estándar para mejorar la interoperatividad, que sólo puede
asegurar la normalización de las interfaces y de los contenidos. Es significativo que fueran los
organismos oficiales de normalización, como ISO, o grupos de interés común, como DAVIC
(Digital Audio Council), OPIMA (Open Platform Initiative for Multimedia Access) o DIG (Digital
Imaging Group), los que han impulsado el diseño de estos formatos.

Básicamente se pueden agrupar los formatos de imagen digital en tres grupos:


– Formato de mapa de bits o raster.
– Formato vectorial
– Formato en 3D
Para distinguir los distintos tipos de formatos, es habitual la existencia de un conjunto de códigos
situados al comienzo del fichero que dan la información necesaria para que los programas
encargados de explorarlos sean capaces de encontrar la información de la imagen. Así, en el fichero
JPEG, al comienzo del fichero hay siempre un código de dos octetos denominado SOI (Start of
Image) y al final del fichero un código EOI (End of Image).

10.1. Sensores
Popularmente el término CCD es familiar como uno de los elementos principales de las cámaras
fotográficas digitales. En éstas, el CCD es el sensor con diminutas células fotoeléctricas que
registran la imagen. Desde allí la imagen es procesada por la cámara y registrada en la tarjeta de
memoria.
La capacidad de resolución o detalle de la imagen depende del número de células fotoeléctricas del
CCD. Este número se expresa en píxels. A mayor número de píxels, mayor resolución. Actualmente
las cámaras fotográficas digitales incorporan CCDs con capacidades de hasta ciento sesenta
millones de píxeles (160 megapíxels) en cámaras Carl Zeiss.

Los píxels del CCD registran gradaciones de los tres colores básicos: rojo, verde y azul (abreviado
"RGB", del inglés Red, Green, Blue), por lo cual tres píxels, uno para cada color, forman un
conjunto de células fotoeléctricas capaz de captar cualquier color en la imagen. Para conseguir esta
separación de colores, la mayoría de cámaras CCD utilizan una máscara de Bayer que proporciona
una trama para cada conjunto de cuatro píxels de forma que un píxel registra luz roja, otro luz azul y
dos píxels se reservan para la luz verde (el ojo humano es más sensible a la luz verde que a los
colores rojo o azul). El resultado final incluye información sobre la luminosidad en cada píxel pero
con una resolución en color menor que la resolución de iluminación. Se puede conseguir una mejor
separación de colores utilizando dispositivos con tres CCD acoplados y un dispositivo de
separación de luz como un prisma dicroico que separa la luz incidente en sus componentes rojo,
verde y azul. Estos sistemas son mucho más caros que los basados en máscaras de color sobre un
único CCD. Algunas cámaras profesionales de alta gama utilizan un filtro de color rotante para
registrar imágenes de alta resolución de color y luminosidad pero son productos caros y tan solo
pueden fotografiar objetos estáticos.

En el medio digital, además, la capacidad resolutiva del sensor está condicionada por el fenómeno
del aliasing. El aliasing es el error que se produce cuando se trata de adivinar unos detalles de forma
112

o color a partir de una información demasiado escasa. Los sensores tienen una gruesa capa de filtros
y cristales protectores. Uno de esos filtros provoca por sí mismo un problema de aliasing, y es el
filtro-mosaico Bayer antes mencionado.

10.2. Tamaños de los ficheros de imágenes


El tamaño de los ficheros de imágenes aumenta con
– la resolución de la imagen, es decir, la cantidad de pixels que la componen lo que es función
del número de filas y columnas de la misma.
– la profundidad del color de los pixels, es decir, el número de bits empleados para definir
cada color, así un píxel de 8 bits puede almacenar 256 colores y un píxel de 24 bits, 16
millones de colores.
Las cámaras de alta resolución generan grandes ficheros de imágenes, desde centenares de
kilooctetos hasta megaoctetos, en función de la resolución de la cámara y de la capacidad del
formato de almacenamiento de la imagen. Las cámaras digitales de alta resolución graban imágenes
de 12 megapixels (1MP = 1,000,000 pixels / 1 millón), o más. Por ejemplo una imagen grabada con
una cámara de 12 MP, cada píxel usa 3 octetos para el color, la imagen descomprimida ocuparía
36.000.000 octetos de memoria, mucha cantidad de almacenamiento digital para una imagen. Frente
a ficheros de gran tamaño, tanto dentro de la cámara como de un disco de almacenamiento, los
formatos de fichero de imagen se han desarrollado para almacenar este tipo de imágenes de gran
tamaño.

10.3. Compresión de los ficheros de imágenes


Dado en general del gran tamaño de los ficheros, es recomendable el uso de la comnpresión para
reducirlos. Así podemos determinar dos tipos básicos de algoritmos de compresión de los ficheros
de imágenes: sin pérdidas y con pérdidas.
Los algoritmos de compresión sin pérdidas reducen el tamaño del fichero sin pérdidas de la calidad
de la imagen, aunque no comprimen tanto como si se empleara un algoritmo de compresión con
pérdidas. Cuando la calidad de imagen es un valor por encima de tamaño del fichero, se suelen
elegir los algoritmos sin pérdidas.
Los algoritmos de compresión sin pérdidas tienen la ventaja de la inherentes limitaciones del ojo
humano y eliminan la información invisible. La mayoría de los algoritmos de compresión con
pérdidas permiten niveles variables de calidad, es decir, a mayor compresión, menos calidad pero se
reduce más el tamaño del fichero. En los niveles más altos de compresión, el deterioro de la imagen
se vuelve más notable, apareciendo defectos de compresión cuando se visualiza la imagen.

10.4. Formato de mapa de bits o raster


Las imágenes de mapa de bits (bitmaps o imágenes raster) están formadas por una rejilla de celdas,
determinada por un número de filas y columnas. A cada una de estas celdas, que se denomina píxel,
se le asigna un valor de color y luminancia propios. Por esto, cuando vemos todo el conjunto de
celdas, tenemos la ilusión de una imagen de tono continuo. Técnica similar a la de los pintores neo-
impresionistas del siglo XIX.
El píxel es una unidad de información, no una unidad de medida, ya que no se corresponde con un
tamaño concreto. Un píxel puede ser tan pequeño como 0,1 mm. o tan grande como 1 cm. Cuando
creamos una imagen de mapa de bits se genera una rejilla específica de píxeles, es decir, de un
número determinado de filas y columnas. Por esto, al modificar su tamaño, transformamos a su vez
113

la distribución y la coloración de los píxeles, por lo que los objetos dentro de la imagen suelen
deformarse.
Las imágenes con una profundidad de 8 bits implica paletas de 256 colores, y se dividen en dos
modalidades: escala de grises y de color indexado. En el primer caso nos referimos a una paleta de
blanco, negro y 254 grises intermedios.
La paleta más utilizada es la RGB con una profundidad de color de 24 bits. Estos 24 bits están
repartidos en tres canales de 8 bits cada uno, los cuales se corresponden con los tres colores
primarios de la luz: Rojo (Red), Verde (Green) y Azul (Blue).
Este sistema permite formar prácticamente cualquier color que se necesite mediante la combinación
de los 256 valores en los tres canales, dando un total de 16,7 millones de colores distintos. Esto
hace que sea la paleta idónea para representar fotografías e incluso para trabajar con ellas. Además
es la paleta más compatible con la mayoría de los dispositivos de entrada de imágenes, como
escáneres, cámaras digitales, filmadoras, etc. La particularidad de trabajar con imágenes RGB
permite una completa disponibilidad de todos los filtros y los efectos de los programas de edición y
se amoldarán naturalmente a esta paleta, cosa que no pasa con la paleta CMYK.
La paleta de 32 bits es, al igual que la anterior, un conjunto de canales de 8 bits cada uno, aunque
esta vez estamos hablando de 4 canales: Cian, Magenta, Amarillo (Yellow) y Negro (Black). De allí
la sigla CMYK, utilizándose la letra K para definir el color negro para que no haya confusión con el
azul. En este caso los canales se corresponden con las 4 tintas que se utilizan en la mayoría de los
sistemas de impresión, ya sea impresoras a chorro de tinta, láser o las fotocromías en offset,
serigrafía y flexografía, y cada canal representa un porcentaje del 0 al 100 de la tinta utilizada.
Los programas que utilizan este tipo de paleta realizan una conversión a RGB para mostrar los
colores en pantalla, y el tipo de algoritmo que se utiliza para realizar dicha tarea es propio de cada
fabricante de software, lo que da como resultado que un mismo color sea mostrado de distintas
maneras en distintos programas, a veces con una diferencia abismal. Otro de los inconvenientes de
esta paleta es que se puede llegar de varias maneras a un mismo color en pantalla, pero a la hora de
la impresión esos valores dan resultados distintos, siendo esto imposible de prever hasta que no
realiza una prueba. Esto pasa con los tonos de baja saturación y especialmente con los tonos
oscuros.
De acuerdo a la tarea que deba realizarse, por lo general se recomienda trabajar con la paleta RGB
hasta casi lograr la imagen final, para luego realizar la conversión a CMYK. De esta manera nos
aseguramos que no ocurran grandes cambios de color dentro de la misma imagen, todos los negros
serán iguales, ni habrá manchas de color en los tonos oscuros. Notaremos, por ejemplo, que el color
negro en RGB (valores 0,0,0) no se corresponde con los valores 0,0,0,100 de la paleta CMYK; esto
se debe a que en los sistemas de impresión, el valor más oscuro que se puede obtener es utilizando
un 100% de la tinta negra y a eso agregarle las otras tres tintas en un valor que ronda el 30%.
También existe una paleta que utiliza 16 bits por cada uno de sus tres canales RGB, dando una
profundidad de color de 48 bits. Este tipo de imágenes ofrece una calidad muy superior al resto, ya
que puede representar con mucho más detalle los gradientes de color y las fotografías, y quedan
reservadas para la edición de vídeo profesional para cine y televisión, ya que el equipo y el
conocimiento que se necesitan para sacarles verdadero provecho es muy complejo.
Esto es porque los objetos pierden o ganan algunos de los píxeles que los definen. Gracias a esta
característica, las imágenes de mapa de bits se crean con un tamaño determinado y pierden calidad
si se modifican sus dimensiones. Por la gran cantidad de información que maneja cada píxel, los
modelos raster necesitan potentes computadoras y de una gran capacidad de memoria virtual y de
disco duro.
114

A continuación se detallan los formatos más importantes en cuanto a su extensión de uso, tales
como: BMP, JPEG/JFIF, Exif, TIFF, RAW, PNG, GIF, CGM

Otros formatos
Otros formatos de ficheros de imagen tipo raster son:
• TGA (TARGA). Este formato raster de imagen fue el formato nativo de las tarjetas TARGA
y VISTA de Truevision Inc., que fueron las primeras tarjetas gráficas para los ordenadores
personales compatibles con IBM para soportar la pantalla HighColor/truecolor. Esta familia
de tarjetas gráficas estaba destinada a la síntesis de la imagen en los ordenadores
profesionales y a la edición de vídeo. Por esta razón, las resoluciones habituales de ficheros
de imagen TGA coinciden con los formatos de vídeo NTSC y PAL. TARGA es un acrónimo
de Truevision Advanced Raster Graphics Adapter y TGA es el acrónimo de Truevision
Graphics Adapter. Hoy en día, la mayoría de la gente se refiere al formato como el formato
TARGA. Normalmente los ficheros TGA suelen tener la extensión ".tga" en los sistemas
Windows y en los sistemas Mac OS X. El formato puede almacenar datos de imagen con 8,
16, 24 o 32 bits de precisión por píxel, el valor máximo de 24 bits RGB y un canal alfa extra
de 8 bits. Los datos de imágenes se pueden almacenar en bruto (raw), u opcionalmente se
puede emplear una compresión sin pérdida del tipo RLE. El método de compresión RLE
(Run Length Encoding) utilizado en el formato TARGA funciona mal cuando la imagen
tiene muchas variaciones de color, como las fotos digitales, pero funciona bien para las
texturas y las imágenes más simples.
• ILBM (InterLeaved BitMap). Es un subtipo del formato IFF (Interchange File Format).
ILBM utiliza el Interleaved Bitmap que se refiere a la forma en que se almacenan las
imágenes. Los datos de la imagen se almacenan como un número variable de planos de bits,
donde cada plano almacena un bit de datos por cada píxel de la imagen. El formato soporta
compresión RLE (Run Length Encoding) horizontal y vertical.
• PCX (Personal Computer eXchange). Es un formato de fichero de imagen desarrollado por
Zsoft Corporation. Es el formato de fichero nativo del programa Paintbrush para los
ordenadores personales y se convirtió en una de los primeros estándares generalmente
aceptados del sistema operativo DOS, aunque su uso ha sido reemplazado por los formatos
de imagen más sofisticados como el GIF, JPEG y PNG. El PCX es un formato raster
independiente del dispositivo; el encabezado del fichero almacena los metadatos de la
imagen, tales como la resolución de los píxeles, la profundidad del color del bit y el número
de planos de bit, las paletas de colores, etc., por separado del mapa de bits de la imagen real,
lo que permite que la imagen sea transferida adecuadamente y sea visualizada en los
sistemas de los ordenadores con diferentes aplicaciones de software y hardware.
Normalmente los ficheros PCX almacenan las imágenes con paletas desde 2 ó 4 colores a 16
y 256 colores, aunque el formato se ha extendido a registrar imágenes con el color verdadero
(24 bits).
• ECW (Enhanced Compression Wavelet). Es un sistema patentado de formato de imagen
comprimido para imágenes aéreas y de satélite. Ha sido desarrollado por Earth Resource
Mapping, y ahora es propiedad de ERDAS, que es el propitario de Leica Geosystems. El
formato de compresión con pérdidas comprime eficazmente imágenes muy grandes con un
gran contraste alternativo. En 1998, ER Mapper, Ltd estaba investigando la entrega rápida
de imágenes de tamaño de teraoctetos a través de Internet utilizando la tecnología de
servidores de bajo costo. El resultado de esta investigación fueron dos productos, el IWS
(Image Web Server), y el ECW. El ECW representó un avance matemático fundamental que
permite las operaciones DWT (Discrete Wavelet Transformations) y su inversa aplicadas a
imágenes muy grandes con la utilización de una pequeña cantidad de memoria RAM.
115

• FITS (Flexible Image Transport System). Es un formato de fichero digital que se utiliza para
almacenar, transmitir y manipular imágenes científicas y de otros tipos. FITS es el formato
de fichero digital más comúnmente usado en astronomía. A diferencia de los muchos
formatos de imagen, FITS está diseñado específicamente para los datos científicos y por lo
tanto incluye numerosas disposiciones para la descripción de la información de calibración
fotométrica y espacial, junto con los metadatos de la imagen original.
• PGF (Progressive Graphics File). Es un formato raster de imagen que emplea compresión de
datos sin pérdidas y con pérdidas. PGF fue creado para mejorar y sustituir el formato JPEG.
Fue desarrollado al mismo tiempo que el JPEG 2000 pero con un enfoque distinto: dar
preferencia a la velocidad en contra de la capacidad de compresión. PGF puede operar a
mayores relaciones de compresión sin tomar más tiempo de codificación/descodificación y
sin generar los característicos defectos del estándar original JPEG basado en DCT. También
permite descargas progresivas más sofisticadas.
• Formato DDS. El formato de fichero DirectDraw Surface de Microsoft se utiliza para
almacenar texturas gráficas y mapas cúbicos de entorno como un fichero de datos, tanto
comprimidos como sin comprimir. Esto hace útil el formato para el almacenamiento de datos
comprimido con el algoritmo con pérdidas S3TC (S3 Texture Compression) usado en GPUs
y cónsolas como la PlayStation 3 y la Xbox 360. La extensión de este fichero de Microsoft
Windows es .dds.
• El formato Netpbm es una familia que incluye el formato de fichero PPM (Portable
Pixmap), el formato de fichero PGM (Portable Graymap) y el formato de fichero PBM
(Portable Bitmap). Estos son o ficheros ASCII puros o ficheros binarios raw con un
encabezado ASCII que proporciona una funcionalidad muy básica, y sirve como un común
denominador para convertir los ficheros pixmap, graymap, bitmap entre diferentes
plataformas. Varias aplicaciones se refieren a ellos colectivamente como el formato PNM
(Portable Anymap).

10.5. Formatos vectoriales


Los llamados gráficos orientados a objetos son las imágenes vectoriales. Su tamaño es mucho más
reducido en comparación con los mapas de bits, porque el modo como organizan la información de
una imagen es más simple que en aquellos formatos. Dicha simplicidad radica en generar los
objetos que conforman una imagen a través de trazos geométricos determinados por cálculos y
fórmulas matemáticas. Los gráficos vectoriales se visualizan a partir de las coordenadas de una
línea guardadas como referencia, las mismas que forman los objetos a partir de la definición
matemática de los puntos y líneas rectas o curvas.
Mientras que en un mapa de bits los objetos se definen píxel por píxel, por lo que no pueden
manipularse individualmente, lo contrario sucede con las imágenes vectoriales, porque cada objeto
dentro de una imagen puede modificarse sin que se alteren los demás objetos de la imágen. En un
gráfico de vectores, estos se delimitan por la posición de los puntos inicial y final y por la
trayectoria de la línea que los une. Como la información se guarda matemáticamente, esto hace
posible que las imágenes vectoriales sean independientes de la resolución del monitor, ya que, al
contrario de los mapas de bits, no dependen de los píxeles. Por lo tanto, tienen la mínima o máxima
resolución que permite el formato en que se almacenen. Asimismo al aumentar o reducir la
resolución de un gráfico vectorial, tampoco se pierde definición en la imagen, porque la
computadora solo tiene que redefinir las coordenadas y vectores que la imagen contenga para
redimensionar los objetos.
En un gráfico vectorial cada vector tiene una línea de contorno, con un color y un grosor
determinados y, a su vez, también cuenta con un color de relleno. Por ello, las características de
contorno y relleno se pueden manipular en cualquier momento. Las imágenes vectoriales son
116

almacenadas como una lista que describe matemáticamente la posición de los puntos y de las
características de sus vectores, así como también las propiedades de los objetos.
Por último, los elementos constituyentes del vector en las imágenes de este tipo, son las curvas de
Bézier. Llamadas así porque Pierre Bézier fue el que las desarrolló por encargo de la empresa
Renault para simplificar el diseño de sus carrocerías. Una curva Bézier se define por cuatro puntos:
los puntos inicial y final de la curva, llamdos nodos o puntos de anclaje y dos puntos de control
llamados manecillas o manejadores. Estos últimos, como su nombre lo indica, sirven para definir la
forma de la curva y no aparecerán en la imagen final. Así para modificar la curva sólo se tiene que
mover alguno de los nodos y definir con la manecilla el grado de la curvatura que tendrá la línea.
Estas curvas son fáciles de manejar además de estilizadas y versátiles, ya que adoptan tanto
curvaturas muy suaves casi como líneas rectas como muy fuertes, es decir, curvas complejas.
Además pueden adaptarse a infinitud de formas. El diseño de iconos y logotipos es uno de los usos
mas frecuentes que se les dan, pero también son muy útiles en el diseño y manipulación de fuentes
de texto.
En algún momento, todos los gráficos vectoriales deben ser rasterizados para que se visualize en los
monitores digitales. Sin embargo las imágenes vectoriales se pueden mostrar con la tecnología CRT
analógico como el que se utiliza en algunos equipos de prueba electrónicos, los monitores médicos,
las pantallas de radar, las muestras de láser y los primeros videojuegos.

A continuación se detalla uno de los más importantes que es el SVG (Scalable Vector Graphics).

Otros formatos
Otros formatos de fichero de imagen de tipo vectorial son:
• SWF (Shockwave Flash). Este formato es un repositorio parcialmente abierto para
multimedia y gráficos vectoriales, diseñado y realizado por el FutureWave Software y luego
bajo el control de Adobe. Destinado a ser lo suficientemente pequeño en cuanto a tamaño
para su publicación en la web, los ficheros SWF pueden contener animaciones o applets con
diversos grados de interactividad y funciones.
• WMF/EMF (Windows Metafile/Enhanced Metafile). Es un formato de fichero para gráficos
en los sistemas Windows de Microsoft, diseñado originalmente en los años 1990. Windows
Metafiles intenta ser intercambiable entre aplicaciones y puede contener componentes de
mapa de bits y de vectores, en contraposición con los formatos raster, tales como JPEG y
GIF. Generalmente Windows Metafiles se usa para almacenar arte basado en líneas,
ilustraciones y contenido creado en aplicaciones de dibujo o presentaciones. La mayor parte
de los cliparts de Windows tienen el formato WMF. Con los gráficos de vectores, un
Windows Metafile puede almacenar una imagen en mucho menos espacio que su
equivalente en formato de mapa de bits, del orden del 1% al 0,5%. Cuando se embebe en los
documentos, las reducciones de espacio de almacenamiento es similar.
• DXF (Autodesk Drawing Interchange). Es un formato de fichero de datos CAD desarrollado
por Autodesk que permite la interoperabilidad de los datos entre los programas AutoCAD y
otros programas. A medida que el AutoCAD es más potente y soporta más tipos complejos
de objetos, el DXF se hace más útil. Determinados tipos de objeto, incluidos los sólidos y las
regiones ACIS, no están documentados. Otros tipos de objetos, incluidos los bloques
dinámicos de AutoCAD 2006 y todos los objetos específicos a las versiones del mercado
vertical de AutoCAD, están documentados parcialmente, pero no lo suficiente para permitir
que otros desarrolladores los soporten. Por estas razones muchas aplicaciones CAD usan el
formato DWG que se puede licenciar de AutoDesk o no nativamente de Open Design
Alliance. El formato de fichero actual AutoCAD (.dwfx) se basa en el estándar ISO/IEC
117

29500-2:2008 Open Packaging Convention.


• DWG (Autodesk Drawing Interchange). Es un formato de fichero usado para almacenar los
datos y los metadatos de un diseño de dos y tres dimensiones. Es el formato nativo para
varios paquetes CAD tales como AutoCAD, IntelliCAD y sus variantes y Caddie. Además
DWG es soportado no nativamente por muchas otras aplicaciones CAD.
• AI (Adobe Illustrator). Es un formato de fichero propietario de Adobe Systems para
representar los dibujos de una sola página basados en vectores ya sea en formato EPS o
PDF. El Adobe Illustrator utiliza la extensión .ai. Las últimas versiones del formato AI,
incluidas los formatos basados en PDF y los recientes formatos EPS, se basan en el formato
nativo PGF que no está relacionado ni con EPS ni con PDF. La compatibilidad PDF se
consigue embebiendo una copia completa de los datos nativos de PGF dentro del fichero
PDF en vez de incorporar una extensión. La misma solución de camino dual se usa en las
últimas versiones del Illustrator para guardar los ficheros compatibles de EPS.

Ventajas del formato raster versus el formato vectorial


1) El espacio de la imagen es definido de una manera uniforme y muy visual. Como resultado,
los sistemas raster tienen mayor poder analítico que el vectorial en el análisis del espacio
continuo, y por tanto, es idóneo para el estudio de fenómenos cambiantes en el espacio
como las variables de los suelos, elevación del terreno, los índices de vegetación,
precipitaciones etc.
2) La estructura de un formato raster se ajusta de parecida manera a la de las computadoras.
Como resultado, los sistemas raster son mas rápidos en la evaluación de problemas que
impliquen diversas combinaciones matemáticas. Es de nuevo, un excelente medio para
explicar modelos medioambientales como la erosión del suelo, manejo y sostenibilidad del
medio forestal. Además, desde que las imágenes satélites emplean estructura raster, hace que
sea mas fácil incorporarlas a los GIS.

Inconvenientes del formato raster versus el formato vectorial


1) El principal inconveniente es el tamaño del fichero, que es sensiblemente más pequeño con
el formato vectorial.
2) Otro inconveniente es cuando se quiere ampliar una imagen. Si es formato raster, cuando
más se amplie, más definición se pierde. Con el formato vectorial, la definición se mantiene
por mucho que se amplie la imagen visualizada.

10.6. Formatos 3D
Un tercer grupo de tipología de imagen digital está compuesto por los formatos de tres dimensiones.
Guardan muchos puntos en común con los gráficos vectoriales, como la escalabilidad, la
organización por objetos, y la división de los mismos en subobjetos.
En primer lugar, existen una gran cantidad de formatos, ya que cada software utiliza su propio
código, y no existe hasta el momento ninguna extensión universal para el intercambio de
información 3D, aunque sí existe la posibilidad de utilizar distintos programas de conversión.
Los programas de edición 3D se pueden agrupar por su función en: CAD, modelado o animación.
En la mayoría de los casos la información 3D será de utilidad durante el desarrollo del proyecto,
para luego poder generar imágenes de mapas de bits, es decir, bidimensionales.
Algunas excepciones es la generación de una maqueta volumétrica de material siliconado a partir
del modelo 3D, o la utilización directa del escenario virtual en videojuegos, simulaciones
interactivas o webs VRML.
118

Los paquetes más populares de 3D son los siguientes: Discreet 3D Studio Max, Autodesk Maya,
Softimage XSI, Maxon Cinema 4D, Newtec Lightwave, Autodesk Autocad, Poser, Zbrush y Swift
3D.

10.7. Formato RAW


El formato RAW se refiere a una familia de formatos raw de imagen que está disponible en algunas
cámaras digitales. Normalmente estos formatos no usan compresión. Aunque hay un formato
estándar raw de imagen, el ISO 12234-2 TIFF/EP, los formatos raw usados en la mayoría de las
cámaras no están estandarizados o documentados, y difieren entre los distintos fabricantes de
cámaras. La especificación DNG (Digital Negative) de Adobe es un intento de estandarizar un
formato raw de imagen para que sea utilizado por las cámaras digitales. Actualmente es soportado
por los fabricantes de cámaras como Pentax, Leica, y Samsung. Los formatos raw de imagen de
más de 230 modelos de cámaras, incluidas las de los fabricantes con las mayores cuotas de
mercado, tales como Canon, Nikon, Sony y Olympus, se pueden convertir a DNG. DNG está
basado en el estándar ISO 12234-2 TIFF/EP.
Un fichero raw de imagen contiene los datos procesados del sensor de imagen de cualquier cámara
digital o escáner. Los ficheros raw se llaman así porque están sin procesar, es decir, son como los ha
generado el sensor de imagen y por lo tanto no están preparados para ser imprimidos o editados con
un editor de gráficos de mapa de bits. Normalmente la imagen es procesada por un convertidor raw
en un espacio de colores internos de gama amplia donde se pueden hacer los ajustes precisos antes
de la conversión a un formato de fichero positivo como el TIFF o el JPEG para su almacenamiento,
impresión o posterior manipulación.
Los ficheros de los formatos raw de las imágenes se denominan negativos digitales, ya que cumplen
el mismo papel que los negativos de una película fotográfica, es decir, el negativo no se puede
utilizar directamente como imagen, pero tiene toda la información necesaria para crear una imagen.
De la misma forma, el proceso de convertir un fichero raw de imagen en un formato visualizable se
denomina a veces desarrollo de una imagen raw, por analogía con el proceso de desarrollo de una
película. La selección de la elección final de la representación de la imagen es parte del proceso del
balance de blancos y del ajuste de color.
Como un negativo fotográfico, una imagen raw digital puede tener un rango dinámico más ancho o
una amplia gama de colores que el eventual formato final de la imagen, y preserva la mayor parte
de la información de la imagen capturada. El objetivo de los formatos raw de imagen es guardarlos
con la mínima pérdida de información de los datos obtenidos del sensor de imagen, y las
condiciones alrededor de la captura de la imagen.

10.7.1. Conceptos básicos


Suministrar una descripción detallada y concisa del contenido de los ficheros raw es altamente
problemático ya que no hay un único formato raw; los formatos pueden ser similares o radicalmente
diferentes, dependiendo del dispositivo y del fabricante. Los distintos fabricantes usan sus propios
formatos propietarios y normalmente sin documentar, que de forma colectiva se conocen como
formatos raw. A menudo también cambian el formato de un modelo de cámara a la siguiente. Los
principales fabricantes de cámaras, incluidos Nikon, Canon y Sony, encriptan partes del fichero para
evitar los intentos de acceso de herramientas de terceros.
Esta situación de formateo inconsistente ha hecho que muchos fotógrafos estén preocupados por la
futura accesibilidad a sus valuosas fotografías raw, ya que esto va aparejado con la evolución de los
sistemas operativos y de los programas asociados. La disponibilidad de software abierto de alta
calidad que descodifique los formatos raw de imagen, en particular el 'dcraw', ha ayudado a aliviar
119

esta cuestión. El formato DNG ha sido puesto como ejemplo de un posible estándar.
Los formatos raw de imagen intentan reproducir con la mayor fiabilidad posible y con el mejor
rendimiento del sensor de imagen en cuestión, la sensitometría de la imagen, es decir, la
información física sobre la intensidad de la luz y el color de la escena.
La mayoría de los formatos raw de imagen almacenan la información de acuerdo con la geometría
de los elementos individuales fotoreceptivos del sensor de imagen, más que los puntos de la
esperada imagen final: los sensores con desplazamiento hexagonal del elemento, por ejemplo,
graban la información de cada una de sus celdas desplazadas hexagonalmente, lo que eventualmente
un decodificador la transformará en una geometría rectangular durante el desarrollo digital.

10.7.2. Contenido del fichero


Los ficheros raw contienen necesariamente la información requerida para producir una imagen
visible con los datos del sensor de la cámara. La estructura de los ficheros raw, incluido el formato
estándar ISO 12234-2 TIFF/EP, sigue a menudo el siguiente patrón común:
• Una corta cabecera de fichero que normalmente contiene un indicador del tipo de fichero.
• Los metadatos del sensor de la cámara que se requieren para interpretar los datos del sensor.
Esto incluye el tamaño del sensor, los atributos del CFA (Color Filter Array) y su perfil de
color.
• Los metadatos de la imagen que se requieren para su inclusión en cualquier entorno CMS
(Color Management System) o base de datos. Esto incluye las características de la
exposición, el modelo de la cámara/escáner/lentes, la fecha del disparo/escaneo, información
del autor y otros. Algunos ficheros raw contienen una sección estandarizada de metadatos
con los datos en un formato Exif.
• Opcionalmente una imagen en tamaño reducido en formato JPEG, que se puede usar como
una vista previa rápida.
• En el caso de los escaneos de las películas, el código de tiempo, el código clave o el número
de fotograma en la secuencia de fichero que representa la secuencia de los fotogramas en la
película escaneada; es un elemento de metadatos muy importante, porque permite que el
fichero sea ordenado en una secuencia de fotogramas sin depender de su nombre de fichero.
• Los datos del sensor de imagen.
Muchos de los formatos raw se basan en el formato TIFF, incluidos los 3FR (Hasselblad), DCR,
K25, KDC (Kodak), CR2 (Canon), ERF (Epson), MEF (Mamiya), MOS (Leaf), NEF (Nikon), ORF
(Olympus), PEF (Pentax), RW2 (Panasonic) y ARW, SRF, SR2 (Sony). Estos ficheros pueden
desviarse de la norma TIFF de varias maneras, por ejemplo, incluyendo el uso de una cabecera de
fichero no estándar, la inclusión de etiquetas adicionales de imagen y la encriptación de algunos de
los datos.
El conversor raw de Panasonic corrige la distorsión geométrica y la aberración cromática de las
cámaras como la LX3, con la información de la corrección necesaria incluido en el raw.
DNG, el formato digital de negativos de Adobe, es una extensión del formato TIFF 6.0 y es
compatible con TIFF/EP, y utiliza varios formatos y/o estándares abiertos, incluidos los metadatos
de Exif, los metadatos de XMP, los metadatos de IPTC, las coordenadas CIE XYZ, los perfiles ICC
y JPEG.

10.7.3. Datos de la imagen del sensor


Los ficheros raw de una cámara digital contiene los datos de los píxeles de un sensor de imagen
rectangular, el equivalente digital de una película fotográfica, por lo general de 12 a 14 bits por
120

píxel. El sensor está casi siempre cubierto con una matriz de filtro sin color, por lo general un filtro
de Bayer, que consiste en un mosaico de filtros de color rojo, azul y verde. Teniendo en cuenta que
los tres colores encajan incómodamente en una matriz rectangular, se eligió el verde para estar
doblemente presente, ya que el ojo humano es más sensible a este color. A menudo también el verde
sirve como canal de luminancia, y como canal dominante para las conversiones negro-blanco
internas de la cámara. Para recuperar una imagen desde un fichero raw, este mosaico de datos se
debe convertir en una imagen completa RGB. A esto se le llama desarrollo digital.
Una variación en el filtro de Bayer es el filtro RGBE de la Sony Cyber-shot DSC-F828, que
cambiaron el verde en las filas RG por el esmeralda. Otros sensores, tales como el sensor Foveon
X3, captura la información directamente en formato RGB, teniendo tres sensores de píxel en cada
lugar, uno por cada componente de color; estos datos raw RGB de la cámara aún necesitan ser
procesados para hacer un fichero de imagen, ya que los valores RGB corresponden a las respuestas
de los sensores, no a un espacio de color estándar como el RGB.
Los sensores de los escáneres planos y de películas son normalmente bandas estrechas RGB o
RGBI (I de infrarrojo) que son tiras distribuidas a lo largo de la imagen. El formato raw HDRi de
los datos es capaz de almacenar los datos raw infrarrojos, que pueden ser utilizados para la limpieza
de infrarrojos, como un canal de adicional de 16 bits.

10.7.4. Estandarización
El estándar ISO del formato raw de imagen es el ISO 12234-2, mejor conocido como TIFF/EP.
TIFF/EP suministra una base para los formatos raw de imagen de muchas cámaras. Por ejemplo, los
ficheros raw NEF de Nikon se basan en TIFF/EP, e incluyen una etiqueta que identifica la versión
de TIFF/EP en que se basan. El formato raw DNG de Adobe se basó en TIFF/EP, y la especificación
DNG dice "DNG ... es compatible con el estándar TIFF-EP". Varias cámaras usan el formato DNG
como su formato raw de imagen, es decir, usan también TIFF/EP.
Adobe Systems lanzó el formato raw DNG de imagen en Septiembre de 2004. En Septiembre de
2006, varios fabricantes de cámaras han comenzado a anunciar el soporte para el DNG en los
nuevos modelos de cámaras, incluyendo Leica, Samsung, Ricoh, Pentax y Hasselblad. La Leica
Digital-Modul-R (DMR) fue la primera en usar el DNG como formato original.
TIFF/EP inicia el ciclo de revisión de cada 5 años en 2006. Adobe ofreció la especificación DNG a
ISO para que formara parte del estándar ISO TIFF/EP revisado. Un informe de Octubre de 2008 de
ISO sobre la revisión de TIFF/EP afirmó que la revisión "... normalmente incluye dos perfiles de
interoperabilidad, el IP 1 para los datos procesados de la imagen, usando la extensión .tif y el IP 2
para los datos raw de la imagen con extensión .dng. "
El formato DNG ha sido explotado por los desarrolladores de código abierto. El uso por los
fabricantes de cámaras varía: las empresas más grandes como Canon, Nikon, Sony, y algunas otras,
no utilizan DNG; pero las empresas más pequeñas que de otra manera podrían tener dificultades
para conseguir el apoyo de empresas de software, con frecuencia usan el formato DNG como
formato nativo raw de la imagen, o en el caso de Pentax, como una alternativa opcional a su propio
formato raw de imagen.

10.8. Formato BMP


El formato BMP, llamado también formato DIB (Device-Independent Bitmap), es un formato de
fichero de imágenes utilizado para almacenar imágenes digitales de mapa de bits, especialmente en
los sistemas operativos de Windows de Microsoft, razón por la cual hay muchas aplicaciones que lo
han incorporado.
121

10.8.1. Almacenamiento de los píxeles


En los ficheros BMP, así como muchos otros formatos de mapa de bits, los píxeles de la imagen se
almacenan con un color de tamaños 1, 4, 8, 16, 24, ó 32 bits por píxel. Las imágenes de 8 o menos
bits pueden ser de escala de grises o de color indexado. Se puede almacenar un canal alfa para la
transparencia en un fichero separado, donde es similar a una imagen de escala de grises, o en un
cuarto canal que lo convierte a imágenes de 24 a 32 bits por píxel.
Normalmente los ficheros de mapas de bits sin comprimir como el BMP son mucho más grandes
que los formatos de la misma imagen comprimidos. Por ejemplo el logo de Wikipedia de
1058×1058 que ocupa 271 KB en el formato PNG, ocupa 3358 KB en un fichero BMP de 24 bits.
Los formatos sin comprimir, al tener un mayor tamaño, tienen tiempos de transmisión bastante más
largos.
Los bits que representan los pixels del mapa de bits se empaquetan por filas. Dependiendo del
número de bits por color, un píxel de la imagen ocupará al menos n/8 octetos, donde n es la
profundidad del bit, dado que 1 octeto son 8 bits.

10.8.2. Estructura
Normalemente un fichero BMP contiene los siguientes bloques de datos:
BMP File Header Almacenará la información general del fichero BMP.
DIB header Almacena la información detallada de la imagen de mapa de bits.
Almacena la definición de los colores que se usan en los mapas de
Paleta de colores
bits de color indexados.
Datos Almacena la imagen actual, píxel a píxel.

BMP File Header


Este bloque de octetos está al principio del fichero y se utiliza para su identificación. Las
aplicaciones que manejan este formato BMP se aseguran de que este fichero tiene el formato BMP
analizando este primer bloque de octetos. Los dos primeros octetos del formato BMP son los
caracteres B y M en codificación ASCII. Todos los valores enteros se almacenan en el formato
'little-endian', es decir, primero el octetos menos significativo.

DIB header
Este bloque de octetos contiene la información detallada de la imagen, que se usará para visualizar
la imagen en la pantalla. El bloque que también coincide con la cabecera usada internamente por los
sistemas operativos Windows y OS/2, tiene distintas variantes. Todas contienen un campo que
especifica su tamaño, así la aplicación puede determinar fácilmente que cabecera se usa en la
imagen. La razón por la que hay distintas cabeceras es que Microsoft emplea para el formato DIB el
concepto de extensiones, cada una con su cabecera. Las nuevas cabeceras extendidas se pueden usar
con algunas funciones GDI en vez de las viejas, suministrando más funcionalidad. Dado que GDI
soporta una función para cargar los mapas de bits, normalmente las aplicaciones Windows usan esta
funcionalidad. Una consecuencia de esto es que en estas aplicaciones, los formatos BMP coinciden
con los formatos de la versión de Windows que se usa.

Paleta de colores
La paleta de colores se coloca después de la cabecera BMP y la cabecera DIB del fichero BMP. Por
lo que su dirección es el tamaño de la cabecera BMP más el tamaño de la cabecera DIB.
122

La paleta de colores es un bloque de octetos que contiene la lista de los colores disponibles para su
uso en una determinada imagen de colores indexados. Cada píxel de la imagen es descrito por un
número de bits (1, 4, o 8), cuyo índice es un único color en esta tabla. El objetivo de esta paleta de
colores en los mapas de bits de colores indexados es decir a la aplicación, cual de los colores de la
tabla le corresponde a cada píxel.
Un formato DIB siempre usa el modelo de colores RGB. En este modelo, un color es la suma de
tres distintas intensidades, de 0 a 255, de cada uno de los tres colores primarios rojo (R), verde (G),
y azul (B). Así se define un color mediante el uso de 3 valores para R, G y B, almacenados en orden
inverso en cada entrada de la paleta.
El número de entradas de la paleta es 2n o un valor más especificado en la cabecera. Cada entrada
contiene 4 octetos, excepto en el caso de las versiones V1 de OS/2 en que solo hay 3 octetos por
entrada. Los 3 primeros octetos en la versión V1 de OS/2 almacenan los valores para el azul, el
verde y el rojo respectivamente, mientras que el último no se usa y se llena con ceros en la mayoría
de las aplicaciones.
La paleta de colores indexados no se usa cuando el mapa de bits es de 16 o más bits; no hay
ninguna paleta de colores en estos ficheros BMP.

Datos en el mapa de bits


Este bloque de octetos describe la imagen, píxel a píxel. Los pixels se almacenan de arriba a abajo
con respecto al orden normal de escaneo de la imagen, empezando por la esquina inferior izquierda,
a continuación de izquierda a derecha, y luego de fila a fila desde el fondo de la imagen hasta su
parte superior. Los mapas de bits descomprimidos de Windows también se pueden almacenar desde
la parte superior a la inferior, si el valor de la altura de la imagen es negativo.
En el DIB original, solo son legales cuatro números de bits por píxel, es decir, 1, 4, 8, y 24. En
todos los casos, cada fila de pixels se extiende hasta el límite de 32 bits (4 octetos), rellenando con
un valor no especificado que no tiene que ser el cero, de forma que la fila siguiente empezará en una
localización de memoria múltiplo de 4 octetos o en el fichero. El número total de octetos de una fila
se puede calcular como el tamaño de la altura de la imagen/mapa de bits en pixels. Siguiendo estas
reglas, hay varias formas de almacenar los datos de los pixels dependiendo de los bits por color y el
tipo de compresión del mapa de bits.
Los valores de píxeles de color de 1 bit, blanco y negro, se almacenan en cada bit, con el primer
píxel, el más a la izquierda, en el bit más significativo del primer octeto. Si el bit vale 0, significa
que tiene el color de la primera entrada de la tabla, y si el bit vale 1, se referirá a la segunda y en
este caso última entrada de la tabla.
Si para almacenar el color se usan 4 bits, se guardarán dos pixels por octeto, y el píxel más a la
izquierda es la parte más significativa. Cada valor del píxel es un índice de la tabla hasta 16 colores.
Los valores de los pixels con color RGB (24 bits) se almacenan con octetos como BGR (azul,
verde, rojo).
Además se insertan los octetos de relleno necesarios para que la línea de datos sea un múltiplo de 4.
Por ejemplo, con un mapa de bits con la paleta de colores de 24 bits con un ancho de 1, tendría 3
octetos de datos por fila (azul, verde, rojo) y 1 octeto de relleno, con un ancho de 2, tendría 2, con
un ancho de 3, tendría 1 y con un ancho de 4, no tendría ningún octeto de relleno.

10.9. Formato JPEG/JFIF


El nombre JPEG viene del acrónimo de Joint Photographic Experts Group, nombre del comité que
123

creó este estándar JPEG. Es uno de los dos subgrupos del ISO/IEC Joint Technical Committee 1,
Subcommittee 29, Working Group 1 (ISO/IEC JTC 1/SC 29/WG 1), titulado como 'Coding of still
pictures'. El grupo se organizó en el año 1986, liberando el primer estándar JPEG en el año 1992,
que fue aprobado en Setiembre de 1992 como ITU-T Recommendation T.81 y en el año 1994 como
ISO/IEC 10918-1.
El estándar JPEG especifica el códec, que define como se comprime una imagen que contiene un
conjunto de octetos y como se descomprime en una imagen, pero no define el formato del fichero
usado para contener esta imagen. Esta compresión es con pérdidas. Los estándares Exif JFIF
definen los formatos usados habitualmente para intercambiar las imágenes comprimidas con JPEG.
Normalmente los estándares JPEG se denominan 'Information technology—Digital compression
and coding of continuous-tone still images'.
Casi todas las cámaras digitales pueden guardar las imágenes en formato JPEG/JFIF, que soporta 8
bits por color (rojo, verde, azul) para un total de 24 bits, produciendo ficheros relativamente
pequeños. Cuando no son demasiado grandes, la compresión no perjudica notablemente la calidad
de la imagen, pero los ficheros JPEG sufren la degradación de la calidad de la imagen cuando en
repetidas ocasiones se edita y guarda. Las imágenes fotográficas pueden ser mejor guardadas en un
formato no JPEG sin pérdidas si tienen que ser reeditadas, o si los pequeños defectos, manchas
causadas por el algoritmo de compresión JPEG, son inaceptables. También el formato JPEG/JFIF se
utiliza como el algoritmo de compresión de imagen en muchos ficheros PDF de Adobe.

10.9.1. Compresión JPEG


El método de compresión del formato JPEG normalmente es con pérdidas, lo que significa que se
pierde alguna información de la imagen original y no se puede recuperar, lo que afecta a la calidad
de la imagen. Hay variaciones del estándar base JPEG que son sin pérdidas, sin embargo no son
ampliamente soportadas.
También hay un formato progresivo JPEG entrelazado, en el cual los datos son comprimidos en
múltiples pasos progresivos de un mayor detalle. Esto es ideal para imágenes grandes que serán
visualizadas mientras son descargadas sobre una conexión lenta, lo que permite una razonable
visión previa después de recibir solo una parte de los datos. Sin embargo los JPEGs progresivos no
son ampliamente soportados, y aunque hay algún software que los soporta como algunas versiones
del Internet Explorer, solo visualiza la imagen una vez ha sido completamente descargada.
También hay muchos sistemas de imágenes médicas que crean y procesan imágenes JPEG con una
profundidad de 12 bits. Este formato ha sido una parte de la especificación JPEG, pero este formato
no es ampliamente aceptado.

Edición sin pérdidas


Se pueden realizar varias alteraciones de la imagen JPEG sin pérdidas, es decir, sin recompresión ni
pérdida asociada de la calidad, en tanto que el tamaño de la imagen es un múltiple de 1 bloque
MCU (Minimum Coded Unit), normalmente 16 pixeles en ambas direcciones para un submuestreo
cromático 4:2:0.
Los bloques pueden ser girados en incrementos de 90 grados, girados según los ejes horizontal,
vertical y diagonal. No todos los bloques de la imagen original necesitan ser utilizados en la imagen
modificada.
La parte superior y la parte izquierda de una imagen JPEG deben estar al principio del bloque, pero
el fondo y la derecha no hace falta que así sea. Esto limita las posibles operaciones de compresión
con pérdidas, y también los giros y rotaciones que se pueden hacer a una imagen cuyos bordes no
124

están en un límite de bloque de todos los canales.


Cuando se trabaja sin pérdidas, si el fondo o el lado derecho de la región comprimida no está en un
límite de bloque, entonces el resto de los datos de los bloques utilizados parcialmente aún se
encuentran en el fichero comprimido y se puede recuperar con relativa facilidad por cualquier
persona con un editor hexadecimal y una comprensión del formato.
También es posible transformar entre el inicio y los progresivos formatos sin ninguna pérdida de
calidad, ya que la única diferencia es el orden en que los coeficientes se colocan en el fichero.

10.9.2. Ficheros JPEG


El formato de fichero JIF (JPEG Interchange Format) se especifica en el anejo B del estándar. Sin
embargo este formato de fichero puro se usa raramente, principalmente debido a la dificultad de
programar codificadores y decodificadores que implementan todos los aspectos del estándar y
debido a ciertas deficiencias del estándar como:
• La definición del espacio de colores
• El registro del submuestreo del componente
• La definición de la relación del aspecto del píxel
Son varias las normas adicionales se han desarrollado para abordar estas cuestiones. El primero de
los cuales, liberado en el año 1992, fue el JFIF (JPEG File Interchange Format), seguido en años
recientes por el formato Exif (Exchangeable image file) y los perfiles de colores ICC (International
Color Consortium) . Ambos formatos usan la disposición actual de octetos del formato JIF, que
consiste con distintos marcadores, pero que además emplea uno de los puntos de extensión del
estándar JIF, llamado los marcadores de la aplicación: JFIF usa APP0, mientras que Exif usa APP1.
Dentro de estos segmentos del fichero, que para el estándar JIF es simplemente un "byte blob" que
no se lee, estos estándares añaden metadatos específicos.
Así en algunos aspectos el JFIF es una versión recortada del estándar JIF, ya que especifica ciertas
limitaciones, por ejemplo, no permitir todos los modos de codificación, mientras que en otros
aspectos es una extensión del JIF, debido a los metadatos agregados.
Los ficheros de imagen que utilizan la compresión JPEG se denominan comúnmente ficheros JPEG.
La mayoría de los dispositivos de captura de imágenes como las cámaras digitales y la mayoría de
los programas de edición de imagen que generan ficheros JPEG, en realidad están creando un
fichero con el formato JFIF y/o Exif.
Los estándares JFIF y Exif son estrictamente incompatibles porque cada uno especifica primero sus
cabeceras. En la práctica, la mayoría de los ficheros JPEG en formato Exif contienen una pequeña
cabecera JFIF que precede a la cabecera Exif. Esto permite a lectores antiguos manejar
correctamente la cabecera JFIF antigua, mientras que los nuevos lectores también decodificar la
cabecera Exif.

Perfil de colores
La mayoría de los ficheros JPEG incluyen el perfil de color ICC (International Color Consortium).
Normalmente los perfiles de color utilizados incluyen los RGB y el RGB de Adobe. Debido a que
los espacios de colores utilizan una transformación no lineal, el rango dinámico de un fichero JPEG
de 8 bits tiene aproximadamente 11 paradas. Sin embargo muchas aplicaciones no pueden negociar
con los perfiles de color de JPEG y simplemente los ignoran.

Sintaxis y estructura
Una imagen JPEG consta de una secuencia de segmentos, cada uno empieza con un marcador que
125

empieza con un octeto 0xFF seguido por otro octeto que indica el tipo de marcador. Algunos
marcadores constan solo de estos dos octetos; otros son seguidos por dos octetos que indican la
longitud de los datos de este marcador. La longitud incluye los dos octetos que contienen la longitud
pero no los dos octetos que definen el marcador. Algunos marcadores son seguidos por datos con
código de entropía; la longitud de dicho indicador no incluye los datos con código de entropía.
Tener en cuenta que los octetos 0xFF consecutivos son octetos de relleno.
Dentro de los datos con código de entropía, después de cualquier octeto 0xFF, el codificador inserta
un octeto 0x00 antes del siguiente octeto, por lo que no parece ser un marcador, y a su vez previene
de errores de tramas. Los descodificadores debe saltarse este octeto 0x00. Esta técnica llamada de
'byte stuffing' sólo se aplica a los datos codificados por la entropía.

10.10. Formato Exif


El formato Exif fue creado por JEIDA (Japan Electronic Industries Development Association)
(http://www.jeita.or.jp). La versión 2.1 de la especificación lleva fecha del 12 de Junio de 1998, y la
última versión 2.2 es de Abril del 2002, y también es conocida como Exif Print. Aunque la
especificación no es actualmente mantenida por ninguna empresa ni organización de estándares, su
uso por los fabricantes de cámaras fotográficas es casi universal.
Los metadatos definidos en el formato Exif incluyen los siguientes conceptos:
• Información de fecha y hora. Las cámaras digitales graban la fecha y la hora actuales y lo
guardan como metadato.
• Característica de la cámara. Esto incluye la información estática como el modelo y el
fabricante de la cámara y la información que varía con cada imagen como su orientación, su
apertura, su velocidad de disparo, su longitud focal, su modo de medición, y la información
de la velocidad ISO.
• Una imagen en miniatura para la previsualización de la imagen en la pantalla LCD de la
cámara, en los administradores de ficheros, o en los programas de manipulación de fotos.
• Descripciones e información de copyright.
El Metadata Working Group se formó a partir de un consorcio de empresas en el año 2006. Liberó
su primer documento el 24 de Setiembre del 2008, dando recomendaciones sobre el uso de los
metadatos de las imágenes Exif, IPTC y XMP.
La XMP (Extensible Metadata Platform) fue creada por Adobe Systems para mejorar el formato de
los metadatos para el procesado de la fotografía y la imagen. Sin embargo generalmente no es
soportado por las cámaras digitales.
El formato Exif (Exchangeable image file) es similar al formato estándar JFIF con las extensiones
TIFF. Su objetivo es grabar las imágenes con sus metadatos, que están grabados como imágenes
individuales e incluyen los datos mencionados anteriormente. Cuando las imágenes se visualizan o
se editan con algún programa, se puede visualizar todos los metadatos asociados.
La estructura de etiquetas Exif está tomada de los ficheros TIFF. En varias propiedades específicas
de la imagen existe un gran solapamiento entre las etiquetas definidas en los estándares TIFF, Exif,
TIFF/EP, y DCF. Para los metadatos descriptivos, se produce una superposición entre la
información del Exif y del IPTC Information Interchange Model, que también se pueden incrustar
en un fichero JPEG.
Cuando se emplea el formato Exif para los ficheros JPEG, los datos Exif se almacenan en una
utilidad Application Segments definida en JPEG, la APP1 con el marcador de segmento 0xFFE1,
que contiene dentro todo el fichero TIFF. Cuando se emplea el formato Exif en los ficheros TIFF, el
Private Tag 0x8769 define un IFD (Image File Directory) que contiene las marcas TIFF relativas al
126

formato Exif. Además Exif también define un Global Positioning System sub-IFD utilizando el
TIFF Private Tag 0x8825, que incluye la información de localización, y un 'Interoperability IFD'
especificado dentro del Exif sub-IFD, usqndo el Exif tag 0xA005.

10.11. Formato TIFF


El formato TIFF (Tagged Image File Format) es un formato de fichero de almacenamiento de
imágenes muy popular en el mundo Apple Macintosh. Desde el año 2009 está controlado por Adobe
Systems. Creado originalmente por la empresa Aldus, el formato TIFF es ampliamente soportado
por las aplicaciones de manipulación de imágenes, por las aplicaciones de publicaciones, y de
procesado de escaneos, faxes y textos, así como de reconocimiento óptico de caracteres. TIFF no ha
tenido ninguna actualización importante desde 1992, aunque se han publicado varias notas técnicas
Aldus/Adobe con extensiones al formato, y varias especificaciones, que incluyen TIFF/EP (ISO
12234-2) y TIFF/IT (ISO 12639) que son la base de la especificación TIFF 6.0.

El formato TIFF es un formato flexible que normalmente ahorra 8 bits o 16 bits por color (rojo,
verde, azul) de un total de 24 y 48 bits, respectivamente, normalmente usando la extensión TIFF o
TIF. La flexibilidad del formato TIFF choca con el hecho de que no hay ningún lector que lea todos
los tipos de ficheros TIFF. Los ficheros TIFF pueden ser almacenados comprimidos con pérdidas y
sin pérdidas, y algunos ofrecen relativamente buena compresión sin pérdidas para las imágenes con
dos niveles, blanco y negro. Algunas cámaras digitales pueden grabar en el formato TIFF, usando el
algoritmo de compresión LZW con pérdidas. El formato de imagen TIFF es ampliamente soportado
por los navegadores de Internet. TIFF es ampliamente aceptado como un estándar de fichero de
fotografía en las empresas de impresión. TIFF puede manejar espacios de color de determinados
dispositivos, como el CMYK definido por un conjunto particular de tintas de imprenta.
Cada imagen con formato TIFF empieza con un indicador de 2 octetos que indica como se ordenan
los octetos: si contiene "II", indica que la ordenación es 'little endian' y si contiene "MM", la
ordenación es 'big endian'. Los siguientes dos octetos representan el número 42, debido a que es el
patrón binario 101010. La especificación TIFF 6.0 dice que los lectores compatibles con TIFF
deben soportar ambas ordenaciones, sin embargo, los grabadores TIFF puede elegir el orden de
octetos que más les convenga.
Un formato clásico TIFF usa las direcciones con valores de 32 bits y, como tal, el tamaño de fichero
está limitado a 4 GB. BigTIFF es una variante del formato TIFF, que puede contener más de 4GiB
de datos mediante el uso de las direcciones con 64 bit. El soporte para los formatos BigTIFF entre
aplicaciones está limitado, ya que la especificación de formato de fichero sólo se ha implementado
recientemente (2007) en la versión LibTIFF 4.0.

10.12. Formato PNG


El formato PNG (Portable Network Graphics) fue creado como un formato abierto para competir
con el formato propietario GIF. El formato PNG soporta hasta 16 millones de colores mientras que
el GIF solo soporta 256 colores. El fichero PNG es bueno cuando la imagen tiene grandes zonas
coloreadas uniformemente. El formato sin pérdidas PNG es el mejor para editar imágenes y
formatos con pérdidas, como el formato JPG es el mejor para la distribución final de imágenes
fotográficas, porque los ficheros JPG son más pequeños que los ficheros PNG. En la actualidad,
este formato PNG ya está soportado por la mayoría de los navegadores de Internet.
127

10.12.1. Profundidad del color


La imágenes PNG pueden utilizar la paleta de colores indexado o estar compuestas por uno o más
canales. Cuando hay más de un canal de una imagen, todos los canales tienen que tener la misma
profundidad del color, es decir, el mismo número de bits asignados por píxel. Aunque la
especificación PNG siempre habla de la profundidad de bit de los canales, la mayoría del software y
de los usuarios en general hablan sobre el número total de bits por píxel. Ya que un píxel puede
oafectar a múltiples canales, el número de bits por píxel es a menudo más alto que el número de bits
por canal.
El número de canales dependerá de si la imagen es en escala de grises o de color y si tiene un canal
alfa. El formato PNG denomina tipo de color a las combinaciones de los canales.
Los tipos de color posibles son:
• escala de grises
• rojo, verde y azul: RGB/color verdadero
• indexado: el canal contiene los índices en una paleta de colores
• escala de grises y canal alfa: nivel de transparencia de cada píxel
• rojo, verde, azul y alfa
Con imágenes de color indexado, la paleta se almacena siempre en RGB con una profundidad de 8
bits por canal. La paleta no debe tener más entradas que la profundidad de bit de la imagen permite,
pero puede tener menos. Por ejemplo, si una imagen sólo utiliza 90 colores, entonces no es
necesario todas las entradas de la paleta de 256 colores.
Las imágenes con formato PNG de color indexadas se les permite tener 1, 2, 4 u 8 bits por píxel
según el estándar. Las imágenes en escala de grises sin canal alfa permiten 1, 2, 4, 8 o 16 bits por
píxel. Todo los demás tipos utilizan una profundidad de bit por canal de 8 ó 16. El estándar exige
que los descodificadores puedan leer todos los formatos de color soportados, pero muchos editores
de imagen sólo puede funcionar con un pequeño subconjunto de ellos.

10.12.2. Transparencia de la imagen


El formato PNG ofrece una variedad de opciones de transparencia. Con las imágenes de color
verdadero o de escala de grises, un único valor de píxel se puede declarar como transparente o se
puede añadir un canal alfa que permita cualquier porcentaje de transparencia parcial. Para las
imágenes con paleta de colores, se pueden añadir los valores alfa a las entradas de la paleta. El
número de dichos valores almacenados puede ser menor que el número total de entradas de la
paleta, en cuyo caso las entradas restantes se consideran totalmente opacas.
El escaneado de los valores de los píxeles para la transparencia binaria se supone que debe ser
realizado antes de que cualquier reducción de color para evitar convertirse involuntariamente en
píxeles transparentes. Esto es lo más probable para los sistemas que pueden descodificar las
imágenes de 16 bits por canal pero la salida sólo a 8 bits por canal.

10.12.3. Compresión
El formato PNG utiliza un proceso de compresión en dos etapas:
• precompresión: filtrado (predicción)
• compresión propiamente dicha
El formato PNG utiliza un método de compresión sin pérdidas no patentado conocido como
'deflate', que es el mismo que se utiliza en la compresión de las librerías zlib.
128

10.12.4. Entrelazado
El formato PNG ofrece el algoritmo opcional Adam7. Este algoritmo consiste en un esquema
bidimensional de entrelazado de 7 pasos. Esto es más sofisticado que el esquema unidimensional de
4 pasos del GIF y permite una imagen más clara de baja resolución para ser visible al principio de la
transferencia, en particular si se utilizan los algoritmos de interpolación como la interpolación
bicúbica.
Sin embargo, como en un sistema de 7 pasos, tiende a reducir más la compresibilidad de los datos
que los esquemas más sencillos.

10.12.5. Animación
El formato PNG no soporta la animación. La extensión del formato MNG (Multiple-image Network
Graphics) es una extensión del formato PNG que permite la animación. Fue diseñado por miembros
del Grupo PNG. El formato MNG comparte la estructura básica del PNG, pero es mucho más
complejo y tiene una firma de fichero diferente, lo que automáticamente hace que sea incompatible
con los descodificadores del estándar PNG.
La complejidad de MNG condujo a la propuesta del formato APNG (Animated Portable Network
Graphics ) por los desarrolladores de la Fundación Mozilla. Se basa en el formato PNG, soporta
animación y es más sencillo que el MNG. El formato APNG ofrece una sola imagen de pantalla
para los descodificadores PNG que no soportan APNG. Sin embargo, ninguno de estos formatos en
la actualidad goza de amplio apoyo. APNG es soportado por Firefox 3.0 y Opera 9.5. El Grupo
PNG decidió en Abril de 2007 no soportar el APNG.

10.13. Formato GIF


El formato GIF (Graphics Interchange Format) es un formato propietario de Compuserve y se
desarrolló específicamente para la transmisión de datos en tiempo real. Está limitado a 256 colores,
es decir, 8 bits para la especificación del color. Esto hace que el formato GIF sea útil para almacenar
gráficos con pocos colores, tales como diagramas simples, formas, logos e imágenes de estilo de
dibujos animados.
Permite crear GIFs entrelazados, que pueden mostrarse progresivamente de menor a mayor
resolución en lugar de tener que esperar a cargarse por completo. También permite la definición de
un color transparente para superponer el gráfico a otros elementos de la página. Los GIFs
transparentes también admiten técnicas de anti-aliasing, como el caso de los textos.
Utiliza el algoritmo de compresión LZW (Lempel-Ziv y Welch) que se basa en reducir el número de
píxeles cuando muchos próximos son del mismo color.
Un fichero GIF solo tiene normalmente dos bloques: una cabecera y un bloque que contiene los
datos de la imagen propiamente dicha.

10.13.1. Estructura
Los ficheros GIF empiezan con una cabecera de longitud fija que contiene la versión, seguido de un
Logical Screen Descriptor de longitud fija que contiene el tamaño y otras características de la
imagen. El descriptor de pantalla también puede especificar la presencia y el tamaño de una Global
Color Table.
Por lo tanto el fichero se divide en segmentos, cada uno identificado por el contenido de un octeto:
• Una imagen (introducida por 0x2C, una coma ',')
129

• Un bloque extensión (introducido por 0x21, una señal de exclamación '!')


• La cola (un único octeto de valor 0x3B, un punto y coma ';'), que debería ser el último octeto
del fichero.
Una imagen se inicia con un Image Descriptor de longitud fija, que puede especificar la presencia y
el tamaño de una Local Color Table. Los datos de la imagen van a continuación: un octeto contiene
el ancho de bit de los símbolos sin codificación, seguido de una lista vinculada de subbloques que
contiene los datos codificados con LZW.
Los bloques de extensión contienen un octeto adicional que especifica el tipo de extensión, y una
lista vinculada de subbloques con los datos de la extensión. Los bloques de extensión que modifican
una imagen, como el Graphic Control Extension que especifica el tiempo opcional de retardo de la
animación y el color opcional de fondo transparente, deben preceder inmediatamente el segmento
que contiene la imagen propiamente dicha.
Las listas enlazadas usadas por los datos de imagen y los bloques de extensión consisten de una
serie de subbloques, cada subbloque empezando con un octeto que indica el número de octetos de
datos posteriores en el subbloque (1 a 255), y la serie terminan con el subbloque vacío (un octeto 0).
Esta estructura permite que el fichero se pueda analizar aunque no se tengan todas las partes.

10.13.2. Paletas
El formato GIF se basa en paletas de colores. Los colores utilizados en una imagen tienen sus
valores RGB definidos en una paleta que es una tabla que puede almacenar hasta 256 entradas, y los
datos de la imagen se refieren a los colores por sus índices ( 0-255) en la tabla de la paleta. Las
definiciones de color en la paleta se pueden obtener de un espacio de colores de millones de tonos
(224 tonos, 8 bits para cada primario), pero el número máximo de colores de una imagen que se
puede utilizar es 256. Esta limitación parece razonable cuando se desarrolló el GIF porque pocas
personas podían permitirse el hardware para mostrar más colores simultáneamente. Los gráficos
simples, los dibujos, las caricaturas y las fotografías en escala de grises suelen necesitar menos de
256 colores.
Otro refinamiento es que cada imagen puede designar un índice como un color de fondo
transparente: cualquier píxel asignado a este índice, toma el color del píxel en la misma posición del
fondo, que puede haber sido determinado por una imagen anterior de la animación.
Muchas técnicas, llamadas colectivamente 'dithering', se han desarrollado para aproximar una gama
más amplia de colores con una paleta de pocos colores mediante el uso de pixels de dos o más
colores para aproximarse a los colores básicos de la paleta. Estas técnicas sacrifican la resolución
espacial con la aproximación de una mayor resolución del color. Si bien no es parte de la
especificación GIF, el 'dithering' se puede utilizar en imágenes ya codificadas como imágenes GIF.
A menudo no es una solución ideal para las imágenes GIF, debido a que la pérdida de resolución
espacial normalmente hace que una imagen se vea borrosa en la pantalla, y debido a que a menudo
los patrones del 'dithering' interfieren con la compresibilidad de los datos de imagen.

10.13.3. GIF animado


El Formato GIF soporta animación y sigue siendo ampliamente utilizado para proporcionar efectos
de animación de imagen. También utiliza una compresión sin pérdidas que es más eficaz cuando las
áreas grandes tienen un solo color, e ineficaz para imágenes detalladas o interpoladas. Así la
estructura definida por la especificación GIF89a permite a los GIFs contener imágenes múltiples
para hacer pequeñas de animaciones. Su esquema general consta de: una cabecera, un descriptor
lógico de pantalla y una paleta opcional de color global. A continuación hay dos bloques opcionales,
uno extendido y otro de control. Luego siguen los bloques de gráficos, que contienen un descriptor
130

de imagen, una paleta opcional de color local y los datos de la imagen.


También existen bloques de texto simple, que indican el texto a sobreponer en una imagen. Puede
definirse la posición y el color del texto.

10.14. Formato CGM


El formato CGM (Computer Graphics Metafile) es un formato de fichero para gráficos vectoriales
2D, gráficos raster y texto, y está definido en la ISO/IEC 8632. Todos los elementos gráficos se
pueden especificar en un fichero fuente de texto que se puede compilar en un fichero binario o en
una de las dos representaciones de texto. El formato CGM es un medio de intercambio de datos
gráficos para la representación informática de la información gráfica en 2D independiente de
cualquier aplicación en particular, ya sea un sistema, una plataforma o un dispositivo. Se ha
adoptado alguna medida en los ámbitos de la ilustración técnica y de diseño profesional, pero ha
sido prácticamente sustituida por formatos como SVG y DXF.

10.15. Formato SVG


El formato SVG (Scalable Vector Graphics) es un estándar abierto creado y desarrollado por el
World Wide Web Consortium (http://www.w3.org) para abordar la necesidad de un formato
vectorial versátil para todos los fines, y su uso a partir de scripts para la web y otras cosas. El
formato SVG es un vocabulario XML de descripción de gráficos de dos dimensiones y de
aplicaciones gráficas. El formato SVG se utiliza en diferentes áreas incluyendo gráficos Web,
animación, interfaz de usuario, intercambio de gráficos, aplicaciones móviles y diseño de alta
calidad. El formato SVG está basado en otros estándares de gran uso como los formatos JPEG y
PNG de imágenes, el DOM para interactividad y scripting, el SMIL (Lenguaje de Integración de
Multimedia Sincronizada) para animación y el CSS (Hojas de Estilo en Cascada) para dar estilo.

El formato SVG funciona con tres tipos de objetos gráficos: formas gráficas vectoriales (rutas que
consisten en líneas rectas y curvas), imágenes y texto. Los objetos gráficos pueden agruparse,
pueden obtener estilo, pueden ser transformados y ser creados sobre objetos previos. Por otro lado
el texto puede estar en cualquier espacio de nombre XML adecuado a la aplicación, que mejora la
accesibilidad de los gráficos SVG. El grupo de características incluye transformaciones anidadas,
áreas seleccionadas, máscaras alfa, efectos de filtros, objetos plantilla y extensibilidad.

La especificación SVG 1.1 define de forma completa este formato.

10.15.1. Modularización
La modularización de SVG es una descomposición del SVG 1.0 y las erratas en una colección de
módulos abstractos que proporcionan las unidades específicas de funcionalidad. Estos módulos se
pueden combinar entre sí y con los módulos definidos en otras especificaciones como XHTML para
crear un subconjunto SVG los tipos de extensión de documento que cualifican a los tipos de
documentos como miembros de la familia SVG.
Cada sección principal de la especificación SVG produce un módulo denominado después de esta
sección, por ejemplo, "Módulo de Texto" o "Módulo Básico de la Estructura". Un módulo sin el
prefijo básico significa que el módulo incluye el conjunto completo de elementos y atributos, sin
ninguna restricción, desde la sección correspondiente de la especificación. Si hay necesidad de
proporcionar un subconjunto de la funcionalidad del módulo completo, a continuación se crea un
módulo básico con el prefijo básico añadido al nombre del módulo. Por ejemplo, el "Módulo Básico
de Texto" es un subconjunto del "Módulo de Texto".
131

10.15.2. Colecciones de elementos y atributos


La mayoría de los módulos definen una colección con nombre de elementos o atributos. Estas
colecciones se utilizan como un atajo para describir el conjunto de atributos permitidos en un
determinado elemento o el conjunto de elementos permitidos como hijos de un determinado
elemento. Todas las colecciones tienen nombres que comienzan con un carácter en mayúscula.
Al definir un perfil, se supone que todos las colecciones de elementos y atributos se definen como
vacíos. De esta forma, un módulo puede redefinir la colección ya que se incluye en el perfil,
mediante la adición de elementos o atributos para ponerlos a disposición en el perfil. Por lo tanto,
no es un error referirse a una colección de elementos o atributos de un módulo que no está incluido
en el perfil, ya que simplemente significa que la colección está vacía.
La excepción a esto es la colección Presentation.attrib, que es la unión de todas las colecciones de la
presentación de atributo. Presentation.attrib no se define en cualquier módulo, pero existe en todos
los perfiles.
Un módulo subconjunto puede definir una colección diferente con nombre de un módulo de
superconjunto. Dado que es un error de incluir un subconjunto y el módulo superconjunto del
mismo grupo en un perfil, todos las colecciones de atributos y elementos o bien se definirán una vez
por módulo que los incluya, o tendrán su valor predeterminado vacío.

10.15.3. Objetos gráficos


Con cualquier gramática XML, el examen tiene que tener en cuenta qué es exactamente lo que se
está modelando. Para los formatos de texto, el modelado es normalmente a nivel de párrafos y
frases, mas que nombres individuales, adverbios, o fonemas. Del mismo modo, SVG modela los
gráficos SVG a nivel de objetos gráficos en lugar de puntos individuales.
SVG proporciona un elemento general de ruta, que puede ser usado para crear una gran variedad de
objetos gráficos, y también proporciona formas básicas comunes como rectángulos y elipses. Estos
son convenientes para la codificación manual y pueden ser utilizados en la misma forma que el
elemento más general de ruta. SVG permite un control preciso sobre el sistema de coordenadas en
el que se definen los objetos gráficos y las transformaciones que se aplicarán durante la
renderización.

10.15.4. Símbolos
Habría sido posible definir algunos símbolos estándar que el SVG pudiera aportar. Pero ¿cuáles?
Siempre habría símbolos adicionales para la electrónica, la cartografía, los diagramas de flujo, etc,
que la gente necesitaría que no se han previsto hasta que la siguiente versión. SVG permite a los
usuarios crear, reutilizar y compartir sus propios símbolos, sin necesidad de un registro
centralizado. Las comunidades de usuarios pueden crear y perfeccionar los símbolos que necesitan,
sin tener que pedirlo a una comisión. Los diseñadores pueden estar seguros de la apariencia gráfica
de los símbolos que utilizan y no tienen que preocuparse por los símbolos no soportados.
Los símbolos pueden ser utilizados en diferentes tamaños y orientaciones, y pueden ser rediseñados
para encajar en el resto de la composición gráfica.

10.15.5. Efectos raster


Muchos gráficos Web existentes utilizan las operaciones de filtrado para encontrar paquetes de
pintura para crear manchas, sombras, efectos de iluminación, etc. Con la rasterización del lado del
cliente utilizada con los formatos vectoriales, estos efectos podrían considerarse imposible. SVG
132

permite la especificación declarativa de los filtros, ya sea solos o en combinación, que se pueden
aplicar en el lado cliente cuando el SVG se renderiza. Estos se especifican de forma que los gráficos
siguen siendo escalables y visualizables con diferentes resoluciones.

10.15.6. Fuentes
La riqueza gráfica del material depende en gran medida del tipo de letra utilizado y la distancia
exacta de los glifos. En muchos casos, los diseñadores convierten el texto en contornos para evitar
cualquier problema de sustitución de fuentes. Esto significa que el texto original no está presente y
por lo tanto no es accesible ni se pueden hacer búsquedas. En respuesta a los comentarios de los
diseñadores, SVG incluye elementos de fuente para que se conserven tanto el texto y como el
aspecto gráfico.

10.15.7. Animación
La animación se puede producir a través de la manipulación basada en scripts del documento, pero
los scripts son difíciles de editar e intercambiar entre las herramientas de creación. Una vez más en
respuesta a los comentarios de la comunidad del diseño, el SVG incluye elementos de animación
declarativos que fueron diseñados en colaboración por el SVG y los Grupos de Trabajo SYMM.
Esto permite que los efectos de animación comunes en los gráficos Web existentes se expresen en
SVG.
133

11.Formatos de sonido digital


Un formato de fichero de audio es un formato de fichero para almacenar audio en un ordenador. La
propuesta general está orientada hacia el audio digital y consiste en muestrear el voltaje de audio
que correspondería a una determinada posición de la membrana en un altavoz de canales
individuales con una determinada resolución, número de bits por muestra, en intervalos regulares. A
continuación estos datos se pueden almacenar descomprimidos o comprimidos con el fin de reducir
el tamaño del fichero.

11.1. Digitalización del sonido


La digitalización de sonido real se realiza mediante la conversión de la señal analógica proveniente
de un micrófono a una señal digital. Así el convertidor analógico/digital toma muestras del sonido
con una determinada frecuencia, que convierte en números que después son almacenados en el
ordenador.
Para medir la calidad del muestreo, debemos referirnos a dos parámetros: la frecuencia de muestreo
y la resolución:
• La frecuencia de muestreo se refiere al número de veces en que se divide la muestra sonora
por segundo. Cuanto mayor sea esta frecuencia, más parecido será el resultado obtenido al
sonido original. Dado que el oído humano es capaz de escuchar sonidos en el rango de 20 a
20.000 Hertzios, aproximadamente, se ha elegido como frecuencia de muestreo más
adecuada, la de 44,1 Khz., es decir, aproximadamente el doble de la frecuencia más aguda
que podemos escuchar. Esto significa que el convertidor analógico-digital mide los niveles
del sonido 44.100 veces por segundo. Si reducimos la frecuencia de muestreo, podemos
apreciar que el sonido es menos nítido, más apagado, porque perdemos frecuencias agudas.
• El nivel de muestreo o cuantificación del sonido asigna a cada una de las muestras
anteriormente tomadas un nivel de sonido mediante cifras de 1 y 0. Se mide en bits: si la
resolución es de 8 bits tenemos 256 niveles posibles. Silo ampliamos a 16 bit, cada medida
puede estar en un rango de 0 a 65.535.

11.2. Tipos de formatos


Es importante distinguir entre un formato de fichero y un códec. Un códec realiza la codificación y
la decodificación de los valores de voltaje de audio mientras que los propios datos se almacenan en
un fichero con un determinado formato. La mayoría de los formatos de audio documentados
públicamente se pueden crear con uno o más codecs. Aunque la mayoría de los formatos de fichero
audio soporta solo un tipo de datos de audio, los creados con el codificador de audio, como MKV o
AVI, pueden soportar varios tipos de datos de audio.
Hay tres grupos principales de formato de audio:
• Formatos de audio sin compresión
• Formatos con compresión sin pérdidas y
• Formatos con compresión y con pérdidas

11.3. Formatos de audio sin compresión


Se trata de formatos que almacenan la señal de audio codificada sin ningún tipo de compresión. Los
más importantes son:
• Formato MIDI. Se detalla más adelante.
134

• Formato WAV. Se detalla más adelante.


• Formato RA (Real Audio). Se detalla más adelante.
• Formato PCM. Es el principal formato de audio sin comprimir que normalmente se
almacena con la extensión .wav en Windows o con la .aiff en Mac OS.
• Formato AU. Es el formato estándar de fichero de audio usado por Sun, Unix y Java. El
audio en los ficheros AU puede ser PCM o comprimido con codecs μ-ley, a-ley o G729.
• Formato BWF (Broadcast Wave Format). Es un formato de audio estándar creado por la
European Broadcasting Union (http://www.ebu.ch) como sucesor del formato WAV. El
formato BWF permite que se almacenen metadatos en el fichero. Este es el formato básico
de grabación que se utiliza en muchas estaciones de audio profesionales en la televisión y la
industria del cine. Los ficheros con formato BWF incluyen una referencia de marca de hora
estándar que permite una fácil sincronización con un elemento separado del audio.
• Formato DCT. Un formato variable de fichero de códec de audio diseñado para el dictado
por NCH Software. Tiene información de cabecera del dictado y se puede encriptar. A
menudo requerido por las leyes de confidencialidad médica. El reproductor estándar es el
Express Scribe Transcripción Player.
• Formato VOX. Este formato utiliza normalmente el códec Dialogic ADPCM (Adaptive
Differential Pulse Code Modulation) y es de código abierto. Los ficheros de formato VOX
son similares a los ficheros WAV salvo que los ficheros VOX no contienen información
sobre las características del audio como la tasa de muestreo y el número de canales. El VOX
es un formato de fichero de audio optimizado para el almacenamiento de datos digitalizados
de voz con un muestreado de baja velocidad. Los ficheros VOX se encuentran normalmente
en aplicaciones de telefonía. Similar a otros formatos ADPCM (Adaptive diferencial Pulse
Code Modulation), el Dialogic ADPCM comprime los datos de audio en una serie de
muestras de 4 bits. Los ficheros Dialogic ADPCM pueden tener un muestreado de 6000 o
8000 muestras por segundo, pero lo más habitual son 8000 muestras por segundo (8000Hz).
• Formato AIFF (Audio Interchange File Format) es un formato de almacenamiento de audio
digital estándar. El formato fue desarrollado por Apple Computer en el año 1988 basándose
en el formato IFF (Interchange File Format) usado de forma amplia en los sistemas Amiga.
Los datos de audio en este formato estándar no están comprimidos y usan PCM (Pulse-Code
Modulation). También hay una variante con compresión conocido como formato AIFF-C o
AIFC, con varios codecs de compresión. El estándar AIFF es un formato importante para las
aplicaciones de audio y de vídeo a nivel profesional. Al igual que cualquier formato sin
compresión, utiliza mucho más espacio en disco que MP3, aproximadamente 10MB para un
minuto de audio estéreo con una frecuencia de muestreo de 44,1 kHz y un tamaño de
muestra de 16 bits. Además de los datos de audio, el formato AIFF puede incluir datos del
punto de bucle del punto y la nota musical de una muestra para uso de las aplicaciones
musicales. La extensión del fichero para el formato estándar AIFF es .aif y .aiff. Para las
variantes comprimidas se supone que es . aifc, pero también se aceptan . aiff o .aif por las
aplicaciones que soportan el formato.

11.4. Formatos de audio con compresión sin pérdidas


Un formato de audio con compresión sin pérdidas requiere más tiempo de procesamiento que un
formato sin comprimir, pero es más eficiente en cuanto al uso del espacio.
Los formatos de audio sin comprimir codifican el sonido y el silencio con el mismo número de bits
por unidad de tiempo. La codificación de un minuto de absoluto silencio sin comprimir produce un
fichero del mismo tamaño que la codificación de un minuto sin comprimir de la música de una
orquesta sinfónica. Sin embargo, en un formato de compresión sin pérdidas, la música ocuparía un
fichero sensiblemente más pequeño y el silencio casi no conllevaría espacio en absoluto.
135

Los formatos más importantes son:


• Formato WMA (Windows Media Audio). Se detalla más adelante.
• Formato APE (Monkey's Audio). Se detalla más adelante.
• Códec FLAC (Free Lossless Audio Codec) es un códec de audio de compresión sin pérdidas
de datos, principalmente escrito por Josh Coalson. El formato FLAC realiza la compresión
de datos sin sacrificar la integridad de la fuente de audio, ya que no se descarta ninguna
parte de los datos. Una grabación de audio digital convertido a formato FLAC puede ser
descomprimida en una copia idéntica de los datos originales de audio. Las fuentes de audio
codificadas a formato FLAC suelen ser reducidos a un 50-60% de su tamaño original. El
formato FLAC es de naturaleza abierta y es código libre lo que hace que sea bien soportado
por muchas aplicaciones de software.
• Formato WV (WavPack). Es un formato de audio comprimido sin pérdidas. Es de código
abierto y desarrollado por David Bryant. El formato WV soporta sonido envolvente y tasas
de muestreo de alta frecuencia. Al igual que otros esquemas de compresión sin pérdidas, la
tasa de reducción de datos varía según la fuente, pero por lo general entre un 30% y un 70%
para la música popular y un poco mejor que el de la música clásica y otras fuentes con
mayor rango dinámico. WavPack también incorpora un modo híbrido que sigue ofreciendo
las características de compresión sin pérdidas, pero que crea dos ficheros: uno relativamente
pequeño y de alta calidad con pérdidas que puede ser utilizado por sí mismo, y un fichero de
corrección (. wvc) que, al combinarse con el fichero con pérdidas, prevé la restauración
completa sin pérdidas. Esto permite la utilización de codecs con pérdidas y sin pérdida de
forma indistinta. Esta característica híbrida también es ofrecida por OptimFROG
DualStream y MPEG-4 SLS.
• Formato ALAC/Apple Lossless. Es un códec de audio desarrollado por Apple Inc. para
compresión sin pérdidas de datos de música digital. Los datos de Apple Lossless se
almacena en un contenedor MP4 con la extensión. M4a. No es una variante del AAC, pero
utiliza la predicción lineal similar al de otros códecs sin pérdida como FLAC y Shorten.
Todos los reproductores iPod actuales pueden reproducir los ficheros Apple Lossless. Apple
indica que los ficheros de audio comprimidos con su códec de compresión sin pérdidas
necesitará aproximadamente la mitad del espacio de almacenamiento que requeriría sin
compresión. Además, la velocidad a la que se puede descodificar, lo hace útil para un
dispositivo con potencia limitada como el iPod. El codificador Apple Lossless se introdujo
como un componente de QuickTime 6.5.1 el 28 de Abril de 2004 y también en iTunes 4.5 y
versiones posteriores. El códec se utiliza también en la aplicación AirTunes de AirPort
Express.
• Formato SHN (Shorten). Es un formato de fichero optimizado para comprimir datos de
audio, principalmente ficheros de audio de calidad de CD (44.1 kHz 16-bit estéreo PCM).
Shorten ya no se desarrolla y ha sido reemplazado por codecs como FLAC, MPEG-4 ALS,
Monkey's Audio (APE), TTA, y WavPack (WV). Sin embargo Shorten sigue siendo un
formato habitual debido a la gran cantidad de grabaciones de conciertos legalmente
comercializados que circulan y están codificados como Shorten. Debido a que es un formato
sin pérdidas, estos ficheros pueden ser codificados y descodificados con codecs más nuevos
y más eficaces sin ningún tipo de pérdida. Las extensiones de los ficheros Shorten es .shn.
• Formato TTA. Es un códec gratuito de audio de compresión sin pérdidas en tiempo real,
basado en filtros adaptativos. Su extensión es .tta cuando se crea con el códec True Audio.
El formato TTA realiza la compresión sin pérdidas sobre datos multicanal de 8, 16 y 24 bits
de ficheros wav sin comprimir. La relación de compresión de TTA depende del tipo de
fichero de música que se comprime, pero después de la compresión el tamaño del fichero de
salida por lo general oscilan entre 30% - 70% del original. El formato TTA soporta las
etiquetas de información ID3 v1 y ID3 v2.
136

• Codificación ATRAC (Adaptive Transform Acoustic Coding) es una familia de algoritmos


propietarios de compresión de audio desarrollados por Sony. MiniDisc fue el primer
producto comercial en incorporar ATRAC en 1992. La codificación ATRAC permitía que un
disco relativamente pequeño como el MiniDisc tuviera el mismo tiempo de ejecución que un
CD mientras almacenaba la información de audio con una mínima pérdida de calidad
perceptible. Hoy ATRAC se utiliza en muchos reproductores de audio marca Sony. Las
mejoras en el códec en forma de ATRAC3, ATRAC3plus y ATRAC Advanced Lossless han
aparecido en los años 1999, 2002 y 2006, respectivamente. Otros fabricantes de MiniDisc
como Sharp y Panasonic también implementaron sus propias versiones del códec ATRAC.
El esquema híbrido de compresión sin pérdidas ha sido añadido a la familia ATRAC en 2006

11.5. Formatos de audio con compresión con pérdidas


Se trata de formatos que almacenan la señal de audio codificada con un algoritmo de compresión,
que con el fin de conseguir un fichero de menor tamaño, no permite que su descodificación pueda
obtener un fichero idéntico al original. Esto conlleva unas pérdidas, que pueden ser más o menos
audibles, cuando se reproduce el fichero de audio. Los más importantes son:
• Formato MP2/MP3. Se detalla más adelante.
• Formato WMA (Windows Media Audio). Se detalla más adelante.
• Foramto OGG (Vorbis). Se detalla más adelante.
• Formato MPC (Musepack). Antiguamente conocido como MPEGplus, MPEG+ o MP+. Es
un códec de audio abierto con pérdidas, especialmente optimizado para la compresión
transparente de audio estéreo en tasas de 160-180 kbps. Musepack y Ogg Vorbis están
clasificados como los dos mejores codecs disponibles para la compresión de alta calidad con
pérdidas de audio en muchas pruebas. Sin embargo Musepack es aún menos popular que
Ogg Vorbis.
• Formato AAC (Advanced Audio Coding). Debido a su excepcional rendimiento y la
calidad, la codificación de audio avanzada (AAC) se encuentra en el núcleo del MPEG-4,
3GPP y 3GPP2, y es el códec de audio de elección para Internet, conexiones inalámbricas y
de radio difusión digital. El AAC utiliza una frecuencia de bits variable (VBR), un método
de codificación que adapta el número de bits utilizados por segundo para codificar datos de
audio, en función de la complejidad de la transmisión de audio en un momento determinado.
AAC es un algoritmo de codificación de banda ancha de audio que tiene un rendimiento
superior al del MP3, que produce una mejor calidad en ficheros pequeños y requiere menos
recursos del sistema para codificar y descodificar. Este códec está orientado a usos de banda
ancha y se basa en la eliminación de redundancias de la señal acústica, así como en el uso de
compresión mediante MDCT (Modified Discrete Cosine Transform), muy parecido al del
MP3.
• Formato 3GP. Es un formato contenedor usado por teléfonos móviles para almacenar
información de medios múltiples (audio y vídeo). Este formato de fichero, creado por 3GPP
(3rd Generation Partnership Project), es una versión simplificada del "ISO 14496-1 Media
Format", que es similar al formato de Quicktime. 3GP guarda vídeo como MPEG-4 o H.263.
El audio es almacenado en los formatos AMR-NB o AAC-LC.
• Formato DSS (Digital Speech Standard). Es un formato propietario de Olympus. Es un
códec muy antiguo y pobre. Es preferible GSM o MP3 si el grabador lo soporta. Permite
almacenar los datos adicionales en la cabecera del fichero.
• Formato AC3. También llamado formato Dolby Digital, es una versión que contiene hasta
seis canales independientes de sonido, con cinco canales para los altavoces de rango normal
(20 Hz - 20.000 Hz) (delantero derecho, central, posterior izquierdo frontal, derecho e
izquierdo posterior) y un canal (20 Hz - 120 Hz) para el subwoofer para los efectos de baja
frecuencia. También son soportados los modos mono y estéreo. El formato AC3 soporta
137

tasas de muestreo de hasta 48 kHz.


• Formato AMR. El códec de audio AMR (Adaptive Multi-Rate) es un esquema de audiop
comprimido patentado optimizado para voz. AMR fue adoptado como un códec estándar de
voz por 3GPP en Octubre de 1998 y es ampliamente utilizado en GSM y UMTS. Utiliza la
adaptación del enlace para seleccionar uno de los ocho diferentes tasas de bits basado en las
condiciones de enlace. Muchos teléfonos modernos de telefonía móvil le permitirá
almacenar grabaciones cortas en el formato AMR, con programas de código abierto y
comerciales que convierten entre éste y otros formatos, como el MP3, aunque hay que
recordar que AMR es un formato para voz y para el otro tipo de audio no es muy
recomendable. La extensión del fichero es .amr.

11.6. Codificadores
Todas las aplicaciones que graban sonidos, deben incorporar los codificadores necesarios para los
formatos de salida. Así cada aplicación cuando se guarda una grabación, visualizará aquellos
formatos de salida que incorpora. Algunas aplicaciones permite añadir otros codificadores para
ampliar la gama de formatos de salida. Todas las aplicaciones de edición de sonido digital también
están en esta tesitura.
La razón por la que codifican unos formatos y no todos, es porque hay formatos propietarios y que
por lo tanto para poderlos incorporar se tienen que pagar las licencias correspondientes.

11.7. Descodificadores
En cuanto a los descodificadores, los requieren todas las aplicaciones que reproducen los sonidos,
que están almacenados en formato digital. También en este caso, los reproductores necesitan el pago
de licencias para poder reproducir los formatos propietarios.
Así no todos los reproductores permiten el acceso a todos los formatos, aunque hay reproductores
que permiten añadir descodificadores una vez instalado el reproductor.

11.8. Formato MIDI


El formato MIDI (Musical Instrument Digital Interface) es un protocolo de comunicación estándar
utilizado para combinar datos entre sintetizadores, programas, procesadores de efectos y otros
dispositivos MIDI.
La tecnología MIDI fue estandarizada y es gestionada por la MMA (MIDI Manufacturers
Association) (http://www.midi.org). Todos los estándares oficiales MIDI son desarrolados
conjuntamente y publicados por el MMA en USA, y en el Japón, el AMEI (MIDI Committee of the
Association of Musical Electronic Industry). A finales de la década de 1970, los dispositivos
electrónicos musicales eran cada vez más comunes y asequibles. Sin embargo generalmente los
dispositivos de diferentes fabricantes no eran compatibles entre sí y no podía ser
interconectados. Los diferentes modelos de interfaz incluídos los voltajes de control en los distintos
estándares, así como otras cuestiones técnicas. En 1981, el ingeniero de sonido y diseñador de
sintetizadores Dave Smith de Sequential Sequential Circuits, Inc. propuso un estándar digital para
los instrumentos musicales en un documento para la Audio Engineering Society. La especificación
MIDI 1.0 se publicó en Agosto de 1984.
Este es el formato más usado en la composición musical y tiene generalmente la extensión mid. El
fichero contiene información de secuenciado, es decir, acerca de cuando tocar que instrumento y de
que forma, y dependiendo del hardware, el sonido puede ser excelente o bien por debajo de lo
aceptable.
El estándar MIDI se remonta al año 1983 y fue tal su éxito que se mantiene con pocos cambios
desde entonces. Su meta inicial era conseguir que desde un teclado central se pudieran controlar
138

distintos instrumentos musicales electrónicos interconectados, pero con el uso de los ordenadores, el
MIDI se convierte además en una herramienta para distintas aplicaciones musicales: ayuda a la
composición, docencia, edición de partituras, etc.
Su velocidad de transmisión es de 31,25 Kbaudios. Los dispositivos MIDI tienen una interfaz
responsable de enviar y recibir los mensajes MIDI, que suele contar con tres conectores: MIDI OUT
que emite mensajes MIDI, MIDI IN que recibe mensajes MIDI y MIDI THRU que reenvía la
información que llega al MIDI IN y sirve para conectar más de dos dispositivos MIDI.
Los tres son conectores DIN hembra de 5 pins. Los cables MIDI siempre conectan el MIDI OUT o
el MIDI THRU de un dispositivo con el MIDI IN de otro, y no deben tener una longitud superior de
15 metros. Los mensajes MIDI se generan habitualmente en un teclado y envían las órdenes al
módulo sintetizador para activar una nota o desactivarla. Un secuenciador es un dispositivo capaz
de grabar, editar y reproducir mensajes MIDI.
En cuanto a los canales, cada canal MIDI permite implementar un instrumento virtual diferente, así
en un sintetizador, hay el concepto de la capacidad polifónica y el de la capacidad multitímbrica.
Los sintetizadores MIDI suelen tener una polifonía de 32 o más notas, y una capacidad
multitímbrica de hasta 16.
Los mensajes MIDI están formados por un octeto de estado que tiene siempre el bit más
significativo a 1, los tres bits siguientes codifican el tipo de mensaje y los cuatro bits menos
significativos codifican el canal. A continuación uno o dos octetos de datos, según el tipo de
mensaje y con bit más significativo a cero.
Hay ocho tipos de mensajes: Note On, Note Off, Polyphonic Aftertouch, Control Change, Channel
Aftertouch, Pitch Bend, Program Change y System Message. Los siete primeros se llaman
genericamente mensajes de canal, porque actúan sobre un único canal a la vez.
Los mensajes de sistema (Message System) tiene una estructura diferente y no se aplican a ningún
canal en concreto. Su octeto de estado comienza por 1111 y los otros cuatro bits definen el tipo de
mensaje de sistema. Son 16 en total y se clasifican en tres grupos: comunes, de tiempo real y
exclusivos.
Un dispositivo MIDI no tiene porque generar o entender todos los tipos de mensajes. Cuando un
dispositivo MIDI recibe un mensaje que no entiende, simplemente lo ignora y lo reenvía por el
puerto MIDI THRU.

Almacenamiento de los ficheros MIDI


En un fichero MIDI la información se almacena conforme a la estructura de un fichero RIFF, pero
al igual que dicha estructura, también existen bloques, con un identificador y una longitud, cada uno
de los cuales contiene una determinada información. A diferencia de lo que ocurre en un fichero
RIFF, un bloque de un fichero MIDI no puede a su vez contener otros bloques. Detrás del
identificador del bloque, en forma del código de cuatro letras, encontraremos un número de 32 bits,
indicando la longitud del bloque, sin contar el número de octetos que ocupan el código y este
mismo número.

El bloque de cabecera
Este bloque cuenta siempre con seis octetos de información, divididos en tres palabras. La primera
de ellas indica el formato de fichero MIDI de los tres posibles, la segunda contiene el número de
pistas existentes, y la tercera el número de ticks por cuarto de nota o negra, dato fundamental para
conocer la velocidad de ejecución de la composición.
139

El tipo de fichero MIDI puede ser 0, 1 ó 2, según que en él exista una sola pista, existan varias que
han de reproducirse de forma síncrona o simultánea, o bien existan varias pistas que se han de
reproducir de forma asíncrona o secuencial.
Obviamente el tipo más simple de fichero MIDI es el de tipo 0, ya que en él tan sólo existe una pista
MIDI, conteniendo los eventos de la composición. Sin embargo no es éste el formato más habitual,
ya que normalmente en un fichero se utilizan varias pistas separadas para contener distintas voces
de la composición.
El número de pistas existentes en el fichero es un dato fundamental para completar la lectura de la
información, almacenando los eventos de cada pista en un bloque que posteriormente usaremos para
la reproducción.

Bloques de pistas
Tras la cabecera del fichero, encontramos una o más pistas, cada una de las cuales se inicia con un
código de cuatro caracteres Mtrk y un número de 32 bits especificando la longitud del bloque.
Detrás del bloque de cabecera se encuentra la primera pista, que tiene una longitud variable en
octetos. En la pista encontraremos principalmente eventos MIDI, estando cada uno de ellos
precedido de una cantidad de tiempo, expresada en ticks, que ha de transcurrir desde el evento
anterior. Esto permite optimizar la ocupación total del fichero.
Existen dos tipos de eventos: los metaeventos y los eventos propiamente dichos. Un metaevento
siempre comienza con el octeto FF, que irá seguido de uno o dos octetos que identifican el
metaevento y adicionalmente con otros octetos de datos si son necesarios. Generalmente un
metaevento hace referencia a una pista o a la composición completa, y no va dirigido a un canal
MIDI en concreto. Los eventos MIDI definen la composición propiamente dicha, con
modificaciones de controles, activación y desactivación de notas.

11.9. Formato WAV


El formato WAV (Waveform Audio File) es un formato de codificación de audio digital promovido
por Microsoft e IBM. Tiene la extensión wav. Su flexibilidad hace de este formato una opción muy
adecuada para el tratamiento del sonido, debido a que puede ser comprimido y grabado con distintas
calidades y tamaños.
El formato WAV está formado por los siguientes bloques:
– Bloque de formato. Obligatorio. Este bloque está identificado por las tres letras fmt y
contiene unos campos comunes a todos los formatos y unos campos específicos de cada tipo
de formato.
– Bloque de hechos. Opcional. En este bloque se almacena la información complementaria de
los fichero wave y es un bloque obligatorio si los datos muestreados están incluidos en un
bloque lista o si se ha realizado compresión de los datos.
– Bloque de pistas. Opcional.
– Bloque lista. Opcional.
– Bloque lista datos asociados. Opcional.
– Bloque de datos. Obligatorio. Cada muestra de sonido digitalizada a 8 bits se almacenará
como un octeto sin signo y los sonidos de 16 bits se representan como un doble octeto con
signo.
140

11.10. Formato MP2/MP3


Este formato fue desarrollado por MPEG (Motion Picture Experts Group) como un estándar ISO
(International Organization for Standardization) para la compresión de alta fidelidad del audio
digital. El estándar de compresión del audio de MPEG es una parte del estándar con múltiples
partes que especifica la compresión de vídeo (11172-2), la compresión de audio (11172-3), y la
sincronización del audio, del vídeo, y de los flujos de datos relacionados (11172-1) a una tasa
agregada de aproximadamente 1,5 Mbps. El estándar de audio de MPEG también se puede usar
para las aplicaciones de solo audio para comprimir los datos de audio de alta fidelidad a tasas
mucho más bajas.

El audio con formato MPEG es un estándar genérico de compresión de audio. A diferencia de los
codificadores específicos de voz que se especializan en las señales vocales, el codificador de audio
de MPEG consigue su compresión sin tener en cuenta la naturaleza de la fuente acústica. En
cambio el codificador explota las limitaciones de la percepción del sistema auditivo humano.
Mucha compresión es consecuencia de la eliminación de las partes irrelevantes de la señal de audio
desde el punto de vista de la percepción. La eliminación de estas partes genera distorsiones
inaudibles, así el audio de MPEG puede comprimir cualquier señal que pueda ser oída por los oídos
humanos. Debido a su naturaleza genérica, el audio de MPEG ofrece distintas clases de modos de
compresión:
• La tasa de muestreo puede ser de 32, 44,1, o 48 kHz.
• El flujo comprimido puede soportar uno o dos canales de audio, lo que da lugar a 4 posibles
modos:
1. modo monofónico para un único canal de audio,
2. modo dual-monofónico para dos canales de audio independientes. Funcionalmente es
idéntico al modo estéreo,
3. modo estéreo para canales estéreos con bits compartidos entre los canales, pero sin
codificación joint-stereo, y
4. modo joint-stereo que toma ventaja de las correlaciones entre los canales estéreo o de la
irrelevancia de la diferencia de fases entre canales , o ambos.
• El flujo comprimido puede tener una de las tasas predefinidas desde 32 a 224 kbps por canal.
Dependiendo de la tasa de muestreo, esto se traduce en factores de compresión de 2,7 a 24. Además
el estándar provee un modo de tasa libre para que se puedan soportar otras tasas distintas de las
predefinidas.
• El audio con formato MPEG ofrece tres niveles independientes de compresión. Esto permite
negociar entre la complejidad del códec y la calidad del audio comprimido:
• Layer I es la opción más simple y es la mejor para tasas de bit por encima de 128 kbps por
canal. Por ejemplo el Digital Compact Cassette de Philips utiliza la compresión Layer I a
192 kbps por canal.
• Layer II tiene una complejidad intermedia y está dirigida a una tasa de bit de alrededor de
128 kbps por canal.
• Layer III es la opción más compleja pero ofrece la mejor calidad de audio, particularmente
para tasas de bit alrededor de 64 kbps por canal.
Los tres niveles son lo suficientemente simples para permitir implementaciones de un decodificador
en tiempo real con un solo chip.
• El flujo de bits codificado admite una opción de código de detección de errores con redundancia
cíclica (CRC).
• El audio con formato MPEG proporciona un medio de inclusión de datos auxiliares dentro del
flujo de bits. Además el flujo de bits tiene funciones como la de acceso aleatorio, el avance rápido
de audio y la posible reversión de audio.
141

De la misma forma que el formato MPEG-1 Audio Layer 2 se le conoce popularmente como MP2,
el formato MPEG-1 Audio Layer 3 se le conoce como MP3.
El Layer II, conocido también como MP2 o MUSICAM, es un formato de audio con pérdidas
diseñado para proporcionar alta calidad a 192 kbps para un sonido estéreo. La descodificación del
audio MP2 es computacionalmente simple, en relación con los formatos MP3, AAC, etc
El estándar MPEG-2 incluye varias extensiones al audio MPEG-1. Estas son conocidos como
MPEG-2 BC y son compatibles con el audio MPEG-1. El audio de MPEG-2 se define en la norma
ISO/ IEC 13818-3
• MPEG Multicanal – Compatible con el sonido surround de canal 5.1.
• Tasa de muestreo: 16000, 22050, y 24000 Hz
• Tasas de bits: 8, 16, 24, 40, 48, y 144 kbit/s

Codificación
El estándar MPEG-1 no incluye una especificación precisa para un codificador de MP3, pero
proporciona modelos psicoacústicos como por ejemplo la tasa de bucle y similares en la parte no
normativa del estándar original. Se suponía que los implementadores del estándar diseñarían sus
propios algoritmos adecuados para la eliminación de aquellas partes de la información de la entrada
de audio. Como resultado, hay disponibles muchos codificadores MP3 diferentes, cada uno
generando ficheros de distinta calidad. Las comparaciones están ampliamente disponibles, por lo
que es fácil para un usuario investigar la mejor opción. Hay que tener en cuenta que un codificador
LAME que es experto en codificación a velocidades altas de bits, no es necesariamente tan bueno a
velocidades bajas de bits.
Durante la codificación, se toman 576 muestras de dominio del tiempo y se transforman en 576
muestras de dominio de frecuencia. Si hay un transitorio, se toman 192 muestras en lugar de 576.
Esto se hace para limitar la propagación temporal del ruido que acompaña al transitorio.

Descodificación
La descodificación está cuidadosamente definida en el estándar. La mayoría de los descodificadores
son 'bitstream compliant', es decir, la salida descomprimida del fichero MP3 será igual dentro de un
determinado grado de tolerancia de redondeo que la salida especificada matemáticamente en el
estándar ISO/IEC 11172-3. Por lo tanto, la comparación de los decodificadores se basa
generalmente en cuanto a su eficiencia desde el punto de vista de consumo de recursos de CPU.

Calidad del audio


Cuando se realiza la codificación de audio con pérdidas, como la creación de un fichero MP3, existe
una negociación entre la cantidad de espacio utilizado y la calidad del sonido del resultado.
Normalmente, el codificador se permite establecer una velocidad de bits, que especifica cuantos
kilobits por segundo de audio puede utilizar el fichero. Si se utiliza una tasa inferior de bits, la
calidad de audio es menor pero el tamaño del fichero es más pequeño. Del mismo modo, utilizando
una tasa más alta de bits, se genera una calidad de audio superior, aunque el tamaño del fichero es
más grande.
Los ficheros codificados con una velocidad baja de bits en general se reproducirán con una calidad
inferior. Con una tasa muy baja de bits, los defectos de compresión, es decir, los sonidos que no
estaban presentes en la grabación original, pueden ser audibles en la reproducción. Algunos ficheros
de audio son difíciles de comprimir debido a su aleatoriedad y a sus ataques de agudos. Cuando este
tipo de audio se comprime, se escuchan normalmente defectos como tintineo o pre-eco. Una
142

muestra comprimida de aplausos con una tasa baja de bits es un buen ejemplo de generación de
defectos de compresión.
Además de la velocidad de bits de una pieza de audio codificada, la calidad de los ficheros MP3
también depende de la calidad del propio codificador, y la dificultad de la señal codificada. Como el
estándar MP3 permite un poco de libertad con los algoritmos de codificación, los distintos
codificadores pueden tener calidades muy diferentes, incluso con velocidades idénticas. Como
ejemplo, en una prueba de audición pública con dos codificadores diferentes MP3 y con 128 kbps,
uno alcanzó un 3,66 en una escala de 1-5, mientras que el otro logró sólo 2,22.
La calidad es dependiente de la elección del codificador y de los parámetros de codificación. Sin
embargo, en el año 1998, el formato MP3 a 128 kbps proporcionaba una calidad equivalente al
formato AAC a 64 kbps y al MP2 a 192 kbps.
El tipo más simple de ficheros MP3 utiliza una tasa de bit igual para todo el fichero, lo que se
conoce como codificación CBR (Constant Bit Rate). La utilización de una tasa de bit constante hace
más simple y más rápida la codificación. Sin embargo también es posible crear ficheros donde la
tasa de bit cambie a lo largo del fichero. Esto se conoce como ficheros VBR (Varianle Bit Rate). La
idea detrás de esto es que, en cualquier pieza de audio, algunas partes serán mucho más fácil de
comprimir, como el silencio o la música que contiene sólo unos pocos instrumentos, mientras que
otros serán más difíciles de comprimir. Por lo tanto, la calidad general del fichero puede ser
aumentada usando una tasa baja de bit para los pasajes menos complejos y una mayor para las
partes más complejas. Con algunos codificadores, es posible especificar una determinada calidad, y
el codificador puede variar la tasa de bit de acuerdo con la calidad establecida. Los usuarios que
conocen un determinado valor de calidad que es transparente para sus oídos, pueden utilizar este
valor cuando se codifica toda su música, y no necesitan preocuparse acerca de la realización
personal de pruebas de audición en cada pieza de música para determinar la tasa de bit correcta.
La calidad percibida puede ser influenciada por el ruido ambiente, la atención del oyente, y el
entrenamiento del oyente y en la mayoría de los casos por el equipo de audio del oyente como
tarjetas de sonido, altavoces y auriculares.
Una prueba hecha a los nuevos estudiantes por el profesor de música Jonathan Berger de la
Universidad de Stanford mostró que la preferencia de los estudiantes por la música con calidad
MP3 aumenta año a año.

Tasa de bit
Se especifican las siguientes tasas de bit en el estándar MPEG-1 Audio Layer III: 32, 40, 48, 56, 64,
80, 96, 112, 128, 160, 192, 224, 256 y 320 kbps, y la frecuencia de muestras disponibles son 32,
44,1 y 48 kHz. Extensiones adicionales se han definido en MPEG-2 Audio Layer III: tasas de bit de
8, 16, 24, 32, 40, 48, 56, 64, 80, 96, 112, 128, 144, 160 kbps y frecuencias de muestreo de 16, 22,05
y 24 kHz.
Casi siempres se utiliza una frecuencia de muestreo de 44,1 kHz, ya que también se usa para los CD
de audio, la principal fuente utilizada para la creación de ficheros MP3. La tasa de bit más utilizada
en Internet es la de 128 kbps, que ofrece una calidad de audio adecuada en un espacio relativamente
pequeño. Debido a que la disponibilidad de ancho de banda de Internet y los tamaños de disco duro
se han incrementado, se están popularizando las tasas de bit a 160 y 192 kbps.
El audio sin comprimir como se almacena en un CD de audio tiene una tasa de bits de 1411,2 kbps,
por lo que las tasas de bits 128, 160 y 192 kbps, representan relaciones de compresión de
aproximadamente 11:1, 9:1 y 7:1 respectivamente.
Con el codificador LAME, se pueden lograr tasas de bits no estándar de hasta 640 kbps con la
opción de formato libre, aunque pocos reproductores de MP3 puede reproducir estos ficheros. De
143

acuerdo con el estándar ISO, los descodificadores sólo deberán ser capaces de descodificar flujos de
hasta 320 kbps.

Estructura del fichero


Un fichero MP3 se compone de una cabecera y una serie de bloque de datos. Esta secuencia de
bloques se le llama corriente primaria. Los bloques no son elementos independientes y por lo tanto
no pueden ser extraídos arbitrariamente. Los bloques de datos de MP3 contienen la información de
audio comprimida en términos de frecuencias y amplitudes. La cabecera de MP3 consta de un
contenido para la sincronización, que se utiliza para identificar el inicio de un bloque válido. Esto es
seguido por un bit que indica que este es el estándar MPEG y dos bits que indican que se utiliza la
capa 3, es decir, MPEG-1 Audio Layer 3 o MP3. Después de esto, los valores serán diferentes,
dependiendo del fichero MP3. La especificación ISO / IEC 11172-3 define el rango de valores para
cada sección de la cabecera, junto con la especificación de la cabecera. La mayoría de los ficheros
MP3 actuales contienen metadatos ID3, que preceden o siguen a los bloques de MP3.

11.11. Formato WMA


Windows Media Audio (WMA) es una tecnología de compresión de datos de audio desarrollado por
Microsoft. El nombre puede ser usado para referirse a su formato de fichero de audio o a sus codecs
de audio. Se trata de una tecnología propietaria que forma parte del marco de Windows Media.
WMA consta de cuatro codecs distintos:
– El códec original WMA, conocido simplemente como WMA, fue concebido como un
competidor a los populares codecs MP3 y RealAudio.
– El WMA Pro, un códec más nuevo y más avanzado, soporta multicanal y audio de alta
resolución.
– Un códec sin pérdidas, WMA Lossless, comprime los datos de audio sin pérdida de fidelidad
de audio y
– El WMA Voice, dirigida a los contenidos de voz, que aplica la compresión utilizando una
gama de velocidades bajas de bits.

11.11.1. Formato del contenedor


Un fichero WMA está encapsulado en la mayoría de las circunstancias, o contenido en el formato
de contenedor ASF (Advanced Systems Format), con una única pista de audio en uno de los cuatro
codecs WMA. Estos codecs son técnicamente distintos e incompatibles entre sí. El formato de
contenedor ASF especifica los metadatos del fichero a codificar, de forma similar a las etiquetas
ID3 utilizado por los ficheros MP3. Los metadatos pueden incluir el nombre de la canción, el
número de pista, el nombre del artista, y también los valores de normalización de audio.
Este contenedor puede opcionalmente soportar DRM (Digital Rights Management) utilizando una
combinación de intercambio de claves con criptografía de curva elíptica, un cifrado en bloque DES,
un cifrado de bloques personalizados, un cifrado de flujo RC4 y la función hash SHA-1.

11.11.2. Códec WMA (Windows Media Audio)


Windows Media Audio (WMA) es el códec más común de los cuatro codecs WMA. La primera
versión del códec lanzado en 1999 es conocido como WMA 1. En el mismo año, la sintaxis del flujo
de bits, o el algoritmo de compresión, se vieron alterados y se convirtió en el WMA 2. Desde
entonces, se han liberado nuevas versiones del códec WMA, pero el proceso de descodificación
sigue siendo el mismo, y asegurando la compatibilidad entre las distintas versiones del códec. El
WMA es un códec de audio con pérdidas basado en el estudio de la psicoacústica. Las señales de
144

audio que se consideran imperceptibles para el oído humano, se codifican con una resolución
reducida durante el proceso de compresión.
El formato WMA puede codificar las señales de audio muestreadas hasta 48 kHz y con hasta dos
canales independientes (estéreo). El WMA 9 introdujo las técnicas de codificación VBR (Variable
Bit Rate) y ABR (Average Bit Rate) en el codificador MS aunque ambos ya estaban soportados por
el formato original. El WMA 9.1 también añade soporte al audio de bajo retardo, lo que reduce la
latencia para la codificación y la descodificación.
Fundamentalmente, el formato WMA es un codificador basado en MDCT (Modified Discrete
Cosine Transform), similar a los formatos AAC, Cook y Vorbis. El flujo de bits de WMA se
compone de supertramas, cada una con uno o más tramas de 2048 muestras. Si no se utiliza el
depósito de bits, una trama es igual a un supertrama. Cada trama contiene una serie de bloques, que
son 128, 256, 512, 1024, o 2048 muestras después de ser transformado en el dominio de la
frecuencia a través de la MDCT. En el dominio de la frecuencia, se determina el enmascaramiento
de las muestras transformadas, y entonces se utiliza para volver a cuantificar las muestras. Por
último, las muestras de punto flotante se descomponen en dos partes: el coeficiente y el exponente e
independientemente con un código Huffman. En las tasas bajas de bits, también se pueden utilizar
para mejorar la calidad los pares de líneas espectrales (normalmente menos de 17 kbps) y una
codificación de la forma del ruido (por lo general menos de 33 kbps).
Al igual que los formatos AAC y Ogg Vorbis, el WMA viene a compensar las deficiencias
percibidas en el estándar MP3. Teniendo en cuenta sus objetivos de diseño, no es sorprendente que
los tres formatos terminan tomando decisiones de diseño similares. Los tres son codecs de
transformación puros. Además la implementación MDCT utilizada en el WMA es esencialmente un
superconjunto de los utilizados en los formatos Ogg y AAC como WMA iMDCT y se pueden
utilizar rutinas de ventanas para decodificar AAC y Ogg Vorbis. Sin embargo la cuantificación y la
codificación de estéreo es manejado de manera diferente en cada códec. La característica principal
que identifica al formato WMA es el uso único de 5 diferentes tamaños de bloque, en comparación
con los formatos MP3, AAC y Ogg Vorbis que cada uno restringe a sólo dos tamaños. El WMA Pro
amplía esto añadiendo un sexto tamaño de bloque utilizado en la tasa de muestreo de 88,1/96 kHz.

11.11.3. Códec WMA Pro (Windows Media Audio Professional)


El WMA Pro (Windows Media Audio Professional) es un códec más nuevo y más avanzado con
compresión con pérdidas. Se basa en un nuevo algoritmo de compresión que no sólo es superior al
WMA en términos de calidad, eficiencia y características, sino que también se adapta bien a tasas
bajas de bits. Puede soportar resoluciones de audio de hasta 96 kHz y hasta ocho canales discretos.
El WMA Pro también soporta la compresión dinámica, lo que reduce la diferencia de volumen entre
los sonidos más fuertes y los más flojos en la pista de audio.
La sintaxis del flujo de bits del códec se congeló en la primera versión del WMA 9 Pro. Las
versiones posteriores de WMA Pro introdujeron la codificación de la tasa baja de bits, el audio de
bajo retardo, el modo de interpolación de frecuencias, y una gama más amplia de opciones de
codificación de velocidad de muestreo y de profundidad de bits. Un fichero comprimido WMA 10
Pro con el modo de interpolación de frecuencias comprende una pista WMA 9 Pro codificada a la
mitad de la tasa original de muestreo, que luego se restaura mediante un nuevo algoritmo de
compresión. En esta situación, los reproductores WMA 9 Pro que no han sido actualizados para el
códec de WMA 10 Pro, sólo puede descodificar el flujo de baja calidad de WMA 9 Pro. Empezando
con el WMA 10 Pro, la codificación de ocho canales a 128 kbps, y las pistas se pueden codificar
con la resolución nativa de CD de audio (44,1 kHz, 16-bit).
A pesar de un creciente número de dispositivos compatibles y su superioridad sobre WMA, WMA
145

Pro todavía tiene poco soporte de hardware y software. Algunas notables excepciones a esto son el
Zune de Microsoft, la Xbox 360, los dispositivos Windows Mobile con Windows Media Player 10
Mobile, y los más nuevos Toshiba Gigabeat y los dispositivos de Motorola. Además el WMA Pro es
un requisito para el programa de certificación WMV HD. En el lado del software, Verizon utiliza el
WMA Pro 10 para su V CAST Music Service, y Windows Media Player 11 ha promovido el códec
como una alternativa al WMA para copiar las pistas de audio CD. A falta del hardware apropiado
de audio, el WMA Pro puede mezclar automáticamente el audio multicanal a modo estéreo o mono,
y la resolución de 24 bits a 16 bits durante la reproducción.

11.11.4. Códec WMA Lossless (Windows Media Audio Lossless)


El WMA Lossless (Windows Media Audio Lossless) es un códec de audio con compresión sin
pérdidas que compite con los formatos ATRAC Advanced Lossless, Dolby TrueHD, DTS-HD
Master Audio, Apple Lossless, Shorten, Monkey's Audio, FLAC y WavPack. Los dos últimos tienen
la ventaja de ser software de código abierto y disponible para casi cualquier sistema operativo.
Diseñado con fines de almacenamiento, comprime las señales de audio sin pérdida de calidad del
original usando VBR. Cuando se descomprime, la señal de audio es una réplica exacta del original.
La primera versión del códec WMA 9 Lossless, y sus revisiones soportan audio de 24 bits hasta 96
kHz hasta 6 canales discretos con control dinámico de compresión. La relación de compresión
típica de música varía entre 1,7:1 y 3:1.
Tiene un amplio soporte de hardware principalmente de los principales fabricantes. Similar a WMA
Pro, el descodificador WMA Lossless puede realizar mezclas cuando no hay hardware presente para
hacerlo.

11.12. Formato APE


El formato APE de Monkey es un formato de fichero para la compresión de datos de audio. Al ser
un formato sin pérdidas, el APE de Monkey no descarta los datos durante el proceso de
codificación, a diferencia de los métodos de compresión con pérdidas, como los formatosAAC,
MP3, Vorbis y Musepack.
Para la compresión de los datos, se utiliza el ancho de banda, el tiempo de transferencia de ficheros
y/o los requisitos de almacenamiento. Una grabación digital codificada para el formato APE de
Monkey puede ser descomprimida en una copia idéntica de los datos de audio originales. Al igual
que los formatos FLAC y Apple Lossless, los ficheros APE de Monkey suelen reducirse a la mitad
del tamaño original, con las correspondientes reducciones de las tasas de transferencia y el ancho de
banda.
Las desventajas del APE de Monkey son que es software propietario, y tiene un soporte limitado en
otras plataformas de software como la de Windows. Los ficheros APE de Monkey utilizan la
extensión .ape para audio, y .apl para la pista de los metadatos.

11.13. Formato OGG


El formato Ogg es un formato estándar de contenedor libre y abierto mantenido por la Xiph.Org
Foundation (http://xiph.org). Los creadores del formato Ogg dicen que no está restringido por las
patentes de software, y está diseñado para proveer una eficiente transmisión y manipulación de
datos multimedia digitales de alta calidad. El formato del contenedor Ogg puede multiplexar varios
flujos independientes de audio, vídeo, texto (subtítulos) y los metadatos.
En el marco multimedia de Ogg, Theora proporciona una capa de vídeo con pérdidas. La capa de
audio es la más frecuente utilizada por el formato Vorbis orientada a la música, pero otras opciones
146

como Speex incluyen un códec para la compresión de la voz humana.


Antes del año 2007, la extensión .ogg fue utilizada por todos los ficheros cuyo contenido utiliza el
formato del contenedor Ogg. Pero desde el año 2007, la Xiph.Org Foundation recomienda .ogg
solamente para los ficheros de audio de Ogg Vorbis. La Xiph.Org Foundation decidió crear un
nuevo conjunto de extensiones de fichero y tipos de medios para describir los diferentes tipos de
contenidos tales como .oga para ficheros de audio solamente, ogv para vídeo con o sin sonido
incluyendo Theora, y .ogx para aplicaciones.
A partir del 25 de Marzo de 2010, la versión actual de la implementación de referencia de la
Xiph.Org Foundation es libogg 1.2.0. Hay otra versión, libogg2, en desarrollo, pero se está a la
espera de una nueva versión a partir del año 2008. Ambas bibliotecas son de software libre, lanzado
bajo la nueva licencia BSD.
Dado que el formato es libre, y su implementación de referencia sin patentes, varios codecs de Ogg
han sido incorporados a varios reproductores libres y propietarios, tanto comerciales como no
comerciales, así como los reproductores portátiles y los receptores GPS de diferentes fabricantes.

11.13.1. Formato del fichero


El formato Ogg se ha creado como el marco de una iniciativa más amplia destinada a desarrollar
una serie de componentes para la codificación y decodificación de contenido multimedia, que esté
disponible de forma gratuita y reimplementable libremente en el software.
El formato consiste en bloques de datos, cada uno definido como una página Ogg. Cada página
comienza con los caracteres OggS para identificar el fichero como formato Ogg.
Un número de serie y un número de página en el encabezado de la página identifica cada página
como parte de una serie de páginas que integran un flujo de bits. Se pueden multiplexar múltiples
flujos de bits en el fichero donde las páginas de cada flujo de bits están ordenadas por el tiempo de
búsqueda de los datos contenidos. Los flujos de bits también se puede añadir al final de los ficheros
existentes, un proceso conocido como encadenamiento, lo que permite la descodificación en
secuencia.
Está dissponible una librería con licencia BSD, llamada libogg, para codificar y descodificar los
datos de flujos Ogg. Se utilizan distintas implementaciones Ogg independientes en varios proyectos
tales como RealPlayer y un conjunto de filtros DirectShow.

11.13.2. Codecs
El Ogg es sólo un formato contenedor. La codificación actual de audio hecha por un códec se
almacena dentro de un contenedor Ogg. Los contenedores Ogg pueden contener flujos codificados
con múltiples codecs, por ejemplo, un fichero de vídeo con sonido contiene datos codificados tanto
por un códec de audio como un códec de vídeo.
Al ser un formato contenedor, el Ogg puede integrar audio y vídeo en varios formatos tales como
Dirac, MNG, CELT, MPEG-4, MP3 y otros, pero el formato Ogg por lo general se utiliza con los
siguientes codecs gratuitos de Xiph.org:
• Audio
• Con pérdidas
• Speex: maneja datos de voz a tasas bajas de bits (~8–32 kbps por canal)
• Vorbis: maneja datos generales de audio a tasas variables medias y altas de
bits (~16–500 kbps por canal)
• Sin pérdidas
• FLAC: maneja los datos de audio de alta fidelidad
• OggPCM: El códec experimental de audio PCM sin compresión.
• vídeo
147

• Con pérdidas
• Theora: basado en el VP3 de On2, para competir con el MPEG-4 de vídeo
(por ejemplo, codificación con DivX or Xvid), RealVideo, o Windows Media
Video.
• Tarkin: un códec de vídeo experimental y obsoleto desarrollado en los años
2000 utilizando transformaciones discretas de ondas pequeñas en las tres
dimensiones de ancho, alto y tiempo. Se ha quedado en suspenso después de
que Theora se convirtiera en el eje principal de la codificación de vídeo .
• Sin pérdidas
• OggUVS: un borrador de códec para almacenar vídeo sin comprimir.
• Texto
• Writ: un códec de texto diseñado para incluir título o subtítulos
• Continuous Media Markup Language: un códec de texto para los metadatos de
tiempo, subtitulación y formateo
• Annodex: Un conjunto gratuito y de software abierto de estándares desarrollados por
CSIRO para anotar e indexar datos de audio y vídeo en red.
• OggKate: Un códec de superposición, diseñado originalmente para el karaoke y el
texto, y que se puede multiplixar en el Ogg.

11.14. Formato RA (Real Audio)


El formato RA (RealAudio) es un formato de audio propietario desarrollado por RealNetworks
(http://www.realnetworks.com). Utiliza distintos codecs de audio, que van desde los formatos de
tasa de bits bajas que se pueden utilizar con los módems de acceso telefónico, a los formatos de alta
fidelidad para música. También se puede utilizar como un formato de streaming de audio, que se
reproduce en el mismo momento en que se descarga. En el pasado, muchas estaciones de radio por
Internet utilizaban RealAudio para distribuir su programación por Internet en tiempo real. Sin
embargo en los últimos años se ha dado paso a otros formatos de audio.
La primera versión de RealAudio fue lanzada en 1995. A partir de 2008, la versión actual es
RealAudio 10.

11.14.1. Extensiones de fichero


El formato RA (RealAudio) se identificó originalmente por una extensión .ra. En el año 1997,
RealNetworks también comenzó a ofrecer un formato de vídeo llamado RealVideo. La combinación
de los formatos de audio y vídeo se llamó RealMedia y usaba la extensión .rm. Sin embargo, la
última versión de RealProducer, codificador principal de RealNetworks, volvió a usar .ra para los
ficheros de audio, y empezó a usar .rv para los ficheros de vídeo (con o sin audio), y .rmvb para
ficheros de vídeo VBR. Las extensiones .ram (Real Audio metadatos) y .smil (Synchronized
Multimedia Integration Language) son formatos de fichero que a veces se encuentran como enlaces
de las páginas web.

11.14.2. Streaming audio


RealAudio se desarrolló como un formato de streaming de audio y vídeo, lo que significa que se
puede reproducir mientras se descarga. Es posible la emisión de RealAudio utilizando el protocolo
HTTP. En este caso, el fichero de RealAudio se recupera de forma similar a una página web normal,
pero la reproducción se inicia tan pronto como se recibe la primera parte y continúa mientras se
descarga el resto del fichero. Algunos protocolos han desarrollado alternativas que funcionan mejor
148

para transmisiones en vivo.


La primera versión de RealAudio utilizaba un protocolo propietario denominado PNA o PNM para
enviar datos de streaming audio. Más tarde RealNetworks se pasó al protocolo RTSP (Real Time
Streaming Protocol), un estándar del IETF, pero solo utilizaba el RTSP para gestionar la conexión.
Los datos de audio se envían con su propio protocolo propietario RDT, que inicialmente se
mantiene en secreto. Recientemente, algunas especificaciones del protocolo RDT se han hecho
públicos a través del proyecto Helix Community. El proyecto MPlayer de código abierto desarrolló
eventualmente un medio de reproducción de los flujos RDT.
En muchos casos, las páginas web no se vinculan directamente a un fichero de RealAudio. En su
lugar, enlazan a un fichero. ram (Real Audio metadatos) o a un fichero SMIL. Este es un pequeño
fichero de texto que contiene un enlace a la transmisión de audio. Cuando un usuario hace clic en
dicho enlace, el navegador del usuario descarga el fichero .ram o .smil y arranca el reproductor del
usuario.
Con RealPlayer no es posible guardar una secuencia de audio a un fichero, pero otros programas,
incluyendo MPlayer, Downloader RM, VLC media player, Streambox VCR, HiDownload y
Real7ime Coverter pueden hacerlo.
149

12. Formatos de vídeo digital


El vídeo es la tecnología de la captación, grabación, procesamiento, almacenamiento, transmisión y
reconstrucción por medios electrónicos digitales o analógicos de una secuencia de imágenes que
representan escenas en movimiento.
La tecnología de vídeo fue desarrollada por primera vez para los sistemas de televisión, pero ha
derivado en muchos formatos para permitir la grabación de vídeo de los consumidores y que
además pueda ser visto a través de Internet.
Inicialmente la señal de vídeo está formada por un número de líneas agrupadas en varios cuadros y
estos a la vez divididos en dos campos portan la información de luz y color de la imagen. El número
de líneas, de cuadros y la forma de portar la información del color depende del estándar de
televisión concreto. La imagen esta formada por luz y color; la luz define la imagen en blanco y
negro (es la información que se utiliza en sistemas de blanco y negro) y a esta parte de la señal de
vídeo se la llama luminancia.
En formato análogico, se trata de visualizar más de 24 imágenes por segundo, para darnos una
agradable sensación de movimiento. Cuando trasladamos esto al formato digital, se trataría de
visualizar más de 24 imágenes digitales por segundo. Esto implica que si usamos imágenes con
formato tipo BMP, el tamaño del fichero de vídeo digital sea enorme e inmanejable. Así nos vamos
a las dos soluciones más utilizadas en la actualidad:
– Una es la de comprimir las imágenes, pero no solo como una compresión de bits, sino como
algo más como por ejemplo, reduciendo el espectro y solo transmitiendo las diferencias de
imagen entre una y la siguiente.
– Otra es reducir el tamaño de visualización, es decir, si lo queremos ver en una gran pantalla,
se necesitará más resolución y por lo tanto transmitir más datos. En el caso de Internet, con
velocidades de transmisión reducidas, el tamaño de la visualización acostumbra a ser una
porción de la pantalla.

El formato de ficheros de vídeo digital es en que forma se guardan los datos de un fichero de vídeo
con el fin de que puedan ser interpretados por un ordenador o dispositivo análogo. Para transformar
la información analógica de las imágenes en digital se usan los códec, acrónimo de
codificador/descodificador. En muchos casos estos codecs analizan los fotogramas y emplean
algoritmos para comprimir sus datos. La compresión puede ser
– temporal, en la que se analiza un fotograma y se guarda la diferencia entre un fotograma y el
fotograma anterior, o
– espacial, en la que se eliminan los datos de los pixels que no cambian en cada fotograma.
Existen tres formatos de vídeo de gran implantación: el MOV de QuickTime, el AVI (Audio Video
Interleaved) y el estándar MPEG (Moving Pictures Experts Group). El formato MOV de
QuickTime, creado por Apple, es multiplataforma y en sus versiones más recientes permite
interactuar con películas en 3D y de realidad virtual. El formato AVI es un formato propio de
Windows, y por lo tanto está diseñado para ejecutarse principalmente en sus sistemas operativos. El
formato correspondiente al estándar MPEG produce una compresión de los datos con una pequeña
pérdida de la calidad; desde su creación, se ha definido el MPEG-1, utilizado en CD-ROM y Vídeo
CD, el MPEG-2, usado en los DVD-ROM y la televisión digital, y el MPEG-4, que se emplea para
transmitir vídeo e imágenes en ancho de banda reducido.
150

12.1. Codificadores
Todas las aplicaciones que graban vídeo, deben incorporar los codificadores necesarios para los
formatos de salida. Así cada aplicación cuando se guarda una grabación, visualizará aquellos
formatos de salida que incorpora. Algunas aplicaciones permite añadir otros codificadores para
ampliar la gama de formatos de salida. Todas las aplicaciones de edición de vídeo digital también
están en esta tesitura.
La razón por la que codifican unos formatos y no todos, es porque hay formatos propietarios y que
por lo tanto para poderlos incorporar se tienen que pagar las licencias correspondientes.

12.2. Descodificadores
En cuanto a los descodificadores, los requieren todas las aplicaciones que reproducen los vídeos,
que están almacenados en formato digital. También en este caso, los reproductores necesitan el pago
de licencias para poder reproducir los formatos propietarios.
Así no todos los reproductores permiten el acceso a todos los formatos, aunque hay reproductores
que permiten añadir descodificadores una vez instalado el reproductor.

12.3. Formato MOV


El formato MOV de QuickTime, creado por Apple, es multiplataforma y en sus versiones más
recientes permite interactuar con películas en 3D y realidad virtual.
Las funciones del formato MOV de QuickTime son las propias de un fichero contenedor
multimedia que contiene una o más pistas, cada una de cuales almacena un determinado tipo de
datos, ya sea audio, vídeo, efectos, o texto, por ejemplo, los subtítulos. Cada pista contiene un flujo
determinado de información codificado digitalmente con un determinado códec o una referencia de
los datos almacenado en otro fichero. Las pistas se mantienen según una estructura jerárquica de
datos que consiste en objetos llamados átomos. Un átomo puede ser el padre de otros átomos o
puede contener información, pero no puede hacer ambas funciones.
La capacidad de contener referencias abstractas de datos de los medios de comunicación, y la
separación de los datos de las direcciones donde están almacenados, indica que el QuickTime es
especialmente adecuado para la edición, ya que es capaz de importar y editar in situ, es decir, sin
necesidad de crear una copia. Otros formatos de contenedor de vídeo desarrollados posteriormente
como el ASF (Advanced Systems Format) de Microsoft o los contenedores de código abierto Ogg y
Matroska carecen de esta abstracción, y exigen que todos los datos se vuelvan a escribir después de
la edición.
El QuickTime 6 añadió soporte limitado para MPEG-4, específicamente la codificación y la
descodificación de Perfil Simple (SP). Las características del ASP (Advanced Simple Profile), como
las B-frames, no eran soportadas a diferencia de los codificadores, como XviD o 3ivx. QuickTime 7
es compatible con el codificador y el decodificador H.264.
Dado que tanto los contenedores MOV y MP4 pueden usar los mismos codecs MPEG-4, en su
mayoría son intercambiables en un entorno de sólo QuickTime. Esto es especialmente cierto en los
dispositivos de hardware, como la Sony PSP y varios reproductores de DVD. Por el lado del
software, la mayoría de los codecs DirectShow/Video de Windows incluyen un analizador de MP4,
pero ninguno para el formato MOV.

12.3.1. Historia
Apple lanzó la primera versión de QuickTime el 2 de Diciembre de 1991 como una extensión
multimedia para el System Software 6 y posteriores. El desarrollador principal de QuickTime,
Bruce Leak, hizo la primera demostración pública en Mayo de 1991 en la Conferencia Mundial de
151

Desarrolladores. La tecnología competidora de Microsoft, el Video para Windows, empleaba varias


miles de líneas de código fuente presuntamente robados de Quicktime y no apareció hasta
Noviembre de 1992.

QuickTime 1.x
Los codecs originales de vídeo incluían:
• el códec Apple Video, también conocido como Road Pizza, adaptado al vídeo normal de
acción en vivo
• el códec Animation, que utilizaba codificación 'run-length' y se adaptaba muy bien a las
imágenes tipo de dibujos animados con grandes áreas de color
• el códec Graphics, para imágenes de 8 bits, incluyendo las que se habían sometido a
'dithering'
Apple publicó QuickTime 1.5 para Mac OS a finales de 1992. En esta versión agregó el Compact
Video, que gestionaba la reproducción de vídeo con la resolución 320 x 240 a 30 fotogramas por
segundo. También agregó pistas de texto, lo que permitió cosas tales como subtítulos, letras, etc,
con un pequeño aumento del tamaño de la película.
En un esfuerzo por aumentar la adopción del QuickTime, Apple contrató a una empresa externa,
San Francisco Canyon Company, para llevar QuickTime a la plataforma Windows. La versión 1.0
de QuickTime para Windows proporcionaba sólo un subconjunto de la API completa de QuickTime,
incluyendo sólo las funciones de reproducción de películas realizadas con el controlador de
películas estándar.

QuickTime 2.x
Apple publicó QuickTime 2.0 para Mac OS en Febrero de 1994. Se añadió soporte para las pistas de
música, que contenían datos MIDI y que podía hacer que el QuickTime funcionara como un
sintetizador.
El QuickTime 2.0 para Windows apareció en Noviembre de 1994 bajo la dirección de Paul
Charlton. Con Charlton como arquitecto y director técnico junto con el colaborador Michael Kellner
a título individual y un pequeño equipo altamente efectivo con Keith Gurganus, portó un
subconjunto del Macintosh Toolbox a Intel y a otras plataformas como las variantes de UNIX,
MIPS y SGI. La primera demostración del QuickTime Media Layer (QTML) fue en la Apple
Worldwide Developers Conference (WWDC), en Mayo de 1996.
Las siguientes versiones, 2.1 y 2.5, volvieron al modelo anterior de QuickTime. Mejoraron el
soporte de la música y añadió pistas que permitían la creación de animaciones complejas con la
adición de un poco más que las imágenes estáticas al tamaño de la película. QuickTime 2.5 también
integró totalmente el QuickTime VR en QuickTime 2.0.1. El 16 de Enero de 1997, Apple lanzó la
extensión MPEG en QuickTime y lo añadió al QuickTime 2.5, lo que añadía capacidades de
software MPEG-1 a la reproducción de QuickTime.

QuickTime 3.x
El lanzamiento de QuickTime 3.0 para Mac OS el 30 de Marzo de 1998 introdujo las nuevas
características de la aplicación MoviePlayer de Apple de forma que los usuarios finales sólo podían
desbloquearla mediante la compra de QuickTime Pro. Dado que las características del QuickTime
Pro eran las mismas que las de QuickTime 2.5, cualquier usuario anterior de QuickTime podría
seguir utilizando una versión anterior de la aplicación MoviePlayer para el tiempo que le queda de
Mac OS hasta 2002.
152

QuickTime 3.0 añadió soporte para los componentes gráficos que podían leer las imágenes GIF,
JPEG, TIFF y otros formatos, y los componentes de salida de vídeo que servían principalmente para
exportar los datos de la película a través de una conexión FireWire. Apple también licenció varias
tecnologías de terceros para su inclusión en QuickTime 3.0, incluyendo el códec Sorenson Video
con compresión avanzada de vídeo y el códec QDesign Music para la compresión sustancial de
audio. También agregó los efectos de vídeo que los programadores podían aplicar en tiempo real a
las pistas de vídeo. Algunos de estos efectos incluso podían responder a los clics del ratón por el
usuario, como parte del nuevo soporte a la interacción con la película.

QuickTime 4.x
Apple liberó el QuickTime 4.0 el 8 de Junio de 1999 para Mac OS 7.5.5 y Windows 95, Windows
98 y Windows NT. Introdujo las siguientes características básicas:
• Componentes gráficos para la exportación, lo que permitía escribir en los mismos formatos
que previamente había leido.
• Soporte a los formatos Qdesign Music 2 y audio MPEG-1 Layer 3 (MP3)
• QuickTime 4 fue la primera versión que soportaba 'streaming'. Fue acompañado por el
lanzamiento de la versión gratuita de QuickTime Streaming Server 1.0.
El 17 de Diciembre de 1999, Apple liberó QuickTime 4.1, con las siguientes mejoras:
• Soporte para ficheros de más de 2,0 GB en el Mac OS 9.
• Soporte VBR para el audio MPEG-1 Layer 3 (MP3)
• Soporte para SMIL (Synchronized Multimedia Integration Language)
• Introducción de AppleScript en Mac OS

QuickTime 5.x
QuickTime 5 fue una de las versiones más cortas en cuanto a duración de QuickTime. Lanzado en
Abril de 2001, fue sustituido por QuickTime 6 un poco más de un año después. Esta versión fue la
último en tener más capacidades bajo Mac OS 9 que bajo Mac OS X, y la última versión de
QuickTime que soportaba las versiones de Mac OS 7.5.5 a 8.5.1 en un PowerPC Mac y Windows
95. La versión 5.0 fue lanzado inicialmente sólo para Mac OS y Mac OS X el 14 de Abril de 2001,
y la versión 5.0.1 que siguió después el 23 de Abril de 2001 que soportaba el Mac OS, el Mac OS X
y el Windows.
El QuickTime 5 introdujo las siguientes mejoras:
• Reproducción de MPEG-1 para Windows, y actualizado el soporte de audio de MPEG-1
Layer 3 para todos los sistemas de audio.
• La reproducción y exportación de Sorenson Video 3 añadido con la actualización 5.0.2.
• Efectos de 'rendering' y transiciones en tiempo real en los ficheros DV.
• La reproducción y la exportación de Flash 4.
• Un nuevo motor QuickTime VR, añadiendo soporte para panoramas cúbicos VR.

QuickTime 6.x
El 15 de Julio de 2002, Apple liberó el QuickTime 6.0, que ofrece las características siguientes:
• La reproducción, importación y exportación del formato MPEG-4, incluyendo el formato
MPEG-4 Parte 2 de vídeo y el AAC Audio.
• Soporte para Flash 5, JPEG 2000, y mejora del manejo de Exif
• La reproducción 'streaming'
• La reproducción de MPEG-2 a través de la compra de MPEG-2 Playback Component de
Apple
153

• El control del ActiveX mediante scripts


QuickTime 6 estuvo inicialmente disponible para Mac OS 8.6 - 9.x, Mac OS X (mínimo 10.1.5), y
Windows 98, Me, 2000 y XP. Sin embargo el desarrollo de QuickTime 6 para Mac OS se ralentizó
considerablemente a principios del año 2003, después del lanzamiento de Mac OS X v10.2 en
Agosto de 2002.
QuickTime 6.1 y 6.1.1 para Mac OS X v10.1 y Mac OS X v10.2 y QuickTime 6.1 para Windows
ofreció la creación de ficheros ISO-Compliant MPEG-4.
Apple liberó el QuickTime 6.2 exclusivamente para Mac OS X el 29 de Abril de 2003 para
proporcionar soporte a iTunes 4, y permitía la codificación AAC de las canciones de la biblioteca de
iTunes. El 3 de Junio de 2003, Apple liberó el QuickTime 6.3 con las siguientes características:
• Soporte para 3GPP, incluyendo 3G Text, vídeo y audio (codecs AAC y AMR)
• Soporte a los formatos .3gp, . amr, y .sdv con componentes separados.
QuickTime 6.4 liberado el 16 de Octubre 2003 para Mac OS X v10.2, Mac OS X 10.3 y Windows,
añadió lo siguiente:
• La adición del códec Apple Pixlet sólo para Mac OS X 10.3 y posteriores
• Soporte ColorSync
• El 3GPP integrado
El 18 de diciembre de 2003, Apple lanzó el QuickTime 6.5, soportando los mismos sistemas que la
versión 6.4. Las versiones 6.5.1 y 6.5.2 aparecieron el 28 de Abril de 2004 y el 27 de Octubre 2004
respectivamente. Esta última versión sería compatible con Windows 98 y Windows Me.La familia
6.5 añadió las siguientes características:
• Soporte de los formatos multimedia móvil 3GPP2 y AMC
• Código de voz QCELP
• Empleo del Apple Lossless en la versión 6.5.1
El QuickTime 6.5.3 fue lanzado el 12 de Octubre de 2005 para Mac OS X v10.2.8

QuickTime 7.x
Inicialmente lanzado el 29 de Abril 2005 junto con el Mac OS X 10.4, el QuickTime 7.0 se
caracteriza por lo siguiente:
• Mejora el cumplimiento de MPEG-4
• Tiene el códec H.264/MPEG-4 AVC
• Tiene Core Graphics (Quartz) para dibujar la pantalla, lo que permite cambiar el tamaño en
vivo y la reproducción en una superficie OpenGL
• El Core Audio reemplaza el Sound Manager, soportando sonido de alta resolución
• Soporte para el uso de filtros de Core Image en Mac OS X 10.4 en vídeo en vivo.
• Soporte a las animaciones de Quartz Composer
• El QTKit, un marco de Cocoa para QuickTime
Apple eliminó el soporte para Windows 2000 con el lanzamiento de QuickTime 7.2 el 11 de Julio
de 2007. La última versión disponible para Windows 2000, la versión 7.1.6, contiene numerosas
vulnerabilidades de seguridad. QuickTime 7.2 es la primera versión para Windows Vista.
Apple eliminó el soporte para el contenido de Flash en QuickTime 7.3, rompiendo el contenido en
que se basaba el Flash para las pistas de interactividad o animación. Sin embargo con el plugin
gratuito Perian se pueden reproducir los ficheros flv de Flash en QuickTime.

12.4. Formato AVI


El formato AVI (Audio Video Interleave) es un formato de contenedor multimedia introducido por
154

Microsoft en Noviembre de 1992 como parte de su vídeo para la tecnología Windows. Los ficheros
AVI puede contener tanto datos de audio y como de vídeo en un contenedor de ficheros que permite
la sincronización del audio con la reproducción del vídeo. Al igual que el formato de vídeo DVD, el
formato AVI soporta múltiples flujos de audio y vídeo, aunque estas características raramente se
utilizan. La mayoría de ficheros AVI también usan las extensiones de fichero del formato
desarrollado por el grupo de OpenDML Matrox en Febrero de 1996.

El formato AVI definido por Microsoft para Windows en 1992, fue majorado posteriormente
mediante las extensiones del formato del grupo OpenDML de la compañía Matrox. Estas
extensiones están soportadas por Microsoft, aunque no de manera oficial y se conocen como AVI
2.0. Los contenidos de audio y vídeo en el contenedor AVI pueden tener otros formatos, como por
ejemplo los formatos AC3, DivX, MP3 y Xvid.
Para que todos la información pueda ser reproducida simultáneamente, es necesario que se
almacene de manera entrelazada. De esta manera, cada fragmento del formato debe tener la
suficiente información como para reproducir unos pocos fotogramas junto con el sonido
correspondiente.
Obsérvese que el formato AVI admite varios flujos de datos de audio, lo que en la práctica significa
que puede contener varias bandas sonoras en distintos idiomas. El reproductor multimedia es el que
decide cuál de estos flujos debe ser reproducido de acuerdo con las preferencias del usuario.
Los ficheros AVI se dividen en fragmentos bien diferenciados denominados 'chunks'. Cada
fragmento tiene asociado un identificador denominado etiqueta FourCC. El primer fragmento se
denomina cabecera y su papel es describir la metainformación con respecto al fichero, por ejemplo,
las dimensiones de la imagen y la velocidad en fotogramas por segundo. El segundo fragmento
contiene los flujos entrelazados de audio y vídeo. Opcionalmente puede existir un tercer fragmento
que actúa a modo de índice para el resto de fragmentos.
Para reproducir un fichero con formato AVI es necesario lo siguiente:
• Un reproductor de vídeo capaz de interpretar el formato AVI.
• El códec de vídeo para interpretar el flujo de vídeo.
• El códec de audio para interpretar el flujo de audio.
La etiqueta FourCC permite identificar el códec necesario para interpretar un flujo de audio o vídeo.
Cada códec tiene asociado el conjunto de etiquetas que es capaz de reproducir. De esta manera, el
reproductor de vídeo es capaz de elegir el códec pertinente sin intervención del usuario.
El reproductor lee de forma consecutiva los fragmentos del fichero con formato AVI. A
continuación separa cada uno de los flujos de audio y vídeo que se encuentran entrelazados en el
fichero. Cada uno de estos flujos, una vez separados, se almacenan en un buffer de memoria y se
pasan al códec correspondiente. El códec de vídeo devuelve los fotogramas a reproducir en otro
buffer. El códec de audio retorna en otro buffer la muestra digital de sonido a reproducir. Con esta
información, el reproductor solamente tiene que sincronizar los fotogramas y el sonido y
reproducirlos a la velocidad adecuada.

12.4.1. Formato
El formato AVI es un derivado del formato RIFF (Resource Interchange File Format), que divide los
datos de un fichero en bloques, o 'chunks'. Cada bloque es identificado por una etiqueta FourCC. Un
fichero con formato AVI toma la forma de un único bloque con formato RIFF, que a continuación se
subdivide en dos bloques obligatorios y otro opcional.
155

El primer bloque se identifica por la etiqueta 'hdrl'. Este bloque es la cabecera del fichero y contiene
los metadatos del vídeo, tales como el ancho, la altura y la velocidad de los fotogramas. El segundo
bloque se identifica por la etiqueta 'movi'. Este bloque contiene los datos actuales de audio/vídeo
que conforman la película AVI. El tercer bloque opcional identificado por la etiqueta 'idx1' indexa
las direcciones de los bloques de datos dentro del fichero.
Por medio del formato RIFF, los datos de audio/vídeo contenidos en el bloque 'movi' se pueden
codificar o decodificar por software con un códec. Un fichero con formato AVI puede contener
datos de audio/vídeo dentro de los bloques en cualquier sistema de compresión, incluido el Full
Frame (sin comprimir), el Intel Real Time (Indeo), el Cinepak, el Motion JPEG, el MPEG, el
VDOWave, el ClearVideo/RealVideo, el QPEG y el vídeo MPEG-4.

12.4.2. Usos
Cuando se utilizan los codecs MPEG-4 como por ejemplo Xvid y DivX, aumentando el tamaño de
fichero más de lo necesario. El contenedor AVI no tiene soporte nativo para las características
modernas del formato MPEG-4 como las B-frames.
Los ficheros con formato AVI no contienen la información de la relación del aspecto de los pixels.
Microsoft confirma que muchos reproductores, incluyendo el Windows Media Player, visualiza
todos los ficheros AVI con pixels cuadrados. Por lo tanto, el cuadro aparece estirado o exprimido
horizontalmente cuando se reproduce el fichero. Existen otros formatos de contenedor de vídeo que
permiten especificar la relación del aspecto de los pixels.
Sin embargo los contenedores como QuickTime, Matroska, Ogg y MP4, y los proyectos basados en
el proyecto Ffmpeg incluyendo ffdshow, MPlayer, Xine y VLC, han resuelto la mayoría de los
problemas con la visualización de ficheros de vídeo en formato AVI.
En Junio del 2005, DivX, Inc. lanzó su propio formato de contenedor llamado DivX Media Format,
con extensión .divx, para suceder al AVI DivX+combo. Sin embargo, este formato es básicamente
un formato AVI mejorado, basado en la estructura del mismo RIFF, para mantener la compatibilidad
con los reproductores y aparatos existentes, y así hasta la fecha, no ha ganado la atracción de los
consumidores, aún cuando el códec DivX fue muy popular en su día.

12.4.3. DV-AVI
DV-AVI es un tipo de fichero con formato AVI donde el vídeo ha sido comprimido de acuerdo con
el estándar DV. La especificación original de DV (Digital Video), conocido como Blue Book, se ha
estandarizado dentro de la familia del estándar IEC 61834. Estos estándares definen las
características comunes, tales como casetes, método de modulación de la grabación, magnetización
y datos básicos del sistema en la parte 1, y profundizar en los detalles en la parte 2.
Hay dos tipos de ficheros DV-AVI:
• Tipo 1: El multiplexado audio-vídeo se guarda en su multiplexado original y guardado junto
con la sección de vídeo del fichero AVI. No emplea demasiado espacio aunque el audio está
descomprimido, pero las aplicaciones Windows basadas en el API VfW no lo soportan.
• Tipo 2 : Como el tipo 1, pero el audio también se guarda en un flujo de audio adicional en el
fichero. Soportado por las aplicaciones VfW pero al precio de un mayor tamaño del fichero.
Actualmente el tipo 1 es el más reciente de los dos tipos. Microsoft hizo las denominaciones de
tipo, y decidió nombrar a su versión más vieja compatible VfW como tipo 2. A finales de los años
1990 hasta principios de los años 2000, la mayoría del software DV de nivel profesional,
incluyendo programas de edición no lineales, sólo admitían el tipo 1. Una excepción notable fue el
156

Adobe Premiere, que sólo soportaba el tipo 2. Normalmente los controladores FireWire de alta
gama solo capturan el tipo 1. Hay software para la conversión de AVI de tipo 1 al tipo 2, y
viceversa, pero este es un proceso que consume tiempo.
Muchos controladores FireWire actuales aún sólo capturan uno u otro tipo. Sin embargo, casi todo
el software DV actual admite la edición y la renderización de tipo 1 y tipo 2. Así muchos de los
usuarios son conscientes del hecho de que hay dos tipos de ficheros DV-AVI.

12.5. Formato MPEG


El formato MPEG (Moving Pictures Experts Group) es un formato de almacenamiento de vídeo
digital con una compresión de los datos con una pequeña pérdida de la calidad. Desde su creación,
se ha definido el MPEG-1 utilizado en Audio CD y Vídeo CD, el MPEG-2, usado en los DVD y la
televisión digital, y el MPEG-4, que se emplea para transmitir vídeo e imágenes con un ancho de
banda reducido.
El formato MPEG-1 se publicó como un estándar ISO/IEC 11172 con el título 'Information
technology -- Coding of moving pictures and associated audio for digital storage media at up to
about 1,5 Mbps'. El estándar consta de un documento con cinco partes:
1. Sistemas. Almacenamiento y sincronización de vídeo, audio, y otros datos juntos.
2. vídeo. Contenido del vídeo comprimido.
3. Audio. Su descripción está en el apartado de audio. Ver formatos MPG y MP3.
4. Prueba de conformidad, comprobando el cumplimiento del estándar por parte de las
implementaciones.
5. Software de referencia. Ejemplo de software mostrando como codificar y descodificar de
acuerdo con el estándar.

12.5.1. Parte 1: Sistemas


La parte 1 del formato MPEG-1 cubre los sistemas, y se define como ISO/IEC-11172-1. Esta parte
especifica el diseño lógico y los métodos utilizados para almacenar el audio, el vídeo y otros datos
codificados en una secuencia de bits, y para mantener la sincronización entre los diferentes
contenidos. Este formato de fichero está diseñado específicamente para el almacenamiento de la
información, y la transmisión por los canales de datos, que se consideran relativamente fiables. Sólo
se define en el estándar la protección limitada de error, y los pequeños errores en el flujo de bits que
pueden causar defectos notables.

Flujos elementales y del programa


Los flujos elementales son los flujos de bits de audio y vídeo del formato MPEG-1 obtenidos
mediante un codificador. Además los flujos elementales se puede hacer más robustos
empaquetándolos, es decir, dividiéndolos en bloques independientes, y añadiendo una
comprobación de redundancia cíclica (CRC) a cada segmento para la detección de errores. Esta es
la estructura PES ( Packetized Elementary Stream).
Los flujos de programa (PS) se refieren a la combinación de múltiples flujos elementales de
paquetes, generalmente sólo uno de audio y uno de vídeo. La existencia de un único flujo garantiza
la entrega simultánea, y mantiene la sincronización. La estructura de los flujos de programa (PS) es
conocido como un multiplexador, o un formato de contenedor.
157

Relojes y marcas de tiempo


El reloj de referencia del sistema (SCR) es un valor del tiempo almacenado en un cabecera de 33
bits en cada flujo elemental, con una frecuencia/precisión de 90 kHz, con una extensión extra de 9
bits que almacena los datos de tiempo adicionales con una precisión de 27 Mhz. Estos son
insertados por el codificador derivado del reloj del sistema (STC). Al mismo tiempo los flujos de
audio y vídeo codificados no tienen idénticos valores del reloj de referencia del sistema (SCR)
debido al buffering de la codificación, al jitter y a otros retardos.
Las marcas del tiempo de presentación (PTS) existen en los flujos del programa para corregir la
disparidad inevitable entre los valores del reloj de referencia del sistema de audio y de vídeo. Los
valores de las marcas del tiempo de presentación a 90 kHz en la cabecera de los flujos de programa
dicen al descodificador que los valores del reloj de referencia del sistema de vídeo coinciden con los
valores del reloj de referencia del sistema de audio. Las marcas del tiempo de presentación
determinan cuando se tiene que visualizar una parte del fichero con formato MPEG, y también es
utilizado por el descodificador para determinar cuando los datos se pueden descargar del búffer. El
vídeo y el audio se retrasarán por el descodificador hasta que el segmento correspondiente del otro
llegue y puede ser decodificado.
El manejo de los flujos de programa puede ser problemático. Los decodificadores deben aceptar
múltiples flujos de programa que han sido concatenados, es decir, unidos secuencialmente. Esto
hace que los valores de las marcas de tiempo de presentación del vídeo se restablecezcan a cero, y
que empiece a incrementarlo de nuevo. Así las disparidades de las marcas de tiempo de
presentación pueden causar problemas de tiempo que debe ser manejados especialmente por el
descodificador.
Además las marcas de tiempo del descodificador (DTS) son necesarias debido a la existencia de las
B-frames. Con las B-frames en el flujo de vídeo, los fotogramas adyacentes tienen que ser
codificados y descodificados desordenadamente. Las marcas de tiempo del descodificador son muy
similares a las marcas de tiempo de presentación, pero en lugar de manipular los fotogramas
secuenciales, contiene las marcas de tiempo apropiadas para decir al descodificador cuando
descodificar y mostrar la siguiente B-frame, por delante de su anclaje (P- o y I-)frame. Si no hay B-
frames en el vídeo, los valores de las marcas de tiempo de presentación y del descodificador son
idénticas.

Multiplexación
Para generar los flujos de programa, el multiplexador intercalará dos o más flujos elementales
paquetizados. Esto se hace así para que los paquetes de los flujos simultáneos puedan ser
transferidos por el mismo canal y se les garantiza que ambos lleguen al descodificador precisamente
al mismo tiempo. Este es un caso de multiplexión por división de tiempo.
Determinar la cantidad de datos de cada flujo en cada segmento de entrelazado es complicado,
aunque es un requisito importante. Un intercalado inadecuado dará lugar a desbordamientos de
buffer, a medida que el receptor recibe más de un flujo de lo que puede almacenar, antes de que
llegue suficiente información para descodificar el otro flujo simultáneo. Uno será el audio y el otro
el vídeo. El verificador del buffer de vídeo MPEG (VBV) ayuda a determinar si un flujo de
programa multiplexado puede ser decodificado por un dispositivo con unos datos determinados a la
velocidad establecida y con el tamaño de buffer en cuestión. Esto ofrece información al multiplexor
y al descodificador, por lo que puede cambiar el tamaño del buffer o ajustar las tasas de bits
necesarios para el cumplimiento.
158

12.5.2. Parte 2: Vídeo


La parte 2 del formato MPEG-1 cubre la parte de vídeo y se define en ISO/IEC-11172-2. El diseño
fue fuertemente influenciado por el formato estándar H.261.
El vídeo del formato MPEG-1 explota los métodos de compresión de percepción para reducir
significativamente la cantidad de datos requeridos por un flujo de vídeo. Reduce o descarta
totalmente la información en determinadas frecuencias y áreas de la imagen en que el ojo humano
tiene una capacidad limitada para percibir plenamente. También utiliza métodos eficaces para
explotar la redundancia temporal y espacial en vídeo para lograr una mayor compresión de datos.

Espacio de color
Antes de la codificación del vídeo al formato MPEG-1, el espacio de color se transforma al Y'CbCr
= (Y' Luma, Cb = Chroma blue, Cr = Chroma Red). La luminancia se define como una tupla de dos
valores: el brillo y la resolución, y la crominancia como una tupla de tres valores: color, matiz y
fase. La luminancia (brillo, resolución) se almacena separadamente de la crominancia (color, matiz,
fase) y además se separa en sus componentes rojo y azul. La crominancia también es muestreada a
4:2:0, lo que significa que es dividido por la mitad en sentido vertical y la otra mitad en sentido
horizontal, a sólo un cuarto de la resolución del vídeo.
Debido a que el ojo humano es mucho menos sensible a pequeños cambios de color que del brillo,
el muestreo de la crominancia es una forma muy eficaz de reducir la cantidad de datos de vídeo que
deben ser comprimidos. En los vídeos con detalle fino, de alta complejidad espacial, esto puede dar
lugar a defectos de 'aliasing' de crominancia. En comparación con otros defectos de compresión
digital, esta cuestión raramente puede ser una molestia.
A causa del muestreo, el vídeo con el espacio de color Y'CbCr siempre debe ser almacenado
utilizando incluso las dimensiones, divisible por 2, de lo contrario se producirá un desajuste de la
crominancia, y aparecerá como si el color estuviera delante o detrás del resto del vídeo, como una
sombra. El espacio de color Y'CbCr se denomina a menudo erróneamente espacio de color YUV
que sólo se utiliza en el dominio de las señales de vídeo analógico.

Resolución/Tasas de bit
El formato MPEG-1 soporta resoluciones de hasta 4095×4095 (12 bits), y tasas de hasta 100 Mbps.
Normalmente los vídeos con formato MPEG-1 se visualizan utilizando alguna de las resoluciones
siguientes: 352x240, 352x288, o 320x240. Estas bajas resoluciones, combinadas con una tasa de
bits inferior a 1,5 Mbps, forman lo que se conoce como CPB (Constrained Parameters Bitstream),
es decir, los parámetros restringidos del flujo de bits. Posteriormente esto se rebautizó como perfil
bajo (Low Level) en el formato MPEG-2. Son las especificaciones mínimas de vídeo que cualquier
descodificador de vídeo debe ser capaz de manejar para ser considerado compatible con el formato
MPEG-1. Estas especificaciones fueron seleccionadas para ofrecer un buen equilibrio entre la
calidad y el rendimiento, permitiendo el uso de hardware de bajo costo.

Tipos de fotograma/imagen/bloque
El formato MPEG-1 tiene varios tipos de fotogramas/imágenes que sirven a propósitos diferentes y
son las siguientes:
– I-frames
– P-frames
159

– B-frames
– D.frames
A continuación se detalla cada una de ellas,
I-frames
I-frame es la abreviatura de Intra-frame, denominado así porque se pueden descodificar de forma
independiente de cualesquiera otros fotogramas. También pueden conocidas como I-pictures o
fotogramas clave debido a su función, en cierto modo, similar a las fotogramas clave que se
utilizan en la animación. Las I-frames se pueden considerar efectivamente idénticas a las imágenes
JPEG de referencia.
La búsqueda de alta velocidad a través de un vídeo con formato MPEG-1 sólo es posible con la I-
frame más cercana. Cuando se corta un vídeo, no es posible iniciar la reproducción de un segmento
de vídeo antes de de la primera I-frame del segmento, al menos sin recodificar el vídeo con un alto
coste de computación. Por esta razón, en las aplicaciones de edición, los vídeos con formato MPEG
solo utilizan I-frames.
Los vídeos que solo tienen I-frames tienen una compresión muy rápida, pero producen tamaños de
fichero muy grandes: un factor de 3x o más, mayor que el vídeo con formato MPEG-1 codificado
normalmente. Los vídeos con formato MPEG-1 con solo I-frames son muy similares al vídeo
MJPEG.
La longitud entre I-frames se conoce como el tamaño GOP (Group Of Pictures). Habitualmente el
formato MPEG-1 utiliza un tamaño GOP de 15-18, es decir, una I-frame por cada 14-17 no I-frames
(una combinación de P-frames y B-frames). Con los codificadores más inteligentes, el tamaño del
GOP es elegido de forma dinámica, hasta el límite máximo preseleccionado.
Se establecen límites en el número máximo de fotogramas entre I-frames debido a la complejidad
de la descodificación, el tamaño de búfer del descodificador, el tiempo de recuperación después de
los errores de datos, la capacidad de búsqueda y la acumulación de errores IDCT en las
implementaciones de baja precisión más comunes en los descodificadores de hardware.
P-frames
P-frame es una abreviatura de Predicted-frame, es decir, fotograma previsto. Las B-frames son
también inter-frames. Las P-frames existen para mejorar la compresión mediante la explotación de
la redundancia temporal en un vídeo. Las P-frames almacenan sólo las diferencias en cuanto a la
imagen del fotograma inmediatamente anterior, ya sea una I-frame o una P-frame. Esta fotograma
de referencia se llama fotograma anclaje.
La diferencia entre una P-frame y su fotograma anclaje se calcula utilizando los vectores de
movimiento en cada macrobloque del fotograma. Los datos del vector de movimiento se integrarán
en la P-frame para el uso por el descodificador.
Un P-frame puede contener cualquier número de código dentro de los bloques, además de cualquier
bloques previsto hacia delante. Si un vídeo cambia drásticamente de un fotograma a otro, como un
corte, es más eficiente codificarlo como una I-frame.
B-frames
Una B-frame es un fotograma bidireccional. Las B-frames son bastante similares a las P-frames,
excepto a que pueden hacer predicciones utilizando tanto las fotogramas anteriores como las
posteriores, es decir, tienen dos fotogramas anclaje.
Por lo tanto es necesario para el reproductor, primero descodificar secuencialmente el siguiente
fotograma anclaje I- o P- después de la B-frame, antes de que la B-frame puede ser descodificada y
160

visualizada. Esto hace que las B-frames sean computacionalmente muy complejas, requiera grandes
buffers de datos, y cause un retraso mayor tanto en la descodificación como durante la codificación.
Esto hace que se necesiten marcas de tiempo de visualización (DTS - Display Time Stamps) en el
flujo de datos. De esta manera las B-frames han sido tema de mucha controversia durante mucho
tiempo, razón por la cual se han evitado muchas veces en los vídeos, y en ocasiones no son
soportadas completamente por los descodificadores de hardware.
No se prevén otros tipos de fotogramas distintos de las B-frame. Debido a esto en caso necesario, se
puede insertar una tasa muy baja de bits de B-frame para ayudar a controlar dicha tasa. Si esto se
hizo con una P-frame, las futuras P-frames precederían de la B-frame y bajaría la calidad de toda la
secuencia. Sin embargo y de manera similar, la futura P-frame aún debe codificar todos los cambios
entre ella y el fotograma anclaje anterior I- o P- , además que gran parte de los cambios están
codificados en las B-frames. Las B-frames también se pueden beneficiar en los vídeos donde el
fondo detrás de un objeto que se está revelando en varias fotogramas, o en las transiciones de
'fading', como los cambios de escena.
D-frames
El formato MPEG-1 tiene un tipo de fotograma único que no se encuentra en los últimos estándares
de vídeo. Las D-frames o DC-pictures son imágenes independientes (intra-frames) que han sido
codificadas DC-sólo (los coeficientes AC-DCT se eliminan) y por lo tanto, son de muy baja
cualidad. Las D-frames nunca son referenciadas por los fotogramas I-, P o B-frames. Las D-frames
sólo se utilizan para las vistas rápidas previas de vídeo, por ejemplo, cuando se busca a través de un
vídeo a alta velocidad.
La existencia de D-frames permite previsualizaciones de alta calidad, y sin la necesidad de las D-
frames que ocupan espacio en el flujo, no mejora la calidad de vídeo.

Macrobloques
El formato MPEG-1 opera en vídeo con una serie de bloques de 8x8 pixels para la cuantificación.
Sin embargo debido a la crominancia, se muestrea con un factor de 4. Así cada par de bloques de
crominancia (rojo y azul) corresponde a 4 bloques diferentes de luminancia. Este conjunto de 6
bloques, con una resolución de 16x16 pixels, se llama macrobloque.
Un macrobloque es la unidad independiente más pequeña de vídeo en color. Los vectores de
movimiento operan exclusivamente en el nivel macrobloque. Si la altura y/o la anchura del vídeo no
es exactamente un múltiplo de 16, a pesar de esto se debe codificar una fila completa de
macrobloques para almacenar el resto de la imagen. Es un despilfarro de una cantidad significativa
de datos en el flujo de bits, y tiene que ser evitado.
Algunos descodificadores también manejan inadecuadamente los vídeos con macrobloques
parciales, con el resultado de una visualización defectuosa.

Vectores de movimiento
Para disminuir la cantidad de redundancia espacial en un vídeo, sólo se actualizan los bloques que
tienen cambios, hasta el tamaño GOP (Group Of Pictures) máximo. Esto se conoce como reposición
condicional. Los movimientos de los objetos, y/o de la cámara puede consumir grandes porciones
del fotograma que se necesita para su actualización, a pesar de que sólo ha cambiado la posición de
los objetos previamente codificados. A través de la estimación del movimiento, el codificador
puede compensar este movimiento y eliminar una gran cantidad de información redundante.
El codificador compara el fotograma actual con las partes adyacentes del fotograma anclaje (la
previa I-frame o P-frame) del vídeo según un patrón en forma de diamante, hasta una zona limitada
161

por un radio predefinido de la zona del macrobloque actual. Si se encuentra una coincidencia, sólo
la dirección y la distancia, es decir, el vector de movimiento de la zona de vídeo anterior al
macrobloque actual deben ser codificadas en el inter-frame (P- o B-frame). El proceso inverso,
realizado por el descodificador para reconstruir la imagen, se llama compensación del movimiento.
Rara vez un macrobloque coincide con la imagen actual a la perfección, sin embargo las diferencias
entre la zona de coincidencia estimada y el fotograma o el macrobloque real se denominan errores
de predicción. Cuanto mayor es el error, más datos se deben añadir en la codificación del
fotograma. Para la compresión eficaz de vídeo, es muy importante que el codificador sea capaz de
realizar con eficacia y precisión la estimación del movimiento.
Los vectores de movimiento registran la distancia entre dos zonas en la pantalla en función del
número de pixels. El vídeo con formato MPEG-1 utiliza una precisión del vector de movimiento de
medio píxel. La precisión más fina del vector de movimiento se corresponde con una mayor
coincidencia, y por tanto a una mejor compresión. Así se debe calcular el mejor valor para
conseguir una buena relación entre la compresión y las pérdidas de coincidencia. Cuanto menor sea
el vector de movimiento, se consigue mejor resultado, pero se debe almacenar mayor cantidad de
datos en el fotograma, y también aumenta la complejidad de la codificación así como el aumento de
los niveles de la interpolación por macrobloque tanto para el codificador y como para el
descodificador, y los rendimientos son decrecientes con una mayor precisión del vector de
movimiento. Se eligió el medio píxel como el equilibrio perfecto.
Debido a que los macrobloques vecinos tienen probablemente vectores de movimiento muy
similares, esta información redundante se puede comprimir de manera bastante efectiva. Sólo se
tiene que almacenar la menor cantidad de diferencia entre el vector de movimiento de cada
macrobloque en el flujo final de bits.
Las P-frames tienen un vector de movimiento por macrobloque en relación al fotograma de anclaje
anterior. Sin embargo las B-frames puede utilizar dos vectores de movimiento: uno desde el
fotograma de anclaje anterior, y otro del fotograma de anclaje siguiente.
Los macrobloques parciales y los bordes negros y las barras codificadas en el vídeo que no caen
exactamente en el límite de macrobloque, distorsionan la predicción de movimiento. La
información de relleno y el borde del bloque impiden la mayor coincidencia del macrobloque con
cualquier otra área del vídeo, y así se debe codificar una significativa mayor cantidad de
información sobre el error de predicción por cada una de las docenas de macrobloques parciales a lo
largo del borde de la pantalla. La codificación DCT y la cuantificación tampoco son efectivas en
cuanto al contraste, si la imagen es grande y hay grandes contrastes en un bloque.
Otro problema importante existe con los macrobloques que contienen ruido significativo y aleatorio
en los bordes, donde normalmente hay las transiciones al negro. Además la aleatoriedad añadida
dificulta una eficiente compresión. Todos estos efectos disminuyen la calidad y aumentan la
cantidad necesaria de bits del vídeo de forma importante.

Transformación DCT (Discrete Cosine Transform)


La codificación de cada bloque de 8x8 pixels consiste en aplicar primero una transformación FDCT
(Forward Discrete Cosine Transform) y luego un proceso de cuantificación. El proceso de
transformación FDCT es teóricamente sin pérdidas, y puede ser revertido mediante la aplicación de
una transformación DCT inversa (IDCT) para reproducir los valores originales en ausencia de
cualquier cuantificación y errores de redondeo. En realidad hay algunos errores de redondeo, a
veces grandes, introducidos tanto por la cuantificación en el codificador como por el error de
aproximación IDCT en el descodificador. La precisión mínima permitida de una aproximación
IDCT del descodificador está definida en ISO/IEC 23002-1.
162

El proceso de transformación FDCT convierte el bloque de 8x8 pixels sin compresión en una matriz
indexada de 8x8 pixels. Uno de estos valores es el coeficiente DC, que representa el valor medio de
todo el bloque de 8x8 pixels. Los otros 63 coeficientes son los coeficientes AC estadísticamente
más pequeños, que son valores positivos o negativos que representan las desviaciones sinusoidales
del valor de bloque plano representado por el coeficiente DC.
Dado que el valor del coeficiente DC de un bloque está correlacionado estadísticamente con el del
bloque siguiente, este se comprime utilizando la codificación DPCM. Sólo se necesita representar la
cantidad más pequeña de la diferencia entre cada valor DC y el valor del coeficiente DC en el
bloque a su izquierda en el flujo final de bits.

Cuantificación
La cuantificación de datos digitales es esencialmente un proceso de reducción de la exactitud de una
señal, dividiéndola en tamaños de paso más grande, es decir, se trata de encontrar el múltiplo más
cercano, y descartar el resto/módulo.
El cuantificador a nivel de fotograma es un número de 0 a 31, aunque generalmente los
codificadores omitirán algunos de los valores extremos. Esto determina cuánta información se
eliminará de un fotograma determinado. El cuantificador a nivel de fotograma
– se selecciona dinámicamente por el codificador para mantener una determinada tasa de bits
especificada por el usuario, o
– lo especifica directamente el usuario, cosa poco frecuente.
Una matriz de cuantificación es una cadena de 64 números (0-255) que dice al codificador la
importancia relativa de cada pieza de la información visual. Cada número en la matriz corresponde
a un determinado componente de la frecuencia de la imagen de vídeo.
La cuantificación se realizan tomando cada uno de los 64 valores de frecuencia del bloque DCT,
dividiéndolos por el cuantificador a nivel de fotograma, y luego se dividen por sus correspondientes
valores en la matriz de cuantificación. Por último, el resultado se redondea por abajo. Esto reduce
significativamente o la elimina por completo la información de algunos componentes de la
frecuencia de la imagen. Normalmente es menos importante visualmente la información de la alta
frecuencia, por lo que las frecuencias altas son cuantificadas mucho más fuertemente. Actualmente
el formato MPEG-1 utiliza dos matrices de cuantificación separadas, uno para los I-frames y otro
para los P- y B-frames así la cuantificación de los diferentes tipos de bloque se puede hacer de
forma independiente, y por lo tanto, más eficazmente.
Generalmente este proceso de cuantificación reduce un número significativo de los coeficientes AC
a cero, con lo que pueden ser más eficientemente comprimidos por la codificación entrópica, sin
pérdidas, en el paso siguiente.
La cuantificación elimina una gran cantidad de datos, y es el principal paso del procesado con
pérdidas en la codificación del vídeo con formato MPEG-1. Esto también hace que sea la principal
fuente de la mayoría de defectos de compresión del vídeo con formato MPEG-1, como cintas de
color, ruido, sonido malo, decoloración, etc. Esto ocurre cuando el vídeo se codifica con un tasa de
bit insuficiente, y por lo tanto el codificador se ve forzado a usar altos cuantificadores a nivel de
fotograma través de gran parte del vídeo.

Codificación entrópica
Varios pasos en la codificación de vídeo con formato MPEG-1 son sin pérdidas, lo que significa que
en la descodificación se reproducen exactamente los mismos valores que los originales. Dado que
estos pasos de compresión de datos sin pérdidas no añaden ruido a veces se le denomina
163

codificación sin ruido. Dado que la compresión sin pérdidas se propone suprimir tanta redundancia
como sea posible, se conoce como codificación entrópica en el campo de la teoría de la
información.
El bloque DCT tiende a tener las frecuencias más importantes hacia la esquina superior izquierda.
Los coeficientes tienden a cero hacia la parte inferior derecha. La máxima compresión se puede
alcanzar mediante un escaneo en zig-zag del bloque DCT empezando por la esquina superior
izquierda y utilizando las técnicas de codificación Run-length. Los coeficientes DC y los vectores
de movimiento se codifican con DPCM.
La codificación Run-length (RLE) es un método muy simple de repetición de la compresión. Una
cadena secuencial de caracteres, no importa su duración en tiempo, pueden ser sustituidos por unos
pocos octetos, teniendo en cuenta el valor que se repite, y cuántas veces se repite. Por ejemplo, si
alguien dijera cinco nueves, usted sabe que significa el número 99999.
La codificación RLE es particularmente eficaz después de la cuantificación, porque un número
significativo de los coeficientes AC son cero, y se pueden representar con sólo un par de octetos.
Esto se almacena en una tabla Huffman de dos dimensiones que codifica el carácter run-length y el
carácter run-ending.
La codificación Huffman es un método muy popular de la codificación entrópica, y se utiliza en el
vídeo con formato MPEG-1 para reducir el tamaño de los datos. Los datos se analizan para
encontrar que cadenas se repiten a menudo. A continuación estas cadenas se ponen en una tabla
especial, con los datos que se repiten con mayor frecuencia asignándole el código más corto. Esto
mantiene los datos con el menor tamaño con esta forma de compresión. Una vez que se ha
construido la tabla, estas cadenas de datos son reemplazadas por sus códigos mucho más pequeños,
con la referencia de la apropiada entrada en la tabla. Simplemente el descodificador invierte este
proceso para reproducir los datos originales. Este es el paso final en el proceso de codificación de
vídeo.

Configuraciones del GOP para determinadas aplicaciones


Las I-frames almacenan la información completa del fotograma y por lo tanto son adecuadas para el
empleo de las búsquedas con acceso aleatorio. Las P-frames suministran la compresión usando los
vectores de movimiento en relación con el fotograma anterior (I o P). Las B-frames proporcionan
compresión máxima pero requieren para la computación el fotograma anterior y el fotograma
siguiente. Por lo tanto el procesado de las B-frames requiere más búffer en el lado de la
descodificación. Se debe seleccionar una configuración del GOP(Group Of Pictures) sobre la base
de estos factores. Solo la secuencia de las I-frames da menos compresión, pero es útil para el acceso
aleatorio, la funcionalidad FF/FR y la capacidad de edición. Las secuencias de las I-frame y las P-
frame dan una compresión moderada y un cierto grado de acceso aleatorio y la funcionalidad
FF/FR. Las secuencias de I, P y B-frames dan una compresión muy alta, pero también aumenta el
retardo de la codificación/descodificación de forma significativa. Por lo tanto estas configuraciones
no son apropiadas para las aplicaciones de vídeo-telefonía o vídeo-conferencia.
La velocidad normal de una I-frame es de 1 bit por píxel mientras que la de una P-frame es de 0,1
bits por píxel y el de un B-frame, 0.015 bits por píxel.
Estas tasas de muestreo son exactamente la mitad de las inicialmente definidas para MPEG-1
Audio. Fueron introducidos para mantener la mayor calidad de sonido cuando se codifica audio en
tasas de bits más bajas. Las tasas de bits aún más bajas fueron introducidas porque las pruebas
mostraron que MPEG-1 Audio podría proporcionar una mayor calidad que los codificadores
existentes con tasas de bits muy bajas.
164

12.6. Formato MPEG-2


MPEG-2 es un formato estándar para el código genérico de información de imágenes en
movimiento y el audio asociado. Describe una combinación de métodos de compresión de vídeo y
audio con pérdida que permiten el almacenamiento y la transmisión de películas usando
normalmente el ancho de banda disponible para su almacenamiento y su transmisión. MPEG-2 se
usa ampliamente como el formato de las señales de televisión digital que son transmitidas mediante
sistemas terrestres, por cable o por satélite. También especifica el formato de las películas y otros
programas que se distribuyen mediante DVD y discos similares. Así las estaciones de TV, los
receptores de TV, los reproductores de DVD y otros equipos se diseñan a menudo para este formato.
El formato MPEG-2 fue el segundo de los estándares desarrollados por el MPEG (Moving Pictures
Expert Group) y es el estándar internacional ISO/IEC 13818. Las partes 1 y 2 de MPEG-2 fueron
desarrolladas en colaboración con ITU-T.
El documento con las especificaciones del formato MPEG-2 incluye una parte 1, Sistemas, que
define dos formatos de contenedor que están relacionados entre si. Uno es el Transport Stream,
diseñado para transportar vídeo y audio sobre medios con pérdidas. El otro es el Program Stream,
un formato de contenedor diseñado para una transmisión con fiabilidad razonable como los discos
ópticos, los DVDs y los SVCDs.
La parte 2, vídeo, del documento es similar al formato estándar MPEG-1, pero ahora suministra
vídeo entrelazado, que es el formato usado por los sistemas de TV analógicos. El vídeo con el
formato MPEG-2 no está optimizado para bajas velocidades, es decir, hasta 1 Mbps no es mejor que
el MPEG-1. Sin embargo si lo es a 3 Mbps y superiores. Todos los descodificadores que cumplen el
estándar MPEG-2 Video son capaces de descodificar el MPEG-1 Video.
Con algunas mejoras, el vídeo y los sistemas MPEG-2 Video también se usan en algunos sistemas
de transmisión HDTV.
La parte 3, Audio, mejora el audio del formato MPEG-1 ya que permite la codificación de los
programas de audio con más de dos canales. Este método es compatible con los descodificadores de
audio de MPEG-1.

Codificación de vídeo
Una cámara HDTV genera un flujo de bits a una velocidad superior a 1 Mbps. Este flujo debe ser
comprimido para que no sea necesario este ancho de banda, y en consecuencia sea menos costoso
económicamente. Las cámaras de TV usan normalmente para transmitir 50 fotogramas por segundo
en Europe o 59,94 fotogramas por segundo en Norteamérica. La televisión digital requiere que se
digitalicen estos fotogramas de forma que se pueden procesar en un ordenador. A continuación cada
elemento del fotograma, es decir, un píxel, se representa por un número que corresponde a la
luminancia y por dos números de crominancia. La crominancia describe el brillo y el color del
píxel. Así cada fotograma digitalizado se puede representar inicialmente por tres matrices
rectangulares de valores.
Un truco común para reducir la cantidad de datos es separar la imagen en dos campos: la parte
superior, que son las filas impares, y la parte inferior, que son las filas pares. Los dos campos se
visualizan de forma alterna. Esto se conoce como vídeo entrelazado. El fotograma estará compuesto
por el conjunto de estos campos entrelazados. La velocidad de visualización de los fotogramas es de
25 o 29,97 fotogramas por segundo. Si el vídeo no es entrelazado, entonces se dice que es vídeo
progresivo y cada imagen es un fotograma. El formato MPEG-2 soporta ambas opciones.
Otro truco para reducir la cantidad de datos es adelgazar las dos matrices de crominancia. En efecto,
los valores de crominancia restantes representan los valores de las inmediaciones que se eliminan.
El adelgazamiento funciona porque el ojo es más sensible al brillo que al color. El formato de
165

crominancia 4:2:2 indica que la mitad de los valores de crominancia se han suprimido. El formato
de crominancia 4:2:0 indica que tres cuartas partes de los valores de crominancia se han suprimido.
Si ningún valor de crominancia se ha suprimido, el formato de crominancia es 4:4:4. El formato
MPEG-2 permite las tres opciones.
Como se ha detallado cuando se ha explicado el formato MPEG-1. El MPEG-2 también tiene los
tres tipos de fotogramas básicos: I-frames, P-frames 0y B-frames, que funcionan de la misma
forma. Así I-frame es una versión comprimida de un fotograma único sin compresión.
En cuanto a la compresión, se utiliza también la transformada DCT, la cuantificación y la
codificación entrópica.

Codificación de audio
MPEG-2 también introduce nuevos métodos de codificación de audio. Estos son
• La codificación con una tasa de bit baja y con tasa de muestreo a la mitad (MPEG-1 Layer
1/2/3 LSF)
• La codificación multicanal con hasta 5.1 canales
• MPEG-2 AAC

Perfiles y niveles
El formato MPEG-2 soporta una amplia gama de aplicaciones desde móviles hasta la edición HD de
alta calidad. Para muchas aplicaciones, es poco realista y demasiado caro soportar el estándar
completo. Para permitir que estas aplicaciones sólo soporten subconjuntos del estándar, define los
perfiles y los niveles.
El perfil define el subconjunto de características que soporta tales como el algoritmo de
compresión, el formato de crominancia, etc. El nivel define el subconjunto de capacidades
cuantitativas, tales como la tasa de bits máxima, el tamaño máximo de fotograma, etc
Una aplicación MPEG debe especificar que perfiles y niveles soporta. La tabla siguiente resume las
limitaciones de cada perfil y cada nivel.

Tasa de
Tasa de bit
Abrev. Nombre píxel/linea Lineas fotograma
(Mbit/s)
(Hz)
LL Low Level 352 288 30 4
ML Main Level 720 576 30 15
H-14 High 1440 1440 1152 30 60
HL High Level 1920 1152 30 80

Aplicaciones
El estándar DVD usa el formato de vídeo MPEG-2, pero con las restricciones siguientes:
• Resoluciones permitidas
• 720 × 480, 704 × 480, 352 × 480, 352 × 240 píxel (NTSC)
• 720 × 576, 704 × 576, 352 × 576, 352 × 288 píxel (PAL)
• Relaciones de visualización permitidas (Display AR): 4:3, 16:9, las 1.85:1 y 2.35:1
• Tasas de fotograma permitidas: 29.97 fotogramas/seg (NTSC) y 25 fotogramas/seg (PAL)
166

• Tasas de bit
• Máxima de vídeo 9.8 Mbps
• Máxima total 10.08 Mbps
• Mínimo 300 kbps
• YUV 4:2:0

• Subtítulos adicionales posibles


• Audio: Linear Pulse Code Modulation (LPCM): 48 kHz o 96 kHz; 16- o 24-bit; hasta 6
canales
• MPEG Layer 2 (MP2): 48 kHz, hasta 5.1 canales
• Dolby Digital (DD, también conocido como AC-3): 48 kHz, 32–448 kbit/s, hasta 5.1 canales
• Digital Theater Systems (DTS): 754 kbps o 1510 kbps
• Los DVDs NTSC deben contener al menos una pista de audio LPCM o Dolby Digital.
• Los DVDs PAL deben contener al menos una pista de audio MPEG Layer 2, LPCM, o
Dolby Digital.
• Los reproductores no requieren playback de audio con más de 2 canales, pero pueden
mezclar audio multicanal de 2 canales.
• Estructura GOP: La cabecera de secuencia debe estar al principio de cada GOP
• Fotogramas máximas por GOP: 18 (NTSC) / 15 (PAL)

En el estándar DVB, las restricciones relativas a la aplicación en el caso del formato de vídeo
MPEG-2 son:
Las resoluciones permitidas para SDTV son:
• 720, 640, 544, 480 or 352 × 480 píxel, 24/1.001, 24, 30/1.001 o 30 fotogramas/seg.
• 352 × 240 píxel, 24/1.001, 24, 30/1.001 o 30 fotogramas/seg.
• 720, 704, 544, 480 or 352 × 576 píxel, 25 fotograma/seg.
• 352 × 288 píxel, 25 fotograma/seg.
Para HDTV:
• 720 x 576 x 50 fotogramas/seg progresivo (576p50)
• 1280 x 720 x 25 or 50 fotogramas/seg progresivo (720p50)
• 1440 or 1920 x 1080 x 25 fotogramas/seg progresivo (1080p25)
• 1440 or 1920 x 1080 x 25 fotogramas/seg entrelazado (1080i25)
• 1920 x 1080 x 50 fotogramas/seg progresivo (1080p50)

12.7. Formato MPEG-4


El formato MPEG-4 es una versión mejorada del formato MPEG-2. Se introdujo a finales de 1998 y
este estándar fue diseñado por el grupo MPEG bajo el nombre de ISO/IEC 14496.
El formato MPEG-4 toma muchas de las características de MPEG-1 y MPEG-2 y otros estándares
relacionados, añadiendo nuevas características, tales como el soporte VRML para rendering 3D,
ficheros compuestos orientado a objetos (incluidos objetos de audio, vídeo y VRML), soporte para
la gestión de derechos digitales y diversos tipos de interactividad.
La mayoría de las características incluidas en el formato MPEG-4 son dejadas a los desarrolladores
individuales para decidir si las implementan. Esto significa que probablemente no hay ninguna
implementación completa de la especificación MPEG-4 con todo el conjunto de normas. Para hacer
frente a esto y lo mismo que sucede con el formato MPEG-2, el estándar MPEG-4 incluye el
concepto de perfiles y niveles, lo que permite definir un conjunto específico de capacidades de una
manera apropiada para un subconjunto de aplicaciones.
167

Inicialmente el formato MPEG-4 fue dirigido principalmente a las comunicaciones de vídeo de baja
velocidad. Sin embargo su ámbito como estándar que es de codificación multimedia se amplió más
tarde. El formato MPEG-4 ofrece las siguientes funcionalidades:
• Mejora de la eficiencia de la codificación
• Posibilidad de codificar datos mezclados de vídeo, audio y voz
• Error de resiliencia que permite una transmisión robusta
• Posibilidad de interactuar con la escena audiovisual generada en el receptor

12.7.1. Visión general


El formato MPEG-4 suministra una serie de tecnologías para los desarrolladores, los proveedores de
servicios y los usuarios finales:
• MPEG-4 permite a los diferentes desarrolladores de programas crear objetos multimedia que
poseen una mejor capacidad de adaptabilidad y de flexibilidad para mejorar la calidad de
dichos servicios y tecnologías como la televisión digital, los gráficos de animación, las
webs y sus extensiones. Este estándar permite a los desarrolladores un mejor control de su
contenido y luchar más eficazmente contra violaciónes de los derechos de autor.
• Los proveedores de servicios pueden utilizar el formato MPEG-4 para la transparencia de
sus datos. Con la ayuda de los procedimientos estándar, los datos en formato MPEG-4 se
pueden interpretar y transformar en otros tipos de señales compatibles con cualquier red
disponible.
• El formato MPEG-4 proporciona a los usuarios finales una amplia gama de interacción con
diferentes objetos animados.
• La señalización de la gestión estandarizada de los derechos digitales, también conocido en la
comunidad MPEG como IPMP (Intellectual Property Management and Protection).
El formato MPEG-4 puede realizar varias funciones, entre las que podemos destacar las siguientes:
• Multiplexa y sincroniza los datos de vídeo y audio, asociados con los objetos de los medios
de comunicación, de tal manera que puedan ser transportados más eficientemente a través de
canales de la red.
• La interacción con la escena audiovisual, que se forma en el lado del receptor.

12.7.2. Perfiles y niveles


El formato MPEG-4 ofrece un conjunto amplio de herramientas para la codificación. Los
subconjuntos de las herramientas de MPEG-4 se han previsto para su uso en determinadas
aplicaciones. Estos subconjuntos, denominados perfiles, limitan el tamaño de la herramienta de
forma que el descodificador solo implementa lo que requiere. A fin de limitar la complejidad
computacional, se establecen uno o varios niveles por cada perfil. Un perfil y una combinación de
niveles permite que:
• Un codificador solo implemente el subconjunto del estándar que necesita, mientras mantiene
la interconexión con otros dispositivos MPEG-4 que implementan la misma combinación.
• La comprobación de que los dispositivos MPEG-4 cumplen con el estándar, denominado
prueba de conformidad.

12.8. Formato WMV


Windows Media Video (WMV) es un formato de fichero de vídeo comprimido propietario
desarrollado por Microsoft. El códec original, conocido como WMV, fue originalmente diseñado
168

para aplicaciones de streaming de Internet, como un competidor del formato RealVideo. Los otros
codecs, como los WMV Screen y WMV Image, atienden a contenidos especializados.
La versión 9 del formato utilizado por Microsoft fue remitida a la SMPTE (Society Motion Picture
and Televisión Engineers) para su aprobación como estándar, bajo el nombre en clave VC-1. Este
códec es también utilizado en la distribución de vídeo de alta definición sobre DVD estándar en un
formato que Microsoft ha denominado WMV HD, el cual puede ser reproducido tanto en
ordenadores como en reproductores de sobremesa.

12.8.1. Formato del contenedor


Un fichero WMV se encapsula en general en un contenedor ASF (Advanced Systems Format).
Normalmente la extensión de fichero .wmv describe los ficheros ASF que usan los codecs de
Windows Media Video. El codec de audio usado junto con Windows Media Video es normalmente
alguna versión del Windows Media Audio, o en raros casos, el códec de audio obsoleto Sipro
ACELP.net. Microsoft recomienda que los ficheros ASF que no son Windows Media, usen la
extensión de fichero .asf.
El contenedor ASF puede opcionalmente soportar la gestión de los derechos digitales utilizando una
combinación de un intercambio de claves de criptografía de curva elíptica, el cifrado en bloque
DES, un cifrado de bloques personalizado, el cifrado RC4 y la función de hashing SHA-1.

Aunque el formaro WMV es generalmente empaquetado en el contenedor ASF, también se puede


poner en formato AVI o en el contenedor Matroska. Los ficheros resultantes tendrán las
extensiones .avi o .mkv respectivamente. El formato WMV se pueden almacenar en un fichero AVI
cuando se utiliza la implementación del códec VCM (WMV 9 Video Compression Manager). Otra
forma común para almacenar WMV en un fichero AVI es utilizar el codificador VirtualDub.

12.8.2. Códec Windows Media Video


Windows Media Video (WMV) es el códec más reconocido dentro de la familia WMV. El uso del
término WMV se refiere a menudo solamente a este códec. Sus principales competidores son
MPEG-4 AVC, AVS, RealVideo, DivX y Xvid. La primera versión del códec, la WMV 7, se liberó
en 1999, y se construyó de acuerdo con la implementación de la Parte 2 del formato MPEG-4.
Siguiendo con su desarrollo propietario, se liberaron nuevas versiones del códec, pero la sintaxis del
flujo de bits no fue congelado hasta la versión WMV 9. Mientras todas las versiones de WMV
soportan la tasa de bits variable, la tasa de bits media y la tasa de bits constante, la versión WMV 9
introdujo varias características importantes como la inclusión de soporte nativo para el vídeo
entrelazado, los pixels no cuadrados, y la interpolación de los fotogramas. También el WMV 9
introdujo un nuevo perfil llamado Windows Media Video 9 Professional, que se activa
automáticamente cada vez que la resolución de vídeo excede los 300.000 pixels, por ejemplo,
528x576, 640×480 o 768x432 y la tasa de bits de 1000 kbps. Su objetivo es que el contenido del
vídeo de alta definición alcance resoluciones de 720p y 1080p.
Los niveles de perfil Simple y Main del formato WMV 9 cumplen con los mismos niveles de perfil
de la especificación CV-1. El perfil Advanced en VC-1 está implementado en un nuevo códec
llamado WMV Windows Media Video 9 Advanced Profile. Mejora la eficiencia de compresión con
contenido entrelazado y se hace independiente del transporte, lo que permite que sea capaz de ser
encapsulado en un flujo de transporte MPEG o en el formato de paquetes RTP. Sin embargo el
códec no es compatible con los codecs anteriores al WMV 9.
169

12.8.3. Códec Windows Media Video Screen


Windows Media Video Screen (Pantalla WMV) es un códec que puede capturar contenido de la
pantalla en vivo, y convertir el vídeo de la pantalla mediante el uso de programas de terceros en
ficheros WMV 9 Screen. Funciona mejor cuando el material de origen es principalmente estático y
contiene una paleta pequeña de colores. Dependiendo de la complejidad del material de origen, el
códec puede conmutar entre la codificación con pérdidas y sin pérdidas para mejorar la eficiencia
de la compresión.
La primera versión del códec fue la WMV 7 Screen, y la versión actual la WMV 9 Screen, que
soporta codificación VBR, además de CBR.

12.8.4. Códec Windows Media Video Image


Windows Media Video Image es un códec de presentación de diapositivas a vídeo. El códec trabaja
por la aplicación de los efectos de tiempo, movimiento y transición a una serie de imágenes durante
la reproducción. El códec logra una más alta relación de compresión y calidad de imagen que el
WMV 9 para imágenes fijas como los ficheros codificados con imágenes estáticas almacenadas con
WMV Image en lugar de vídeo de movimiento completo.
Dado que el códec se basa en el descodificador para generar los fotogramas de vídeo en tiempo real,
la reproducción de los ficheros WMV Image incluso a resoluciones moderadas, por ejemplo, 30
fotogramas por segundo con una resolución de 1024 × 768, requiere mucho procesamiento de la
computadora. La última versión del códec WMV 9,1 Image utilizado por Photo Story 3, cuenta con
efectos de transformación adicionales, pero no es compatible con el códec original WMV 9 Image.

12.8.5. Calidad de vídeo


Microsoft dice que el formato WMV 9 establece una relación de compresión que es dos veces mejor
que la del formato MPEG-4 y tres veces mejor que el formato MPEG-2; también dice que el
formato WMV 9 es de 15-50% mejor que WMV 8 en términos de eficiencia de compresión. Sin
embargo un informe del ensayo publicado en Enero de 2005 demostró que el WMV 9 tenía una
peor eficiencia de compresión que el WMV 8. Muchos compiladores WMV de terceros han tenido
peor rendimiento que Windows Movie Maker.

12.9. Formato H.261


El formato H.261 es un estándar de codificación de vídeo de la ITU (International
Telecommunication Union) (http://www.itu.int) del año 1990, diseñado originalmente para la
transmisión a través de líneas RDSI en el que las velocidades de transmisión son múltiplos de 64
kbps. Es un miembro de la familia H.26x de los estándares de codificación de vídeo en el dominio
del VCEG (Video Coding Experts Group) de la ITU. El algoritmo de codificación fue diseñado para
poder operar a velocidades de vídeo de 40 kbps y 2 Mbps. El estándar soporta dos tamaños de
fotograma de vídeo: CIF (352x288 luminancia con 176x144 crominancia) y QCIF (176x144
luminancia con 88x72 crominancia) utilizando un sistema de muestreo 4:2:0.

12.9.1. Historia
Mientras que el formato H.261 fue precedido en 1984 por el H.120 como un estándar de
codificación de vídeo digital, el H.261 fue el primer estándar de codificación de vídeo digital
verdaderamente práctico. De hecho todos los estándares internacionales posteriores de codificación
de vídeo como los MPEG-1 Parte 2, H.262/MPEG-2 Part 2, H.263, MPEG-4 Parte 2, y
H.264/MPEG-4 parte 10, se han basado en el diseño del H.261. Además los métodos utilizados por
170

el comité de desarrollo del H.261 han permanecido en el proceso básico de operación para el trabajo
de estandarización subsiguiente. El algoritmo de codificación utiliza un híbrido de la predicción de
la compensación del movimiento entre imágenes y la codificación de la transformación espacial con
cuantificación escalar, escaneo en zig-zag y codificación entrópica.

12.9.2. Diseño
La unidad básica de procesamiento del diseño se llama macrobloque, y el formato H.261 fue el
primer estándar en el que apareció el concepto de macrobloque. Cada macrobloque consiste en una
matriz de muestras de luminancia de 16x16 pixels y las dos matrices correspondientes de las
muestras de crominancia de 8x8 pixels, utilizando un muestreo de 4:2:0 y un espacio de color
YCbCr.
La predicción inter-fotograma reduce la redundancia temporal con los vectores de movimiento
usados que ayudan al códec a compensar el movimiento. Mientras que sólo los vectores de
movimiento con valores enteros son compatibles con el H.261, se puede aplicar un filtro de
desenfoque a la señal de predicción, mitigando parcialmente la falta de precisión del vector de
movimiento de la muestra fraccional. La codificación de transformación DCT (Discrete Cosine
Transform) con 8x8 pixels reduce la redundancia espacial. A continuación se aplica la
cuantificación escalar para redondear los coeficientes de la transformación a la precisión adecuada
fijada por un parámetro de control de tamaño del paso y los coeficientes de la transformación
cuantificada son escaneados en zig-zag y codificados entropicamente para eliminar la redundancia
estadística.
Actualmente el estándar H.261 sólo especifica como descodificar el vídeo. Los diseñadores del
codificador tienen libertad para diseñar sus propios algoritmos de codificación, siempre y cuando su
salida se restringiera adecuadamente para permitir que pueda ser decodificado por cualquier
decodificador de acuerdo con el estándar. Los codificadores son también libres para realizar
cualquier tratamiento previo que quieran a su vídeo de entrada, y los descodificadores están
autorizados a realizar cualquier procesamiento posterior. Una de las técnicas efectivas de procesado
posterior que se convirtió en un elemento clave de los mejores sistemas basados en H.261 se llama
filtrado de desbloqueo. Esto reduce la aparición de errores molestos en forma de bloques
producidos por la compensación del movimiento basado en el bloque y las partes de transformación
espacial del diseño. De hecho, estos errores son probablemente un fenómeno familiar para casi
todos los que han visto el vídeo digital. El filtrado de desbloqueo se ha convertido en una parte
integral del estándar más reciente el H.264.
Las mejoras de diseño introducidas en la última estandarización se han traducido en mejoras
significativas en la capacidad de compresión en relación con el diseño del H.261.Esto ha hecho que
el H.261 sea esencialmente obsoleto, aunque todavía se utiliza como un modo de compatibilidad
hacia atrás en algunos sistemas de videoconferencia y para algunos tipos de vídeo de Internet. Sin
embargo el formato H.261 sigue siendo un hito histórico fundamental en el desarrollo del campo de
la codificación de vídeo.

12.10. Formato H.262


El formato H.262 es una compresión de vídeo digital y una codificación estándar desarrollada y
mantenida conjuntamente por el VCEG de la ITU y el MPEG del ISO/IEC. Se trata de la segunda
parte del estándar MPEG-2 de la ISO/IEC. Los documentos de la Recomendación H.262 de la UIT-
T y el ISO / IEC 13818-2 son idénticos.
171

12.11. Formato H.263


El formato H.263 es un códec de vídeo estándar diseñado originalmente como un formato de
compresión con una tasa baja de bits para videoconferencias. Ha sido desarrollado por la VCEG de
la ITU en un proyecto que terminó en los años 1995/1996 como uno de los miembros de la familia
H.26x de los estándares de codificación de vídeo en el dominio de la ITU.
El formato H.263 ha encontrado muchas aplicaciones en Internet, así gran parte del contenido de
Flash Video suele ser codificado en formato Sorenson Spark, una aplicación incompleta de H.263,
aunque muchos sitios utilizan ahora VP6 o codificación H.264. La versión original del códec
RealVideo se basa en H.263 hasta la liberación de RealVideo 8.
El formato H.263 fue desarrollado como una mejora evolutiva basada en la experiencia del formato
H.261, el estándar anterior de la ITU para la compresión de vídeo, y de los estándares MPEG-1 y
MPEG-2. Su primera versión se terminó en el año 1995 y proporcionaba un sustituto adecuado para
el H.261 a cualquier velocidad. Se mejoró aún más en los proyectos conocidos como H.263v2 y
H.263v3.

12.12. Formato H.264


El formato H.264 es un estándar para la compresión de vídeo, cuyo borrador final en la primera
versión del estándar se completó en Mayo del 2003.
El códec H.264/AVC es el último orientado al bloque y basado en la compensación del movimiento
desarrollado por el VCEG (Video Coding Experts Group) de la ITU, junto con el MPEG (Moving
Picture Experts Group) de ISO/IEC. El formato H.264 de la ITU y el formato MPEG-4 AVC de la
ISO/ IEC son gestionados de forma conjunta para que tengan un contenido técnico idéntico.

12.12.1. Visión general


La intención del formato H.264/AVC fue crear un estándar capaz de proporcionar buena calidad de
vídeo con tasas de bits sustancialmente más bajas que los estándares anteriores, por ejemplo, la
mitad o menos que la tasa de bits de vídeo MPEG-2, H.263 o MPEG-4, esto sin aumentar la
complejidad del diseño de tal manera que sería poco práctico o demasiado costoso su
implementación. Un objetivo adicional es proporcionar la suficiente flexibilidad para que el formato
H.264 se aplique a una amplia variedad de aplicaciones en una amplia variedad de redes y sistemas,
incluyendo las tasas de bits bajas y altas, la resolución de vídeo alta y baja, la difusión, el
almacenamiento DVD, las redes de paquetes RTP/IP, y los sistemas de telefonía multimedia de la
ITU.
El formato H.264 es una familia de estándares basado en perfiles, cuya filosofía es similar a los
formatos de versiones anteriores. Un decodificador específico es para utilizarlo con uno o más
perfiles, pero no necesariamente todos. La especificación del descodificador describe cuales de los
perfiles están implementados.
La primera versión del formato H.264/AVC fue completado en Mayo de 2003. A continuación se
desarrollaron las extensiones que se conocen como las Fidelity Range Extensions (FRExt). Estas
extensiones permiten una mayor calidad de vídeo con la codificación, con una mayor profundidad
de bits de la muestra y de una mayor resolución de la información del color, incluyendo estructuras
de muestreo conocidas como YUV 4:2:2 y YUV 4:4:4. También se incluyen otras características
tales como la conmutación adaptativa entre las transformaciones de los enteros 4x4 y 8x8 pixels, las
matrices de ponderación con cuantificación basada en la percepción y especificada en el
codificador, la eficiente codificación sin pérdidas y con la interrelación de la imagen, y el soporte de
172

espacios adicionales de color. El trabajo de diseño de las Fidelity Range Extensions se completó en
Julio del 2004, y el borrador se completó en Septiembre de 2004.
Con posteridad se han añadido cinco nuevos perfiles destinados principalmente para las
aplicaciones profesionales. Se añade soporte del espacio de color con gama ampliada, se definen
indicadores adicionales de la relación de aspecto, se definen dos tipos adicionales de información
suplementaria mejorada.
La codificación SVC (Scalable Video Coding) como se especifica en el anexo G del formato H.264/
AVC permite la construcción de la secuencia de bits que contiene una subsecuencia de bits que se
ajusta al formato H.264/AVC. Para la escalabilidad temporal de la secuencia de bits, es decir, la
presencia de una subsecuencia de bits con una tasa de muestreo temporal más pequeña que el flujo
de bits, las unidades de acceso completas se eliminan del flujo de bits cuando se deriva la
subsecuencia de bits. En este caso, la sintaxis de alto nivel y las imágenes de referencia inter-
predicción en la secuencia de bits se construyen de acuerdo con ello. Para la escalabilidad espacial y
la cualidad del flujo de bits, es decir, la presencia de una subsecuencia de bits con una resolución
espacial más baja o la calidad que el flujo de bits, el NAL (Network Abstraction Layer) elimina del
flujo de bits cuando se deriva la subsecuencia de bits. En este caso, la predicción dentro de la capa,
es decir, la predicción de la resolución espacial más alta o la señal de calidad por los datos de la
resolución espacial más baja o la señal de calidad, normalmente es utilizada para la codificación
eficiente. La extensión SVC (Scalable Video Coding) se completó en Noviembre de 2007.

12.12.2. Características
La parte 10 del formato H.264 contiene una serie de nuevas características que le permiten
comprimir el vídeo de forma mucho más eficaz que los antiguos formatos y proporcionan una
mayor flexibilidad para su aplicación en una amplia variedad de entornos de red. Las principales
características son:
• La predicción multi-imagen inter-imagen incluye las características siguientes:
• Uso de imágenes previamente codificadas como referencias de una manera mucho
más flexible que en los formatos anteriores, permitiendo hasta 16 fotogramas de
referencia o 32 campos de referencia en el caso de la codificación entrelazada. Esto
está en contraste con los formatos anteriores, donde normalmente el límite era uno; o,
en el caso de las B-frames eran dos. Esta característica permite en general modestas
mejoras en la tasa de bits y de calidad en la mayoría de las escenas. Pero en ciertos
tipos de escenas, tales como aquellas con los movimientos repetitivos o escenas hacia
atrás y hacia adelante que cortan o descubren áreas de fondo, permite una reducción
significativa en la tasa de bits manteniendo la claridad.
• La compensación VBSMC (Variable block-size motion compensation) con tamaños
de bloque tan grandes como 16x16 pixels y tan pequeños como 4x4 pixels, permiten
la segmentación precisa de regiones en movimiento. Los tamaños de bloque
soportados de predicción de luminancia incluyen 16x16, 16x8, 8x16, 8x8, 8x4, 4x8 y
4x4 pixels, muchos de los cuales se pueden utilizar juntos en un macrobloque único.
Los tamaños de bloque de la predicción de crominancia son proporcionalmente
menores según el submuestreo de crominancia usado.
• La capacidad de usar múltiples vectores de movimiento por macrobloque, uno o dos
por partición, con un máximo de 32 en el caso de un B-frame construido con 16
particiones de 4x4 pixels.
• La capacidad de utilizar cualquier tipo de macrobloque en las B-frames, incluyendo
las I-frames, permite una codificación mucho más eficiente que cuando se utiliza
173

solo las B-frames.


• La precisión de un cuarto de píxel para la compensación del movimiento, permite la
precisa descripción de los desplazamientos de las zonas en movimiento. Para la
crominancia, normalmente la resolución suele reducirse a la mitad tanto vertical
como horizontalmente, por lo que la compensación de movimiento de la crominancia
utiliza unidades de un octavo de píxel.
• La predicción ponderada, que permite a un codificador especificar el uso de una
escala y el offset cuando se realiza la compensación de movimiento, y proporciona
un beneficio significativo en el rendimiento en casos especiales tales como las
transiciones de fade a negro, de fade-in, y de crossfade. Esto incluye la predicción
ponderada implícita de B-frames, y la predicción ponderada explícita para P-frames.
• La predicción espacial de los bordes de los bloques vecinos para la codificación interna, en
lugar de la predicción solo DC encontrada en el formato MPEG-2 y la predicción del
coeficiente de transformación encontrado en H.263v2 y MPEG-4. Esto incluye los tamaños
del bloque de predicción de luminancia de 16x16, 8x8, y 4x4 pixels, de los cuales sólo un
tipo puede ser utilizado dentro de cada macrobloque.
• Las características de la codificación del macrobloque sin pérdidas incluyen:
• Un modo de representación de un macrobloque PCM sin pérdidas en que las
muestras de datos de vídeo están representadas directamente, permitiedo la
representación perfecta de determinadas regiones y permitiendo un límite estricto a
ser puestos en la cantidad de datos codificados de cada macrobloque.
• Un modo mejorado de representación del macrobloque sin pérdidas permitiendo la
representación perfecta de determinadas regiones mientras se usa normalmente pocos
bits menos que el modo PCM.
• Las características de la codificación flexible de vídeo de escaneo entrelazado incluyen:
• La codificación MBAFF (Macroblock-adaptive frame-field), empleando una
estructura par de macrobloque para las imágenes codificadas como fotogramas,
permitiendo macrobloques de 16x16 pixels en modo campo, en comparación con los
macrobloques de 16x8 pixels en MPEG-2.
• La codificación PAFF o PicAFF (Picture-adaptive frame-field) permite una mezcla
libremente elegida de imágenes codificadas como fotogramas MBAFF con imágenes
codificadas como campos únicos individuales de vídeo entrelazado.
• Las nuevas características del diseño de transformación incluyen:
• Una transformación del bloque espacial de 4x4 pixels con una concordancia exacta,
lo que permite la colocación precisa de las señales residuales con poco error. Esto es
conceptualmente similar al diseño del DCT pero simplificado y hecho para
proporcionar exactamente la descodificación especificada.
• Una transformación del bloque espacial de 8x8 pixels con una concordancia exacta,
lo que permite que las regiones altamente correlacionados se compriman más
eficientemente que con la transformación 4x4. Esto es conceptualmente similar al
diseño del DCT pero simplificado y hecho para proporcionar exactamente la
descodificación especificada.
• Selección del codificador de adaptación entre el tamaño de los bloques de
transformación de 4x4 y 8x8 para la operación de transformación el entero.
174

• Una transformación Hadamard secundaria realizada con coeficientes DC de la


transformación espacial primaria aplicada a los coeficientes DC de la crominancia
para obtener aún más compresión en las regiones suaves.
• Un diseño de cuantificación que incluye:
• Control logarítmico del tamaño del paso para facilitar la gestión de la tasa de bits por
los codificadores y amplificar el escalado de la cuantificación inversa.
• Matrices de escalado de la cuantificación a medida de la frecuencia seleccionadas por
el codificador para la optimización de la cuantificación basada en la percepción.
• Un filtro de desbloqueo in-loop que ayuda a prevenir los errores del bloqueo a otras técnicas
de compresión de imagen basadas en DCT, resultando una mejor apariencia visual y mayor
eficiencia de compresión.
• Un diseño de codificación entrópica que incluye:
• CABAC (Context-adaptive binary arithmetic coding), un algoritmo de compresión
sin pérdidas. CABAC comprime los datos de manera más eficiente que CAVLC pero
requiere más procesamiento en la descodificación.
• CAVL (Context-adaptive variable-length coding), que es una alternativa de menor
complejidad que el CABAC para la codificación de los valores de los coeficientes de
la transformación cuantificada. A pesar de la menor complejidad que CABAC,
CAVLC es más elaborado y más eficaz que los métodos normalmente utilizados para
codificar los coeficientes en otros diseños.
• Una técnica de codificación simple y de longitud de variable altamente estructurada
para muchos de los elementos de sintaxis no codificadas por CABAC o CAVLC, que
se conoce como la codificación Exponential-Golomb.
• Las características de la pérdida de capacidad incluyen:
• Una definición de NAL (Network Abstraction Layer) que permita la misma sintaxis
de vídeo para ser utilizado en muchos entornos de red. Un concepto de diseño muy
fundamental de H.264 es generar paquetes autocontenidos para eliminar la
duplicación de la cabecera como en el HEC (Header Extension Code ) de MPEG-4.
Esto se logró desacoplando la información relevante para más de un tramo del flujo.
La especificación H.264 incluye dos tipos de conjuntos de parámetros: SPS
(Sequence Parameter Set) y PPS (Picture Parameter Set). Un conjunto activo y
secuencial de parámetros (SPS) se mantiene sin cambios en toda una secuencia de
vídeo codificado, y un conjunto activo de parámetros de imagen (PPS) se mantiene
sin cambios dentro de una imagen codificada. Las estructuras del conjunto de
parámetros de secuencia e imagen contienen información como el tamaño de la
imagen, los modos opcionales de codificación empleado, y el macrobloque para
cortar el mapa de grupo.
• FMO (Flexible Macroblock Ordering), también conocido como grupos de corte y
ASO (Arbitrary Slice Ordering), que son técnicas para la reestructuración del orden
de la representación de las regiones fundamentales (macrobloques) de las imágenes.
Normalmente se considera una característica de la robustez del error/pérdidas.
• Particionamiento de datos (DP), una característica que ofrece la capacidad de separar
los elementos de sintaxis más y menos importantes en diferentes paquetes de datos,
permitiendo la aplicación de la protección de error desigual (UEP) y otros tipos de
mejora de la robustez de error/pérdida.
175

• RS(Redundant slices), una característica de la robustez de error/pérdida que permite


que un codificador envíe una representación adicional de una región de imagen,
normalmente una menor fidelidad, que puede ser utilizado si la representación
principal está dañada o corrupta.
• Marco de numeración, una característica que permite la creación de subsecuencias,
que permite una escalabilidad temporal mediante la inclusión opcional de imágenes
adicionales entre otras imágenes, y la detección y el ocultamiento de las pérdidas de
imágenes completas, que puede producirse debido a las pérdidas de paquetes de la
red o los errores de canal.
• Un proceso automático simple para la prevención de la emulación accidental de los códigos
de inicio, que son secuencias especiales de bits en los datos codificados que permiten el
acceso aleatorio en el flujo de bits y la recuperación de la alineación del octeto en los
sistemas que pueden perder la sincronización.
• Información mejorada suplementaria (SEI) e información de la usabilidad del vídeo (VUI),
que es información extra que puede ser insertada en el flujo de bits para mejorar el uso del
vídeo para una amplia variedad de fines.
• Imágenes auxiliares, que pueden ser utilizadas para fines tales como la composición alfa.
• Soporte de monocromo, submuestreo de crominancia 4:2:0, 4:2:2, y 4:4:4, dependiendo del
modo seleccionado.
• Soporte de la precisión de la profundidad del bit de muestreo de 8 a 14 bits por muestra en
función del perfil seleccionado.
• Contar el orden de las imágenes, una característica que sirve para mantener el orden de las
imágenes y los valores de las muestras en las imágenes descodificadas aisladas de la
información de tiempo, permitiendo que la información de tiempo sea transportada y
controlada/cambiada por separado por un sistema sin afectar el contenido de la imagen
descodificada.
Estas técnicas, junto con otras varias, hacen que el H.264 sea mucho mejor que cualquier formato
anterior bajo una amplia variedad de circunstancias en una amplia variedad de entornos de
aplicaciones. A menudo el H.264 puede ser mejor que el MPEG-2 Video. Normalmente se obtiene
la misma calidad a mitad de la tasa de bits o menos, sobre todo en la tasa de bits alta y situaciones
de alta resolución.

12.12.3. Perfiles
Un perfil de un códec es un conjunto de características de este códec identificadas para cumplir con
un determinado conjunto de especificaciones de las aplicaciones previstas. Esto significa que
muchas de las características enumeradas no son compatibles en algunos perfiles. El formato H.264
incluye los siguientes perfiles (profile):
– Constrained Baseline Profile (CBP). Perfil usado principalmente para aplicaciones de bajo
coste, como por ejemplo videoconferencias y aplicaciones de móviles. Se corresponde con
el subconjunto de características que son comunes a los perfiles Baseline, Main y High
descritos a continuación.
– Baseline Profile (BP). Usado principalmente para aplicaciones de bajo coste que requiere
una robustez adicional de error. Este perfil se usa raramente en videoconferencia y
aplicaciones de móviles. Añade herramientas adicionales de capacidad de recuperación de
error. La importancia de este perfil se desvanece después de haberse definido el CBP
176

(Constrained Baseline Profile).


– Main Profile (MP). Originalmente concebido como el perfil del consumidor general para las
aplicaciones de difusión y almacenamiento, la importancia de este perfil se desvaneció
cuando se desarrolló el perfil High para estas aplicaciones.
– Extended Profile (XP). Previsto como el perfil de vídeo streaming, tiene una capacidad de
compresión relativamente alta y algunos trucos adicionales para la robustez de las pérdidas
de datos y la conmutación de flujo del servidor.
– High Profile (HiP). El perfil principal para las aplicaciones de difusión y almacenamiento en
disco, especialmente para aplicaciones de televisión de alta definición, Este es el perfil
adoptado en HD DVD y Blu-ray Disc.
– High 10 Profile (Hi10P). Este perfil se basa en el perfil High, pero con soporte para hasta 10
bits por muestra de precisión de la imagen descodificada.
– High 4:2:2 Profile (Hi422P). Fundamentalmente dirigido a las aplicaciones profesionales de
vídeo que utiliza vídeo entrelazado. Este perfil se basa en el perfil High 10, pero con soporte
para el formato de submuestreo de crominancia 4:2:2 mientras se usan hasta 10 bits por
muestra de precisión de la imagen descodificada.
– High 4:4:4 Predictive Profile (Hi444PP). Este perfil se basa en el perfil High 4:2:2, pero con
soporte para el muestreo de crominancia 4:4:4, de hasta 14 bits por muestra, y, además da
soporte eficiciente a la codificación regional sin pérdidas y a la codificación de cada imagen
en tres planos de colores distintos.
– High Stereo Profile. Este perfil esta dirigido al vídeo 3D estereoscópico y combina las
herramientas del perfil High con capacidad de predicción inter-vista de la extensión
Multiview Video Coding.
Además, la norma contiene otros cuatro perfiles 'all-intra', que se definen como subconjuntos
simples de otros perfiles correspondientes, y que en su mayoría se usan en las aplicaciones
profesionales, y son:
• High 10 Intra Profile.
• High 4:2:2 Intra Profile.
• High 4:4:4 Intra Profile.
• CAVLC 4:4:4 Intra Profile. Se basa en el High 4:4:4 Intra Profile, al que se le añade la
codificación entrópica CAVLC. No soporta CABAC.

Como resultado de la ampliación de la codificación SVC (Scalable Video Coding), este formato
H.264 contiene tres perfiles escalables adicionales, que se definen como una combinación del perfil
H.264/AVC para el nivel base y que son los siguientes:
– Scalable Baseline Profile. Perfil fundamentalmente dirigido a las aplicaciones de
videoconferencia, de móviles y de vigilancia. Se basa en el perfil CBP (Constrained
Baseline Profile), y se le dota de un conjunto de las herramientas para facilitar la
escalabilidad.
– Scalable High Profile. Perfil fundamentalmente dirigido a aplicaciones de difusión y
streaming. Se basa en el perfil High.
– Scalable High Intra Profile. Fundamentalmente dirigido a las aplicaciones de producción,
este perfil está restringido al uso 'all-Intra'.
177

12.13. DivX
DivX es una marca de productos creada por DivX, Inc. que incluye el DivX Códec que se ha
popularizado debido a su capacidad de comprimir los largos segmentos de vídeo en tamaños
pequeños manteniendo la calidad visual relativamente alta.
Hay dos codecs DivX: el códec DivX MPEG-4 Parte 2 y el códec DivX H.264/MPEG-4 AVC. Es
uno de los distintos codecs comúnmente asociados con el 'ripping', es decir, la transferencia de
audio y vídeo a un disco duro y codificado.

12.13.1. DivX Media Format (DMF)


DivX 6 amplió el alcance de DivX de incluir sólo un códec y un reproductor mediante la adición de
un formato opcional de contenedor llamado DivX Media Format (DMF) con una extensión .divx
que incluye soporte para lel DVD-Video y el contenedor VOB. Este formato de contenedor se
utiliza para el códec MPEG-4 Parte 2.
Las características principales del DivX Media Format (DMF) son:
• Menús de vídeo interactivos
• Múltiples subtítulos (XSUB)
• Múltiples pistas de audio
• Múltiples secuencias de vídeo
• Puntos de capítulo
• Otros metadatos (xTAG)
• Múltiples formatos
• Compatibilidad parcial con AVI

Este nuevo DivX Media Format", también viene con una Certificación DivX Ultra, y todos los
reproductores con certificado Ultra deben soportar todas las características DivX Media Format.
Mientras que el vídeo codificado con el códec DivX es una secuencia de vídeo con formato MPEG-
4, el DivX Media Format es análogo a los formatos de contenedores como el QuickTime de Apple.
De la misma manera que los formatos tales como el DVD especifican el vídeo MPEG-2 como parte
de su especificación, el DivX Media Format especifica el vídeo MPEG-4-compatible como parte de
su especificación. Sin embargo, a pesar de la utilización de el "." en la extensión, este formato es
una extensión del formato AVI. Los métodos de la inclusión de múltiples pistas de audio y
subtítulos implican el almacenamiento de los datos en cabeceras RIFF y otras AVI que se conocen
desde hace bastante tiempo, y que VirtualDubMod aún los soporta. DivX, Inc. hizo esto con el
propósito de mantener al menos parcialmente la compatibilidad con AVI, para que los reproductores
que no son soportan las nuevas características disponibles al formato .divx., como menús
interactivos, puntos de capítulos y subtítulos XSUB, al menos puedan reproducir el vídeo principal.
Por supuesto, el códec DivX y las herramientas como el Dr.DivX todavía soportan el método
tradicional de creación de ficheros estándar AVI.

12.13.2. DivX Plus HD


DivX Plus HD es un nombre comercial de un tipo de fichero que utiliza el formato de conetenedor
Matroska (.mkv) en lugar del formato propietario de DivX Media. Los ficheros DivX Plus HD
contienen una secuencia de vídeo H.264, sonido de audio envolvente AAC y varios accesorios
basados en XML que definen capítulos, subtítulos y metadatos. Este formato de contenedor
multimedia se utiliza para el códec H.264/MPEG-4 AVC.
178

12.13.3. Perfiles DivX


DivX ha definido muchos perfiles, que son conjuntos de características MPEG-4 según lo
determinado por DivX. Debido a que la agrupación es diferente de lo especificado en el estándar
MPEG-4, hay un proceso de certificación de dispositivos específicos de DivX para fabricantes de
dispositivos. Los perfiles de DivX difieren de los perfiles estandarizados del estándar internacional
ISO / IEC MPEG-4.

12.13.4. vídeo DivX a la demanda


DivX Video on Demand (VOD DivX) es la versión DivX de gestión de los derechos digitales
(DRM), que permite a los propietarios de contenido el control de la distribución en un esfuerzo por
frustrar la piratería. DivX, Inc. ha recibido la aprobación del formato de los grandes estudios de
Hollywood incluyendo Sony, Paramount y Lionsgate, que han permitido a los minoristas vender
contenidos protegidos de vídeos que se reproducirán en en las generaciones actuales y anteriores de
dispositivos certificados DivX.

12.14. Formato MOD


MOD y TOD son nombres informales de formatos de vídeo sin cinta utilizados por JVC (MOD y
TOD), Panasonic (solamente MOD) y Canon (solamente MOD) en algunos modelos de
videocámaras digitales. Los nombres del formato corresponden a las extensiones de los ficheros de
vídeo. Ni JVC ni Panasonic, que fueron los pionero del formato, han explicado el sentido de las
extensiones de fichero y los formatos nunca se les dio un nombre oficial. MOD se utiliza
exclusivamente para los ficheros de vídeo de definición normal, mientras que TOD se utiliza para
los ficheros de alta definición.
Las primeras cámaras de vídeo que utilizaban el formato MOD aparecieron en 2003. JVC introdujo
el Everio GZ-MG30, que grababa directamente en el disco duro interno. Panasonic lanzó el SDR-
S100 donde grababa en tarjetas SD. El tipo de codec, las tasas de datos, la velocidad de fotogramas
y el tamaño de la trama eran muy igualados a los parámetros de DVD-vídeo.
En enero de 2007, JVC anunció su primera videocámara de alta definición sin cinta, Everio GZ-
HD7, que podría grabar 1080i MPEG-2 de vídeo ya sea en la unidad de disco duro integrada o una
tarjeta de memoria SD. Las tasas de datos, la tasa de fotograma y el tamaño de trama iguales o
mayores que los parámetros de HDV 1080i de vídeo. Este formato se conoce como TOD.
Ni Panasonic ni Canon han lanzado una videocámara de consumo de alta definición con formato de
grabación TOD. En su lugar, Panasonic se unió a Sony para desarrollar AVCHD. La primera
videocámara AVCHD, Sony Handycam HDR-SR1, salió a la venta en Septiembre de 2006.
Panasonic siguió con el lanzamiento de la HDC-SD1 en Noviembre de 2006. Canon soporta el
formato AVCHD mediante la liberación de su primera videocámara AVCHD en 2007.
En Enero de 2008 Canon dio a conocer una familia de videocámaras de consumo con definición
estándar sin cinta: los modelos FS100, FS10 y FS11. Todas estas videocámaras graban en formato
MOD.
Ambos MOD y TOD son formatos basados en ficheros que se almacenan en un soporte de acceso
aleatorio. La estructura de directorios y la convención de nombres son idénticas, excepto para las
extensiones de los ficheros multimedia.
El vídeo con definición estándar se almacena en los ficheros con contenedor de flujo del programa
MPEG con extensión MOD; en la mayoría de los otros sistemas, estos ficheros tienen extensión
MPG o MPEG. El vídeo de alta definición se almacena en los ficheros con contenedor de flujo de
transporte MPEG con extensión TOD; en la mayoría de los otros sistemas, estos ficheros tienen
extensión M2T. Los ficheros de flujo de transporte se pueden convertir en ficheros de flujo de
programas más comunes sin volver a comprimir el propio vídeo. Por ejemplo, FFmpeg, un
179

programa de software libre, realiza la conversión en los sistemas Windows y Linux con el siguiente
comando: ffmpeg-i-myclip.TOD -acodec copy -vcodec copy myclip.mpg. El software, incluido con
las cámaras de vídeo TOD, realiza esta conversión como parte del proceso de captura. Se usa un
comando similar para los ficheros MOD: ffmpeg-i myClip.MOD -vcodec copy -acodec ac3 -ab
384K myClip.mpg -acodec mp2-ab 192k-newaudio.
A pesar de que la estructura de ficheros es única a este formato de grabación de vídeo, la ubicación
de las imágenes fijas sigue el estándar acordado por muchos fabricantes de cámaras.
El vídeo de definición estándar se pueden grabar en los formatos 4:3 y 16:9, pero este último no
está correctamente identificado en la cabecera del fichero, así el vídeo puede aparecer apretado
horizontalmente. El software que se suministra con las cámaras de vídeo es capaz de procesar
relaciones de aspecto correctamente utilizando los metadatos almacenados en los ficheros MOI.
También hay herramientas de terceros para el establecimiento de la etiqueta del ancho de pantalla en
la cabecera del fichero.
El vídeo MOD se puede ver en un ordenador con un reproductor que sea capaz de reproducir vídeo
MPEG-2. Este vídeo puede ser fácilmente creado para ver en un reproductor de DVD sin
recompresión, ya que es totalmente compatible con el estándar DVD-vídeo.
El formato TOD es comparable con el AVCHD, pero no pueden ser directamente reproducido
equipos de vídeo de consumo. Los ficheros TOD deben ser envasados en formatos de distribución
como HD DVD o Blu-ray Disc, utilizando el software de edición. Uno de los modos de grabación
TOD, el 1440CBR, tiene el mismo tamaño de trama, la relación de aspecto y la velocidad de
fotogramas que el 1080i HDV.

12.15. Formato ASF


El formato ASF (Advanced Systems Format) es un formato de almacenamiento de vídeo digital,
propiedad de Microsoft y es parte del marco de Windows Media. ASF se basa en objetos
serializados que son esencialmente secuencias de octetos identificados por un marcador de GUID.
El formato no especifica cómo se debe codificar el vídeo o el audio, sólo especifica la estructura del
flujo de vídeo/audio. Esto es similar a la función realizada por los formatos de contenedor como
QuickTime, AVI, o Ogg. Uno de los objetivos del formato ASF es dar soporte a la reproducción de
los servidores de medios digitales, los servidores HTTP, y los dispositivos locales de
almacenamiento, como unidades de disco duro.
Los tipos de fichero más comunes contenidos en un fichero ASF son los formatos WMA y WMV.
Tener en cuenta que las abreviaturas de la extensión del fichero son diferentes de los codecs que
tienen el mismo nombre. Los ficheros que contienen sólo audio WMA pueden ser nombrados
usando una extensión .wma y los ficheros de contenido de audio y vídeo pueden tener la
extensión .wmv. Ambos pueden usar la extensión .asf si lo desea.
Los ficheros ASF también pueden contener objetos que representan los metadatos, como el artista,
el título, el álbum y el género de una pista de audio, o el director de una pista de vídeo, muy similar
a las etiquetas ID3 de los ficheros MP3. Soporta los tipos de medios escalables y la priorización del
flujo y, como tal, es un formato optimizado para el streaming.
El contenedor ASF proporciona el marco para la gestión de los derechos digitales de Windows
Media Audio y Windows Media Video. Un análisis de un esquema anterior utilizado en WMA
revela que está usando una combinación de criptografía de curva elíptica con intercambio de claves,
el cifrado en bloque DES, un cifrado de bloques personalizados, cifrado de flujo RC4 y la función
hash SHA-1.
Para la transmisión de los datos normalmente se utilizan los protocolos MMS o RTSP.
180

12.16. Formato 3G2/3GP


El formato 3GP (3GPP) es un formato de contenedor multimedia definido por el Third Generation
Partnership Project (3GPP) para los servicios multimedia de 3G UMTS.
El formato 3G2 (3GPP2) es un formato de contenedor multimedia definido por el 3GPP2 para los
servicios multimedia de 3G CDMA2000. Es muy similar al formato 3GP, pero tiene algunas
ampliaciones y limitaciones en comparación con el formato 3GP.
Las especificaciones técnicas del formato 3GP está, estandarizadas en el ETSI 3GPP. El formato
3GP es un formato requerido para el vídeo y asociado al audio y al texto temporizado.
Los formatos 3GP y 3G2 están basados estructuralmente basado en el formato de media de ISO
definido en ISO / IEC 14496-12 - MPEG-4 Parte 12, pero las versiones anteriores del formato 3GP
no utilizó algunas de sus características. 3GP y 3G2 son formatos de contenedor similares al
MPEG-4. Los formatos 3GP y 3G2 fueron diseñados para disminuir el almacenamiento y la
necesidad de ancho de banda con el fin de acomodarlo a los teléfonos móviles.
Las diferencias básicas de los formatos 3GP y 3G2 son:
• El formato 3GPP fue diseñado para los teléfonos basados en GSM y pueden tener la
extensión .3gp
• El formato 3GPP2 fue diseñado para los teléfonos basados en CDMA y pueden tener la
extensión .3g2
El formato 3GP almacena los flujos de vídeo como MPEG-4 o H.263, y los flujos de audio como
AMR-NB, AMR WB, AMR-WB +, AAC-LC, HE-AAC v1 o Enhanced aacPlus (HE-AAC v2). El
formato 3GPP permite el uso de llos codecs de AMR y H.263 en los medios basados en MPEG-4,
porque el formato 3GPP especifica el uso de la Sample Entry y los campos de plantilla.
El formato 3G2 puede almacenar los mismos flujos de vídeo y la mayoría de los flujos de audio
utilizados en el formato 3GP. Además el 3G2 almacena los flujos de audio como EVRC, EVRC-B,
EVRC-WB, 13K (QCELP), SMV o VMR BM, que fue especificad por el formato 3GPP2 para su
uso en los medios con el formato con base ISO. La especificación del formato 3G2 también define
algunas mejoras al texto temporizado del formato 3GPP.
Algunos teléfonos móviles utilizan la extensión .mp4 para el vídeo 3GP.
181

13. RAID (Redundant Array of Independent Disks)


Una simple sustitución de una unidad en un grupo de unidades de disco no aumentará la fiabilidad
ya que la vida de todo el sistema dependerá de cualquiera de estas unidades. De hecho la fiabilidad,
definida como el tiempo medio antes del fallo o MTBF, disminuirá con el aumento del número de
unidades de disco ya que la probabilidad de fallo de uno de ellos no crecerá. Por ello, se necesita un
cierto nivel de redundancia en el diseño de una matriz de unidades de disco para aumentar la
fiabilidad del sistema de almacenamiento.
La funcionalidad RAID es un conjunto de unidades de disco, conocido como matriz de discos, que
funciona como una única unidad de almacenamiento. En general las unidades podrían ser cualquier
sistema de almacenamiento con acceso aleatorio de datos, como discos duros magnéticos,
almacenamiento óptico, cintas magnéticas, etc.

13.1. Funciones RAID


La tecnología RAID (Redundant Array of Independent Disks) cubre las funciones siguientes:
• Disponibilidad inmediata de datos y dependiendo del nivel de RAID, como recuperamos los
datos almacenados cuando se pierden parcialmente. La pérdida completa de datos no nos da
la posibilidad de recuperarlos.
• Redundancia de los datos de acuerdo con el nivel elegido.
Dependiendo del nivel de RAID que se está utilizando, este método de almacenamiento de datos
proporciona la redundancia necesaria de datos para un sistema de alta seguridad, con el beneficio
adicional de una recuperación más rápida de los datos a través de su acceso múltiple. Si fallan uno o
más unidades de disco, normalmente se pueden sustituir sin interrumpir el funcionamiento normal
del sistema. Así las matrices de discos pueden garantizar que no se pierden los datos si una unidad
de disco de la matriz falla, porque no solo puede sustiturse en caliente, sino que también se puede
reconstruir la unidad fallada sin tener que para el RAID, y por lo tanto continuar dando servicio a
los usuarios de forma ininterrumpida. La matriz incluye las unidades, los controladores, las fuentes
de alimentación, los ventiladores, los cables, etc y el software. Cada matriz está dirigida por el
ordenador principal como una unidad. Existen varios tipos de configuración RAID, llamados
niveles, y que controlan la manera de organizar los datos en las unidades, así como organizan el
flujo de datos hacia y desde el ordenador principal.
En 1993, el Raid Advisory Board (RAB) estableció el programa RAID Level Conformance, que
siguió aproximadamente la clasificación inicial de los primeros trabajos de la Universidad de
California en Berkeley.

13.2. Conjuntos de bandas sin paridad


A diferencia de un conjunto de volúmenes, un conjunto de bandas requiere al menos dos unidades
físicas. En un conjunto de bandas, los datos se escriben equitativamente por todos los discos físicos,
de fila en fila. Todas las unidades que pertenecen al conjunto de bandas realizan las mismas
funciones que una única unidad. Esto permite que se emitan y se procesen comandos concurrentes
de entrada/salida en todas las unidades simultáneamente. De esta forma los conjuntos de bandas
pueden incrementar la velocidad de entrada/salida del sistema si éste tiene discos duros que
permiten el acceso simultáneamente.
182

13.3. Conjunto de bandas con paridad


A diferencia del anterior, cuando se almacenan los datos propiamente dichos, se les añade una
información adicional, la paridad, que permite la recuperación de datos ante fallos. Los datos y su
paridad están repartidos entre distintos discos. Para ello es necesario que haya un bloque de bandas
con paridad por cada banda del disco.
La lectura de datos de conjuntos de bandas con paridad es más rápida que leer datos de los
conjuntos de espejo. Sin embargo, si falla un disco, el rendimiento de lectura de un conjunto de
bandas con paridad es más lento, pues se recuperan los datos usando la información de paridad.
Todas las operaciones normales de escritura de un conjunto de bandas con paridad requieren el
triple de memoria debido al cálculo de la paridad.

13.4. Niveles RAID

13.4.1. RAID-0
El nivel RAID-0 usa la técnica de las bandas (striping), es decir, se trata de distribuir los datos entre
discos, con las bandas divididas en trozos contiguos llamados bloques. Este nivel no proporciona
ninguna redundancia, ya que si falla una unidad, todos los datos de la matriz se perderán.
Su tasa de transferencia es muy altas, dado que se accede en paralelo a todos los discos.

13.4.2. RAID-1
Este nivel RAID se le conoce también como sistema espejo porque los datos de un disco se
duplican exactamente en otro disco.
Su principal problema es que se requiere el 100% de redundancia o sea que se necesita el doble de
capacidad de disco de la que es realmente útil. Por otra parte, su rendimiento de lectura es mejor y
un mayor porcentaje de unidades en RAID-1 pueden fallar al mismo tiempo en comparación con un
sistema de RAID con paridad.
Tiene un alta fiabilidad en cuanto los mismos datos se escriben y leen dos o más veces.
El coste es al menos el doble de la capacidad normal.

13.4.3. RAID-2
Un nivel RAID 2 divide los datos a nivel de bits en lugar de a nivel de bloques y usa un código de
Hamming para la corrección de errores. Éste es el único nivel RAID original que actualmente no se
usa. Permite tasas de trasferencias extremadamente altas.

13.4.4. RAID-3
Un nivel RAID 3 usa división a nivel de bits con un disco de paridad dedicado. Si falla una unidad,
los datos pueden ser recuperados gracias a la paridad almacenada y las otras unidades seguirán
trabajando hasta que alguien sustituya y reconstruya la unidad fallada. Durante el fallo, el
rendimiento se resiente porque es necesaria uns reconstrucción de datos.
El nivel RAID 3 se usa rara vez en la práctica. Uno de sus efectos secundarios es que normalmente
no puede atender varias peticiones simultáneas, debido a que por definición cualquier bloque de
datos se dividirá por todos los miembros del conjunto, residiendo la misma dirección dentro de cada
uno de ellos. Así, cualquier operación de lectura o escritura exige activar todos los discos del
conjunto.
Tiene una alta fiabilidad y es más barato que el RAID-1. Su tasa de transferencia es muy alta, dado
que la lectura y la escritura se hace en paralelo. Para una determinada capacidad, se necesitan
183

menos discos que en RAID-1 El controlador puede ser más complejo y caro.

13.4.5. RAID-4
Un nivel RAID 4 usa división a nivel de bloques con un disco de paridad dedicado. Necesita un
mínimo de 3 discos físicos. El RAID 4 es parecido al RAID 3 excepto por el hecho de que divide a
nivel de bloques en lugar de a nivel de octetos. Esto permite que cada miembro del conjunto
funcione independientemente cuando se solicita un único bloque. Si la controladora de disco lo
permite, un conjunto de nivel RAID 4 puede servir varias peticiones de lectura simultáneamente. En
principio también sería posible servir varias peticiones de escritura simultáneamente, pero al estar
toda la información de paridad en un solo disco, éste se convertiría en el cuello de botella del
conjunto.

13.4.6. RAID-5
Se trata de un conjunto de discos dispuestos en bandas con paridad distribuida o paridad intercalada.
Necesita un mínimo de 3 discos. Cada vez que un bloque de datos se escribe en un RAID 5, se
genera un bloque de paridad dentro de la misma división. Los bloques de paridad no se leen en las
operaciones de lectura de datos, ya que esto sería una sobrecarga innecesaria y disminuiría el
rendimiento. Sin embargo, los bloques de paridad se leen cuando la lectura de un sector de datos
detecta un error de CRC. En este caso, el sector en la misma posición relativa dentro de cada uno de
los bloques de datos restantes en la división y dentro del bloque de paridad en la división se utilizan
para reconstruir el sector erróneo.
Tiene una alta fiabilidad y un alto rendimiento

13.4.7. RAID-6
Un nivel RAID 6 amplía el nivel RAID 5 añadiendo otro bloque de paridad, por lo que divide los
datos a nivel de bloques y distribuye los dos bloques de paridad entre todos los miembros del
conjunto. El RAID 6 no era uno de los niveles RAID originales.

13.5. Disponibilidad de los datos


El nivel RAID-0 es inadecuado cuando la disponibilidad de datos es un problema, ya que no
proporciona redundancia de datos y no tiene tolerancia a fallos. Para solventar la tolerancia a fallos
hay dos solucioes:
– La simetría de datos (RAID-1) o
– la comprobación de la paridad (RAID-3 a RAID-5).
El nivel RAID-5 es recomendable debido a su combinación de una alta disponibilidad de
datos y un buen rendimiento. En el caso de fallo de un disco, incluso si los datos siguen
estando físicamente disponibles, puede ser inaccesible dentro del período necesario debido a
una drástica caída en el rendimiento del sistema. La caída de rendimiento de un 50% no es
totalmente inusual durante la reconstrucción del sistema.

13.6. Características de rendimiento

Nivel de RAID Capacidad Transferencia de Tasa I/O Disponibilidad de


datos datos
184

Un disco Fija (100%) Bueno Bueno 10.000 a 1,000.000


horas
RAID-0 Excelente Muy bueno Muy bueno Pobre
RAID-1 Moderada (50%) Bueno Bueno Bueno
RAID-2 Muy bueno Bueno Pobre Bueno
RAID-3 Muy bueno Muy bueno Pobre Bueno
RAID-4 Muy bueno Muy bueno Pobre Bueno
RAID-5 Muy bueno Muy bueno Bueno Bueno

La disponibilidad es igual al MTBF de un disco dividido por el número de discos del conjunto. Con
la caída del precio de los discos duros, los sistemas RAID son lo suficientemente asequibles incluso
para el uso casero. El RAID-0 y el RAID-1 son los más sencillos de integrar mientras que los otros
niveles son sistemas más complejos.

13.7. Discos de repuesto en caliente


Una unidad de disco de repuesto en caliente es una unidad especial que está diseñada para su uso
automático en el caso de fallo de una unidad dentro de una matriz. El cambio en caliente tiene una
capacidad de almacenamiento superior o igual a la de la unidad más pequeña de una matriz. Es
posible definir tantos discos de reposición en caliente como se quiera. Si falla un disco dentro de
una matriz, el adaptador automáticamente solicitará una reposición en caliente de la unidad de disco
que ha fallado, y reconstruye los datos que estaban en el disco que ha fallado en caliente si es
posible.

13.8. EDAP (Extended Data Availability & Protection)


EDAP es la capacidad de un sistema de disco de proporcionar acceso de forma continua de forma
fiable a los datos bajo determinadas condiciones anormales. Estas condiciones, que son descritas
por el RAB (Raid Advisory Board), son las siguientes:
• Fallos dentro del sistema de discos
• Fallos externos: Fallos del equipo conectado al sistemas de discos incluyendo los buses I/O
y los servidores
• Fallos del entorno: Fallos resultantes de las condiciones ambientales anormales, tales como:
la fuente de alimentación externa, la temperatura, los desastres naturales como inundaciones
y terremotos, desastres como los incendios accidentales y los actos ilícitos, tales como
sabotaje, incendios, terrorismo, etc
• Períodos de sustitución: Los períodos de sustitución son los intervalos necesarios para la
sustitución de un componente fallado. Si no está soportado la sustitución en caliente por el
sistema de disco, entonces el período de sustitución de componentes es equivalente al
tiempo de inactividad del sistema de discos. Si se soporta la sustitución en caliente, entonces
el tiempo de inactividad debido a un período de sustitución se elimina; sin embargo, hasta
que se sustituya el componente que ha fallado, el sistema de disco se encuentra en una
situación vulnerable.
• Período vulnerable: Son los que se producen cuando el sistema de disco ha invocado su
capacidad para eludir un fallo, lo que hace al sistema vulnerable a los fallos adicionales y
haciendo que el sistema funcione a menos de un rendimiento óptimo hasta que se corrija el
185

fallo.

13.9. Nueva clasificación RAID


En 1996, el RAB introdujo una clasificación mejorada de los sistemas RAID. Divide el RAID en
tres tipos:
• Sistemas de discos resistentes al fallo, protegiendo de esta forma la pérdida de datos.
• Sistemas de discos tolerante a fallos, que solo protegen la pérdida de datos en el caso del
fallo de un único componente
• Sistemas de discos tolerantes a los desastres, que consta de dos o más zonas independientes,
cada una de las cuales suministra los datos almacenados.
La clasificación original RAID de Berkeley todavía se conserva como un importante punto de
referencia histórico, y también para reconocer que los Niveles 0-6 RAID definen de forma
satisfactoria todos los mapas de datos conocidos y los esquemas de protección para los discos.
Desafortunadamente, la clasificación original provocaba cierta confusión debido a la suposición de
que los mayores niveles de RAID implicaban mayor redundancia y rendimiento. Estas confusión
fue aprovechada por los fabricantes de sistemas RAID, y dio nacimiento a los productos con
nombres tales como RAID-7, RAID-10, RAID -30, RAID-S, etc. El nuevo sistema describe las
características de la disponibilidad de los datos del sistema RAID en lugar de los detalles de su
implementación.
La lista siguiente detalla los criterios para definir las tres clases de RAID:
- Sistemas de discos resistentes al fallo (deben cumplir estos 6 criterios):
1. Protección contra la pérdida de datos y la pérdida de acceso a los datos debido al
fallo de los sistemas de disco
2. Reconstrucción del contenido del disco fallado en el disco sustituído
3. Protección contra la pérdida de datos debido a un agujero de escritura
4. Protección contra la pérdida de datos debido al fallo del ordenador y el bus I/O del
mismo
5. Protección contra la pérdida de datos debido al fallo de la unidad reemplazable
6. Monitorización de la unidad reemplazable e indicación del fallo
- Sistemas de discos tolerantes al fallo (deben cumplir los criterios del 1 al 15):
7. Reemplazo automático y en caliente del disco
8. Protección contra la pérdida de datos debido al fallo de la cache
9. Protección contra la pérdida de datos debido a un fallo externo de la alimentación
eléctrica
10.Protección contra la pérdida de datos debido al sobrecalentamiento
11.Unidad reemplazable y aviso de fallo del ambiente
12.Protección contra la pérdida de datos debido al fallo del canal del dispositivo
13.Protección contra la pérdida del acceso a los datos debido al fallo del módulo del
controlador
14.Protección contra la pérdida del acceso a los datos debido al fallo de la cache
15.Protección contra la pérdida del acceso a los datos debido al fallo de la alimentación
interna
- Sistemas de discos tolerantes al fallo (debe cumplir los criterios del 1 al 21):
16.Protección contra la pérdida del acceso a los datos debido al servidor y el fallo del
bus I/O del servidor
186

17.Protección contra la pérdida del acceso a los datos debido al fallo de la alimentación
externa
18.Protección contra la pérdida del acceso a los datos debido al reemplazo del
componente
19.Protección contra la pérdida de los datos y la pérdida del acceso a los datos debido a
un fallo múltiple del disco
20.Protección contra la pérdida de acceso a los datos debido al fallo de la zona
21.Protección a larga distancia contra la pérdida de datos debido al fallo de la zona
187

14. Clustering
Un clúster de computadoras es un grupo de computadoras enlazadas, trabajando en estrecha
colaboración a fin de que en muchos aspectos, forman un solo equipo. Normalmente los
componentes de un clúster están, pero no siempre, conectados entre sí a través de rápidas redes de
área local. Normalmente los clusters están desplegados para mejorar el rendimiento y/o la
disponibilidad en comparación con un solo ordenador.

14.1. Categorías de clusters

14.1.1. Clusters de alta disponibilidad


Los clusters de alta disponibilidad se implementan principalmente con el propósito de mejorar la
disponibilidad de los servicios que ofrece el clustering. Operan teniendo nodos redundantes, que se
utilizan para prestar el servicio cuando los componentes del sistema fallan. El tamaño más común
de un clúster de alta disponibilidad son dos nodos, que es el requisito mínimo para proporcionar
redundancia. La implementaciones de clúster de alta disponibilidad intentan utilizar la redundancia
de los componentes del clúster para eliminar los puntos únicos de fallo.
Hay muchas implementaciones comerciales de clústeres de alta disponibilidad para muchos
sistemas operativos. El proyecto HA-Linux es uno de los de uso más amplio de software libre para
el sistema operativo Linux.

14.1.2. Clusters con balanceo de carga


El balanceo de la carga consiste en varios ordenadores que están enlazados entre sí para compartir
la carga de trabajo computacional o la función como un equipo virtual. Lógicamente, desde el lado
del usuario, hay múltiples máquinas, pero funcionan como una sola máquina virtual. Las solicitudes
iniciadas por el usuario son gestionadas por y distribuidas entre todos los equipos independientes
que forman el cluster. Esto se traduce en un trabajo balanceado de cálculo entre las diferentes
máquinas, mejorando el rendimiento del sistema de clúster.

14.1.3. Clusters de computación


A menudo, los clusters son utilizados principalmente para fines de cálculo, en lugar de manejar las
operaciones de E/S como el servicio web o las bases de datos. Por ejemplo, un clúster puede
soportar simulaciones computacionales de tiempo o de choques de vehículos. La distinción
principal dentro de los clusters de computación es como se acoplan en cuanto son nodos
individuales. Por ejemplo, un único trabajo de computación puede exigir una frecuente
comunicación entre los nodos; esto implica que el clúster comparte una red dedicada, se encuentra
densamente localizada, y probablemente tiene nodos homogéneos. Este diseño de clúster se conoce
normalmente como Beowulf Cluster. El otro extremo es donde un trabajo de computación utiliza
uno o pocos nodos, y necesita poca o ninguna comunicación entre nodos. Esta última categoría es a
veces llamada computación 'grid'. Los clusters de computación fuertemente acoplados están
diseñados para trabajos que tradicionalmente podría haber sido llamados de supercomputación. El
middleware como MPI (Message Passing Interface) o PVM (Parallel Virtual Machine) permite que
los programas de clusters de computación sean portables a una amplia variedad de clusters.

14.1.4. Computación en red


Las redes ('grids') usan por lo general clusters de ordenadores, pero más centradas en el rendimiento
188

como una utilidad informática en lugar de correr pocos trabajos bien acoplados. A menudo, estas
redes se incorporan a conjuntos heterogéneos de ordenadores, posiblemente distribuidos
geográficamente, a veces, administrado por organizaciones independientes.
La computación en red está optimizada para cargas de trabajo que se componen de muchos trabajos
independientes, que no tienen que compartir datos entre los trabajos durante el proceso de
computación. Las redes sirven para gestionar la asignación de trabajos a los ordenadores que
realizarán el trabajo de forma independiente del resto del clúster en red. Los recursos tales como el
almacenamiento puede ser compartidos por todos los nodos, pero los resultados intermedios de un
trabajo no afectan a otros trabajos en curso en otros nodos de la red.
Un ejemplo de una red muy grande es el proyecto Folding@home. Es el análisis de datos que usan
los investigadores para encontrar curas para enfermedades como el Alzheimer y el cáncer. Otro gran
proyecto es el SETI@home, que puede ser la mayor red de distribución existente. Emplea
aproximadamente tres millones de ordenadores particulares en todo el mundo para analizar los
datos del radiotelescopio del Observatorio de Arecibo, en busca de evidencia de inteligencia
extraterrestre. En ambos casos, no hay comunicación entre nodos o almacenamiento compartido.
Los nodos individuales se conectan a uno principal, fundamental para la recopilación de los
resultados.
La configuración de la red significa que los nodos pueden realizar muchos trabajos que son capaces
de procesar en una sola sesión y luego devolver los resultados y adquirir un nuevo trabajo de un
servidor central del proyecto.

14.2. Implementaciones
La lista semestral de la organización TOP500 de las 500 computadoras más rápidas incluyen por lo
general muchos clusters. TOP500 es una colaboración entre la Universidad de Mannheim, la
Universidad de Tennessee, y el National Energy Research Scientific Computing Center en el
Lawrence Berkeley National Laboratory. El 18 de junio de 2008, la supercomputadora más potente
era el sistema Roasruuner de IBM del Departamento de Energía de USA con un rendimiento de
1026 TFlops medidos según High-Performance LINPACK benchmark.

14.2.1. Cónsolas de juegos


Debido a la creciente potencia de cálculo de cada generación de consolas de juegos, ha emergido un
nuevo uso donde son reutilizados en clusters HPC. Algunos ejemplos de clusters en las consolas de
juegos son los clusters de PlayStation de Sony y los de Microsoft Xbox.

14.3. Historia
En cuanto a la historia del clustering, en una nota a pie de página del libro 'In Search of Clusters' de
Greg Pfister dice: "Prácticamente todos los comunicados de prensa de DEC citan los clusters
diciendo, 'DEC, que inventó los clusters ...". IBM no los inventó. Los usuarios inventaron los
clusters, tan pronto como no podían hacer su trabajo con un solo ordenador, o necesitaban una copia
de seguridad. La fecha del primer clúster es desconocido, pero podría ser en la década de 1960, o
incluso a finales de 1950."
La base formal de la ingeniería del clustering como un medio de hacer un trabajo paralelo de
cualquier tipo, fue posiblemente inventado por Gene Amdahl de IBM, que en 1967 publicó lo que
ha llegado a ser considerado como el documento fundamental sobre el procesamiento en paralelo: la
Ley de Amdahl. La ley de Amdahl describe matemáticamente que la paralelización uede acelerar
los procesos en contra de la serialización de las tareas. Este artículo define la base de la ingeniería
189

tanto para la computación multiprocesador como de la computación en clúster, donde el principal


factor diferenciador es si las comunicaciones entre procesadores son compatibles dentro de la
computadora o fuera del ordenador en una red.
En consecuencia, la historia de los primeros clusters está más o menos directamente ligada a la
historia de las primeras redes. Así uno de los motivos principales para el desarrollo de una red fue la
vinculación de los recursos informáticos, creando de hecho un clúster de computadoras. Las redes
de conmutación de paquetes fueron conceptualmente inventadas por la corporación RAND en 1962.
Utilizando el concepto de una red de conmutación de paquetes, el proyecto ARPANET tuvo éxito en
su creación en 1969, que podría decirse que fue la primera red basada en clúster de ordenadores
mediante el enlace de cuatro centros de computación. El proyecto ARPANET se convirtió en el
Internet de hoy que puede ser considerado como la madre de todos los clústers de ordenadores. El
uso de redes de conmutación de paquetes permite realizar comunicaciones entre los procesadores
ubicados en en redes discontinuas.
El desarrollo de los clusters construidos por usuarios y grupos de investigación siguió en paralelo
con la de las redes y el sistema operativo Unix de la década de 1970, así como el protocolo TCP/IP
y el proyecto de PARC de Xerox creado y formalizado con protocolos basados en la red de
comunicaciones. El sistema operativo Hydra fue construido para un clúster de miniordenadores
DEC PDP-11 llamado C.mmp en C-MU en el año 1971. Sin embargo, no fue sino hasta alrededor
de 1983 que se definieron los protocolos y las herramientas para hacer fácilmente la distribución de
trabajos remotos y la compartición de ficheros.
El primer producto comercial de clustering fue ARCnet, desarrollado por Datapoint en el año 1977.
ARCnet no fue un éxito comercial y el clustering por si mismo no despegó hasta que DEC lanzó su
producto VAXcluster en 1984 para el sistema operativo VAX/VMS. Los productos ARCnet y
VAXcluster no sólo soportaban computación paralela, sino también sistemas de ficheros
compartidos y los dispositivos periféricos compartidos. La idea era ofrecer las ventajas del
procesamiento en paralelo, mientras se mantenía la fiabilidad y la unicidad de los datos.
VAXcluster, ahora VMScluster, todavía está disponible en los sistemas OpenVMS de HP corriendo
en sistemas Alpha e Itanium.
Dos notables clusters comerciales fueron el Tandem Himalaya, un producto de alta disponibilidad
en el año 1994 y el S/390 Parallel Sysplex de IBM en paralelo también de 1994, principalmente
para uso comercial.
La historia de los clusters de ordenadores no estaría completa sin señalar el papel fundamental
desempeñado por el desarrollo de PVM (Parallel Virtual Machine) en el año 1989. Este software de
código abierto basado en comunicaciones con el protocolo TCP/IP permitió la creación inmediata
de una supercomputador virtual, un clúster de ordenadores de alto rendimiento, hecho con distintos
sistemas conectados. Los clusters heterogéneos basados en la parte superior de este modelo lograron
rápidamente el rendimiento total que superaba con creces la disponibilidad de las
supercomputadoras más caras.
La tecnología PVM y el abaratamiento de las redes de ordenadores personales llevó, en 1993, a un
proyecto de la NASA a construir superordenadores con clusters. En 1995, la invención del clúster
estilo Beowulf permitió las computaciones HPC en paralelo mediante la red como si fuera un
superordenador. Esto a su vez estimuló el desarrollo independiente de la computación en red.

14.4. Tecnologías
MPI es una librería de comunicación ampliamente disponible que permite programas paralelos
escritos en C, Fortran, Python, OCaml, y muchos otros lenguajes de programación.
190

El mundo GNU/Linux soporta varios software en clúster. Para aplicaciones en clustering, hay el
Beowulf, distcc, y MPICH Linux Virtual Server, Linux-HA-director basado en clusters que permite
que las solicitudes de servicios se distribuyan a través de varios nodos en clúster. MOSIX,
openMosix, Kerrighed, OpenSSI son clusters integrados en el núcleo que proporcionan la migración
automática de procesado entre los nodos homogéneos. OpenSSI, openMosix y Kerrighed son
implementaciones de imagen en un único sistema.
Microsoft Windows Compute Cluster Server 2003 basada en la plataforma Windows Server
proporciona piezas para la computación de alto rendimiento como el planificador de tareas, la
librería MSMPI y las herramientas de gestión. El Lincoln de la NCSA es un clúster de servidores
450 Dell PowerEdge 1855 corriendo Windows Compute Cluster Server 2003.
gridMathematica proporciona computaciones distribuidas sobre clusters incluido el análisis de
datos, la álgebra computacional y la visualización en 3D. Puede hacer uso de otras tecnologías, tales
como Altair PBS Professional, Microsoft Windows Compute Cluster Server, Plataforma LSF y Sun
Grid Engine.
gLite es un conjunto de tecnologías middleware creadas por Enabling Grids para el proyecto E-
sciencE (EGEE).
Otro ejemplo de productos de juegos que se adaptan a la computación de alto rendimiento es la
estación de trabajo NVIDIA Tesla, que obtiene su potencia de procesamiento aprovechando la
potencia de varios chips procesadores de la tarjeta aceleradora gráfica.
191

15. NAS (Network Attached Storage)


Una unidad NAS es esencialmente un ordenador autónomo conectado a una red, con el único
propósito de suministrar servicios de almacenamiento de datos basados en ficheros a otros
dispositivos en la red. El sistema operativo y otro software en la NAS proporcionan la funcionalidad
de almacenamiento de datos, sistemas de ficheros y el acceso a los ficheros y la gestión de estas
funcionalidades. La unidad no está diseñada para llevar a cabo tareas generales de computación,
aunque técnicamente puede ser posible ejecutar otros programas. Normalmente las unidades NAS
no tienen teclado ni pantalla, y son controlados y configurados a través de la red, a menudo
mediante la conexión de un navegador a su dirección de red. La alternativa al almacenamiento NAS
en una red es utilizar un ordenador como servidor de ficheros. En su forma más básica, un servidor
de ficheros dedicado no es más que una unidad NAS con teclado y pantalla y un sistema operativo
que, optimizado para proporcionar servicios de almacenamiento, puede ejecutar otras tareas; sin
embargo, los servidores de ficheros son cada vez más utilizado para suministrar otras
funcionalidades, tales como el suministro de servicios de bases de datos, servicios de correo
electrónico, y otros.
Un sistema operativo de propósito general no es necesario en un dispositivo NAS, y con frecuencia
se usan sistemas operativos con mínima funcionalidad. Por ejemplo FreeNAS, que es software NAS
abierto diseñado para su uso en los estándares de hardware, es sólo una versión de FreeBSD con
todas las funcionalidades no relacionadas con el almacenamiento de datos sacadas. NASLite es una
distribución de Linux muy optimizada que se ejecuta desde un disquete con el único propósito de un
NAS. Asimismo, NexentaStor se basa en el núcleo de Nexenta OS, un sistema operativo híbrido y
abierto con un núcleo de OpenSolaris y un entorno de usuario GNU.
Los sistemas NAS contienen uno o más discos duros, a menudo organizados en contenedores de
almacenamiento lógicos redundante o arreglos RAID. NAS elimina la responsabilidad del servicio
de ficheros de otros servidores en la red.
NAS utiliza protocolos basados en ficheros como NFS, SMB / CIFS o AFP. Las unidades NAS rara
vez limitan los clientes a un protocolo único.
NAS proporciona almacenamiento y sistema de ficheros. Esto es a menudo contrastado con SAN,
que proporciona sólo almacenamiento basados en bloques y deja lo referente al sistema de ficheros
en el lado cliente. Los protocolos de SAN son SCSI, Fibre Channel, iSCSI, ATA sobre Ethernet
(AoE), o HyperSCSI.
Pese a que las diferencias entre SAN y NAS no son mutuamente excluyentes y pueden ser
combinadas en una SAN-NAS híbrida, ofreciendo tanto protocolos de nivel de fichero (NAS) como
protocolos de nivel de bloque (SAN) en el mismo sistema. Un ejemplo de esto es Openfiler, un
producto de software libre que corre sobre Linux.

15.1. Historia
A principios de los años 1980, la Newcastle Connection de Brian Randell y sus colegas de la
Universidad de Newcastle demostraron y desarrollaron el acceso remoto a ficheros a través de un
conjunto de máquinas UNIX. El sistema operativo de servidor NetWare de Novell y el protocolo
NCP fue lanzado en 1983. Después de Newcastle Connection, Sun Microsystems en1984 liberó el
NFS, permitiendo a los servidores de la red compartir su espacio de almacenamiento con los
clientes de la red. 3Com y Microsoft desarrollarían el software y el protocolo LAN Manager a
seguir en este nuevo mercado. El software 3Server y 3+Share de 3Com fue instalado por primera
192

vez en servidores en sistemas abiertos. Inspirado por el éxito de los servidores de ficheros de
Novell, IBM y Sun, varias empresas desarrollaron servidores de ficheros dedicados. Mientras que
3Com fue una de las primeras empresas en construir una NAS dedicada para los sistemas operativos
de sobremesa, Auspex Systems fue uno de los primeros en desarrollar un servidor NFS dedicado
para el uso en el mercado de UNIX. Un grupo de ingenieros de Auspex se separó de ellos en la
década de 1990 para crear el ficherador integrado NetApp, que soportaba el CIFS de Windows y el
NFS de UNIX, y tenía una escalabilidad superior y mayor facilidad de despliegue. Así comenzó el
mercado de dispositivos NAS propietarios ahora encabezados por NetApp y EMC Celerra.
A partir de la década de 2000, una serie de nuevas empresas surgieron ofreciendo soluciones
alternativas a la solución de ficherador único en forma de NAS - Spinnaker Networks, Exanet,
IBRIX, Isilon, PolyServe, y Panasas, para nombrar unos pocos.
En el 2009, los proveedores de NAS comenzaron a introducir soluciones de copia de seguridad en
línea integrada en sus dispositivos NAS, para la recuperación de desastres en línea.

15.2. Beneficios
La diferencia clave entre DAS (Direct Attached Storage) y NAS es que DAS es simplemente una
extensión a un servidor existente y no hay red mientras que NAS se basa en una red como una
entidad propia; es más fácil compartir ficheros con NAS.
La disponibilidad de datos potencialmente podría aumentar con NAS si ofrece RAID integrado y
clustering.
El rendimiento puede ser aumentado con NAS porque el servicio de ficheros se realiza con la NAS
y no hay un servidor responsable de hacer también otro tipo de procesamiento. Sin embargo el
rendimiento de los dispositivos NAS depende en gran medida de la velocidad y el tráfico en la red y
de la cantidad de memoria caché (RAM) en los equipos o dispositivos NAS.

15.3. Inconvenientes
Debido al multiprotocolo, a la reducida CPU y el nivel de sistema operativo, la NAS tiene sus
limitaciones en comparación con los sistemas DAS/SAN. Si el NAS está ocupada con demasiados
usuarios, demasiadas operaciones de E/S o la potencia de procesamiento de CPU esta demasiado
ocupada, el NAS alcanza sus límites. Un sistema servidor es fácilmente actualizable mediante la
adición de uno o más servidores en un clúster, así la potencia de la CPU se puede actualizar,
mientras que el NAS está limitado a su propio hardware, que es en la mayoría de los casos no
actualizable.
Ciertos dispositivos NAS fallan en exponer los servicios bien conocidos que son típicos de un
servidor de ficheros, o que puedan de alguna manera que no sea eficiente. Algunos ejemplos son: la
capacidad para calcular el uso de disco de directorios separados, la capacidad para indexar ficheros
rápidamente, la capacidad de hacer espejos de manera eficiente con rsync. Todavía aún usando
rsync, pero a través de un cliente NFS o CIFS; este método no puede enumerar las jerarquías de
ficheros grandes a la velocidad nominal de las unidades locales y provoca un tráfico de red
considerable.
Cabe señalar que NAS es efectivamente un servidor en sí mismo, con todos los principales
componentes de un PC típico y su fiabilidad está en función de lo bien que esté diseñado
internamente. Un NAS sin rutas de acceso de datos redundantes, controladores redundantes, fuentes
de alimentación redundantes, es probablemente menos fiable que Direct Attached Storage (DAS)
conectado a un servidor que tiene la redundancia de sus componentes principales.
193
194

16. SAN (Storage Area Network)


En los antiguos entornos centrados en un gran ordenador, la gestión de almacenamiento era
centralizada y los dispositivos de almacenamiento se conectaban directamente al ordenador. Es
relativamente sencillo y fácil administrar el almacenamiento de esta manera.
El advenimiento de la computación cliente/servidor, junto con las tendencias de reducción y
'rightsizing', creó un nuevo conjunto de problemas, como el aumento de los costos de gestión, así
como nuevos problemas de gestión de almacenamiento. La información que estaba centralizada en
un ordenador actualmente está dispersa en toda la red y a menudo está mal gestionada y mal
controlada. Los dispositivos de almacenamiento están dispersos y conectados a máquinas
individuales. Los aumentos de capacidad se deben planificar máquina a máquina. El
almacenamiento adquirido para una plataforma de sistema operativo a menudo no se puede utilizar
en otras plataformas. Podemos visualizar este entorno como islas de información. La información
en una isla es a menudo difícil de acceder desde otras islas.

Así aparece el concepto de SAN (Storage Area Network) como una red de almacenamiento de alta
velocidad y gestionada de forma centralizada. Esta SAN está compuesta por dispositivos de
almacenamiento de distintos fabricantes, un programa de gestión del almacenamiento, servidores de
aplicación y hardware de red. La SAN se ha centralizado e interconectado, lo que representa, en
efecto, una reincorporación al modelo de almacenamiento central del host o computadora central.

También se puede definir la SAN como una red de alta velocidad, similar a una LAN, que permite
el establecimiento de conexiones directas entre los dispositivos de almacenamiento y los
procesadores (servidores). La SAN se puede ver como una extensión del concepto de bus de
almacenamiento que permite la interconexión de dispositivos de almacenamiento y servidores
usando elementos similares a los de redes de área local (LAN) y redes de área amplia (WAN):
enrutadores, concentradores, conmutadores y pasarelas. Una SAN puede ser compartida entre
servidores y/o dedicado a un servidor. Puede ser local o se puede extender a través de distancias
geográficas. Las interfaces SAN pueden ser Connection Enterprise Systems (ESCON), Small
Computer Systems Interface (SCSI), Serial Storage Architecture (SSA), High Interface Productivity
Parallel Interface (HIPPI), Fibre Channel (FC) o cualquiera conectividad física nueva que surja.

Las SANs crean nuevos métodos de asignación de almacenamiento a los servidores. Estos nuevos
métodos proveen grandes mejoras en cuanto a disponibilidad y rendimiento. Las SANs se utilizan
para conectar el almacenamiento compartido a múltiples servidores, y se utilizan servidores en
clustering para solventar los fallos. Pueden interconectar los discos o las cintas de los grandes
ordenadores a los servidores o clientes de la red, y pueden crear caminos paralelos de datos en
entornos computacionales de grandes anchos de banda. Una SAN es otra red que difiere de las redes
tradicionales porque se construyen a partir de interfaces de almacenamiento. A menudo se dice que
son redes detrás de los servidores.

Una SAN se puede utilizar para resolver los cuellos de botella de las redes tradicionales. Soporta
transferencias de datos directas y a alta velocidad entre servidores y dispositivos de almacenamiento
de tres formas posibles:
– Servidor a almacenamiento: Es el modelo tradicional de interacción con los dispositivos de
almacenamiento. La ventaja es que se puede acceder a un determinado dispositivo de
almacenamiento serialmente o concurrentemente por varios servidores.
– Servidor a servidor: Una SAN se puede utilizar para comunicaciones de alta velocidad y
gran volumen entre servidores.
– Almacenamiento a almacenamiento: Esta capacidad de movimiento de datos permite que los
195

datos se muevan sin la intervención de servidores, así liberamos ciclos de los procesadores
de los servidores, que se pueden utilizar para otras actividades como son el procesado de
aplicaciones. Los ejemplos incluyen un dispositivo de disco que hace copias de seguridad de
sus datos en una cinta sin la intervención de un serrvidor, o hacer un espejo de un
dispositivo remoto a través de la SAN.

Las SANs permiten a las aplicaciones mover datos con un mejor rendimiento, por ejemplo,
enviando los datos directamente desde un origen a un dispositivo destino sin la intervención de un
servidor. Las SANs también permiten nuevas arquitecturas de red donde varios ordenadores
acceden a varios dispositivos de almacenamiento en la misma red. Usando una SAN, se pueden
ofrecer potencialmente los beneficios siguientes:
– Mejoras en la disponibilidad de la aplicación: Almacenamiento independiente de las
aplicaciones y accesible a través de caminos alternativos de datos.
– Mayor rendimiento de la aplicación: procesado del almacenamiento aparte de los servidores
y su movimiento por una red separada.
– Almacenamiento centralizado y consolidado: Gestión más sencilla, escalabilidad,
flexibilidad, y disponibilidad.
– La copia remota de datos permite la protección ante posibles desastres.
– Gestión centralizada simplificada.

16.1. Servidores SAN


La infraestructura de servidores es la principal razón de todas las soluciones SAN. Esta
infraestructura incluye una mezcla de servidores con distintas plataformas como por ejemplo
Windows Server, UNIX y OS/390. Aunque las primeras soluciones SAN solo soportaban entornos
homogéneos, la SAN ha evolucionado hacia entornos heterogéneos.

16.2. Almacenamiento SAN


La infraestructura de almacenamiento es la base sobre la que se basa la información y por lo tanto
deben apoyar los objetivos de negocio de una empresa. En este entorno, no basta con el despliegue
de dispositivos de almacenamiento más y más rápidos. Se necesita un nuevo tipo de infraestructura,
que proporcione una mayor disponibilidad de la red, mayor accesibilidad de los datos y mayor
capacidad de administración del sistema que proporcionan la infraestructura actual.

La SAN cumple con este reto. La SAN libera el dispositivo de almacenamiento, por lo que no está
en un determinado bus del servidor, sino que lo asocia directamente a la red. En otras palabras, el
almacenamiento se externaliza y funcionalmente se distribuye en toda la organización. La SAN
también permite la centralización de los dispositivos de almacenamiento y el clustering de
servidores, lo que hace la administración más fácil y menos costosa.

16.3. Aplicaciones SAN


Las SANs (Storage Area Networks) permiten que varias aplicaciones mejoren el rendimiento, la
gestión y la escalabilidad de las infraestructuras TI. Estas aplicaciones están siendo impulsadas por
las capacidades de la tecnología, y como la tecnología madura con el tiempo, es probable que
veamos más y más aplicaciones en el futuro.

16.3.1. Repositorio y Datos Compartidos


Las SANs permiten que el almacenamiento sea externalizado desde el servidor y centralizado, y al
hacerlo, permite que los datos sean compartidos entre varios servidores sin afectar el rendimiento
del sistema. El término compartición de datos describe el acceso de los datos para el procesamiento
196

por múltiples plataformas de computadoras o servidores.


Los datos compartidos pueden estar en plataformas que son similares o diferentes; esto también se
conoce como la compartición de datos homogénea y heterogénea.

16.3.2. Almacenamiento compartido


Con el uso compartido del almacenamiento, dos o más servidores homogéneos o heterogéneos
comparten un único subsistema de almacenamiento, cuya capacidad ha sido físicamente
particionada de manera que a cada servidor conectado solo puede tener acceso las unidades
asignadas al mismo.

16.3.3. Compartición de la copia de los datos


La compartición de la copia de los datos permite que distintas plataformas accedan a los mismos
datos ya sea desde una plataforma u otra. Hay dos propuestas para hacer esto: mediante
transferencia de ficheros o usando tuberías.

16.3.4. Compartición verdadera de datos


En la compartición verdadera de datos, sólo se accede a una copia de los datos desde múltiples
plataformas, ya sean homogéneas o heterogéneas. Cada plataforma tiene acceso de lectura y
escritura a la copia única de datos.

16.3.5. Copias de seguridad de los datos


En la mayoría de los escenarios actuales de copias de seguridad de datos, el almacenamiento casi es
en línea. La red primaria, LAN o WAN, es el medio utilizado para el transferir tanto el servidor, el
fichero y el servidor de base de datos, o los datos del cliente de usuario final a los medios de
almacenamiento. Las SANs permiten que las operaciones de copias de seguridad de los datos en los
servidores sean más rápidas e independientes de la red primaria, lo que ha llevado a la existencia de
nuevas aplicaciones de movimiento de datos como las copias de seguridad LAN-less y las sin
servidor.

16.3.6. Intercambio de datos


Hoy en día, el intercambio de datos consiste principalmente en mover los datos de un sistema de
almacenamiento a otro. Sin embargo, los planes de trabajo de SAN de muchos fabricantes muestran
el intercambio de datos entre los diferentes sistemas heterogéneos como uno de los objetivos de las
SAN. Esto es debido principalmente a las distintas plataformas de almacenamiento y al acceso a los
datos utilizando diferentes métodos de codificación de los datos y estructuras de ficheros. El
verdadero intercambio de datos heterogéneos sólo puede lograrse cuando estos diferentes sistemas
de ficheros permiten el acceso transparente de datos.

16.3.7. Clustering
Normalmente el clustering se suele considerar como un proceso de servidor que proporciona
redundancia ante un error con un servidor, o como un procesamiento escalable usando varios
servidores en paralelo. En un entorno de clúster, las SAN proporcionan el canal de datos, que
permite que el almacenamiento sea compartido.
197

16.3.8. Protección de datos y recuperación de datos ante un


desastre
El nivel más alto de disponibilidad de las aplicaciones requiere evitar las tradicionales
técnicas de recuperación a partir de las copias de seguridad. En cambio las nuevas técnicas con los
sistemas y datos duplicados deben ser diseñadas de modo que, en el caso de de un fallo, esté
preparado otro sistema para seguir suministrando los datos a los usuarios.
La mejor protección de datos en entornos con el mayor nivel de disponibilidad se consigue
mediante la creación de segundas copias redundantes de los datos mediante el almacenamiento con
espejo, la duplicación remota de los discos, la copia remota puerto a puerto (CIPP - Peer-to-Peer
Remote Copy) y la Extended Remote Copy (XRC), la copia concurrente, y otras soluciones de
protección de datos de alta disponibilidad. Estas copias se utilizan para la recuperación de desastres.
La conectividad SAN permite soluciones redundantes de datos/almacenamiento dinámicas y sin
impacto en la red primaria y los servidores.

16.4. Asociaciones y organizaciones relacionadas con las SAN


Muchas asociaciones industriales, organismos de normalización y agrupaciones de empresas
participan en el desarrollo y la publicación de los estándares de SAN.
Las funciones de estas asociaciones y organismos se clasifican en tres categorías:
• Desarrollo de mercados. Estas asociaciones participan en el desarrollo del mercado, el
establecimiento de los requisitos, la realización de la educación de los clientes, las
conferencias de usuarios, etc. Las principales organizaciones son SNIA (Storage Network
Industry Association), FCIA (Fibre Channel Industry Association) y la SCSITA (SCSI Trade
Association). Algunas de estas organizaciones también participan en la definición de los
estándares de facto.
• Estándares de facto. Estas organizaciones y organismos tienden a promover estándares e
incluyen grupos de trabajo dentro de las organizaciones de desarrollo del mercado, como la
SNIA y FCIA. Otras son asociaciones entre los grupos de empresas de la industria, tales
como Jiro, Fibre Alliance y OSFI (Open Standards Fabric Initiative). Ellas ofrecen
definiciones de arquitectura, escriben artículos, organizan conferencias técnicas, y pueden
referirse a las implementaciones basadas en los desarrollos en sus propias empresas
asociadas. Pueden presentar estas especificaciones para la aceptación y aprobación de los
estándares formales. La OSFI es un buen ejemplo, y está compuesto por cinco fabricantes de
productos de conmutación de Fibre Channel. En Julio de 1999, anunciaron una iniciativa
para acelerar la definición, la finalización y la aprobación de estándares específicos de Fibre
Channel de cara a una posible interoperabilidad.
• Estándares formales. Son las organizaciones de estándares formales como el IETF, ANSI e
ISO, que están para revisar, obtener consenso, aprobar y publicar los estándares definidos y
presentados por las otras dos categorías de organizaciones.

Storage Networking Industry Association (SNIA)


La SNIA (Storage Networking Industry Association) es un foro internacional de la industria de la
computación de desarrolladores, integradores y profesionales IT que evolucionan y promueven la
tecnología de almacenamiento en redes y sus soluciones. SNIA se creó para garantizar que las redes
de almacenamiento fueran soluciones eficientes, completas y confiables a través de la comunidad
IT. SNIA es aceptada como la principal organización para el desarrollo de los estándares de la SAN,
con más de 125 empresas entre sus miembros, incluyendo los principales empresas de servidores,
almacenamiento y fabricantes de componentes. SNIA también tiene un grupo de trabajo dedicado a
la elaboración de normas de NAS. SNIA está comprometida a ofrecer arquitecturas, educación, y
servicios que impulsan las soluciones de redes de almacenamiento en un mercado más amplio. Para
198

más información visitar la web: www.snia.org

Fibre Channel Industry Association (FCIA)


La FCIA (Fibre Channel Industry Association) fue creada en otoño del año 1999 como resultado de
la fusión de la FCA (Fibre Channel Association) y la FCC (Fibre Channel Community).
Actualmente la FCIA tiene más de 150 miembros en los Estados Unidos y con sus organizaciones
afiliadas de Europa y Japón. La misión de la FCIA es nutrir y ayudar a desarrollar el más amplio
mercado para los productos de Fibre Channel. Esto se hace mediante el desarrollo del mercado, la
educación, la supervisión de las normas y el fomento de la interoperabilidad entre los productos de
los miembros. Para más información visitar la web: www.fibrechannel.com

SCSI Trade Association (SCSITA)


La SCSITA (SCSI Trade Association) fue creada para promocionar el uso y la comprensión de la
tecnología de interfaz paralelo SCASI para los pequeños sistemas de computación. La SCSITA
suministra un punto focal para explicar los beneficios de SCSI en el mercado, e influye en la
evolución de SCSI en el futuro. Para más información visitar la web: www.scsita.org

InfiniBand (SM) Trade Association


Las demandas de Internet y la computación distribuida tienen como retos la escalabilidad, la
fiabilidad, la disponibilidad y el rendimiento de los servidores. Para cumplir esta demanda se
requiere una arquitectura balanceada del sistema con un buen rendimiento de la memoria, el
procesador, y los subsistemas de entrada/salida. Varias de las principales compañías se han unido
para desarrollar una nueva especificación común de entrada/salida más allá de la arquitectura del
bus PCI actual, para ofrecer un canal basado en la tecnología de conmutación. InfiniBand™
Architecture representa una nueva propuesta a la tecnología de entrada/salida y se basa en la
investigación colectiva, el conocimiento y la experiencia de los líderes de la industria. Para más
información visitar la web: www.futureio.org

National Storage Industry Consortium (NSIC)


El NSIC (National Storage Industry Consortium) consta de aproximadamente 50 corporaciones,
universidades y laboratorios de Estados Unidos, con un interés común en el campo del
almacenamiento digital de la información. Muchos proyectos están esponsarizados por el NSIC,
incluyendo los NASDs (Network Attached Storage Device). El objectivo del proyecto NASD es
desarrollar, explorar, validar y documentar las tecnologías necesarias para poder desarrollar y
adoptar los dispositivos de red, y sus sistemas. Para más información, se puede consultar su web:
www.nsic.org
199

Índice de contenidos
1. Introducción......................................................................................................................................6
2.Tipos de soporte.................................................................................................................................7
2.1.Nanotubos de carbono...............................................................................................................7
Descubrimiento......................................................................................................................7
2.2.Efecto túnel magnético..............................................................................................................8
3.Memorias sólidas...............................................................................................................................9
3.1. Memoria RAM..........................................................................................................................9
3.2.Historia.......................................................................................................................................9
3.3.Tipos de RAM............................................................................................................................9
3.3.1.DRAM..............................................................................................................................10
3.3.2.SDRAM...........................................................................................................................10
3.4.Dispositivos SSD (Solid-State Drive)......................................................................................11
3.4.1.Historia.............................................................................................................................11
3.4.2.Arquitectura y función.....................................................................................................12
Basada en DRAM.................................................................................................................12
Basada en flash.....................................................................................................................12
3.4.3.Comparación con los discos duros...................................................................................12
3.5.Dispositivo flash USB.............................................................................................................14
Tecnología............................................................................................................................14
Historia.................................................................................................................................15
Tamaño y tipo de empaquetado............................................................................................15
Sistema de ficheros...............................................................................................................15
3.6.Tarjeta MMC (MultiMedia Card)............................................................................................16
3.7.Tarjeta SD (Secure Digital)......................................................................................................16
3.7.1.Historia.............................................................................................................................16
3.7.2.Diseño e implementación.................................................................................................17
Lengüeta opcional de protección contra escritura................................................................17
Sistema de ficheros...............................................................................................................18
3.7.3.Velocidades......................................................................................................................18
3.7.4.Estándares........................................................................................................................18
Explicación técnica...............................................................................................................18
Características DRM (Digital Rights Management)............................................................19
Compatibilidad con capacidad superior a 4 GB...................................................................19
Tarjetas SD (non-SDHC) mayores de 1 GB.........................................................................20
3.7.5.Tarjetas SDHC.................................................................................................................20
Cuestiones de compatibilidad SD y SDHC..........................................................................20
3.7.6.Tarjetas SDXC.................................................................................................................21
3.7.7.Tarjetas SDIO (Secure Digital Input/Output)..................................................................21
3.7.8.Tarjetas SD con características especiales.......................................................................21
4.Dispositivos magnéticos..................................................................................................................23
4.1. Discos duros............................................................................................................................23
4.1.1.Historia.............................................................................................................................23
4.1.2.Estructura física................................................................................................................24
4.1.3.Direccionamiento.............................................................................................................25
4.1.4.Estructura lógica..............................................................................................................25
4.1.5.Características de un disco duro.......................................................................................25
4.2. Disquetes (Floppy disk)..........................................................................................................26
200

Historia.................................................................................................................................26
Estructura..............................................................................................................................27
4.3.Cintas magnéticas....................................................................................................................28
4.3.1.Tecnología LTO (Linear Tape-Open) ..............................................................................29
Pin guía.................................................................................................................................29
LTO-CM...............................................................................................................................29
Disposición de la cinta.........................................................................................................30
WORM.................................................................................................................................30
Compresión..........................................................................................................................30
Encriptación..........................................................................................................................31
Detección y corrección de errores........................................................................................31
4.3.2.Tecnología DLT (Digital Linear Tape).............................................................................31
Tecnología............................................................................................................................31
4.3.3.Tecnología DDS (Digital Data Storage)..........................................................................32
5.Dispositivos ópticos.........................................................................................................................33
5.1. CD (Compact Disc)................................................................................................................33
Formatos...............................................................................................................................33
Contenido de un sector del CD.............................................................................................34
5.2. DVD (Digital Versatile Disc / Digital Video Disc).................................................................34
Tipos de DVD.......................................................................................................................34
5.2.1. DVD+R / DVD-R...........................................................................................................35
5.2.2. DVD+RW / DVD-RW ...................................................................................................36
5.2.3. DVD-RAM (DVD-Random Access Memory)...............................................................36
5.3.Disco Blu-ray...........................................................................................................................36
5.3.1.Historia.............................................................................................................................36
Orígenes................................................................................................................................37
Especificaciones físicas........................................................................................................37
Lanzamientos y desarrollos..................................................................................................37
Competencia con los DVD...................................................................................................37
5.3.2.Especificaciones técnicas.................................................................................................38
Laser y óptica.......................................................................................................................38
La tecnología del recubrimento duro....................................................................................38
5.3.3.Estándares del software....................................................................................................39
Codecs de vídeo....................................................................................................................39
Codecs de audio....................................................................................................................39
Velocidades...........................................................................................................................39
Formato del contenedor........................................................................................................39
5.4.Tecnología UDO (Ultra Density Optical)................................................................................40
5.4.1.Historia.............................................................................................................................40
5.4.2.Especificaciones...............................................................................................................40
5.4.3.Características..................................................................................................................41
Autenticidad e integridad de los datos.................................................................................41
Retención de los datos a largo plazo....................................................................................41
Alta capacidad y escalabilidad.............................................................................................41
Rápido acceso a la información............................................................................................41
Coste de propiedad bajo.......................................................................................................41
6.Almacenamiento de datos: valores y texto......................................................................................42
6.1.Valores.....................................................................................................................................42
Binario..................................................................................................................................42
Decimal entero: con/sin signo..............................................................................................42
201

Decimal flotante...................................................................................................................42
6.2.Texto........................................................................................................................................42
6.2.1.EBCDIC...........................................................................................................................42
6.2.2.ASCII...............................................................................................................................43
6.2.3.Unicode............................................................................................................................43
6.2.4.Unificación Han...............................................................................................................44
7.Tipos de interface de unidades de discos.........................................................................................45
7.1.Interfaz IDE (Integrated Device Electronics)..........................................................................45
7.2. Interfaz SATA (Serial Advanced Technology Attachment)....................................................46
Velocidades...........................................................................................................................46
SATA Externo.......................................................................................................................46
Ventajas de SATA.................................................................................................................47
Alternativas..........................................................................................................................47
7.3. Interfaz SCASI........................................................................................................................47
Tipos de interfaz SCSI..........................................................................................................47
Características......................................................................................................................48
7.4. Interfaz iSCASI.......................................................................................................................48
Funcionalidad.......................................................................................................................48
Dispositivos de almacenamiento..........................................................................................49
7.5.Interfaz Fibre Channel.............................................................................................................49
7.5.1.Topologías........................................................................................................................49
7.5.2.Capas................................................................................................................................50
7.5.3.Puertos..............................................................................................................................50
7.6.Interfaz Firewire (IEEE 1394).................................................................................................50
7.7.Tecnología SAS (Serial Attached SCSI)..................................................................................51
7.8.Interfaz USB (Universal Serial Bus).......................................................................................52
7.8.1.Historia.............................................................................................................................52
7.8.2.Visión global....................................................................................................................52
7.8.3.Tipos de conector.............................................................................................................54
USB-A..................................................................................................................................54
USB-B..................................................................................................................................54
Mini y Micro........................................................................................................................54
Micro-AB Socket OTG........................................................................................................55
7.8.4.Cables...............................................................................................................................55
7.8.5.USB 3.0 ...........................................................................................................................56
Nuevas características..........................................................................................................57
8. Tipos de formateo de discos...........................................................................................................58
8.1.Formateo de bajo nivel de los disquetes..................................................................................58
8.2.Formateo de bajo nivel de los discos duros.............................................................................59
8.3.Reinicialización del disco........................................................................................................59
8.4.Formateo de alto nivel.............................................................................................................59
8.5.Formateo en DOS....................................................................................................................59
8.6.Recuperación de datos de un disco formateado.......................................................................60
9.Sistemas de ficheros........................................................................................................................61
9.1.Asignación del espacio de almacenamiento............................................................................63
9.2.Sistemas de ficheros especiales...............................................................................................64
9.2.1. Sistema de ficheros orientados al registro.......................................................................64
9.2.2. Sistemas de ficheros de discos compartidos...................................................................64
9.2.3. Sistemas de ficheros distribuidos....................................................................................65
9.2.4. Sistemas de ficheros distribuidos tolerantes a fallos.......................................................65
202

9.2.5. Sistemas de ficheros paralelos distribuidos.....................................................................66


9.2.6. Sistemas de ficheros tolerante a fallos paralelamente distribuidos.................................66
9.2.7.Sistemas de ficheros encriptados.....................................................................................67
9.3. Sistema de ficheros de Linux..................................................................................................67
9.3.1.Inodos...............................................................................................................................67
9.3.2.Directorios........................................................................................................................68
9.3.3.Enlaces.............................................................................................................................68
9.3.4.Ficheros especiales de dispositivo...................................................................................69
9.3.5.Sistema de ficheros VFS (Virtual File System)...............................................................69
9.4.Sistema de ficheros Ext (Extended File System).....................................................................71
9.5.Sistema de ficheros Ext2..........................................................................................................71
9.5.1.Características estándar....................................................................................................71
9.5.2.Características avanzadas.................................................................................................72
9.5.3.Estructura física................................................................................................................73
9.5.4.Optimizaciones de rendimiento........................................................................................74
9.5.5.La librería de Ext2fs.........................................................................................................75
9.6.Sistema de ficheros Ext3..........................................................................................................75
9.6.1.Ventajas............................................................................................................................75
9.6.2.Inconvenientes.................................................................................................................76
Funcionalidad.......................................................................................................................76
Desfragmentación.................................................................................................................77
Recuperación de ficheros borrados......................................................................................77
Compresión..........................................................................................................................77
Límites de tamaño................................................................................................................77
9.7.Sistema de ficheros EXT4.......................................................................................................77
9.7.1.Características..................................................................................................................78
Grandes sistemas de ficheros ..............................................................................................78
Extensiones ..........................................................................................................................78
Compatibilidad con versiones anteriores ............................................................................78
Preasignación de espacio en disco .......................................................................................78
Asignación retardada ...........................................................................................................78
Superar el límite de 32.000 subdirectorios ..........................................................................79
Comprobación de errores en el diario .................................................................................79
Desfragmentación en línea ..................................................................................................79
Comprobación más rápida del sistema de ficheros .............................................................79
Asignador multibloque ........................................................................................................79
Marcas de tiempo mejorados................................................................................................79
9.7.2.Inconvenientes.................................................................................................................80
9.8.Sistema de ficheros FAT..........................................................................................................80
9.8.1.Historia.............................................................................................................................80
9.8.2.Sistema de ficheros FAT12...............................................................................................81
9.8.3.Directorios........................................................................................................................81
9.8.4.Sistema de ficheros FAT16 inicial....................................................................................82
9.8.5.Partición extendida y dispositivos lógicos.......................................................................82
9.8.6.Sistemas de ficheros FAT16 final.....................................................................................82
9.8.7.Nombres largos de ficheros (VFAT, LFNs).....................................................................83
9.8.8.Sistema de ficheros FAT32...............................................................................................83
9.8.9.Fragmentación..................................................................................................................84
9.8.10.Otras consideraciones.....................................................................................................85
9.8.11.Sistema de ficheros exFAT.............................................................................................85
203

9.8.12.Diseño............................................................................................................................86
9.8.13.Tabla de asignación de ficheros.....................................................................................86
9.8.14.Tabla de directorio..........................................................................................................87
Los nombres largos de fichero.............................................................................................88
9.9. Sistema de ficheros HPFS (High Performance File System).................................................89
9.10.Sistema de ficheros NTFS (New Technology File System)..................................................90
9.10.1.Historia...........................................................................................................................91
9.10.2.Versiones........................................................................................................................91
9.10.3.Características................................................................................................................91
Enlaces duros y nombres cortos de ficheros........................................................................92
Ficheros dispersos................................................................................................................92
Compresión de ficheros........................................................................................................92
Servicio VSS (Volume Shadow Copy Service)....................................................................92
NTFS Transaccional.............................................................................................................93
Encrypting File System (EFS)..............................................................................................93
Cuotas...................................................................................................................................94
Puntos de montaje del volumen............................................................................................94
Uniones de directorio...........................................................................................................94
Enlaces simbólicos...............................................................................................................95
Hierarchical Storage Management (HSM)...........................................................................95
Compatibilidad con FAT.......................................................................................................95
Metadatos.............................................................................................................................95
Metaficheros.........................................................................................................................95
9.10.4.Limitaciones...................................................................................................................96
9.11.Sistema de ficheros UFS (UNIX File System)......................................................................96
Diseño...................................................................................................................................96
9.12.Sistema de ficheros Apple HFS Plus.....................................................................................97
Diseño...................................................................................................................................97
9.13.Sistema de ficheros ISO9660/CDFS......................................................................................99
9.13.1.Especificaciones.............................................................................................................99
9.13.2.Restricciones en el nombre del fichero y del directorio...............................................100
9.13.3.Límite en el tamaño del fichero 2/4 GiB......................................................................101
9.13.4.Límite en el número de directorios..............................................................................101
9.13.5.Soporte multisesión......................................................................................................101
9.14.Sistema de ficheros Joliet....................................................................................................102
9.14.1.Visión global................................................................................................................102
9.14.2.Especificación de grabación.........................................................................................103
9.14.3.Orden de clasificación..................................................................................................103
Clasificación Natural de idiomas.......................................................................................104
Octetos de relleno de la justificación.................................................................................104
Orden de clasificación obligatorio.....................................................................................104
Campos de descriptor afectados por la secuencia de escape de UCS-2.............................104
9.15.Sistema de ficheros UDF (Universal Disk Format).............................................................104
9.15.1.Restricciones y requerimientos básicos.......................................................................105
9.16.Sistema de ficheros JFFS (Journalling Flash File System)..................................................107
9.16.1.Diseño..........................................................................................................................107
9.16.2.Inconvenientes.............................................................................................................107
9.17.Sistema de ficheros JFFS2...................................................................................................108
9.17.1.Características..............................................................................................................108
9.17.2.Diseño..........................................................................................................................108
204

9.17.3.Inconvenientes.............................................................................................................108
9.18.Sistema de ficheros ReiserFS..............................................................................................109
9.19.Sistema de ficheros Reiser4.................................................................................................109
10. Formatos de imagen digital.........................................................................................................111
10.1.Sensores................................................................................................................................111
10.2.Tamaños de los ficheros de imágenes..................................................................................112
10.3.Compresión de los ficheros de imágenes.............................................................................112
10.4.Formato de mapa de bits o raster.........................................................................................112
Otros formatos....................................................................................................................114
10.5.Formatos vectoriales............................................................................................................115
Otros formatos....................................................................................................................116
Ventajas del formato raster versus el formato vectorial.....................................................117
Inconvenientes del formato raster versus el formato vectorial...........................................117
10.6.Formatos 3D.........................................................................................................................117
10.7.Formato RAW......................................................................................................................118
10.7.1.Conceptos básicos........................................................................................................118
10.7.2.Contenido del fichero...................................................................................................119
10.7.3.Datos de la imagen del sensor......................................................................................119
10.7.4.Estandarización............................................................................................................120
10.8.Formato BMP......................................................................................................................120
10.8.1.Almacenamiento de los píxeles....................................................................................121
10.8.2.Estructura.....................................................................................................................121
BMP File Header................................................................................................................121
DIB header.........................................................................................................................121
Paleta de colores.................................................................................................................121
Datos en el mapa de bits.....................................................................................................122
10.9.Formato JPEG/JFIF.............................................................................................................122
10.9.1.Compresión JPEG........................................................................................................123
Edición sin pérdidas...........................................................................................................123
10.9.2.Ficheros JPEG..............................................................................................................124
Perfil de colores..................................................................................................................124
Sintaxis y estructura...........................................................................................................124
10.10.Formato Exif......................................................................................................................125
10.11.Formato TIFF.....................................................................................................................126
10.12.Formato PNG.....................................................................................................................126
10.12.1.Profundidad del color.................................................................................................127
10.12.2.Transparencia de la imagen........................................................................................127
10.12.3.Compresión................................................................................................................127
10.12.4.Entrelazado.................................................................................................................128
10.12.5.Animación..................................................................................................................128
10.13.Formato GIF......................................................................................................................128
10.13.1.Estructura...................................................................................................................128
10.13.2.Paletas........................................................................................................................129
10.13.3.GIF animado..............................................................................................................129
10.14.Formato CGM....................................................................................................................130
10.15.Formato SVG.....................................................................................................................130
10.15.1.Modularización..........................................................................................................130
10.15.2.Colecciones de elementos y atributos........................................................................131
10.15.3.Objetos gráficos.........................................................................................................131
10.15.4.Símbolos.....................................................................................................................131
205

10.15.5.Efectos raster..............................................................................................................131
10.15.6.Fuentes.......................................................................................................................132
10.15.7.Animación..................................................................................................................132
11.Formatos de sonido digital...........................................................................................................133
11.1.Digitalización del sonido.....................................................................................................133
11.2.Tipos de formatos.................................................................................................................133
11.3.Formatos de audio sin compresión......................................................................................133
11.4.Formatos de audio con compresión sin pérdidas.................................................................134
11.5.Formatos de audio con compresión con pérdidas................................................................136
11.6.Codificadores.......................................................................................................................137
11.7.Descodificadores..................................................................................................................137
11.8.Formato MIDI......................................................................................................................137
Almacenamiento de los ficheros MIDI..............................................................................138
El bloque de cabecera.........................................................................................................138
Bloques de pistas................................................................................................................139
11.9.Formato WAV......................................................................................................................139
11.10.Formato MP2/MP3............................................................................................................140
Codificación.......................................................................................................................141
Descodificación..................................................................................................................141
Calidad del audio................................................................................................................141
Tasa de bit...........................................................................................................................142
Estructura del fichero.........................................................................................................143
11.11.Formato WMA...................................................................................................................143
11.11.1.Formato del contenedor..............................................................................................143
11.11.2.Códec WMA (Windows Media Audio)......................................................................143
11.11.3.Códec WMA Pro (Windows Media Audio Professional)...........................................144
11.11.4.Códec WMA Lossless (Windows Media Audio Lossless).........................................145
11.12.Formato APE......................................................................................................................145
11.13.Formato OGG....................................................................................................................145
11.13.1.Formato del fichero....................................................................................................146
11.13.2.Codecs........................................................................................................................146
11.14.Formato RA (Real Audio)..................................................................................................147
11.14.1.Extensiones de fichero...............................................................................................147
11.14.2.Streaming audio..........................................................................................................147
12. Formatos de vídeo digital...........................................................................................................149
12.1.Codificadores.......................................................................................................................150
12.2.Descodificadores..................................................................................................................150
12.3.Formato MOV......................................................................................................................150
12.3.1.Historia.........................................................................................................................150
QuickTime 1.x....................................................................................................................151
QuickTime 2.x....................................................................................................................151
QuickTime 3.x....................................................................................................................151
QuickTime 4.x....................................................................................................................152
QuickTime 5.x....................................................................................................................152
QuickTime 6.x....................................................................................................................152
QuickTime 7.x....................................................................................................................153
12.4.Formato AVI........................................................................................................................153
12.4.1.Formato........................................................................................................................154
12.4.2.Usos..............................................................................................................................155
12.4.3.DV-AVI........................................................................................................................155
206

12.5.Formato MPEG....................................................................................................................156
12.5.1.Parte 1: Sistemas..........................................................................................................156
Flujos elementales y del programa.....................................................................................156
Relojes y marcas de tiempo................................................................................................157
Multiplexación....................................................................................................................157
12.5.2.Parte 2: Vídeo...............................................................................................................158
Espacio de color.................................................................................................................158
Resolución/Tasas de bit......................................................................................................158
Tipos de fotograma/imagen/bloque....................................................................................158
Macrobloques.....................................................................................................................160
Vectores de movimiento.....................................................................................................160
Transformación DCT (Discrete Cosine Transform)...........................................................161
Cuantificación....................................................................................................................162
Codificación entrópica.......................................................................................................162
Configuraciones del GOP para determinadas aplicaciones................................................163
12.6.Formato MPEG-2................................................................................................................164
Codificación de vídeo.........................................................................................................164
Codificación de audio.........................................................................................................165
Perfiles y niveles................................................................................................................165
Aplicaciones.......................................................................................................................165
12.7.Formato MPEG-4................................................................................................................166
12.7.1.Visión general...............................................................................................................167
12.7.2.Perfiles y niveles..........................................................................................................167
12.8.Formato WMV.....................................................................................................................167
12.8.1.Formato del contenedor...............................................................................................168
12.8.2.Códec Windows Media Video......................................................................................168
12.8.3.Códec Windows Media Video Screen..........................................................................169
12.8.4.Códec Windows Media Video Image...........................................................................169
12.8.5. Calidad de vídeo..........................................................................................................169
12.9.Formato H.261.....................................................................................................................169
12.9.1.Historia.........................................................................................................................169
12.9.2.Diseño .........................................................................................................................170
12.10.Formato H.262...................................................................................................................170
12.11.Formato H.263...................................................................................................................171
12.12.Formato H.264...................................................................................................................171
12.12.1.Visión general.............................................................................................................171
12.12.2.Características............................................................................................................172
12.12.3.Perfiles.......................................................................................................................175
12.13.DivX...................................................................................................................................177
12.13.1.DivX Media Format (DMF).......................................................................................177
12.13.2.DivX Plus HD............................................................................................................177
12.13.3.Perfiles DivX..............................................................................................................178
12.13.4.vídeo DivX a la demanda...........................................................................................178
12.14.Formato MOD....................................................................................................................178
12.15.Formato ASF......................................................................................................................179
12.16.Formato 3G2/3GP..............................................................................................................180
13.RAID (Redundant Array of Independent Disks).........................................................................181
13.1.Funciones RAID .................................................................................................................181
13.2.Conjuntos de bandas sin paridad.........................................................................................181
13.3.Conjunto de bandas con paridad..........................................................................................182
207

13.4.Niveles RAID......................................................................................................................182
13.4.1.RAID-0 ........................................................................................................................182
13.4.2.RAID-1 ........................................................................................................................182
13.4.3.RAID-2.........................................................................................................................182
13.4.4.RAID-3 ........................................................................................................................182
13.4.5.RAID-4.........................................................................................................................183
13.4.6.RAID-5 ........................................................................................................................183
13.4.7.RAID-6.........................................................................................................................183
13.5.Disponibilidad de los datos .................................................................................................183
13.6.Características de rendimiento ............................................................................................183
13.7.Discos de repuesto en caliente ............................................................................................184
13.8.EDAP (Extended Data Availability & Protection) ..............................................................184
13.9.Nueva clasificación RAID...................................................................................................185
14.Clustering....................................................................................................................................187
14.1.Categorías de clusters..........................................................................................................187
14.1.1.Clusters de alta disponibilidad.....................................................................................187
14.1.2.Clusters con balanceo de carga....................................................................................187
14.1.3.Clusters de computación..............................................................................................187
14.1.4.Computación en red.....................................................................................................187
14.2.Implementaciones................................................................................................................188
14.2.1.Cónsolas de juegos.......................................................................................................188
14.3.Historia.................................................................................................................................188
14.4.Tecnologías..........................................................................................................................189
15.NAS (Network Attached Storage)...............................................................................................191
15.1.Historia.................................................................................................................................191
15.2.Beneficios............................................................................................................................192
15.3.Inconvenientes.....................................................................................................................192
16.SAN (Storage Area Network)......................................................................................................194
16.1.Servidores SAN...................................................................................................................195
16.2.Almacenamiento SAN.........................................................................................................195
16.3.Aplicaciones SAN................................................................................................................195
16.3.1.Repositorio y Datos Compartidos................................................................................195
16.3.2.Almacenamiento compartido.......................................................................................196
16.3.3.Compartición de la copia de los datos..........................................................................196
16.3.4.Compartición verdadera de datos.................................................................................196
16.3.5.Copias de seguridad de los datos.................................................................................196
16.3.6.Intercambio de datos....................................................................................................196
16.3.7.Clustering.....................................................................................................................196
16.3.8.Protección de datos y recuperación de datos ante un desastre.....................................197
16.4.Asociaciones y organizaciones relacionadas con las SAN..................................................197
Storage Networking Industry Association (SNIA).............................................................197
Fibre Channel Industry Association (FCIA)......................................................................198
SCSI Trade Association (SCSITA).....................................................................................198
InfiniBand (SM) Trade Association...................................................................................198
National Storage Industry Consortium (NSIC)..................................................................198