INTRODUCCION
Sistemas de archivos
Se trata de estndares diseados por cada desarrollador de sistemas operativos, los cules indican la forma en que van a ser almacenados los archivos en los dispositivos de almacenamiento masivo (unidades SSD, discos duros, discos pticos, memorias USB, etc.), as como tambin la forma en que va a iniciar el sistema operativo (proceso de arranque). Aunado a lo anterior, el trmino formatear, se refiere a preparar el dispositivo de almacenamiento, para guardar la informacin en un sistema de archivos definido. Consta de dos partes: 1 - Coleccin de archivos: almacena datos relacionados. 2 - Estructura de archivos: organiza u proporciona informacin. Un sistema de archivos son los mtodos y estructuras de datos que un sistema operativo utiliza para seguir la pista de los archivos de un disco o particin; es decir, es la manera en la que se organizan los archivos en el disco. El trmino tambin es utilizado para referirse a una particin o disco que se est utilizando para almacenamiento, o el tipo del sistema de archivos que utiliza. As uno puede decir tengo dos sistemas de archivo refirindose a que tiene dos particiones en las que almacenar archivos, o que uno utiliza el sistema de archivos extendido, refirindose al tipo del sistema de archivos. La diferencia entre un disco o particin y el sistema de archivos que contiene es importante. Unos pocos programas (incluyendo, razonablemente, aquellos que crean sistemas de archivos) trabajan directamente en los sectores crudos del disco o particin; si hay un archivo de sistema existente all ser destruido o corrompido severamente. La mayora de programas trabajan sobre un sistema de archivos, y por lo tanto no utilizarn una particin que no contenga uno (o que contenga uno del tipo equivocado). Antes de que una particin o disco sea utilizada como un sistema de archivos, necesita ser iniciada, y las estructuras de datos necesitan escribirse al disco. Este proceso se denomina construir un sistema de archivos.
FAT (File Allocation Table"), que significa tabla de localizacin de archivos, utiliza la convencin tradicional de nombres de archivo 8.3 y todos los nombres de archivo deben crearse con el juego de caracteres ASCII. El nombre de un archivo o directorio puede tener ocho caracteres de longitud, despus un separador de punto (.) y una extensin de hasta tres caracteres. El nombre debe empezar con una letra o un nmero y puede contener cualquier carcter excepto los siguientes: . " / \ [ ] : ; | = ,. Se dise para su uso en dispositivos de almacenamiento electrnico basados en el uso de tecnologa de memoria NAND, tales como memorias USB y unidades SSD, para ser utilizado con versiones de Microsoft Windows CE, es importante mencionar que Windows Vista y Windows 7 tienen soporte para el formateo con este sistema de archivos, al igual que MacOS y Linux. Una caracterstica importante es que permite almacenar hasta 1000 archivos en una carpeta. FAT32 permite trabajar con particiones mayores de 2 GB. No solamente esto, sino que adems el tamao del grupo (clster) es mucho menor y no se desperdicia tanto espacio como ocurra en las particiones FAT. La conversin de FAT a FAT32, se puede realizar desde el propio sistema operativo Windows 98, o bien desde utilidades como Partition Magic. Sin embargo, la conversin inversa no es posible desde Windows 98, aunque s desde Partition Magic. Los sistemas operativos Linux e UNIX son capaces de detectar casi cualquier sistema de archivos (EXT, FAT, FAT32, NTFS, CDFS, UDF, etc.). NTFS (New Tecnology File System, sistema de archivos de nueva tecnologa): Este es el sistema de archivos que permite utilizar todas las caractersticas de seguridad y proteccin de archivos de Windows NT. Permite definir el tamao del grupo (clster), a partir de 512 bytes (tamao de un sector) de forma independiente al tamao de la
Sistemas de Archivos Pgina 2
Seguridad o permisos o listas de control de acceso (ACLs) o UGO (por sus siglas en ingls, User, Group, Others) o Capacidades granuladas o Atributos extendidos (ej.: slo aadir al archivo pero no modificar, etc.) Mecanismo para evitar la fragmentacin Capacidad de enlaces simblicos o duros Integridad del sistema de archivos (Journaling) Soporte para archivos dispersos Soporte para cuotas de discos Soporte de crecimiento del sistema de archivos nativo
Especificador de fichero. Tamao del fichero. Fecha y hora de creacin o ltima modificacin del fichero. Atributos.
Caractersticas generales de los archivos: * Nombre y extensin: Cada archivo es individual y es identificable por un nombre y una extensin opcional que suele identificar su formato. El formato sirve para identificar el contenido del archivo. Los nombres de archivos originalmente tenan un lmite de ocho caracteres ms tres caracteres de extensin, actualmente permiten muchos ms caracteres dependiendo del sistema de archivos. * Datos sobre el archivo: Adems para cada fichero, segn el sistema de archivos que se utilice, se guarda la fecha de creacin, modificacin y de ltimo acceso. Tambin poseen propiedades como oculto, de sistema, de solo lectura, etc. * Tamao: Los archivos tienen tambin un tamao que se mide en bytes, KB, MB, GB y depende de la cantidad de caracteres que contienen. * Ubicacin: Todo archivo pertenece a un directorio o subdirectorio. La ruta de acceso a un archivo suele comenzar con la unidad lgica que lo contiene y los sucesivos subdirectorios hasta llegar al directorio contenedor, por ejemplo: "C: Archivos de programaMicrosoftarchivo.txt".
ORGANIZACIN DE LOS ARCHIVOS: Los archivos y las carpetas se organizan en jerarqua llamadas carpetas, directorios o catlogos.
Organizacin Secuencial: La organizacin secuencial es la organizacin de archivo ms comn. Los registros son almacenados uno tras otro en orden de llegada. Para acceder un registro determinado se deben leer todos los registros que estn almacenados antes de ste. Cuando el orden secuencial coincide con el orden fsico se dice que existe un orden serial (en una cinta magntica siempre se cumple esta caracterstica). Organizacin Directa: es cuando el orden fsico no se corresponde con el orden lgico. Los datos de sitan en el archivo y se accede a ellos directa o aleatoriamente mediante su posicin, es decir, el lugar relativo que ocupa. Tiene la ventaja de que puede leer y escribir registros en cualquier orden y posicin. Son muy rpidos de acceso a la informacin que ocupan. Organizacin Secuencial Indexada: Un diccionario es un archivo secuencial cuyos registros son las entradas y cuyas claves son las palabras definidas por las entradas. Para buscar una palabra, no se busca secuencialmente desde la a hasta la z, sino que se abre por la letra inicial de la palabra. El nivel superior para las letras iniciales y el nivel menor para las cabeceras de pgina.
ESQUEMA DE UN ARBOL DE CARPETAS Y DIRECTORIOS Extensiones de archivos * Extensiones de archivos audio. * Extensiones de archivos de imagen. * Extensiones de archivos comprimidos. * Extensiones de archivos de texto. * Extensiones de archivos del sistema. * Extensiones de archivos de video. Extensiones standard de fichero en DOS:
BAT: fichero de procesamiento por lotes. BAK: fichero de copia de seguridad. COM: fichero ejecutable de comandos. EXE: fichero ejecutable. DOC: fichero de documentos.
Pgina 5
Sistemas de Archivos
TXT: fichero de texto. DBF: base de datos. HLP: fichero de ayuda. SYS: fichero de sistema operativo. TMP: fichero temporal creado por otro programa o por un comando. BAS: fichero BASIC. ASM: fichero en ENSAMBLADOR. CBL: fichero en COBOL. C: fichero en C. PAS: fichero en PASCAL. OBJ: fichero objeto de un programa compilado.
3. DIRECTORIOS: En informtica un directorio o a partir de Windows 95 carpetas de archivos es un contenedor virtual en el que se almacenan una agrupacin de archivos de datos y otros subdirectorios, atendiendo a su contenido, a su propsito o a cualquier criterio que decida el usuario. Tcnicamente el directorio almacena informacin acerca de los archivos que contiene: cmo los atributos de los archivos o dnde se encuentran fsicamente en el dispositivo de almacenamiento. Los directorios y carpetas funcionan con el fin de estructurar la informacin dentro de un disco duro. Los programas y personas crean un directorio de archivos, con diferentes ramificaciones, que permiten organizar todos los archivos almacenados. En el entorno grfico de los sistemas operativos modernos, el directorio se denomina metafricamente carpeta y de hecho se representa con un icono con esta figura.
Esta imagen se asocia con el ambiente administrativo de cualquier oficina, donde la carpeta de cartn encierra las hojas de papel (representando a los archivos de datos) de un expediente. En DOS y sus sucesores Windows y OS/2, la sintaxis de una ruta (o path en ingls), indica una jerarqua de directorios, donde el primer elemento puede ser bien la letra indicativa de cualquier Unidad Lgica (disco) en el sistema, o la barra invertida o backslash (\), designando al "directorio raz" de la unidad lgica actual. Si la ruta comienza directamente en el nombre de un directorio es una ruta relativa desde el directorio de trabajo actual. Por ejemplo, en la ruta "C:\AB\AGENDA", "C:" es la unidad lgica (el disco), "AB" un directorio y "AGENDA" un subdirectorio o un archivo. "AB\AGENDA" podra designar el mismo elemento si el directorio actual es "C:\". Caractersticas de los Directorios:
Zona o divisin lgica de almacenamiento u otros subdirectorios. Los directorios constituyen una estructura jerrquica en forma de rbol. En cualquier momento el usuario est en un determinado directorio y, a menos que se indique otra cosa, todos los ficheros se buscan o se crean en este directorio. Al igual que para los ficheros, la nomenclatura consta de un nombre de 1 a 8 caracteres y una extensin de cero a tres caracteres (aunque se recomienda no emplearla).
Pgina 6
Sistemas de Archivos
En toda unidad de disco existe el directorio raz, representado por una barra (\). Una ruta est formada por una unidad y uno o varios directorios (C:\DOS) La unidad activa es la unidad en la que se est trabajando. Una ruta activa es la ruta en la que se est en un momento determinado, cuando se arranca el ordenador la ruta activa es el directorio raz del disco.
El directorio que hace referencia al directorio en s. El directorio que referencia al directorio padre.
Esto no se cumple para el directorio raz ya que este no puede tener directorio padre. Se le llama directorio-padre al directorio que contiene dentro de si otros directorios para formar una jerarqua de directorios que mantengan estructurados todos los archivos propios de un programa o destinados a un propsito especfico. Comandos para directorios: Existen varios comandos relacionados con el manejo de directorios en MS-DOS, los ms importantes son:
MD nombre: Sirve para crear un directorio indicando el nombre. Es interno. RD nombre: Borra un directorio, que debe estar vaco. Es un comando interno. DELTREE: Borra un directorio sin necesidad de que est vaco. Es externo. DIR: Comando que permite visualizar el contenido de un directorio. CD: Comando que permite cambiar el directorio activo. Es un comando interno. TREE: Comando externo que presenta de forma grfica la estructura de directorios de una ruta de acceso; tiene dos parmetros (/F presenta los nombres de los archivos que cada directorio comprende y /A indica que utilice caracteres de texto en lugar de caracteres grficos). MOVE: Comando que renombra directorios, excepto el directorio activo. Los comandos ms usuales para la gestin de archivos son los que siguen: TYPE: Es un comando interno cuya funcin es mostrar el contenido de un archivo de texto, no permite el uso de caracteres comodines. PRINT: Es un comando externo que imprime un archivo de texto por impresora. Tiene cuatro parmetros (/T borra la cola de impresin y coloca un archivo en impresora; /D permite indicar el puerto en el que est situada la impresora; /Q permite indicar el tamao de la cola; /U indica el valor del tiempo a esperar si la impresora no est preparada). COPY: Es un comando interno que permite copiar archivos de un lugar a otro. Tiene un slo parmetro que es /V y sirve para controlar que la copia del fichero se hace correctamente. MOVE: Permite copiar un fichero de un directorio a otro, borrndolo del primero. Es un comando externo y tiene como nico parmetro de importancia /Y que indica que si el directorio destino no existe debe crearlo. RENAME: Es un comando interno que cambie el nombre de uno o varios archivos, aunque no permite cambiar a otro directorio. DEL, ERASE: Comando interno que elimina los archivos especificados. Su parmetro ms importante es el /P que significa que debe pedir confirmacin antes de borrar un archivo. FC: Comando externo que permite comparar de dos formas distintas: con el parmetro /B realiza una comparacin binaria y con el parmetro /L realiza una comparacin lnea a lnea. UNDELETE: Permite recuperar ficheros previamente borrados con la orden DEL. Es un comando externo y tiene tres parmetros interesantes (/LIST presenta una
Pgina 7
Sistemas de Archivos
En los sistemas operativos de tipo UNIX, el directorio se organiza a partir del Directorio raz "/", el cual contiene archivos y otros directorios. Esos directorios pueden contener archivos y directorios y as sucesivamente. Esto puede organizarse por el sistema en una estructura llamada rbol. Archivos y directorios no pueden ser diferenciados a travs del nombre, sino solo a travs de las herramientas del sistema operativo, las que adems muestran otras propiedades de archivos y directorios, como fecha de creacin, fecha de modificacin, usuarios y grupos de usuarios que tienen acceso o derechos al archivo o directorio. 4. Proteccin y seguridad: Una norma bsica de seguridad radica en la asignacin a cada usuario slo de los permisos necesarios para poder cubrir las necesidades de su trabajo sin poner en riesgo el trabajo de los dems. Muchos sistemas informticos modernos proporcionan mtodos para proteger los archivos frente a daos accidentales o intencionados. Las computadoras que permiten varios usuarios implementan permisos sobre archivos para controlar quin puede o no modificar, borrar o crear archivos y carpetas. A un usuario dado se le puede conceder solamente permiso para modificar un archivo o carpeta, pero no para borrarlo; o a un usuario se le puede conceder permiso para crear archivos o carpetas, pero no para borrarlos. Los permisos tambin se pueden usar para permitir que solamente ciertos usuarios vean el contenido de un archivo o carpeta. Los permisos protegen de la manipulacin no autorizada o destruccin de la informacin de los archivos, y mantienen la informacin privada confidencial impidiendo que los usuarios no autorizados vean ciertos archivos. Los sistemas operativos proveen algunos mecanismos de proteccin para poder implementar polticas de seguridad. Las polticas definen qu hay que hacer (qu datos y recursos deben protegerse de quin; es un problema de administracin), y los mecanismos determinan cmo hay que hacerlo. Esta separacin es importante en trminos de flexibilidad, puesto que las polticas pueden variar en el tiempo y de una organizacin a otra. Los mismos mecanismos, si son flexibles, pueden usarse para implementar distintas polticas. Los mecanismos que ofrece el sistema operativo necesariamente deben complementarse con otros de carcter externo. Por ejemplo, impedir el acceso fsico de personas no autorizadas a los sistemas es un mecanismo de proteccin cuya implementacin no tiene nada que ver con el sistema operativo. Un aspecto importante de la seguridad es el de impedir la prdida de informacin, la cual puede producirse por diversas causas: 1. Actos Divinos: incendios, inundaciones, terremotos, guerras, revoluciones, o ratas que roen las cintas o discos flexibles.
proteccin no obstaculice el uso del sistema por parte de usuarios autorizados. Demasiada seguridad podra ser contraproducente si es muy engorrosa para los usuarios, pues estos tendern a eludir los procedimientos para facilitarse la vida. Otra forma de atentar contra la integridad del sistema de archivos es: Que un usuario legitimo abandone su puesto o terminal sin realizar un log out dejando el terminal abierto para otro usuario indebido o intruso que pueda continuar con la sesin abierta que dejo el usuario legtimo. Programas caballos de trolla: Estos ocultan su funcionabilidad. Por ejemplo: un programa falso de login, con idntica identificacin que el original. EL usuario teclea su password y posteriormente el intruso es capaz de acceder a todo su sistema de archivos. Gusanos y virus informticos: * Los primeros son programas en s que usan desproporcionadamente los recursos del sistema bloqueando. * Los segundos son trozos de cdigo que se copian en otros programas o que son capaces de borrar ficheros, etc. Normalmente el virus se suele distribuir a travs de medios que lleguen a muchos usuarios, cuantos ms mejor. Por ello Internet es un buen medio para la transmisin de virus. Tambin lo sera un juego, etc. Intrusos: Saber qu hacer con los intrusos en el sistema, es un tema bien interesante. Son dos:
Los Intrusos Pasivos. Slo desean leer los archivos que no estn autorizados para leer. Los Intrusos Activos. Son ms crueles. Desean hacer cambios no autorizados a los datos. Si se desea disear un sistema seguro contra los intrusos, es importante tener en cuenta el tipo de intruso contra el cual se quiere tener proteccin. Algunas categoras comunes son: Curiosidad casual de usuarios no tcnicos. Conocidos husmeando.
Sistemas de Archivos Pgina 9
Identificacin de usuarios: La seguridad de acceso de un sistema se basa en la combinacin de tres tipos de identificacin: * Por contrasea * Artefactos * Fsica Contraseas: Suelen estar almacenadas en ficheros. El problema es que muchos usuarios usan el nombre de ciudades, parientes, fechas de nacimiento, etc.; fciles de obtener. Hay software especial, que tras un numero de intentos te denegan el acceso, bloquean la cuenta. Y otros que tras un periodo de tiempo determinado te piden y obligan a cambiar la password. Artefactos: Suelen ser bandas magnticas, tarjetas electrnicas, donde la password esta almacenada internamente en la tarjeta lo que hace difcil hacerse con ella. Identificacin fsica: consiste en usar caractersticas fsicas del usuario: Fisiolgicas: huellas dactilares, caractersticas faciales, geometra de la mano, etc. De comportamiento: anlisis de firma, o patrones de voz. Objetivos de la Proteccin: Inicialmente proteccin del SO frente a usuarios poco confiables. Proteccin: control para que cada componente activo de un proceso slo pueda acceder a los recursos especificados, y slo en forma congruente con la poltica establecida. La mejora de la proteccin implica tambin una mejora de la seguridad. 5. Implementacin de Sistemas de Archivos Organizacin. La implementacin de la abstraccin de Sistemas de Archivos., implica varios niveles, desde la interfaz de programas hasta el acceso a disco. En el medio intervienen abstracciones que pueden residir en el controlador, en el BIOS y/o en el kernel. Montar sistemas de archivos. Un S. A. puede comprender varios dispositivos (discos, particiones, CD-ROM, etc.); para ofrecer una visin unificada de S. A., se montan todos estos componentes en una sola estructura de directorios. Cada dispositivo contiene una estructura de directorios relativa a su contenido (y compatible con el S. A.); la operacin de montarlo consiste en enlazar esa estructura de directorios en la estructura general. Organizacin: Los discos reservan el primer sector (sector 0) para guardar el Master Boot Record MBR, que contiene cdigo para el arranque. El final del MBR contiene la tabla de particiones (direccin inicial y final de cada particin), y sus atributos. El programa en el MBR carga el primer sector (sector de arranque) de la particin activa y lo ejecuta. Despus del sector de arranque viene el superbloque, que contiene la informacin sobre el formato de la particin (S.A.), el nmero de bloques que contiene, etc. El superbloque es cargado en memoria. Luego contiene informacin del espacio libre (mapa de bits o lista de apuntadores, ver abajo). Luego vendran los i-nodos (por ejemplo), luego el directorio raz, y luego los archivos y resto de directorios.
Sistemas de Archivos Pgina 10
Los distintos bloques lgicos que conforman el sistema de archivos se describen a continuacin:
El primer bloque lgico de un disco se denomina boot block. Este bloque contiene el cdigo para el arranque (carga y comienzo) del sistema operativo (boot strap code). El superbloque es el segundo bloque lgico. Describe el estado del sistema de archivos - cun grande es, cuntos archivos es capaz de almacenar, cunto espacio libre contiene y dnde se ubica este espacio. A continuacin del superbloque se encuentran los I-nodos.
I-nodos
Cada archivo tiene asociado un i-nodo (de tamao 128 bytes en Solaris), que contiene toda la informacin perteneciente al archivo con excepcin de su nombre. Entre los datos que almacena un i-nodo se encuentran: modo y tipo del archivo, el nmero de bytes del archivo, direcciones directas o indirectas a los bloques de datos, fecha de creacin del archivo, fecha de la ltima modificacin, fecha del ltimo acceso, identificador (user id) del propietario y el identificador del grupo al cual el archivo pertenece. Los i-nodos incluyen dos vectores que contienen las direcciones que permiten acceder a los bloques de datos. El primer vector contiene doce direcciones directas, a travs de las cuales se accede a los primeros doce bloques de datos del archivo. Si el tamao del archivo es superior a los doce bloques, se tendr que acceder a sus bloques de datos usando los bloques de direcciones del segundo vector; estas direcciones pueden apuntar directamente a los datos o a ms bloques de direcciones. Los dos vectores son propios de la implementacin en Solaris, en otros sistemas basados en UNIX puede existir un nico vector, pero se mantiene el esquema de direccionamiento directo, indireccionamiento simple, doble y triple. La figura 4 muestra el esquema de direccionamiento descrito. Los bloques de datos: El resto del espacio del sistema de archivos que no est asignado a los tres tipos de bloques mencionados anteriormente, se destina a bloques que almacenan los datos. Los bloques de datos suelen usarse para el contenido de los
Sistemas de Archivos Pgina 11
Asignacin de espacio de disco archivos: Contigua: El directorio contiene el apuntador al primer bloque lgico, y el tamao (nmero de bloques). Es muy ventajoso para el acceso secuencial y directo. Tiene como desventaja lo mismo que para el caso de la memoria (especialmente fragmentacin externa). Enlazada: El directorio contiene el apuntador al primer bloque lgico. Cada bloque tiene un apuntador al siguiente bloque. Resuelve el problema de la fragmentacin externa. Funciona bien para el acceso secuencial, pero no para directo u otro. Necesita espacio para los apuntadores en los bloques. Si se daa un bloque, se pierde el enlace y el acceso al resto de los bloques. FAT (File Allocation Table). Es una optimizacin de la
Sistemas de Archivos Pgina 12
Tamao promedio de archivo (en Unix): cerca de 1 KB. A menor tamao de bloque, menor fragmentacin interna. Pero cada archivo consistir entonces de varios bloques, lo cual implica posiblemente mayor movimiento de cabezales y mayor tiempo de servicio. A mayor tamao, mejor desempeo en acceso, y menor espacio para direcciones. Conclusin: usar entre 1K y 4K para sistemas genricos
BIBLIOGRAFIA
http://www.ibiblio.org/pub/Linux/docs/LDP/system-adminguide/translations/es/html/ch06s08.html http://isis.faces.ula.ve/computacion/Html/Sistemas_operat/Apuntes_10.html http://www.slideshare.net/aretche/sistemas-de-archivos-presentation http://www.alegsa.com.ar/Dic/sistema%20de%20archivos.php http://es.wikipedia.org/wiki/Archivo_%28inform%C3%A1tica%29 http://es.wikipedia.org/wiki/Directorio http://www.xataka.com/discos-duros-multimedia/discos-duros-multimedia-laimportancia-del-sistema-de-archivos
CONCLUSION
Los sistemas de archivo son la parte ms importante de todo sistema operativo, dado que de ellos depende la integridad de los datos, por ende no se puede confiar en la integridad de los datos a la fiabilidad del hardware nicamente, en seguridad jams se ha confiado solo en una de las partes. Este sistema garantiza un nivel adicional de proteccin para mantener los sistemas corriendo y activos por una mayor cantidad de tiempo.