Anda di halaman 1dari 7

1. QUE SON ARCHIVOS?

Los archivos tambin denominados ficheros son una coleccin de informacin (datos relacionados entre s), localizada o almacenada como una unidad en alguna parte de la computadora. Los archivos son el conjunto organizado de informaciones del mismo tipo, que pueden utilizarse en un mismo tratamiento; como soporte material de estas informaciones.

1.1. INTRODUCCIN A LOS ARCHIVOS.

Los archivos como coleccin de datos sirven para la entrada y salida a la computadora y son manejados con programas. Los archivos pueden ser contrastados con Arrays y registros; Lo que resulta dinmico y por esto en un registro se deben especificar los campos, l nmero de elementos de un arrays (o arreglo), el nmero de caracteres en una cadena; por esto se denotan como "Estructuras Estticas". En los archivos no se requiere de un tamao predeterminado; esto significa que se pueden hacer archivos de datos ms grandes o pequeos, segn se necesiten. Cada archivo es referenciado por su identificador (su nombre.).

Organizacin de los archivos. La organizacin de los registros en los archivos se puede hacer de tres maneras diferentes, y para hacer la comparacin por ventajas y desventajas, ver tabla 1: 1. Organizacin secuencial: En esta organizacin los registros se almacenan uno tras otro en un orden predeterminado. El orden lo determina su campo clave. Los registros deben ser ordenados de una forma especfica para su almacenamiento, lo cual tiene su costo en tiempo. Tiene ventajas cuando se necesita acceso a la totalidad o una gran porcin de registros, pero si se trata de ubicar un registro particular puede ser sumamente lento. Con este tipo de organizacin, para llegar al registro 6510, deben recorrerse uno a uno, los primeros 6509 registros anteriores empezando por el 0001. 2. Organizacin directa: Para esta organizacin, los registros no se almacenan uno tras otro, sino que se ubican en una direccin particular que est determinada por su campo clave. La direccin es establecida mediante programas que usan una tcnica denominada clculo de clave, que convierten el valor numrico del campo clave, en una direccin de almacenamiento particular. Los programas son usados tambin para la localizacin posterior de tales registros. Al usar organizacin directa de archivos pueden localizarse velozmente registros especficos. Por ejemplo, si se desean los datos de un carro particular en un archivo con los carros de una ciudad, puede obtenerse casi instantneamente simplemente suministrando su placa. Sin embargo esta organizacin tiene como desventaja que requiere mayor espacio de almacenamiento en disco. Adems, no es tan apta como la organizacin secuencial de archivos para llevar a cabo un gran nmero de actualizaciones o listar un gran nmero de registros. 3. Organizacin secuencial de ndice: Es una combinacin de las dos organizaciones presentadas, que busca aprovechar las ventajas de ambas. Los registros se van almacenando en orden secuencial, pero este archivo cuenta con un ndice. El archivo ndice enlista las claves de cada grupo de registros almacenados y sus direcciones de disco correspondientes. Cuando se desea buscar un registro particular, la computadora inicia la bsqueda secuencialmente, identificando el principio del grupo de registros. Esta organizacin es ms rpida que la secuencial, pero no lo es tanto como el acceso directo. Es especialmente til cuado se requiere actualizar ocasionalmente grandes lotes de transacciones y se necesita disponer de acceso rpido y frecuente a los datos.

ARCHIVOS SECUENCIALES. Es la forma bsica de organizar un conjunto de registros, que forman un archivo, utilizando una organizacin secuencial. En un archivo organizado secuencialmente, lo registros quedan grabados consecutivamente cuando el archivo se utiliza como entrada. En la mayora de los casos, los registros de un archivo secuencial quedan ordenados de acuerdo con el valor de algn campo de cada registro. Semejante archivo se dice que es un archivo ordenado; el campo, o los campos, cuyo valor se utiliza para determinar el ordenamiento es conocido como la llave del ordenamiento. Un archivo puede ordenarse ascendente o descendentemente con base en su llave de ordenamiento. La forma ms comn de estructura de archivo es el archivo secuencial. En este tipo de archivo, un formato fijo es usado para los registros. Todos los registros tienen el mismo tamao, constan del mismo nmero de campos de tamao fijo en un orden particular. Como se conocen la longitud y la posicin de cada campo, solamente los valores de los campos se necesitan almacenarse; el nombre del campo y longitud de cada campo son atributos de la estructura de archivos.

Archivo secuencial es la forma ms simple de almacenar y recuperar registros de un archivo. En un archivo secuencial, se almacenan los registros uno tras otro. El primer registro almacenado se coloca al principio del archivo. El segundo se almacena inmediatamente despus (no existen posiciones sin uso), el tercero despus del segundo, etc. Este orden nunca cambia en la organizacin secuencial.

Una caracterstica de los archivos secuenciales es que todos los registros se almacenan por posicin: de primer registro, segundo registro etc.

3.1 Ventajas y desventajas.

Ventajas: Los archivos secuenciales proveen la mejor utilizacin de espacio y son rpidos cuando los registros son accesados secuencialmente.

Los archivos con poca volatilidad, gran actividad y tamao variable son altamente susceptibles de ser organizados secuencialmente.

La ventaja ms importante de la tcnica de organizacin secuencial de archivos es la capacidad de acceso al "siguiente" registro rpidamente: Mientras que el patrn de acceso a un archivo secuencial se conforme al ordenamiento de registros en el archivo, los tiempos de acceso sern muy buenos. Sin embargo, si el patrn de acceso al programa no se conforma al patrn de ordenamiento de los registros, entonces la eficiencia del programa puede ser terrible.

Otra ventaja de los archivos de organizacin secuencial es que son muy sencillos de usar y aplicar. Desventajas: El acceso a un registro es pobre, la localizacin de un determinado registro no se puede hacer individualmente no de manera rpida, y el acceso aleatorio es imprctico.

Adems, en los archivos secuenciales la direccin de registro est implcita y estn vulnerables a fallas del sistema.

ARCHIVO SECUENCIAL INDEXADO Archivos Secuenciales indexados Un mtodo popular para superar las desventajas de los archivos secuenciales es el del archivo secuencias indexado. El archivo secuencial indexado mantiene las caractersticas bsicas de los archivos secuenciales: los registros estn organizados en una secuencia basada en un campo. Dos caractersticas se aaden: un ndice del archivo para soportar los accesos aleatorios y un archivo de desbordamiento ( overflow ). El ndice provee una capacidad de bsqueda para llegar rpidamente a las proximidades de un registro deseado. El archivo de desbordamiento (overflow) es similar al archivo de registro usado en un archivo secuencial, pero esta integrado de forma que los registros del archivo de desbordamiento se ubican en la direccin de un puntero desde su registro precedente. En la estructura secuencial indexada ms simple, se usa un solo nivel de indexacin. El ndice, en este caso, es un archivo secuencial simple. Cada registro del archivo ndice tiene dos campos: un campo clave, que es el mismo que el campo clave del archivo principal y un puntero al archivo principal. Para encontrar un campo especfico se busca en el ndice hasta encontrar el valor mayor de la clave que es igual al valor deseado de la clave. La bsqueda contina en el archivo principal a partir de la posicin indicada por el puntero.

Las caractersticas ms relevantes de un archivo indexado

a) El diseo del registro tiene que tener un campo, o combinacin de campos, que permita identificar cada registro de forma nica, es decir, que no pueda haber dos registros que tengan la misma informacin en l. A este campo se le llama campo clave y es el que va a servir de ndice. Un mismo fichero puede tener mas de un campo clave, pero al menos uno de ellos no admitir valores duplicados y se le llama clave primaria. A las restantes se les llama claves alternativas.

b) Permiten utilizar el modo de acceso secuencial y el modo de acceso directo para leer la informacin guardada en sus registros.

El modo de acceso directo se hace conociendo el contenido del campo clave del registro que queremos localizar. Con esa informacin el sistema operativo puede consultar el ndice y conocer la posicin del registro dentro del fichero.

En el modo de acceso secuencial los registros son ledos ordenados por el contenido del campo clave, independientemente del orden en que se fueron grabando (El orden lgico no es igual al orden fsico), debido a que el acceso a los datos se hace a travs del ndice, que para hacer ms fcil la bsqueda de los registros permanece siempre ordenado por el campo clave.

c) Solamente se puede grabar en un soporte direccionable. Ej.: disco magntico. Si esto no fuera as no podra emplear el acceso directo.

VENTAJAS 1. Permite el acceso secuencial.

2. Permite el acceso directo a los registros.

3. Se pueden actualizar los registros en el mismo fichero, sin necesidad de crear un fichero nuevo de copia en el proceso de actualizacin.

DEVENTAJAS

1. Ocupa ms espacio en el disco que los ficheros secunciales, debido al uso del rea de ndices. 2. Tiene tendencia a que aumente el tiempo medio de acceso a los registros, cuando se producen muchas altas nuevas con claves que hay que intercalar entre las existentes, ya que aumenta el rea de overflow. 3. Solo se puede utilizar soportes direccionables.

4. Obliga a una inversin econmica mayor, por la necesidad de programas y, a veces, hardware ms sofisticado.

ARCHIVO DIRECTO

Los archivos directos explotan la capacidad de los discos para acceder directamente a cualquier bloque de direccin conocida. Como en los archivos secuenciales y secuenciales indexados, se requiere un campo clave en cada registro. Sin embargo, aqu no hay concepto de ordenamiento secuencial. Organizacin directa: Para esta organizacin, los registros no se almacenan uno tras otro, sino que se ubican en una direccin particular que est determinada por su campo clave. La direccin es establecida mediante programas que usan una tcnica denominada clculo de clave, que convierten el valor numrico del campo clave, en una direccin de almacenamiento particular. Los programas son usados tambin para la localizacin posterior de tales registros. Al usar organizacin directa de archivos pueden localizarse velozmente registros especficos. Por ejemplo, si se desean los datos de un carro particular en un archivo con los carros de una ciudad, puede obtenerse casi instantneamente simplemente suministrando su placa. Sin embargo esta organizacin tiene como desventaja que requiere mayor espacio de almacenamiento en disco. Adems, no es tan apta como la organizacin secuencial de archivos para llevar a cabo un gran nmero de actualizaciones o listar un gran nmero de registros. Un archivo relativo (directo) consiste en una coleccin de registros de longitud fija almacenados uno al lado del otro en un dispositivo de almacenamiento de acceso directo (direct - access storage device, DASD). El almacenamiento de este tipo de archivos se restringe a los DASD, tales como discos y tambores, por que el acceso a registros se hace generalmente en orden aleatorio.

Cada registro en un archivo de organizacin relativa se puede referir por medio de un nmero -entero- de direccin, el cual indica su distancia o desplazamiento desde el origen del archivo. Al primer registro en un archivo relativo se le asigna el valor 1, 2 al siguiente y as sucesivamente. De este modo, la direccin relativa de un valor entero que refleja su posicin respecto al primer registro del archivo. El acceso aleatorio de un registro en un archivo de organizacin relativa se hace va su nmero relativo de registro. Un archivo de organizacin relativa puede crearse con un programa en un lenguaje de alto nivel si es que el mtodo de acceso del sistema operativo central es capaz de manejar esta organizacin, y si el compilador del lenguaje de interface con tal mtodo de acceso.

METODO DE BUSQUEDA HASHING

Hash: se refiere a una funcin o mtodo para generar claves o llaves que representen de manera casi unvoca a un documento, registro, archivo, etc., resumir o identificar un dato a travs de la probabilidad, utilizando una funcin hash o algoritmo hash. Un hash es el resultado de dicha funcin o algoritmo.

4.2 Funciones Hashing En informtica , Hashing es un mtodo para resumir o identificar un dato a travs de la probabilidad , utilizando una funcin hash o algoritmo hash. Un hash es el resultado de dicha funcin o algoritmo.

Una funcin de hash en funcionamiento Una funcin de hash es una funcin para sumarizar o identificar probabilsticamente un gran conjunto de informacin ( dominio ), dando como resultado un conjunto imagen finito generalmente menor (un subconjunto de los nmeros naturales por ejemplo). Varan en los conjunto de partida y de llegada y en cmo afectan a la salida similaridades o patrones de la entrada. Una propiedad fundamental del hashing es que si dos resultados de una misma funcin son diferentes, entonces las dos entradas que generaron dichos resultados tambin lo son. Son usadas en mltiples aplicaciones, como los arrays asociativos , criptografa , procesamiento de datos y firmas digitales entre otros. Una buena funcin de hash es una que experimenta pocas colisiones en el conjunto esperado de entrada; es decir que se podr identificar unvocamente las entradas (ver funcin inyectiva ). Muchos sistemas relacionados con la seguridad informtica usan funciones o tablas de hashing .

VENTAJAS: Se pueden usar los valores naturales de la llave, puesto que se traducen internamente a direcciones fciles de localizar. Se logra independencia lgica y fsica, debido a que los valores de las llaves son independientes del espacio de direcciones No se requiere almacenamiento adicional para los ndices.

DESVENTAJAS: El archivo no est clasificado No permite llaves repetidas Solo permite acceso por una sola llave Tiempo de procesamiento requerido para la aplicacin de la funcin hash

Anda mungkin juga menyukai