Anda di halaman 1dari 25

Bases de datos

Conceptos de administracin de
informacin
Ing. Rosa Navarrete

1. CONCEPTOS DE ADMINISTRACIN DE INFORMACIN


1.1 Almacenamiento y recuperacin
1.2 Captura y representacin
1.3 Bsqueda y recuperacin
1.4 Anlisis e indexamiento
1.5 Confiabilidad, seguridad, escalabilidad, eficiencia

Slabo

Almacenamiento de Informacin
(Information Storage)

El almacenamiento de la informacin se refiere a la


disposicin persistente de datos que se conservan para
su acceso (de acuerdo a su propsito y vigencia),
generalmente desde los sistemas informticos.
El almacenamiento est relacionado con la disposicin a
largo plazo, por tanto no se considera como
almacenamiento formal de datos, los mecanismos de
almacenamiento temporal en memoria principal (chips
de silicio de la RAM o memoria de acceso aleatorio).
El almacenamiento externo se refiere al uso de
dispositivos de almacenamiento secundarios o auxiliares,
los cuales son capaces de conservar la informacin de
manera permanente.

Almacenamiento de informacin

La tecnologa de almacenamiento actual utiliza


todo tipo de soportes. Por ejemplo, sistemas
WORM, bibliotecas de cintas y bibliotecas
virtuales.
En los ltimos aos, los sistemas SAN y NAS han
demostrado su excelente fiabilidad.

Tecnologas de almacenamiento

Las unidades SAN (Storage Area Network)


pueden ser rack (armarios) gestionan ms que
cientos de discos duros, con ms de 50 terabytes
de capacidad
Las unidades NAS (Network Attached Storage)
son unidades independientes que cuentan con
sistemas operativos y de archivos propios y
gestionan los discos duros que llevan
conectados.

Tecnologas de almacenamiento

Los sistemas de discos duros SAN Serial ATA


(SATA) se estn convirtiendo en una manera
rentable de disponer de gran capacidad de
almacenamiento.
Otras tecnologas de almacenamiento, como
iSCSI, DAS (Direct Attached Storage), Near-Line
Storage (datos adjuntos en soportes extrables) y
CAS (Content Attached Storage), tambin
proporcionan disponibilidad.

Sistemas de almacenamiento de
Informacin

Los sistemas que manejan datos, como Bases de


datos, Data-Warehouse, Meta-Datos, DataMining, Cloud entre otros, son utilizados para
registrar datos, con una estructura lgica,
organizada y almacenada para su explotacin.
La explotacin se refiere a almacenar, buscar,
recuperar y actualizar informacin.

Bases de Datos (Databases)

Es
un conjunto
de datos
relacionados
coherentemente que almacenan informacin.
La informacin esta organizada y almacenada, para
su explotacin.
Los usuarios puedan buscar, recuperar y actualizar
los datos que necesitan, a travs de lenguajes
especficos que permiten formular consultas
(expresin lgica sobre la informacin).
Las consultas permiten la identificacin de un
subconjunto lgico de la base de datos, es decir, una
seleccin de registros que cumplen la condicin
lgica.

Data Warehouse

Almacenamiento de grandes volmenes de


datos (generalmente datos histricos).
Se subdividen a veces en unidades lgicas ms
pequeas, Datamarts, dependientes de la lgica
de agrupacin de los datos.
Generalmente utilizadas para procesamiento
analtico de los datos (Sistemas de ayuda en la
decisin (DSS), Sistemas de informacin
ejecutiva (EIS) o herramientas para hacer
consulta o informes).

Data Mining

Data-Mining es un proceso para extraer


informacin til a partir de grandes cantidades
de datos.
Explotacin del Data Warehouse.
Transformar la informacin disponible en
conocimiento til para el contexto.

Meta Datos

Sus funciones principales son la localizacin,


identificacin y descripcin de recursos, legibles
e interpretables a travs de computador.
Metadatos para la conservacin, preservar los
recursos de informacin.
Metadatos tcnicos, informar sobre los
requerimientos tcnicos del hardware o
software
Metadatos de uso, informar sobre el nivel de
utilizacin, tipo de usuarios, etc.

Cloud

La nube es un avance en el suministro de


tecnologa de la informacin y los servicios.
Proporciona acceso bajo demanda a un conjunto
compartido de recursos informticos, de forma
dinmica a escala.
Ventajas en costes, rapidez y eficiencia.
Funcin principal, almacenar datos de Base de
datos como servicio (DBaaS), especficamente en
torno a la informacin confidencial que se
almacena en la nube.

Sistemas de Recuperacin de Informacin


(Information Retrieval System)

Calvin N. Moores fue el primero en introducir el


trmino information retrieval, en el ao 1950,
basado en organizacin; bsqueda y sistematizacin
y generacin de tcnicas. La bsqueda de
informacin en un stock de documentos, efectuada
a partir de la especificacin de un tema.
Jean Tague Sutcliffe identific las variables que
definen a la recuperacin de informacin como:
Campo de estudio; coleccin de documentos o bases
de datos; representacin de la informacin;
usuarios; consultas y frases u oraciones de bsqueda
o estrategia de bsqueda; intermediarios de
bsqueda; proceso de bsqueda y evaluacin de la
bsqueda.

Sistemas de Recuperacin de
Informacin

Salton en 1983, define: La recuperacin de la


informacin tiene que ver con la representacin,
almacenamiento, organizacin y acceso a los tem de
informacin. Indica que, en principio, no deben
existir limitaciones a la naturaleza del objeto
informativo
Baeza-Yates incorpora la reflexin siguiente: La
representacin y organizacin debera proveer al
usuario un fcil acceso a la informacin en la que se
encuentre interesado. Desafortunadamente, la
caracterizacin de la necesidad informativa de un
usuario no es un problema sencillo de resolver.

Sistemas de Recuperacin de
Informacin

Recuperacin de
datos
Acierto
Exacto
Inferencia
Algebraica
Modelo
Determinstico
Lenguaje
de Fuertemente
consulta
Estructurado
Especificacin
Precisa
consulta
Error en la
Sensible
respuesta

Recuperacin de
informacin
Parcial, el mejor
Inductiva
Posibilstico
Estructurado
o
Natural
Imprecisa
Insensible

Sistemas de Recuperacin de
Informacin
Base de Datos

Necesidad de
Informacin

Documentos
Relevantes
Recuperacin
Documentos
Documentos
no Relevantes

Modelos de un SRI
Modelo

Descripcin
Incluye los tres ms comnmente citados:
Modelos clsicos
booleano, espacio vectorial y probabilstico.
Modelos
Estn basados en la Lgica Fuzzy.
alternativos
Basados en la Lgica Formal. La
Modelos lgicos recuperacin de informacin es un proceso
inferencial.
Incluyen posibilidades de expansin del
Modelos basados
alcance de la bsqueda y hacen uso de
en
la
retroalimentacin por la relevancia de los
interactividad
documentos recuperados.
Modelos basados Bases de conocimiento, redes neuronales,
en la Inteligencia algoritmos genticos y procesamiento del
Artificial
lenguaje natural.

Evolucin

Almacenamientos estructurados, recuperacin


estructurada.
Recuperacin de informacin en las bibliotecas
(semi-estructurada)
World Wide Web: La evolucin lgica de los SRI
ha sido hacia la web, donde han encontrado una
alta aplicacin prctica y un aumento del
nmero de usuarios, especialmente en el campo
de los directorios y motores de bsqueda.

Captura y representacin

La captura y representacin de informacin constituyen parte


del procesamiento de datos.
La captura se refiere a la obtencin del dato.
Un dato es un smbolo lingstico o numrico o de ndole
visual (pixel) o audible, que representa ya sea algo concreto
como abstracto.
Datos + contexto, implica informacin.
La captura implica tcnicas elctricas, electrnicas o
mecnicas usadas para manipular datos para el empleo
humano o de mquinas.
Para la representacin se definen formatos estandarizados
que permiten la interpretacin de los smbolos que se
capturan.

Anlisis de datos

El Anlisis de Datos (Data Analysis) se refiere a la exploracin


sistemtica de volmenes de datos en bruto (estructurados o no)
orientado a buscar comportamientos o informacin que pueda ser
deducida.
Implica el proceso de inspeccionar, limpiar y transformar datos con el
objetivo de resaltar informacin til, lo que sugiere conclusiones, y
apoyo a la toma de decisiones.
El anlisis de datos se distingue de la extraccin de datos por su alcance,
su propsito y su enfoque sobre el anlisis.
Los extractores de datos clasifican inmensos conjuntos de datos usando
software sofisticado para identificar patrones no descubiertos y
establecer relaciones escondidas.
El anlisis de datos se centra en la inferencia, el proceso de derivar una
conclusin basndose solamente en lo que conoce el investigador.
Fundamenta los Sistemas de informacin para la decisin, utilizados en
entornos empresariales.
Se usa en las ciencias, para verificar o reprobar modelos o teoras
existentes.

Anlisis de datos

El anlisis de datos incluye por ejemplo, el procesamiento analtico


en lnea (OLAP) hasta el anlisis CRM en centros de llamadas.
Los bancos y las compaas de tarjetas de crdito, por ejemplo,
analizan los retiros y los patrones de gasto para prevenir el fraude o
robo de identidad.
Las compaas de comercio electrnico (Ecommerce) examinan el
trfico en el sitio web o los patrones de navegacin para determinar
qu clientes son ms o menos propensos a comprar un cierto
producto o servicio, basndose en compras previas o patrones de
visualizacin.
El anlisis de datos moderno normalmente usa tableros de
informacin que se basan en flujos de datos en tiempo real.
El llamado anlisis en tiempo real implica anlisis e informes
dinmicos basados en los datos que introducidos en un sistema un
minuto antes del tiempo actual de uso.

Anlisis de datos

Anlisis exploratorio de datos (EDA), donde se descubren


nuevas caractersticas en los datos,
Anlisis confirmatorio de datos (CDA), donde se prueba si las
hiptesis existentes son verdaderas o falsas.
El anlisis cuantitativo de datos (QDA) es usado en las ciencias
sociales para sacar conclusiones de datos no numricos, como
palabras, fotografas o videos.

Indexamiento

El indexamiento se refiere a ordenar una serie de datos o


informaciones de acuerdo a un criterio comn a todos ellos,
para facilitar su consulta y anlisis.
Indexar datos almacenados depende de cul es su estructura,
base de datos, datawarehouse, etc.
El indexamiento en bases de datos produce informacin
estructurada de apoyo que permite el ordenamiento y la
localizacin directa de informacin.
El indexamiento requiere de estructuras previamente
acordadas y de algoritmos que manejen dichas estructuras
para mantenerlas actualizadas, conforme la informacin sea
agregada, modificada o eliminada.

Indexamiento

El ndice de una base de datos es una estructura de datos que


mejora la velocidad de las operaciones, por medio de
identificador nico de cada fila de una tabla, permitiendo un
rpido acceso a los registros de una tabla en una base de
datos.
El ndice tiene un funcionamiento similar al ndice de un libro,
guardando parejas de elementos: el elemento que se desea
indexar y su posicin en la base de datos. Para buscar un
elemento que est indexado, slo hay que buscar en el ndice
dicho elemento para, una vez encontrado, devolver el registro
que se encuentre en la posicin marcada por el ndice.
Los ndices son construidos sobre rboles B, B+, B* o sobre
una mezcla de ellos, funciones de clculo u otros mtodos.

Confiabilidad, seguridad, escalabilidad y


eficiencia

Respecto de las caractersticas de calidad que debe reunir el


entorno de soporte de la informacin almacenada.
En el caso de las bases de datos, los DBMS (Data Base
Management System).
Confiabilidad, soporte seguro de la informacin almacenada,
no susceptible a prdidas por eventos no programados.
Seguridad, acceso por perfiles a la informacin.
Escalabilidad, crecimiento horizontal (incorporacin de nuevas
tablas o nuevos campos en tablas) y vertical (volumen de
registros) de las bases de datos. Tambin se refiere a la
escalabilidad del hardware de soporte.
Eficiencia, respuesta exitosa ante la gestin de los datos
(tiempo, exactitud).

Anda mungkin juga menyukai