Anda di halaman 1dari 33

FUNDAMENTOS DE BASE

DE DATOS

INGENIERÍA INFORMÁTICA

COMPETENCIA 1. INTRODUCCIÓN A LAS


BASES DE DATOS
1.1 Conceptos básicos

1.2 Objetivos de las Bases de Datos COMPETENCIA ESPECÍFICA


1.3 Áreas de Aplicación de los Sistemas de Bases de Conoce y comprende los
datos conceptos básicos de base de
1.4 Modelos de bases de datos datos para proponer soluciones
en el tratamiento de información.
1.5 Clasificación de Bases de Datos

1.6 Arquitectura de base de datos

1.7 Arquitectura del SGBD

Recopilado por: M.I Norma H. Jiménez


o SISTEMA GESTOR DE BASE DE DATOS (SGBD). Un Sistema de Gestión
de Base de Datos (SGBD) o en inglés Database Management System 1.1 CONCEPTOS
(DBMS), es una colección de programas cuyo objetivo es servir de BÁSICOS
interfaz entre la base de datos, el usuario y las aplicaciones. Se
compone de un lenguaje de definición de datos, de un lenguaje de
manipulación de datos y de un lenguaje de consulta. Un SGBD
permiten definir los datos a distintos niveles de abstracción y
manipular dichos datos, garantizando la seguridad e integridad de
los mismos.

o BASE DE DATOS. Es la representación integrada de los conjuntos de


entidades instanciadas, correspondientes a las diferentes entidades
y de sus interrelaciones. Esta representación informática (o conjunto
estructurado de datos) debe poder ser utilizada de forma
compartida por muchos usuarios de distintos tipos. Las bases de
datos tradicionales se organizan por campos, registros y archivos.

o ARCHIVO. Los archivos también denominados ficheros es una


colección de registros relacionados entre sí con aspectos en común
y organizados para un propósito en específico.

Recopilado por: M.I Norma H. Jiménez


o REGISTROS. Un registro es una colección de información, normalmente
relativa a una entidad en particular. Un registro es una colección de
campos lógicamente relacionados que pueden ser tratados como
una unidad por algún programa.

o CAMPOS. Un campo es un ítem o elemento de datos elementales,


tales como un nombre, número de empleado, ciudad, número de
identificación, etc. Un campo está caracterizado por su tamaño o
longitud y su tipo de datos (de caracteres, entero, lógico, etc. ). Los
campos pueden incluso variar en longitud. Un campo es la unidad
mínima de información de un registro.

o SUBCAMPOS. Los datos contenidos en un campo se dividen con


frecuencia en subcampos.

o CARACTERES. Los caracteres se agrupan en campos de datos.

Recopilado por: M.I Norma H. Jiménez


Recopilado por: M.I Norma H. Jiménez
o Una base de datos tiene como propósito organizar y almacenar 1.2 OBJETIVOS DE
datos para su fácil manejo, es un “almacén” de información LA BASE DE
cuyo contenido puede ser tan variado como se desee. DATOS

o En la actualidad es más sencillo utilizar una base de datos que


llevar el registro de información manualmente ya que se puede
cometer errores que no nos podemos permitir o que afectarían
cualquier documento importante ya que en la mayoría de los
casos la información que almacenamos es para utilizarla más
adelante.

o El objetivo principal de una base de datos es poder almacenar,


ordenar y clasificar información para facilitarnos el trabajo,
además podemos importarla a otros programas

Recopilado por: M.I Norma H. Jiménez


Las siguientes son algunas de las áreas de aplicación más
comunes: 1.3 ÁREAS DE
Banca: Para información de los clientes, cuentas, préstamos, APLICACIÓN DE
transacciones bancarias, para compras con tarjeta de crédito, LOS SISTEMAS DE
generación mensual de pagos, créditos, etc. BASES DE DATOS

Líneas aéreas: Para reservas e información de planificación. Las


líneas aéreas fueron de los primeros en usar las bases de datos de
forma distribuida geográficamente (las terminales situadas en todo
el mundo accedían al sistema de bases de datos centralizado a
través de las líneas telefónicas y otras redes de datos).

Escuelas: Para información de los estudiantes, matrículas de las


asignaturas y cursos.

Recopilado por: M.I Norma H. Jiménez


Telecomunicaciones: Para guardar un registro de las llamadas
realizadas, generación mensual de facturas, manteniendo el saldo de
las tarjetas telefónicas de prepago y para almacenar información 1.3 ÁREAS DE
sobre las redes de comunicaciones. APLICACIÓN DE
LOS SISTEMAS DE
Finanzas: Para almacenar información sobre grandes empresas, ventas BASES DE DATOS
y compras de documentos formales financieros, como bolsa y bonos.

Ventas: Para información de clientes, productos y compras.

Producción: Para la gestión de la cadena de producción y para el


seguimiento de la producción de elementos en las factorías,
inventarios de elementos en almacenes y pedidos de elementos.

Recursos humanos: Para información sobre los empleados, salarios,


impuestos y beneficios, y para la generación de las nóminas.

Recopilado por: M.I Norma H. Jiménez


La revolución de Internet a finales de la década de 1990 aumentó
significativamente el acceso directo del usuario a las bases de datos. Las
organizaciones convirtieron muchas de sus interfaces telefónicas a las bases de
datos en interfaces Web, y pusieron disponibles en línea muchos servicios. 1.3 ÁREAS DE
APLICACIÓN DE
Por ejemplo, cuando se accede a una tienda de libros en línea y se busca un LOS SISTEMAS DE
libro o una colección de música se está accediendo a datos almacenados en BASES DE DATOS
una base de datos.

Cuando se solicita un pedido en línea, el pedido se almacena en una base de


datos.

Cuando se accede a un banco en un sitio Web y se consulta el estado de la


cuenta y los movimientos, la información se recupera del sistema de bases de
datos del banco.

Cuando se accede a un sitio Web, la información personal puede ser


recuperada de una base de datos para seleccionar los anuncios que se
deberían mostrar.

Recopilado por: M.I Norma H. Jiménez


Tópicos de bases de datos
Un Data Warehouse: Es un almacén en el que residen todos los datos
procedentes de las distintas plataformas informáticas de toda la 1.3 ÁREAS DE
compañía. Desde el data warehouse se establecen una serie de data APLICACIÓN DE
marts que albergan información concreta para una área específica LOS SISTEMAS DE
de la compañía ya sea el de marketing, finanzas, etc.
BASES DE DATOS

Un Data Mart: Son subconjuntos de datos de un data warehouse que


tienen el propósito a ayudar a áreas específicas dentro del negocio
que pueda tomar mejores decisiones. Entre las características de un
data mart se destacan que solo se puede acceder para algunos
usuarios dentro de áreas específicas donde se tiene un propósito
específico. También existe la posibilidad inversa: a partir de una serie
de data marts acaba configurándose un data warehouse. Así se van
solucionando los problemas de negocio más específicos, conociendo
aspectos importantes como quién o quiénes son los clientes que más
beneficios producen. Ofreciendo este concepto no es necesario
remitirse a toda la información. Se trata de obtener respuestas a
preguntas.

Recopilado por: M.I Norma H. Jiménez


El Data Mining: Consiste en algo más preciso. Una vez que todos los
datos están organizados, el data mining es una de las formas de 1.3 ÁREAS DE
explotar los datos. Existen varias herramientas para realizar esa APLICACIÓN DE
explotación, como herramientas OLAP sistemas EIS, "query and LOS SISTEMAS DE
reporting" y "business reporting". "El data mining es, entonces, una BASES DE DATOS
de las tecnologías que existen para explorar los datos y entender y
solucionar los problemas de negocio. De hecho, es la técnica más
avanzada de explotar los datos y de encontrar información que no
aparece a simple vista, esos esquemas y tendencias escondidos en
los datos. A través del data mining es más fácil cuantificar el
resultado. Existen aplicaciones de marketing como perfiles de
clientes, segmentación de mercado u otras áreas que utilizan
técnicas de data mining para saber algo más acerca de los datos.
El ejemplo típico es el análisis de la cesta de la compra, en el que
se buscan los enlaces entre la compra de unos productos y de
otros. Esto tiene como objeto optimizar el servicio a los clientes y
facilitarles la compra“.

Recopilado por: M.I Norma H. Jiménez


OLAP: cuyo traducción significa “Procesamiento Analítico en Línea” es
una forma de explotación de los datos que se utilizada en el campo
de la llamada Inteligencia empresarial (o Business Intelligence) cuyo 1.3 ÁREAS DE
objetivo es agilizar la consulta de grandes cantidades de datos. Para APLICACIÓN DE
ello utiliza estructuras multidimensionales (o Cubos OLAP) que
contienen datos resumidos de grandes Bases de datos o Sistemas LOS SISTEMAS DE
Transaccionales. BASES DE DATOS

ROLAP: significa “Procesamiento Analítico Relacional en Línea”, es


decir, se trata de sistemas y herramientas OLAP construidos sobre una
base de datos relacional.

MOLAP:significa “Procesamiento Analítico Multidimensional en Línea”


.Se trata de una alternativa a la tecnología ROLAP.Aunque ambos
tipos de herramientas están diseñadas para realizar análisis de datos a
través de un modelo de datos multidimensional, MOLAP se diferencia
significativamente en que requiere un pre procesamiento y
almacenamiento de la información contenida en el cubo OLAP.
MOLAP almacena estos datos en una matriz de almacenamiento
multidimensional optimizado, más que en una base de datos relacional
(o en un ROLAP).
Recopilado por: M.I Norma H. Jiménez
HOLAP: “Procesamiento Analítico Híbrido en Línea” es una
combinación de ROLAP y MOLAP 1.3 ÁREAS DE
APLICACIÓN DE
LOS SISTEMAS DE
Una información que, teniendo en cuenta el actual contexto
BASES DE DATOS
digital, puede provenir tanto de datos procedentes de Data
Warehouses como de sistemas de Big Data y alojarse en la nube o
en infraestructuras locales, siendo cada vez más habituales los
esquemas híbridos. A su vez, el signo de los nuevos tiempos ha
multiplicado el número de aplicaciones utilizadas, así como los
problemas creados por los silos en los que se encuentran los datos.

Por otro lado, las aplicaciones avanzadas pueden ser


personalizadas para automatizar determinados tipos de trabajo a
partir de las necesidades que tenga la empresa.

Recopilado por: M.I Norma H. Jiménez


Introducción.
Al igual que cuando se habla, p.ej., de coches no existe un único
modelo, ni una sola marca, ni siquiera una sola tecnología sobre su
1.4 MODELOS
funcionamiento, cuando se trabaja con bases de datos ocurre una
cosa parecida: no existe una sola marca, sino varias, y además DE BASES DE
cada marca puede tener diferentes productos cada uno de ellos DATOS
apropiado a un tipo de necesidades.

Definición.
Un modelo de datos es básicamente una "descripción“ de algo
conocido como contenedor de datos (algo en donde se guarda la
información), así como de los métodos para almacenar y
recuperar información de esos contenedores. Los modelos de
datos no son cosas físicas: son abstracciones que permiten la
implementación de un sistema eficiente de base de datos; por lo
general se refieren a algoritmos, y conceptos matemáticos.

Recopilado por: M.I Norma H. Jiménez


La división que a continuación se presenta de las bases de
datos será en función de la tecnología empleada en su
funcionamiento. Algunos modelos con frecuencia utilizados en
1.4 MODELOS
las bases de datos: DE BASES DE
DATOS
Bases de datos jerárquicas
En este modelo los datos se organizan en una forma similar a un
árbol (visto al revés), en donde un nodo padre de información
puede tener varios hijos. El nodo que no tiene padres es
llamado raíz, y a los nodos que no tienen hijos se los conoce
como hojas.
Las bases de datos jerárquicas son especialmente útiles en el
caso de aplicaciones que manejan un gran volumen de
información y datos muy compartidos permitiendo crear
estructuras estables y de gran rendimiento.
Una de las principales limitaciones de este modelo es su
incapacidad de representar eficientemente la redundancia de
datos.
Recopilado por: M.I Norma H. Jiménez
Bases de datos de red
1.4 MODELOS
Éste es un modelo ligeramente distinto del jerárquico; su DE BASES DE
diferencia fundamental es la modificación del concepto de DATOS
nodo: se permite que un mismo nodo tenga varios padres
(posibilidad no permitida en el modelo jerárquico).

Fue una gran mejora con respecto al modelo jerárquico, ya


que ofrecía una solución eficiente al problema de
redundancia de datos; pero, aun así, la dificultad que
significa administrar la información en una base de datos de
red ha significado que sea un modelo utilizado en su
mayoría por programadores más que por usuarios finales.

Recopilado por: M.I Norma H. Jiménez


Bases de datos transaccionales
Son bases de datos cuyo único fin es el envío y recepción de datos a 1.4 MODELOS
grandes velocidades, estas bases son muy poco comunes y están
dirigidas por lo general al entorno de análisis de calidad, datos de DE BASES DE
producción e industrial, es importante entender que su fin único es DATOS
recolectar y recuperar los datos a la mayor velocidad posible, por lo
tanto la redundancia y duplicación de información no es un problema
como con las demás bases de datos, por lo general para poderlas
aprovechar al máximo permiten algún tipo de conectividad a bases
de datos relacionales.

Un ejemplo habitual de transacción es el traspaso de una cantidad de


dinero entre cuentas bancarias. Normalmente se realiza mediante dos
operaciones distintas, una en la que se decrementa el saldo de la
cuenta origen y otra en la que incrementamos el saldo de la cuenta
destino. Para garantizar la atomicidad del sistema (es decir, para que
no aparezca o desaparezca dinero), las dos operaciones deben ser
atómicas, es decir, el sistema debe garantizar que, bajo cualquier
circunstancia (incluso una caída del sistema), el resultado final es que,
o bien se han realizado las dos operaciones, o bien no se ha realizado
ninguna.

Recopilado por: M.I Norma H. Jiménez


Bases de datos relacionales
Éste es el modelo utilizado en la actualidad para modelar 1.4 MODELOS
problemas reales y administrar datos dinámicamente. Tras ser DE BASES DE
postulados sus fundamentos en 1970 por Edgar Frank Codd, de los DATOS
laboratorios IBM en San José (California), no tardó en consolidarse
como un nuevo paradigma en los modelos de base de datos. Su
idea fundamental es el uso de "relaciones". Estas relaciones podrían
considerarse en forma lógica como conjuntos de datos llamados
"tuplas". Pese a que ésta es la teoría de las bases de datos
relacionales creadas por Codd, la mayoría de las veces se
conceptualiza de una manera más fácil de imaginar. Esto es
pensando en cada relación como si fuese una tabla que está
compuesta por registros (las filas de una tabla), que representarían
las tuplas, y campos (las columnas de una tabla).

Recopilado por: M.I Norma H. Jiménez


En este modelo, el lugar y la forma en que se almacenen
los datos no tienen relevancia (a diferencia de otros 1.4 MODELOS
modelos como el jerárquico y el de red). Esto tiene la
DE BASES DE
considerable ventaja de que es más fácil de entender y
de utilizar para un usuario esporádico de la base de DATOS
datos. La información puede ser recuperada o
almacenada mediante "consultas" que ofrecen una
amplia flexibilidad y poder para administrar la
información.

El lenguaje más habitual para construir las consultas a


bases de datos relacionales es SQL, Structured Query
Language o Lenguaje Estructurado de Consultas, un
estándar implementado por los principales motores o
sistemas de gestión de bases de datos relacionales.

Recopilado por: M.I Norma H. Jiménez


Las bases de datos pueden clasificarse de varias 1.5
maneras, de acuerdo al contexto que se esté
manejando, la utilidad de las mismas o las necesidades CLASIFICACIÓN
que satisfagan. DE BASES DE
DATOS
Según la variabilidad de los datos almacenados
Bases de datos estáticas
Son bases de datos de sólo lectura, utilizadas
primordialmente para almacenar datos históricos que
posteriormente se pueden utilizar para estudiar el
comportamiento de un conjunto de datos a través del
tiempo, realizar proyecciones, tomar decisiones y realizar
análisis de datos para inteligencia empresarial.

Recopilado por: M.I Norma H. Jiménez


1.5
CLASIFICACIÓN
DE BASES DE
Bases de datos dinámicas DATOS
Éstas son bases de datos donde la información
almacenada se modifica con el tiempo, permitiendo
operaciones como actualización, borrado y adición de
datos, además de las operaciones fundamentales de
consulta. Un ejemplo de esto puede ser la base de datos
utilizada en un sistema de información de un
supermercado, una farmacia, un videoclub o una
empresa.

Recopilado por: M.I Norma H. Jiménez


Según el contenido
Bases de datos bibliográficas
1.5
CLASIFICACIÓN
Sólo contienen un subrogante (representante) de la
DE BASES DE
fuente primaria, que permite localizarla. Un registro típico
de una base de datos bibliográfica contiene DATOS
información sobre el autor, fecha de publicación,
editorial, título, edición, de una determinada
publicación, etc. Puede contener un resumen o extracto
de la publicación original, pero nunca el texto completo,
porque si no, estaríamos en presencia de una base de
datos a texto completo (o de fuentes primarias). Como
su nombre lo indica, el contenido son cifras o números.
Por ejemplo, una colección de resultados de análisis de
laboratorio, entre otras.

Recopilado por: M.I Norma H. Jiménez


Bases de datos de texto completo Almacenan las fuentes 1.5
primarias, como por ejemplo, todo el contenido de todas las CLASIFICACIÓN
ediciones de una colección de revistas científicas. DE BASES DE
DATOS
Directorios Un ejemplo son las guías telefónicas en formato
electrónico.

Bases de datos o "bibliotecas" de información química o


biológica Son bases de datos que almacenan diferentes tipos
de información proveniente de la química, las ciencias de la
vida o médicas.

Recopilado por: M.I Norma H. Jiménez


En 1975, el comité ANSI-SPARC (American National Standard
Institute – Standards Planning and Requirements Committee)
propuso una arquitectura de tres niveles para los Sistemas de 1.6
Base de Datos cuyo objeto objetivo principal era separar la BD
ARQUITECTURA
física de los programas de aplicación.
DE BASES DE
DATOS
La arquitectura se divide en tres niveles generales: interno,
conceptual y externo.
Nivel Interno: es el más cercano al almacenamiento físico, es
decir, el que concierne a la manera como los datos se
almacenan en realidad. Tiene un esquema interno, que
describe la estructura física de almacenamiento de la base de
datos. El esquema interno emplea un modelo físico de los datos
y describe todos los detalles para su almacenamiento, así como
los caminos de acceso para la base de datos

Recopilado por: M.I Norma H. Jiménez


Nivel Externo o de vistas: es el más cercano a los usuarios, es decir,
el que atañe a la manera cómo cada usuario ve los datos. Incluye
varios esquemas externos o vistas de usuario. Cada esquema
externo describe la parte de la base de datos que interesa a un 1.6
grupo de usuarios determinado, y oculta a ese grupo el resto de la ARQUITECTURA
base de datos. En este nivel podemos usar un modelo de datos de DE BASES DE
alto nivel o uno de implementación. Cabe señalar que los tres
esquemas no son más que descripciones de los datos; los únicos
DATOS
datos que existen realmente están en el nivel físico.

Nivel Conceptual: es un nivel de mediación entre los otros dos.


Describe la estructura de toda la base de datos para una
comunidad de usuarios. El esquema conceptual oculta los detalles
de las estructuras físicas de almacenamiento y se concentra en
describir entidades, tipos de datos, vínculos, operaciones de los
usuarios y restricciones. En este nivel podemos usar un modelo de
datos de alto nivel o uno de implementación.

Recopilado por: M.I Norma H. Jiménez


Para que el sistema sea útil, debe recuperar los datos
eficientemente. Como muchos usuarios de sistemas de bases de
datos no están familiarizados con computadoras, los
desarrolladores esconden la complejidad a los usuarios a través de
varios niveles de abstracción para simplificar la interacción de los
1.6
usuarios con el sistema: ARQUITECTURA
Nivel físico: El nivel más bajo de abstracción describe cómo se DE BASES DE
almacenan realmente los datos. En el nivel físico se describen en DATOS
detalle las estructuras de datos complejas de bajo nivel.

Nivel lógico: El siguiente nivel más alto de abstracción describe qué


datos se almacenan en la base de datos y que relaciones existen
entre esos datos.

Nivel de vistas: El nivel más alto de abstracción describe sólo parte


de la base de datos completa. Los usuarios necesitan acceder sólo
a una parte de la base de datos. El sistema puede proporcionar
muchas vistas para la base de datos..

Recopilado por: M.I Norma H. Jiménez


1.7
ARQUITECTURA
DEL SGBD

Un gestor de base de datos


(DataBase Management System)
es un sistema que permite la
Un SGBD permite el
creación, gestión y administración
almacenamiento, manipulación y
de bases de datos, así como la
consulta de datos pertenecientes
elección y manejo de las
a una base de datos organizada en
estructuras necesarios para el
uno o varios ficheros.
almacenamiento y búsqueda de la
información del modo más
eficiente posible.
En decir, un SGBD es:
o conjunto coordinado de programas, procedimientos, lenguajes, etc. que
suministra
o a los distintos usuarios de la B.D. los medios necesarios
o para describir, recuperar y manipular los datos almacenados en la Base de
Datos,
o manteniendo su integridad, confidencialidad y seguridad
Funciones básicas del SGBD
Otras funciones del SGBD
Funcionamiento global de un SGBD