Índice:
Tema Hoja
1. Generalidades. 1
2. Metodología de diseño de datos. 2
2.1. Fases de la metodología. 3
2.2. Presentación de la documentación. 4
2.3. Entradas y salidas del desarrollo de una base de datos. 5
3. El Modelado Conceptual. 6
4. El Diseño lógico (general). 9
5. Diseño lógico específico (diseño físico). 11
6. Teoría formal de la normalización de esquemas relacionales (M E/R) 11
7. Construcción de un Esquema E/R.
Fuente:
DISEÑO DE BASES DE DATOS, PROBLEMAS RESUELTOS de
Adoración de Miguel Castaño y Otros. Ed. Alfaomega Ra-Ma.
DISEÑO DE BASES DE DATOS RELACIONALES de Adoración de
Miguel Castaño y Otros Ed. Alfaomega Ra-Ma.
1. Generalidades:
Una metodología de diseño se puede concebir como un conjunto de herramientas y
técnicas empleadas dentro de un marco organizacional que puede ser aplicado
consistentemente a proyectos sucesivos de desarrollo.
También se acepta como un Conjunto de pasos y procedimientos que deben seguirse para
el desarrollo de software.
Otra definición indica que una metodología es una serie de métodos que pueden ser
aceptados ampliamente y utilizados en el ciclo de vida completo de una aplicación
informática.
Una aplicación informática es un conjunto de mecanismos para realizar ciertos procesos
sobre ciertos datos. En el análisis de la aplicación se puede poner mayor énfasis en los
procesos o en los datos.
El enfoque orientado solo a los procesos o funciones (acontecimientos) puede ofrecer los
siguientes inconvenientes:
- Las funciones de un sistema tienden a evolucionar con el tiempo.
- Se descuida el análisis de las estructuras de datos.
- No facilita la integración de aplicaciones.
Hoja: 1
Metodología de Sistemas
Desarrollo de Bases de Datos Relacionales.
- Las aplicaciones medias o grandes pueden ser difíciles de definir a partir de un
detalle de funciones o de una única función.
Si en el análisis se incluyen los datos se pueden obtener las siguientes ventajas:
- Los datos tienden a ser más estables que los procesos.
- Es posible integrar aplicaciones en base a los datos que comparten.
Hoja: 2
Metodología de Sistemas
Desarrollo de Bases de Datos Relacionales.
- Redundancias y, por tanto, posibilidad de inconsistencias.
- Ambigüedades.
- Pérdida de información.
- Pérdida de dependencias funcionales (ciertas restricciones de integridad que dan
lugar a interdependencias entre los datos)
- Existencia de valores nulos (inaplicables)
- Aparición, en la base de datos, de estados que no son válidos en el mundo real
(anomalías de inserción, de borrado o de modificación)
Para modelar los datos es necesario contar con una metodología adecuada. Para este caso
una metodología es un conjunto de fases y herramientas que nos permiten pasar de una
fase a la siguiente en el proceso de diseño de las bases de datos.
Hoja: 3
Metodología de Sistemas
Desarrollo de Bases de Datos Relacionales.
Cada fase es parte de un proceso iterativo y, como tal, se van produciendo refinamientos
sucesivos.
En las fases del diseño de bases de datos se obtiene:
En la primera fase (modelo conceptual):
- El esquema conceptual (esquema lógico global – M CD)
- Las principales vistas del usuario (estructuras externas derivadas del
esquema lógico global)
En la segunda fase (diseño lógico):
- Las especificaciones del modelo de datos concreto del SGBD a
utilizar (M E/R y diccionario de datos)
- Configuración y características del equipo físico.
- El esquema interno o vista del sistema.
En la tercera fase (diseño físico, que corresponde a la implementación de la base de
datos):
- Construcción del diccionario en el SGBD.
- Construcción de las tablas en el SGBD.
- Programación de los procesos.
Pasando luego a la carga y explotación de la base de datos.
Esquema del proceso de diseño de bases de datos y su relación con las fases de análisis y
de diseño.
Realidad
2.2. Presentación de la documentación.
La presentación va variando en su grado de formalismo a lo largo de las diferentes fases
del ciclo de vida. En las primeras etapas el propósito debe ser la comunicación entre los
Hoja: 4
Metodología de Sistemas
Desarrollo de Bases de Datos Relacionales.
diferentes actores involucrados en el proyecto, mientras que en las últimas se necesita
representar la información de manera procesable por las máquinas por lo que se utiliza una
notación estrictamente formal, sin lugar para ambigüedades.
Se trata de ir adaptando el rigor de la notación a medida que progresa el diseño, pensando
en cada fase el tipo de personas involucradas.
De esta manera se consiguen las siguientes ventajas:
- Se requiere menos especialización por parte del diseñador
- Los usuarios participan en el diseño
- El diseño puede ser verificado por las personas que participan en el
proyecto.
- La estructura obtenida es flexible y fácil de mantener
- El afinamiento físico es más sencillo
- Cada fase tiene su documentación, más o menos formal según las
características de cada una.
Las especificaciones informales facilitan: la identificación de requisitos, el aprendizaje y la
comunicación, mientras que las formales proporcionan: claridad, precisión y son más
adecuadas para el análisis y verificación.
Este enfoque propone ir adaptando el rigor de la notación a medida que progresa el diseño,
pensando en cada fase el tipo de personal involucrado.
Primeras etapas de desarrollo Ultimas etapas de desarrollo
Propósito de la Articular ideas y proporcionar Expresar información concebida para
notación comunicación entre personas. su procesamiento por máquinas.
Características de la Imprecisa. Precisa, invariable, no ambigua.
información
Personas Audiencia variada con diferente Programadores y administradores
involucradas formación de base. entrenados en el uso de lenguajes
formales.
Grado de Bajo (preferentemente lenguaje Alto. Estrictamente formal.
formalismo natural).
Hoja: 5
Metodología de Sistemas
Desarrollo de Bases de Datos Relacionales.
Esquema: de entradas y salidas en el desarrollo de bases de datos relacionales.
3. El Modelado Conceptual:
El modelo conceptual permite la colaboración de los analistas con los usuarios con una
participación activa en el diseño por parte de estos últimos. El primer enfoque del D E/R, a
nivel conceptual, no hace referencia a la instrumentación del esquema en un SGBD sino
que permite ver la información con todo su contenido semántico. En este nivel del M E/R
se hace referencia al principio de cardinalidad pero no se resulten las relaciones N:M.
Etapas del Modelado Conceptual:
a- Análisis de requisitos
El objetivo es lograr un esquema descriptivo de la realidad en lenguaje natural,
aceptando los problemas de ambigüedad y escaso formalismo. El usuario establece
en sus propios términos el problema a resolver (especifica sus necesidades).
b- Conceptualización (cómo representar)
Características del esquema conceptual
- Claridad
- Coherencia
- Plenitud
- Fidelidad
- Sencillez
c- Modelado (que representar)
- El esquema conceptual (esquema lógico global - MCD)
- Las principales vistas del usuario (estructuras externas
derivadas del esquema lógico global)
Serie de actividades utilizadas habitualmente en la construcción del esquema
conceptual:
- Completar el enunciado con una descripción correcta y lo
más completa posible.
- Identificar las entidades.
Hoja: 6
Metodología de Sistemas
Desarrollo de Bases de Datos Relacionales.
- Identificar las interrelaciones con sus cardinalidades.
- Identificar los atributos
d- Símbolos para el diseño conceptual:
Entidad y nombre de entidad:
Interrelación y cardinalidad:
(1: 1) (1: n)
Pertenec
Provincia e
Región
Atributos:
El círculo representa el dominio
Entidad Se indica el nombre del atributo
Ejemplo: La entidad “alumno” con los atributos: número de alumno, apellido y nombres, fecha de
nacimiento y domicilio. Si número de alumno es el atributo identificador debe ser indicado con el
círculo lleno.
• Numero alumno
Apellido y nombres
Fecha de nacimiento
Domicilio Son los atributos de la entidad “Alumno”
Alumno
Hoja: 7
Metodología de Sistemas
Desarrollo de Bases de Datos Relacionales.
A partir del análisis de cada uno de los DFD se identifica la información que debe ser
almacenada y se atribuye a unidades básicas de información. Así se establecen las
entidades y los primeros atributos de ellas en el MCD.
Hoja: 8
Metodología de Sistemas
Desarrollo de Bases de Datos Relacionales.
(1) La mayoría de los SGBD están basados en la arquitectura ANSI-SPARC la cual divide a un
sistema en tres niveles: interno, conceptual y externo.
La vista conceptual, conocida también como vista lógica global, representa la visión de la
comunidad de usuarios de los datos en la base de datos. No toma en cuenta la forma en que
las aplicaciones individuales observan los datos o como éstos son almacenados. La vista
conceptual está basada en el esquema conceptual y su construcción se hace en la primera
fase del diseño de una base de datos.
Los usuarios, incluyendo a los programadores de aplicaciones, observan los datos a través de
un esquema externo definido a nivel externo. La vista externa proporciona una ventana a la
vista conceptual lo cual permite a los usuarios observar únicamente los datos de interés y los
aísla de otros datos en la base de datos. Puede existir cualquier número de vistas externas.
El esquema conceptual se mapea a un esquema interno a nivel interno, el cual es el nivel de
descripción más bajo de los datos en una base de datos. Este proporciona una interfaz al
sistema de archivos del sistema operativo el cual es el responsable del acceso a la base de
datos. El nivel interno tiene que ver con la especificación de qué elementos serán indexados,
qué técnica de organización de archivos utilizar y como los datos se agrupan en el disco para
mejorar su acceso.
Hoja: 9
Metodología de Sistemas
Desarrollo de Bases de Datos Relacionales.
La interrelación puede considerarse un tipo especial de entidad cuya existencia
depende de las entidades a las que relaciona.
En el gráfico del modelo conceptual las restricciones de cardinalidad se representan
por una etiqueta (0, 1), (1, 1), (0, N) o (1, N).
Atributo: Cada una de las propiedades o características que tiene un tipo de
entidad o un tipo de interrelación se denomina Atributo.
Un Atributo es un objeto de datos al que se le asigna un valor o interviene en una
operación.
Los atributos se utilizan para detallar las entidades asignándoles propiedades
descriptivas tales como nombre, color y peso. Existen dos tipos de atributos:
identificadores y descriptores. Los primeros se utilizan para distinguir de una
manera única cada una de las ocurrencias de unja entidad (distinguiéndose entre
identificadores principales e identificadores alternativos). Los descriptores se
utilizan para describir una ocurrencia de entidad.
En relación a los atributos también existe el concepto de dominio que es el conjunto
de valores sobre los que se define el atributo.
Los atributos no poseen información descriptiva.
Un atributo multivaluado se incorpora al M E/R como una entidad. La excepción
(mantenerlo como atributo) puede ser cuando este atributo tiene un número
limitado y no muy elevado de ocurrencias y el concepto que representa no está
relacionado con otras entidades.
Dominio y Valor: Las distintas propiedades o características de un tipo de entidad
o de interrelación toman Valores para cada ejemplar de estas. El conjunto de
posibles valores que puede tomar cierta característica se denomina Dominio. Se
define dominio como un conjunto de valores homogéneos con un nombre.
Atributos:
(nombre de cada uno
de los atributos con
indicación de los
atributos
identificadores)
Interrelación:
Línea de relación (este caso 1:1)
Hoja: 10
Metodología de Sistemas
Desarrollo de Bases de Datos Relacionales.
Relación obligatoria
Grados de relación:
- 1:1 – Para un elemento de una entidad existe un elemento de la otra
y viceversa.
- 1: N – Para un elemento de una entidad existen N elementos de la
otra.
- N: M – Para N elementos de una entidad existen M elementos de la
otra y viceversa.
Reglas:
- Una entidad se corresponde con una tabla.
- En las relaciones 1: N la entidad de las N ocurrencias hereda la clave
de la entidad de ocurrencia única.
- Las relaciones N: M se convierten en el M E/R en una tabla cuyos
atributos son como mínimo las claves de las dos entidades relacionadas.
Hoja: 11
Metodología de Sistemas
Desarrollo de Bases de Datos Relacionales.
También se pueden incluir:
- Minimización de dependencias. Incluye minimizar el número de dependencias
y el número de atributos contenidos en ellas.
- Minimización de esquemas resultantes. Minimizar el número de esquemas y
el número de sus atributos.
La idea central en el diseño formal de una base de datos es el concepto de dependencia
entre los datos. Íntimamente ligado a este concepto de dependencias tenemos el de Forma
Normal en que se encuentra un esquema de relación.
Con la teoría de la normalización se consigue la formalización del diseño lógico de bases
de datos relacionales (M E/R). Esta teoría permite disponer de instrumentos algorítmicos
que permiten el desarrollo de programas para automatizar el diseño en el modelo
relacional.
Normalización de las relaciones: Normalización es el proceso con el que se obtienen
refinamientos sucesivos del modelo hasta lograr una relación normalizada evitando
redundancias, incoherencias o inconsistencias
Dependencia funcional: Dada una entidad, sean atributo1 y atributo2 atributos de esa
entidad, diremos que atributo2 tiene dependencia funcional del atributo1 cuando dado un
valor del atributo1 se obtiene un valor único de atributo2, o que a cada valo0r del atributo2
le corresponda un único valor del atributo1.
Dependencia funcional completa: Si en una entidad, atributo1 es un conjunto de atributos,
entonces diremos que atributo2 tiene dependencia funcional completa de atributo1 cuando
atributo2 tiene dependencia funcional de todo el conjunto de atributo1, y no tiene
dependencia funcional de un subconjunto del atributo1. Cuando atributo1 consta de un
único atributo entonces coincide la dependencia funcional y la dependencia funcional
completa.
Candidato a clave: Candidato a clave es un atributo o un conjunto de atributos que
identifica en forma univoca una ocurrencia de una entidad. Uno de los candidatos a clave
debe ser utilizado como clave principal o primaria.
Atributo no clave: Es aquel atributo que no forma parte de la clave o de un atributo
candidato a clave.
Determinante: Es un atributo o conjunto de atributos que dependen de otros atributos.
No Normalizado: Decimos que una entidad o una relación no está normalizada cuando sus
diferentes atributos se encuentran en un formato sin distinción funcional, longitud variable,
atributos descomponibles, atributos no clave sin dependencia funcional completa de la
clave primaria o existen dependencias entre atributos no clave.
Definición de las tres primeras Formas Normales
Primera forma Normal (1NF): Una relación está en 1NF si y solo si sus atributos son no
descomponibles. Es decir que dentro de un mismo atributo guardamos información que no
puede ser susceptible de una ulterior subdivisión.
Segunda Forma Normal (2NF): Está en 2NF cuando está en 1NF y cada atributo no clave
tiene dependencia funcional completa de la clave primaria.
Tercera Forma Normal (3NF): está en 3NF cuando está en 2NF y cada atributo no clave
tiene dependencia no transitiva de la clave principal. Cada atributo tiene dependencia
únicamente de la clave no existiendo dependencia entre atributos no clave.
Hoja: 12