Anda di halaman 1dari 130

Lenguaje SQL y Bases de

Datos Relacionales

por Claudio Casares

ProInf.net,

SCP

667 551 698 667 551 687


admin@proinf.net
www.proinf.net

ProInf.net, SCP
www.proinf.net

Tabla de contenidos
1. Generalidades______________________________________________4
1.1. Arquitecturas_______________________________________________4
1.2. Cursores y Buffers___________________________________________5

2. Modelo de datos_____________________________________________8
2.1. Introduccin________________________________________________8
2.2. Los Usuarios________________________________________________9
2.3. Ciclo de vida de una base de datos_____________________________10
2.4. Criterios de calidad_________________________________________12
2.5. Indicadores de calidad_______________________________________15
2.6. El modelo lgico____________________________________________16
2.7. Restricciones de integridad___________________________________17

3. Modelo Relacional__________________________________________21
3.1. Introduccin_______________________________________________21
3.2. Proceso de normalizacin_____________________________________24
3.3. Las interrelaciones__________________________________________29
3.4. Algebra relacional__________________________________________32
3.5. Clculo relacional___________________________________________36

4. Lenguaje SQL______________________________________________38
4.1. Introduccin_______________________________________________38
4.2. Consultas de Seleccin______________________________________41
4.3. Consultas de Accin_________________________________________46
4.4. Consultas de Unin Internas__________________________________50
4.5. Consultas de Unin Externas__________________________________58
4.6. Consultas de Referencias Cruzadas_____________________________60
4.7. Criterios de Seleccin________________________________________64
4.8. Agrupamiento de Registros___________________________________71
4.9. Tipos de Datos_____________________________________________76
4.10.Subconsultas______________________________________________78
4.11.Estructuras de las Tablas_____________________________________84
4.12.Problemas resueltos: Registros duplicados_______________________89
4.13.Problemas resueltos: Registros no relacionados___________________90
4.14.Cursores__________________________________________________90
4.15.FREETEXT y CONTAINS (FULLTEXT SQL-SERVER)__________________94
Claudio Casares

ProInf.net, SCP
www.proinf.net

4.16.Access: Bases externas_____________________________________118


4.17.Access: Parmetros________________________________________120
4.18.Access: Omitir permisos____________________________________120
4.19.Access: Clusula PROCEDURE________________________________121
4.20.Optimizar Sentencias_______________________________________122

5. APNDICES______________________________________________125
5.1. Las 12 reglas de Codd que determinan la fidelidad de un sistema relacional
al modelo relacional________________________________________125

Claudio Casares

ProInf.net, SCP
www.proinf.net

1. Generalidades
1.1.

Arquitecturas
En muchas ocasiones, despus de haber realizado un gran estudio detallado
del SGBD y haber revisado su diseo, nos podemos encontrar que ha
implementado sobre un equipo con insuficientes recursos o no se ha
seleccionado la arquitectura adecuada para su explotacin. Entre otras
arquitecturas, caben destacar las siguientes:

1.1.1. Cliente / Servidor


Esta arquitectura consta de un cliente inteligente que puede solicitar servicios
de un servidor en red. En el lado del cliente de esta arquitectura encontramos
una aplicacin frontal bastante sencilla ejecutndose en un ordenador
personal. A una aplicacin cliente / servidor se le puede pedir que realice
validaciones o que muestre listas de opciones vlidas, pero la mayor parte de
las reglas de integridad de los datos y de negocio se imponen en la propia base
de datos: relaciones, ndices, valores predeterminados, rangos, disparadores,
procedimientos almacenados, etc. En el lado del servidor encontramos un
motor de servidor de bases de datos inteligente. El servidor est diseado para
aceptar consultas SQL desde la aplicacin frontal, generalmente en forma de
llamadas a procedimientos almacenados que devuelven conjunto de resultados
claramente definidos y de mbito limitado.
Generalmente, la aplicacin cliente es responsable, al menos, de la
administracin de la conexin, la captura de los datos, la presentacin de datos
y la administracin de los errores.
El servidor es el responsable de la administracin inteligente de los recursos, la
administracin de la seguridad, la administracin de los datos, de las consultas
y sobre todo de la integridad de los datos.

1.1.2. Motor Distribuido


En este caso, cada uno de los clientes posee el motor necesario para acceder a
la base de datos y acceden de forma independiente del resto de los usuarios.
Esta arquitectura tiene la ventaja del aprovechamiento de los recursos del
cliente pero la desventaja del control de versiones.

1.1.3. Componentes Distribuidos


Esta arquitectura aade un tercer elemento al sistema de acceso a la base de
datos, se trata de los objetos de lgica de negocio, encargados de procesar las
peticiones de los clientes y hacrselas llegar al servidor. Estos objetos pueden
estar instalados en mquinas diferentes a la del cliente y del servidor. La
principal ventaja radica en el aprovechamiento de los servicios cliente /
servidor y en asegurar el control de las versiones del motor de acceso a datos.
La aplicacin frontal realiza peticiones a los objetos de lgica de negocio que
son trasmitidas al servidor, la respuestas del mismo llegan a los objetos y stos
las devuelven al cliente.
Claudio Casares

ProInf.net, SCP
www.proinf.net

1.2.

Cursores y Buffers
Bsicamente, un cursor es un conjunto de punteros a las filas devueltas por
una consulta, la mayora, son como un conjunto de resultados, excepto por
que los datos reales generalmente permanecen en el servidor.
Un buffer es un depsito RAM en el lado del cliente donde se guardan los datos
del conjunto de resultados de manera temporal hasta que pueden llevarse a
otro lugar para su almacenamiento.
Las columnas de datos de una o varias filas se dice que son miembros del
cursor si la clusula WHERE de la consulta las incluye. Esta columnas,
combinadas en filas lgicas se convierten en filas miembro del conjunto de
resultados.
Por ejemplo:
SELECT

Nombre, Genero
FROM

Animales

WHERE

Edad < 10
Cuando se ejecuta esta consulta, el motor cliente empieza inmediatamente a
seleccionar miembros para el conjunto de resultados. En este caso son todos
los animales menores de diez aos.
Si no es necesaria una ordenador, el SGDB pasa las primeras filas de este
conjunto de resultados de vuelta a la estacin de trabajo nada ms capturarlas
y despus detiene el procesamiento hasta que la estacin recupera las filas
capturadas, una vez recuperadas el gestor de datos pasa ms filas y as
sucesivamente. Debido a este proceso, si otros usuarios estn actualizando la
base de datos, hay posibilidades que se aada otra fila que cumpla las
condiciones del conjunto de resultados; en este caso la fila aadida pasa a ser
miembro del conjunto y es recuperada por la estacin de trabajo. Tambin
existe la posibilidad de la eliminacin o modificacin de una fila, en estos
casos, si la fila no ha sido enviada a la estacin de trabajo o no se enva o se
enva modificada; pero siempre cabe la posibilidad de que la estacin de
trabajo haya ledo una fila que ya no existe o que haya sido modificada por
otro usuario. Estas actualizaciones no se incluirn en el conjunto de resultados
si la estacin de trabajo ha comenzado a procesar los resultados.
El proceso de relleno del cursor finaliza cuando el gestor de datos ha
determinado cual es la ltima fila del conjunto de resultados y se considera
completamente relleno cuando la estacin de trabajo ha capturado la ltima
fila, en este momento cuando se conoce el nmero de filas que componen el
cursor. Por este motivo los mtodos o propiedades que informan del nmero de
filas devueltas o afectadas no son reales hasta que el cursor no se rellenado
completamente.
Claudio Casares

ProInf.net, SCP
www.proinf.net

1.2.1. Ubicacin de los cursores


Como ya se ha comentado un cursor es un conjunto de punteros a un conjunto
de resultados. Estos punteros pueden estar ubicados en el servidor o en la
estacin de trabajo, originando dos tipos de cursores, los cursores del lado del
cliente y los cursores del lado del servidor. Pero no todos los gestores de datos
permiten crear cursores en el lado del servidor, slo se pueden crear con
aquellos gestores que tengan comportamiento cliente / servidor.
Las ventajas e inconvenientes de cada tipo de cursor es muy variable y
depende siempre de la explotacin que se desee hacer de los datos, de la
topologa de la red y de los equipos empleados. En general los cursores en el
lado del servidor reducen los tiempos de acceso a los datos y mejoran el
desplazamiento por el conjunto de resultados, si embargo consumen ms
cantidad de recursos de servidor y de red.

1.2.2. Tipos de cursores


Conjuntos de resultados sin cursor
Con un conjunto de resultados sin cursor las filas de datos pasan al frontal
para su procesamiento. Este el sistema ms rpido para llevar los datos desde
el servidor al cliente, pero no ofrece los beneficios del cursor, por que, si bien
algunos son actualizables, a menudo no lo son y hay que controlar el proceso
desde el frontal para controlar las modificaciones.

Cursores desplazables
Uno de los aspectos ms costosos de la administracin de los cursores es dar
soporte a la capacidad de desplazamiento. Esta capacidad significa que, una
vez ejecutada una consulta, un cursor desplazable permite la colocacin en
cualquier fila del conjunto de resultados. Estos mtodos de reubicacin son
costosos en el sentido que consumen recursos del sistema. Para aumentar el
rendimiento se aconseja limitar los cursores y seleccionar los no desplazables.

Cursores de slo avance


Este tipo de cursor slo permite utilizar los mtodos para desplazarse
avanzando por las filas del conjunto de resultados, no permiten el retroceso
por las mismas. En este caso el gestor de datos enviar las filas del conjunto
de resultados tan rpido como le sea posible.

Cursores estticos
Un cursor esttico proporciona la capacidad de direccionamiento por todo el
conjunto de resultados generando una copia en la estacin de trabajo de las
filas devueltas, todos los trabajos realizados sobre este conjunto de resultados
afectar nicamente a la copia local. Por su naturaleza este cursor necesita de
un espacio de almacenamiento en el cliente. Este cursor no es la mejor opcin
para datos que cambian constantemente, pero para tablas de bsqueda cuyos
valores no es probable que cambien, este cursor tiene mucho sentido.

Claudio Casares

ProInf.net, SCP
www.proinf.net

Cursores de conjunto de claves


Un cursor de conjunto de claves, u hoja de respuesta dinmica, almacena un
conjunto de claves, bsicamente un conjunto de punteros, y permite volver a
capturar una fila seleccionada de acuerdo con la informacin especfica de la
fila almacenada en dichas claves. Estos cursores necesitan espacio de
almacenamiento independiente para los datos de cada una de las claves que lo
componen. Cualquier cambio o modificacin sobre una fila del conjunto de
resultados por parte de cualquier usuario es reflejado en cualquier estacin de
trabajo al leer la informacin de dicha fila.

Cursores dinmicos
Al igual que en los dos casos anteriores, un cursor dinmico almacena un
bloque de claves. Sin embargo, con este tipo de cursor, la consulta que se ha
utilizado para generar el conjunto de resultados se vuelve a ejecutar
constantemente siempre que se hace referencia al cursor. Debido a esta
actividad repetida, los cursores dinmicos consumen gran cantidad de
recursos, pero poseen la gran ventaja que jams cierran la pertenencia o no
pertenencia de las filas al conjunto de resultados. En los dos casos anteriores
una vez rellenado el cursor no se admite la inclusin o exclusin de filas.

Cursores de slo lectura


Todos los tipos de cursores citados admiten la posibilidad de slo lectura, en
este caso ninguna de las filas del conjunto de resultados pueden ser
modificadas por la estacin de trabajo. Este cursor es muy til para la
generacin de consultas o informes en donde se sabe que ningn dato ser
modificado. Poseen la ventaja y el inconveniente de no generar bloqueos sobre
las filas consultadas, de tal forma que cualquier usuario puede editar las filas
contenidas en este cursor.

1.2.3. Tipos de buffers


Buffers de una nica fila
Un buffer de una nica fila no es en realidad un cursor, aunque aqu se
apliquen las mismas reglas de pertenencia que se aplican a un cursor de
conjunto de claves de slo avance. Con un buffer de una nica fila slo es
posible examinar los datos de la fila del conjunto de resultados. Las filas
anteriores no estn disponibles y la fila actual no estar accesible despus de
pasar a la siguiente fila del conjunto de resultados.

Buffers de n filas
Un buffer de n filas ampla el mbito y la capacidad de desplazamiento del
buffer de una nica fila. En este caso, a la estacin de trabajo se le expone un
nmero determinado de filas del conjunto de resultados y a la aplicacin se le
permite que se desplace libremente por esas filas.

Claudio Casares

ProInf.net, SCP
www.proinf.net

2. Modelo de datos
2.1.

Introduccin
Desde tiempos remotos, los datos han sido registrados por el hombre en algn
tipo de soporte (piedra, papel, madera, etc.) a fin de que quedara constancia
de una fenmeno o idea. Los datos han de ser interpretados para que se
conviertan en informacin til, esta interpretacin supone un fenmeno de
agrupacin y clasificacin.
En la era actual y con el auge de los medios informticos aparece el
almacenamiento en soporte electromagntico, ofreciendo mayores
posibilidades de almacenaje, ocupando menos espacio y ahorrando un tiempo
considerable en la bsqueda y tratamiento de los datos. Es en este momento
donde surge el concepto de bases de datos y con ellas las diferentes
metodologas de diseo y tratamiento.
El objetivo bsico de toda base de datos es el almacenamiento de smbolos,
nmeros y letras carentes de un significado en s, que con un tratamiento
adecuado se convierten en informacin til. Un ejemplo podra ser el siguiente
dato: 19941224, con el tratamiento correcto podra convertirse en la siguiente
informacin: "Fecha de nacimiento: 24 de diciembre de 1994".
Segn van evolucionando los tiempos, las necesidades de almacenamiento de
datos van creciendo y con ellas las necesidades de transformar los mismos
datos en informacin de muy diversa naturaleza. Esta informacin es utilizada
diariamente como herramientas de trabajo y como soporte para la toma de
decisiones por un gran colectivo de profesionales que toman dicha informacin
como base de su negocio. Por este motivo el trabajo del diseador de bases de
datos es cada vez ms delicado, un error en el diseo o en la interpretacin de
datos puede dar lugar a informacin incorrecta y conducir al usuario a la toma
de decisiones equivocadas. Se hace necesario la creacin de un sistema que
ayude al diseador a crear estructuras correctas y fiables, minimizando los
tiempos de diseo y explotando todos los datos, nace as la metodologa de
diseo de bases de datos.
La metodologa de diseo de datos divide cada modelo en tres esquemas:
A) Modelo Global: se trata de una representacin grfica legible por el usuario
y que nos aporta el flujo de informacin dentro de una organizacin. No
existen reglas para su construccin y se debe realizar siempre el esquema ms
sencillo posible para la comprensin por parte del usuario de la base de datos.
Por ejemplo:

Claudio Casares

ProInf.net, SCP
www.proinf.net

B) Modelo Lgico: se trata de una representacin grfica, mediante smbolos y


signos normalizados, de la base de datos. Su objetivo es representar la
estructura de los datos y las dependencias de los mismos, garantizando la
consistencia y evitando la duplicidad. Este modelo de datos se estudiar con
profundidad en los captulos siguientes.
C) Modelo Fsico: se trata del almacn de los datos, es la base de datos en s
misma, el soporte donde se almacenan los datos y de donde se extraen para
convertir los datos en informacin. En funcin del gestor de bases de datos
empleado las reglas de almacenamiento varan.

2.2.

Los Usuarios
En todo sistema de base de datos cabe diferenciar tres tipos diferentes de
usuarios, entre todos comparten la informacin pero acceden a ella de una
forma diferente, siempre en funcin de sus necesidades.
El primer grupo de usuarios es el PED (Procesamiento Electrnico de Datos),
normalmente compuestos por los operarios de la organizacin. Las necesidades
bsicas de este grupo de usuarios son:
1. El foco operativo fundamental se centra en el almacenamiento de los
datos, el procesamiento de los mismos y el flujo de datos;
2. Generan informes de tipo listados;
3. Poseen acceso restringido a la informacin.
El segundo grupo de usuarios es el SIM (Sistemas de Informacin de Gestin)
y suele estar formado por los mandos medios de la organizacin. Las
necesidades bsicas de este grupo de usuarios son:

Claudio Casares

10

ProInf.net, SCP
www.proinf.net

El foco operativo se fundamenta en la toma de decisiones, tomando


como partida los datos del grupo PED e introduciendo un volumen
pequeo de informacin;
No poseen acceso medianamente restringido a la informacin;
Generan informes de resmenes de datos del grupo PED y listados de la
informacin que introducen.

El tercer ltimo grupo de usuarios lo forman el STD (Sistema de apoyo a Toma


de Decisiones), este grupo se centra en el nivel ms alto de la organizacin y
poseen las caractersticas siguientes:

El foco operativo se centra en la decisin, con una entrada mnima de


datos;
No tienen acceso restringido;
Generan informes globales que les sirven como apoyo a las tomas de
decisiones del negocio, estos son los informes ms importantes y suelen
ir acompaados de resmenes, grficas y sobre todo centrados en la
evolucin y comparacin de la informacin.

Cabe destacar la figura de un cuarto grupo de usuarios, en este caso usuarios


avanzados, que est compuesto por los administradores del sistema, cuya
opinin es fundamental para seleccionar el soporte de los datos, evitar la
duplicacin de informacin ya existente en otros sistemas y sobre todo puede
aportar el conocimiento de sus usuarios, sus necesidades y los problemas ya
resueltos.
En general, podemos decir que los objetivos de una base de datos son los
siguientes:

2.3.

Ayudar en la toma de decisiones;


Compartir de forma controlada y restringida los datos y el acceso a la
informacin;
Integrar los datos de una forma lgica, evitando la duplicidad;
Asegurar un rpido acceso a la informacin y los datos.

Ciclo de vida de una base de datos


2.3.1. Anlisis de las necesidades
En reunin con el cliente se deben documentar los tres grupos de usuarios
definidos en la introduccin, las necesidades de informacin de cada uno de
ellos, as como los informes que cada uno necesita para su actividad y el
contenido de los mismos. Cuanta ms precisin exista en estos requisitos
iniciales ms preciso ser el desarrollo de la base de datos.
En esta reunin tambin debe quedar documentados los niveles de seguridad
de los grupos de usuarios, los derechos de cada uno de ellos sobre los datos,
los requisitos de los sistemas informticos del cliente (sistema operativo, tipo
de red, servidores, etc.) y la ubicacin de los usuarios.
Claudio Casares

11

ProInf.net, SCP
www.proinf.net

No hay que olvidar que normalmente en las empresas existen ya sistemas de


almacenamiento de datos, por tanto es conveniente analizar los datos ya
existentes y analizar las posibles relaciones con la base de datos a desarrollar.
Un cuestionario muy sencillo pero muy til para el administrador es el
siguiente (a rellenar por todos los usuarios):

Nombre
Cargo
Area de Responsabilidad
Obligaciones principales que requieren informacin de la base datos
De qu aplicaciones recibe informacin?
Con cunta frecuencia recibe informacin?
Qu hace con esta informacin?
Qu precauciones de seguridad debe tomar con respecto a la
informacin?
Para que aplicacin proporciona datos?
Estn contemplados cambios para alguna de sus actividades actuales
que involucren alguna de las informaciones anteriores?

2.3.2. Estudio de viabilidad


Un estudio de viabilidad implica la preparacin de un informe con las
caractersticas siguientes:

Viabilidad tecnolgica. Hay tecnologa suficiente para el desarrollo?


Viabilidad operacional. Existen suficientes recursos humanos,
presupuesto, experiencia y formacin para el desarrollo?
Viabilidad econmica. Se pueden identificar los beneficios? Los
beneficios costearan el desarrollo del sistema? Se pueden medir los
costes y los beneficios?

2.3.3. Definicin de requisitos


Los requisitos de desarrollo involucran el software y hardware necesario para la
implementacin, los recursos humanos necesarios (tanto internos como
externos), la formacin al personal.
Aunque un poco al margen del tema es conveniente parar en este momento y
planificar las acciones a realizar elaborando un cronograma del proyecto y un
organigrama con las responsabilidades de cada miembro del equipo. Conviene
sealar quienes van a ser los interlocutores y fijar un calendario de reuniones
de seguimiento del proyecto.
Hay que definir la figura del validador, esta persona ser la encargada de velar
en cada momento que no se est rebasando el alcance del proyecto, as como
asegurar que la implementacin est encaminada a subsanar las necesidades
del cliente.

2.3.4. Diseo
Claudio Casares

12

ProInf.net, SCP
www.proinf.net

En esta etapa se crea un esquema conceptual de la base de datos. Se


desarrollan las especificaciones hasta el punto en que puede comenzar la
implementacin. Durante esta etapa se crean modelos detallados de las vistas
de usuario y sobre todo las relaciones entre cada elemento del sistema,
documentando los derechos de uso y manipulacin de los diferentes grupos de
usuarios.
Si parte de la informacin necesaria para crear algn elemento establecido ya
se encuentra implementado en otro sistema de almacenamiento hay que
documentar que relacin existir entre uno y otro y detallar los sistemas que
eviten la duplicidad o incoherencia de los datos.
El diseo consta, como se vio anteriormente, de tres fases: el diseo global o
conceptual, el diseo lgico y el modelo fsico.

2.3.5. Implementacin
Una vez totalmente detallado el modelo conceptual se comienza con la
implementacin fsica del modelo de datos, a medida que se va avanzando en
el modelo el administrador del sistema va asegurando la correccin del modelo
y el validador la utilidad del mismo.
La implementacin consiste en el desarrollo de las tablas, los ndices de los
mismos, las condiciones de validacin de los datos, la relacin entre las
diferentes tablas. Por otro lado, la definicin de las consultas y los parmetros
a utilizar por cada una de ellas.
Una vez finalizada la implementacin fsica, se asignan las correspondientes
medidas de seguridad y se ubica la base de datos en el lugar correspondiente.

2.3.6. Evaluaccin y Perfeccionamiento


En esta ltima etapa todos los usuarios del sistema acceden a la base de datos
y deben asegurarse el correcto funcionamiento de la misma, que sus derechos
son los adecuados, teniendo a su disposicin cuanta informacin necesiten.
Tambin debern asegurarse que el acceso a los datos es cmodo, prctico,
seguro y que se han eliminado, en la medida de lo posible, las posibilidades de
error.
El administrador se asegura que todos los derechos y todas las restricciones
han sido implementadas correctamente y que se ha seguido en manual de
estilo en la totalidad de la implementacin.
El validador se asegurar que todas las necesidades del cliente han sido
satisfechas.

2.4.

Criterios de calidad
Legibilidad
El diseo de una base de datos ha de estar redactado con la suficiente claridad
para que pueda ser entendido rpidamente. El lenguaje utilizado debe ser lo
Claudio Casares

13

ProInf.net, SCP
www.proinf.net

suficientemente claro, conciso y detallado para que explique con total claridad
el diseo del modelo, sus objetivos, sus restricciones, en general todo aquello
que afecte al sistema de forma directa o indirecta. En este punto conviene
aplicar el principio que una imagen vale ms que mil palabras, pero en
ocasiones son necesarias esas mil palabras y obviar la imagen.

Fiabilidad
Se trata de realizar un sistema de bases de datos lo suficientemente robusto
para que sea capaz de recuperarse frente a errores o usos inadecuados. Se
deben utilizar gestores con las herramientas necesarias para la reparacin de
los posibles errores que las bases de datos pueden sufrir, por ejemplo tras un
corte inesperado de luz.

Portabilidad
El diseo deber permitir la implementacin del modelo fsico en diferentes
gestores de bases de datos.

Modificabilidad
Ningn sistema informtico es esttico, las necesidades de los usuarios varan
con el tiempo y por lo tanto las bases de datos se deben adaptar a las nuevas
necesidades, por lo que se precisa que un buen diseo facilite el
mantenimiento, esto es, las modificaciones y actualizaciones necesarias para
adaptarlo a una nueva situacin.

Eficiencia
Se deben aprovechar al mximo los recursos de la computadora, minimizando
la memoria utilizada y el tiempo de proceso o ejecucin, siempre que no sea a
costa de los requisitos anteriores. En este punto se debe tener en cuenta los
gestores cliente / servidor de bases de datos. En muchas ocasiones es ms
rentable cargar de trabajo al servidor y liberar recursos de los clientes, pero no
todos los gestores permiten este tipo de trabajo, por lo tanto se ha de tener en
cuenta estas dos circunstancias en el diseo de la base de datos.

Auto descripcin
En la documentacin generada debe estar todo el detalle del diseo, evitando
referencias a otros documentos que no estn incluidos dentro de la
documentacin de la base de datos.

Trivialidad
Tanto el diseo como la implantacin se deben realizar utilizando los
estndares fijados a priori, estos estndares debern quedar reflejados al inicio
del documento.

Claridad
Todos los documentos deben estar redactados de forma clara y fcil de
entender, los nombre utilizados para las tablas, los campos, ndices, etc. deben
ser autodescriptivos y estar perfectamente documentados.
Claudio Casares

14

ProInf.net, SCP
www.proinf.net

Coherencia
Las anotaciones y terminologa utilizada deben ser uniformes, para ello se debe
seguir algn tipo de metodologa estndar, indicado cual se ha empleado, en
los casos en que se utilice alguna metodologa no estndar se debe adjuntar a
la documentacin.

Completo
Todos los elementos constitutivos de la base de datos existen, no se han
dejado partes incompletas, sin documentar o sin implementar.

Concisin
No existen elementos intiles ni repetitivos. En este apartado hay que hacer un
especial hincapi en la repeticin de datos en diferentes tablas, hay que evitar
a toda costa que el mismo dato se repita en varias tablas para conseguir as
una optimizacin del tamao de la base de datos.

Facilidad de Aprendizaje
La documentacin de la base de datos se puede utilizar sin necesidad de otros
conocimientos informticos fuera del alcance del diseo e implementacin de la
base de datos.

Facilidad de Uso
Los datos deben ser fciles de elaborar y los resultados fciles de entender.

Generalidad
La base de datos debe ser capaz de adaptarse a cualquier tipo de empresa y a
cualquier casustica.

Independencia de Usuario
La base de datos no debe estar ligada a la utilizacin en una nica instalacin,
hay que tener en cuenta que, aunque se trate de un desarrollo a medida, en
un futuro se podra realizar la instalacin en un cliente diferente al inicial.

Independencia de Sistema
Las prestaciones y diseo de la base de datos no estn vinculadas al entorno.

Independencia de Instalacin
La base de datos se puede transportar fcilmente de una instalacin a otra.

Modularidad
La base de datos puede ser descompuesta en elementos independientes. Si se
trata de un diseo grande, en donde hay un gran nmero de tablas, conviene
realizar agrupaciones entre ella, creando mdulos funcionales que permitan la
mejor compresin del diseo y de la implantacin.

Claudio Casares

15

ProInf.net, SCP
www.proinf.net

Observable
La base de datos debe permitir observar los accesos a los datos. Siempre que
se pueda hay que dejar un rastro de la utilizacin de los datos por parte de los
usuarios, esta informacin ayuda al redimensionado de la base de datos y a
conocer el nmero de accesos a los datos.

Precisin
Los clculos efectuados se deben realizar con la precisin requerida.

Proteccin
La base de datos debe permitir la proteccin de los datos frente a usos no
debidos, para ello hay que elaborar un sistema de accesos definiendo
diferentes usuarios con diferentes claves y especificar que autorizaciones
tendr cada usuario sobre los diferentes datos.

Trazabilidad
Tomando como punto de partida la versin actual se puede remontar su diseo
hasta las especificaciones iniciales

2.5.

Indicadores de calidad
Al finalizar el diseo de una base de datos podemos utilizar la siguiente tabla
para comprobar el grado de calidad del trabajo.
1

10

Legibilidad

__ __ __ __ __ __ __ __ __ __

Fiabilidad

__ __ __ __ __ __ __ __ __ __

Portabilidad

__ __ __ __ __ __ __ __ __ __

Modificabilidad

__ __ __ __ __ __ __ __ __ __

Eficiencia

__ __ __ __ __ __ __ __ __ __

Auto Descripcin

__ __ __ __ __ __ __ __ __ __

Trivialidad

__ __ __ __ __ __ __ __ __ __

Claridad

__ __ __ __ __ __ __ __ __ __

Coherencia

__ __ __ __ __ __ __ __ __ __

Completo

__ __ __ __ __ __ __ __ __ __

Conciso

__ __ __ __ __ __ __ __ __ __

Facilidad de Aprendizaje

__ __ __ __ __ __ __ __ __ __

Facilidad de Uso

__ __ __ __ __ __ __ __ __ __
Claudio Casares

16

ProInf.net, SCP
www.proinf.net

Generalidad

__ __ __ __ __ __ __ __ __ __

Independencia de Usuario

__ __ __ __ __ __ __ __ __ __

Independencia del Sistema

__ __ __ __ __ __ __ __ __ __

Independencia de Instalacin

__ __ __ __ __ __ __ __ __ __

Modularidad

__ __ __ __ __ __ __ __ __ __

Observable

__ __ __ __ __ __ __ __ __ __

Precision

__ __ __ __ __ __ __ __ __ __

Proteccin

__ __ __ __ __ __ __ __ __ __

Trazable

__ __ __ __ __ __ __ __ __ __

Legibilidad

__ __ __ __ __ __ __ __ __ __
TOTAL __ __ __ __ __ __ __ __ __ __

PUNTUACIN FINAL

2.6.

__

El modelo lgico
Anteriormente se expuso el ciclo de vida del desarrollo de una base de datos.
Este captulo se centrar en el diseo del modelo lgico de los datos, por tanto
antes de comenzar esta modelacin es necesario tener documentado las
necesidades, viabilidad y definicin de los requisitos, as como tener elaborado
el modelo global o conceptual del diseo.
El paso del modelo global o conceptual de datos al modelo lgico supone una
abstraccin, un mecanismo para la conversin del mundo real a un mundo
formado por datos, a su agrupacin y clasificacin. El proceso de abstraccin
consiste en identificar los elementos conceptos empleados en el modelo
global y transformarlo en lo que denominamos entidades en el modelo lgico.
La abstraccin se puede realizar de las siguientes formas:

Clasificacin
Consiste en generar una nica entidad conceptos con caractersticas comunes,
todos ellos tendrn las mismas caractersticas y se diferencian unos de otros
por los valores que toman dichas caractersticas. Por ejemplo: los conceptos
cursos de ingls, cursos de espaol y cursos de francs se pueden agrupar en
una nica entidad denominada "CURSOS" que englobe y diferencie cada uno
de los diferentes cursos que se imparten.

Claudio Casares

17

ProInf.net, SCP
www.proinf.net

Agregacin
Consiste en separar cada una de las partes de un concepto para generar
distintas entidades, por ejemplo el concepto coche lo podemos definir
utilizando las entidades rueda, motor y chasis.

Generalizacin
Consiste en ir generado entidades de diferentes niveles de tal forma que cada
entidad de nivel superior agrupe las de nivel inferior.

Asociacin
Consiste en la generalizacin de entidades a partir de entidades ya existentes.

2.7.

Restricciones de integridad
En el mundo real existen ciertas restricciones que deben cumplir los elementos
en l existentes; por ejemplo, una persona slo puede tener un nmero de DNI
y una nica direccin oficial. Cuando se disea una base de datos se debe
reflejar fielmente el universo del discurso que estamos tratando, lo que es los
mismo, reflejar las restricciones existentes en el mundo real.
Los componentes de una restriccin son los siguientes:

Claudio Casares

ProInf.net, SCP
www.proinf.net

18

La operacin de actualizacin (insercin, borrado o eliminacin) cuya


ejecucin ha de dar lugar a la comprobacin del cumplimiento de la
restriccin.
La condicin que debe cumplirse, la cual es en general una proposicin
lgica, definida sobre uno o varios elementos del esquema, que puede
tomar uno de los valores de verdad (cierto o falso).
La accin que debe llevarse a cabo dependiendo del resultado de la
condicin.

En general, se puede decir que existen tres tipos de integridad:

Integridad de dominio: restringimos los valores que puede tomar un


atributo respecto a su dominio, por ejemplo EDAD >= 18 - 65.
Integridad de entidad: la clave primaria de una entidad no puede tener
valores nulos y siempre deber ser nica, por ejemplo DNI.
Integridad referencial: las claves ajenas de una tabla hija se tienen que
corresponder con la clave primaria de la tabla padre con la que se
relaciona. Por ejemplo, en la tabla familiares de los empleados
necesitaremos el DNI de empleado, que es la clave ajena de la tabla.

Las restricciones se clasifican en:


A. Inherentes
o Estn impuestas por el modelo,
o No tiene que ser definidas por el usuario, ya que se encuentran en el
propio modelo,
o Se activan en el momento de la definicin del esquema cuando se produce
un intento de violacin,
o Se rechaza todo esquema que no cumple estas restricciones,
o Introducen rigideces en el modelo.
B. Semnticas
o Impuestas por el universo del discurso,
o Tienen que ser definidas por los diseadores,
o Se activan en el momento de la actualizacin de la base de datos,
o Se rechaza todo ejemplar que no cumpla estas restricciones (o se ponen
en marcha otros medios a fin de que no se produzca un estado de
inconsistencia),
o Ayudan a capturar la semntica de los datos y a conseguir su
consistencia.
1. Ajenas
Se especifican en los programas de aplicacin,
No estn almacenadas en el esquema de la base de datos,
Pueden ser violadas por actualizaciones en las que no se haya
programado la restriccin,
El sistema de bases de datos no puede comprobar si son consistentes
en s mismas.
El optimizador no puede tomarlas en consideracin,
Claudio Casares

ProInf.net, SCP
www.proinf.net

19

Proporcionan el mximo de flexibilidad,


Pueden ser programadas en un lenguaje de propsito general o en

algn lenguaje propio del sistema de bases de datos,


Suponen una importante carga de programacin y mantenimiento.
2. Propias
Se identifican en el esquema,
Estn almacenadas en el esquema de la base de datos,
No pueden ser violadas por ninguna actualizacin.
a. Accin General
Es obligatorio especificar la condicin y la accin,
Son procedimentales (al menos en parte, ya que la accin se
especifica siempre mediante un procedimiento),
Suponen carga de programacin,
Es muy difcil (prcticamente imposible en la mayor parte de los
casos) que el sistema de bases de datos pueda comprobar su
consistencia,
El optimizador no puede tomarlas en consideracin,
Hasta ahora no estn estandarizadas,
Estn muy ligadas a los productos,
Son muy flexibles,
Tienen nombre y existencia propia dentro del programa.
i. Procedimientos almacenados
Es obligatorio especificar la condicin (adems de la
accin),
Son totalmente procedimentales,
Pueden ser tan complejas como imponga la semntica del
mundo real (tanto en la condicin como en la accin),
Son las ms flexibles dentro de las restricciones propias.
ii. Disparadores
Combinan los enfoques declarativo (en la condicin) y
procedimental (en la accin),
Pueden ser tan complejas como imponga la semntica del
mundo real en cuanto a la accin, y bastantes complejas en
la condicin (todo lo que permite la proposicin lgica
mediante la que se expresa la condicin),
El cumplimiento de la condicin dispara la accin,
Son ms flexibles que las restricciones de accin especfica.
b. Accin Especfica
La accin est implcita en la misma restriccin, por lo que no
hay que definirla,
Son declarativas, puesto que no especifica la accin y la
condicin, si se define, es declarativa,
El no cumplimiento de la condicin lleva a aplicar la accin,
Claudio Casares

20

ProInf.net, SCP
www.proinf.net

Podran ser definidas mediante un lenguaje de tipo general,


El sistema de bases de datos puede comprobar si son

consistentes en s mismas,
El optimizador puede tomarlas en consideracin,
No suponen carga de programacin, slo de definicin.
i. Condicin General
No se especifica la accin, que es siempre de rechazo (el no
cumplimiento de la condicin lleva consigo el rechazo de la
actualizacin),
Es obligatorio declarar la condicin mediante una
proposicin lgica que permite condiciones de complejidad
arbitraria,
Adems de la condicin, se puede especificar algn otro
componente,
Son ms flexibles que las de condicin especfica,
Es ms difcil optimizar su ejecucin que en el caso de las
de condicin especfica.
I. Verificacin
No tienen existencia en s mismas,
Su definicin forma parte de la definicin del
elemento afectado por la restriccin,
Se aplican a un nico elemento y aunque pueden
afectar a otros, en este caso se complica su
definicin,
Pueden no tener nombre.
II. Asercin
Tienen existencia por s mismas,
Se definen con independencia de cualquier
elemento del esquema,
Pueden afectar a ms de un elemento,
Tienen nombre.
ii. Condicin Especfica
Son opciones proporcionadas por el propio modelo,
No se especifica ninguno de los componentes relativos a
una restriccin (ni la operacin, ni la condicin, ni la
accin),
Son poco flexibles,
El optimizador puede tomarlas en consideracin,
Su ejecucin puede ser ms fcilmente optimizada que las
de condicin general.

Claudio Casares

21

ProInf.net, SCP
www.proinf.net

3. Modelo Relacional
3.1.

Introduccin
Las bases de datos relacionales son el tipo de bases de datos actualmente ms
difundido. Los motivos de este xito son fundamentalmente dos:
1. ofrecen sistemas simples y eficaces para representar y manipular los
datos
2. se basan en un modelo, el relacional, con slidas bases tericas
El modelo relacional fue propuesto originariamente por E.F. Codd en un ya
famoso artculo de 1970. Gracias a su coherencia y facilidad de uso, el modelo
se ha convertido en los aos 80 en el ms usado para la produccin de DBMS.
La estructura fundamental del modelo relacional es precisamente esa,
"relacin", es decir una tabla bidimensional constituida por lneas (tuple) y
columnas (atributos). Las relaciones representan las entidades que se
consideran interesantes en la base de datos. Cada instancia de la entidad
encontrar sitio en una tupla de la relacin, mientras que los atributos de la
relacin representarn las propiedades de la entidad. Por ejemplo, si en la base
de datos se tienen que representar personas, se podr definir una relacin
llamada "Personas", cuyos atributos describen las caractersticas de las
personas (tabla siguiente). Cada tupla de la relacin "Personas" representar
una persona concreta.
Persona
Nombre
Apellido
Nacimiento
Sexo
Estado Civil
Juan
Loza
15/06/1971
H
Soltero
Isabel
Galvez
23/12/1969
M
Casada
Micaela
Ruiz
02/10/1985
M
Soltera
En realidad, siendo rigurosos, una relacin es slo la definicin de la estructura
de la tabla, es decir su nombre y la lista de los atributos que la componen.
Cuando se puebla con las tuplas, se habla de "instancia de relacin". Por eso,
la tabla anterior representa una instancia de la relacin persona. Una
representacin de la definiticn de esa relacin podra ser la siguiente:
Personas (nombre, apellido, fecha_nacimiento, sexo, estado_civil)
A continuacin, se indicarn ambas (relacin e instancia de relacin) con el
trmino "relacin", a no ser que no quede claro por el contexto a qu acepcin
se refiere.
Las tuplas en una relacin son un conjunto en el sentido matemtico del
trmino, es decir una coleccin no ordenada de elementos diferentes. Para
distinguir una tupla de otra, se recurre al concepto de "clave primaria", o sea a
un conjunto de atributos que permiten identificar unvocamente una tupla en
una relacin. Naturalmente, en una relacin puede haber ms combinaciones
Claudio Casares

ProInf.net, SCP
www.proinf.net

22

de atributos que permitan identificar unvocamente una tupla ("claves


candidatas"), pero entre stas se elegir una sola para utilizar como clave
primaria. Los atributos de la clave primaria no pueden asumir el valor nulo
(que significa un valor no determinado), en tanto que ya no permitiran
identificar una tupla concreta en una relacin. Esta propiedad de las relaciones
y de sus claves primarias est bajo el nombre de integridad de las entidades
(entity integrity).
A menudo, para obtener una clave primaria "econmica", es decir compuesta
de pocos atributos fcilmente manipulables, se introducen uno o ms atributos
ficticios, con cdigos identificativos unvocos para cada tupla de la relacin.
Cada atributo de una relacin se caracteriza por un nombre y por un dominio.
El dominio indica qu valores pueden ser asumidos por una columna de la
relacin. A menudo un dominio se define a travs de la declaracin de un tipo
para el atributo (por ejemplo diciendo que es una cadena de diez caracteres),
pero tambin es posible definir dominios ms complejos y precisos. Por
ejemplo, para el atributo "sexo" de nuestra relacin "Personas" podemos
definir un dominio por el cual los nicos valores vlidos son 'M' y 'F'; o bien por
el atributo "fecha_nacimiento" podremos definir un dominio por el que se
consideren vlidas slo las fechas de nacimiento despus del uno de enero de
1960, si en nuestra base de datos no est previsto que haya personas con
fecha de nacimiento anterior a esa. El motor de datos se ocupar de controlar
que en los atributos de las relaciones se incluyan slo los valores permitidos
por sus dominios. Caracterstica fundamental de los dominios de una base de
datos relacional es que sean "atmicos", es decir que los valores contenidos en
las columnas no se puedan separar en valores de dominios ms simples. Ms
formalmente se dice que no es posible tener atributos multivalor (multivalued).
Por ejemplo, si una caracterstica de las personas en nuestra base de datos
fuese la de tener uno o ms hijos, no sera posible escribir la relacin Personas
de la siguiente manera:
Personas (nombre, apellido, fecha_nacimiento, sexo, estado_civil, hijos)
En efecto, el atributo hijos es un atributo no-atmico, bien porque una persona
puede tener ms de un hijo o porque cada hijo tendr diferentes caractersticas
que lo describen. Para representar estas entidades en una base de datos
relacional hay que definir dos relaciones:
Personas (*nmero_persona, nombre, apellido, fecha_nacimiento, sexo,
estado_civil)
Hijos(*nmero_persona, *nombre_apellido, edad, sexo)
En las relaciones precedentes, los asteriscos (*) indican los atributos que
componen sus claves primarias. Ntese la introduccin en la relacin Personas
del atributo nmero_persona, a travs del cual se asigna a cada persona un
identificativo numrico unvoco que se usa como llave primaria. Estas
relaciones contienen slo atributos atmicos. Si una persona tiene ms de un
hijo, stos se representarn en tuplas diferentes de la relacin Hijos. Las
diferentes caractersticas de los hijos las representan los atributos de la
Claudio Casares

23

ProInf.net, SCP
www.proinf.net

relacin Hijos. La unin entre las dos relaciones est constituida por los
atributos nmero_persona que aparecen en ambas relaciones y que permiten
que se asigne cada tupla de la relacin hijos a una tupla concreta de la relacin
Personas. Ms formalmente se dice que el atributo nmero_persona de la
relacin Hijos es una clave externa (foreign key) hacia la relacin Personas.
Una clave externa es una combinacin de atributos de una relacin que son, a
su vez, una clave primaria para otra relacin. Una caracterstica fundamental
de los valores presentes en una clave externa es que, a no ser que no sean
null, tienen que corresponder a valores existentes en la clave primaria de la
relacin a la que se refieren. En nuestro ejemplo, esto significa que no puede
existir en la relacin Hijos una tupla con un valor del atributo nmero_persona
sin que tambin en la relacin Personas exista una tupla con el mismo valor
para su llave primaria. Esta propiedad va bajo el nombre de integridad
referencial (referential integrity).
Una de las grandes ventajas del modelo relacional es que define tambin un
lgebra, llamada "lgebra relacional". Todas las manipulaciones posibles sobre
las relaciones se obtienen gracias a la combinacin de tan slo cinco
operadores: RESTRICT, PROJECT, TIMES, UNION y MINUS. Por comodidad, se
han definido tambin tres operadores adicionales que de todos modos se
pueden obtener aplicando los cinco fundamentales: JOIN, INTERSECT y
DIVIDE. Los operadores relacionales reciben como argumento una relacin o
un conjunto de relaciones y restituyen una nica relacin como resultado.
Veamos brevemente estos ocho operadores:
RESTRICT: restituye una relacin que contiene un subconjunto de las tuplas
de la relacin a la que se aplica. Los atributos se quedan como estaban.
PROJECT: restituye una relacin con un subconjunto de los atributos de la
relacin a la que viene aplicado. Las tuplas de la relacin resultado se
componen de las tuplas de la relacion original, de manera que siguen siendo
un conjunto en sentido matemtico.
TIME: se aplica a dos relaciones y efecta el producto cartesiano de las tuplas.
Cada tupla de la primera relacin est concatenada con cada tupla de la
segunda.
JOIN: se concatenan las tuplas de dos relaciones de acuerdo con el valor de
un conjunto de sus atributos.
UNION: aplicando este operador a dos relaciones compatibles, se obtiene una
que contiene las tuplas de ambas relaciones. Dos relaciones son compatibles si
tienen el mismo nmero de atributos y los atributos correspondientes en las
dos relaciones tienen el mismo dominio.
MINUS: aplicado a dos relaciones compatibles restituye una tercera que
contiene las tuplas que se encuentran slo en la primera relacin.

Claudio Casares

24

ProInf.net, SCP
www.proinf.net

INTERSECT: aplicado a dos relaciones compatibles restituye una relacin que


contiene las tuplas que existen en ambas.
DIVIDE: aplicado a dos relaciones que tengan atributos comunes, restituye
una tercera que contiene todas las tuplas de la primera relacin que se puede
hacer que correspondan con todos los valores de la segunda relacin.
En las siguientes tablas, a ttulo de ejemplo, se representan los resultados de
la aplicacin de algunos operadores relacionales a las relaciones Personas e
Hijos. Como nombres para las relaciones resultado se han utilizado las
expresiones que las producen.
Personas
nmero_persona nombre

apellido

fecha_nacimiento

sexo estado_civil

Mario

Rossi

29/03/1965

Casado

Giuseppe

Russo

15/11/1972

Soltero

Alessandra

Mondella 13/06/1970

Soltera

Hijos
nmero_persona

nombre_apellido

edad

sexo

Maria Rossi

Gianni Rossi

RESTRICT (Personas)
sexo='M'
nmero_persona nombre

apellido

fecha_nacimiento

sexo estado_civil

Mario

Rossi

29/03/1965

Casado

Giuseppe Russo

15/11/1972

Soltero

Las bases de datos relacionales efectan todas las operaciones en las tablas
usando el lgebra relacional, aunque normalmente no le permiten al usuario
usarla. El usuario interacciona con la base de datos a travs de una interfaz
diferente el lenguaje SQL, un lenguaje declarativo que permite escribir
conjuntos de datos. Las instrucciones SQL vienen descompuestas por el motor
de datos en una serie de operaciones relacionales.

3.2.

Proceso de normalizacin
El proceso de normalizacin es un estndar que consiste, bsicamente, en un
proceso de conversin de las relaciones entre las entidades, evitando:
La redundancia de los datos: repeticin de datos en un sistema.
Anomalas de actualizacin: inconsistencias de los datos como resultado
de datos redundantes y actualizaciones parciales.
Claudio Casares

25

ProInf.net, SCP
www.proinf.net

Anomalas de borrado: prdidas no intencionadas de datos debido a que


se han borrado otros datos.
Anomalas de insercin: imposibilidad de adicionar datos en la base de
datos debido a la ausencia de otros datos.

Tomando como referencia la tabla siguiente:


AUTORES Y LIBROS
NOMBRE

NACION

CODLIBRO

TITULO

EDITOR

Date

USA

999

IBD

AW

Ad.Mig.

ESP

888

CyD

RM

Ma.Piat.

ITA

777

CyD

RM

Date

USA

666

BdD

AW

Se plantean una serie de problemas:

Redundancia: cuando un autor tiene varios libros, se repite la


nacionalidad.
Anomalas de modificacin: Si Ad.Mig. y Ma.Piat. desean cambiar de
editor, se modifica en los 2 lugares. A priori no podemos saber cuntos
autores tiene un libro. Los errores son frecuentes al olvidar la
modificacin de un autor. Se pretende modificar en un slo sitio.
Anomalas de insercin: Se desea dar de alta un autor sin libros, en un
principio. NOMBRE y CODLIBRO son campos clave, una clave no puede
tomar valores nulos.

Asegurando:

Integridad entre los datos: consistencia de la informacin.

El proceso de normalizacin nos conduce hasta el modelo fsico de datos y


consta de varias fases denominadas formas normales, estas formas se detallan
a continuacin.

3.2.1. Definicin de la clave


Antes de proceder a la normalizacin de la tabla lo primero que debemos de
definir es una clave, esta clave deber contener un valor nico para cada
registro (no podrn existir dos valores iguales en toda la tabla) y podr estar
formado por un nico campo o por un grupo de campos.
En la tabla de alumnos de un centro de estudios no podemos definir como
campo clave el nombre del alumno ya que pueden existir varios alumnos con el
mismo nombre. Podramos considerar la posibilidad de definir como clave los
campos nombre y apellidos, pero estamos en la misma situacin: podra darse
el caso de alumnos que tuvieran los mismo apellidos y el mismo nombre (Juan
Fernndez Martn).
Claudio Casares

26

ProInf.net, SCP
www.proinf.net

La solucin en este caso es asignar un cdigo de alumno a cada uno, un


nmero que identifique al alumno y que estemos seguros que es nico.
Una vez definida la clave podremos pasar a estudiar la primera forma normal.

3.2.2. Primera forma normal (1NF)


Se dice que una tabla se encuentra en primera forma normal (1NF) si y solo si
cada uno de los campos contiene un nico valor para un registro determinado.
Supongamos que deseamos realizar una tabla para guardar los cursos que
estn realizando los alumnos de un determinado centro de estudios, podramos
considerar el siguiente diseo:
Cdigo

Nombre

Cursos

Marcos

Ingls

Lucas

Contabilidad, Informtica

Marta

Ingls, Contabilidad

Podemos observar que el registro de cdigo 1 si cumple la primera forma


normal, cada campo del registro contiene un nico dato, pero no ocurre as con
los registros 2 y 3 ya que en el campo cursos contiene ms de un dato cada
uno. La solucin en este caso es crear dos tablas del siguiente modo:
TABLA A
Cdigo

TABLA B

Nombre

Cdigo

Curso

Marcos

Ingls

Lucas

Contabilidad

Marta

Informtica

Ingls

Informtica

Como se puede comprobar ahora todos los registros de ambas tablas


contienen valores nicos en sus campos, por lo tanto ambas tablas cumplen la
primera forma normal.
Una vez normalizada la tabla en 1NF, podemos pasar a la segunda forma
normal.

3.2.3. Segunda forma normal (2NF)


Claudio Casares

27

ProInf.net, SCP
www.proinf.net

La segunda forma normal compara todos y cada uno de los campos de la tabla
con la clave definida. Si todos los campos dependen directamente de la clave
se dice que la tabla est es segunda forma normal (2NF).
Supongamos que construimos una tabla con los aos que cada empleado ha
estado trabajando en cada departamento de una empresa:
Cdigo Empleado

Cdigo Dpto.

Nombre

Departamento

Aos

Juan

Contabilidad

Pedro

Sistemas

Sonia

I+D

Vernica

Sistemas

10

Pedro

Contabilidad

Tomando como punto de partida que la clave de esta tabla est formada por
los campos cdigo de empleado y cdigo de departamento, podemos decir que
la tabla se encuentra en primera forma normal, por tanto vamos a estudiar la
segunda:
1. El campo nombre no depende funcionalmente de toda la clave, slo
depende del cdigo del empleado.
2. El campo departamento no depende funcionalmente de toda la clave,
slo del cdigo del departamento.
3. El campo aos si que depende funcionalmente de la clave ya que
depende del cdigo del empleado y del cdigo del departamento
(representa el nmero de aos que cada empleado ha trabajado en cada
departamento)
Por tanto, al no depender todos los campos de la totalidad de la clave la tabla
no est en segunda forma normal, la solucin es la siguiente:
Tabla A

Tabla B

Tabla C

Cdigo
Empleado

Nombre

Cdigo
Departamento

Dpto.

Cdigo
Empleado

Cdigo
Departamento

Aos

Juan

I+D

Pedro

Sistemas

Sonia

Contabilidad 3

Vernica

10

Podemos observar que ahora si se encuentras las tres tabla en segunda forma
normal, considerando que la tabla A tiene como ndice el campo Cdigo
Claudio Casares

28

ProInf.net, SCP
www.proinf.net

Empleado, la tabla B Cdigo Departamento y la tabla C una clave compuesta


por los campos Cdigo Empleado y Cdigo Departamento.

3.2.4. Tercera forma normal (3NF)


Se dice que una tabla est en tercera forma normal si y solo si los campos de
la tabla dependen nicamente de la clave, dicho en otras palabras los campos
de las tablas no dependen unos de otros. Tomando como referencia el ejemplo
anterior, supongamos que cada alumno slo puede realizar un nico curso a la
vez y que deseamos guardar en que aula se imparte el curso. A voz de pronto
podemos plantear la siguiente estructura:
Cdigo

Nombre

Curso

Aula

Marcos

Informtica

Aula A

Lucas

Ingls

Aula B

Marta

Contabilidad

Aula C

Estudiemos la dependencia de cada campo con respecto a la clave cdigo:


Nombre depende directamente del cdigo del alumno.
Curso depende de igual modo del cdigo del alumno.
El aula, aunque en parte tambin depende del alumno, est mas ligado
al curso que el alumno est realizando.

Por esta ltima razn se dice que la tabla no est en 3NF. La solucin sera la
siguiente:
Tabla A

Tabla B

Cdigo Nombre

Curso

Curso

Aula

Marcos

Informtica

Informtica

Aula A

Lucas

Ingls

Ingls

Aula B

Marta

Contabilidad

Contabilidad

Aula C

Una vez conseguida la segunda forma normal, se puede estudiar la cuarta


forma normal.

3.2.5. Cuarta forma normal (4NF)


Una tabla est en cuarta forma normal si y slo si para cualquier combinacin
clave - campo no existen valores duplicados. Vemoslo con un ejemplo:
Geometra
Figura

Color

Tamao
Claudio Casares

29

ProInf.net, SCP
www.proinf.net

Cuadrado

Rojo

Grande

Cuadrado

Azul

Grande

Cuadrado

Azul

Mediano

Crculo

Blanco

Mediano

Crculo

Azul

Pequeo

Crculo

Azul

Mediano

Comparemos ahora la clave (Figura) con el atributo Tamao, podemos


observar que Cuadrado Grande est repetido; igual pasa con Crculo Azul,
entre otras. Estas repeticiones son las que se deben evitar para tener una tabla
en 4NF.
La solucin en este caso sera la siguiente:
Tamao

Color

Figura

Tamao

Figura

Color

Cuadrado

Grande

Cuadrado

Rojo

Cuadrado

Pequeo

Cuadrado

Azul

Crculo

Mediano

Crculo

Blanco

Crculo

Pequeo

Crculo

Azul

3.2.6. Otras formas normales


Existen otras dos formas normales, la llamada quinta forma normal (5FN) que
no detallo por su dudoso valor prctico ya que conduce a una gran divisin de
tablas y la forma normal dominio / clave (FNDLL) de la que no existe mtodo
alguno para su implantacin.

3.3.

Las interrelaciones
Las interrelaciones son las relaciones que existen entre varias tablas del
sistema (Clientes y Pedidos, por ejemplo). Existen tres formas de
interrelaciones dependiendo de la cardinalidad con la que se combinan los
elementos de ambas tablas.

3.3.1. Interrelaciones uno a uno


Una interrelacin es de uno a uno entre la tabla A y la tabla B cuando a cada
elemento de la clave de A se le asigna un nico elemento de la tabla B y para
cada elemento de la clave de la tabla B contiene un nico elemento en la tabla
A. Un ejemplo de interrelacin de este tipo es la formada por las tablas Datos
Generales de Clientes y Datos Contables de Clientes. En esta relacin cada
Claudio Casares

30

ProInf.net, SCP
www.proinf.net

cliente tiene una nica direccin y una direccin en cada una de las tablas.
Representamos la relacin como A 1: 1 B.
Ante la presencia de este tipo de relacin nos podemos plantear el caso de
unificar todos los datos en nica tabla pues no es necesario mantener ambas
tablas a la misma vez.
Este tipo de relacin se genera cuando aparecen tablas muy grandes, con gran
cantidad de campos, disgregando la tabla principal en dos para evitar tener
una tabla muy grande. Tambin surge cuando los diferentes grupos de usuario
cumplimentan una informacin diferente para un mismo registros; en este caso
se crean tantas tablas como registros, evitando as tener que acceder a
informacin que el usuario del grupo actual no necesita.

3.3.2. Interrelaciones uno a varios


Una interrelacin es de uno a varios entre las tablas A y B cuando una clave de
la tabla A posee varios elementos relacionados en la tabla B y cuando una
clave de la tabla B posee un nico elemento relacionado en la tabla A.
Estudiemos la relacin entre la tabla de clientes y la tabla de pedidos. Un
cliente puede realizar varios pedidos pero un pedido pertenece a un nico
cliente, por tanto se trata de una relacin uno a varios y la representamos A 1:
n B.
Estas relaciones suelen surgir de aplicar la 1NF a una tabla.

3.3.3. Interrelaciones varios a varios


Una interrelacin es de varios a varios entre las tablas A y B cuando una clave
de la tabla A posee varios elementos relacionados en la tabla B y cuando una
clave de la tabla B posee varios elementos relacionados en la tabla A.
Un caso muy caracterstico de esta interrelacin es la que surge entre las
tablas de Puestos de Trabajo y Empleados de una empresa. Un Empleado
puede desempear realizar varias funciones dentro de una empresa
(desempear varios puestos de trabajo), y un puesto de trabajo puede estar
ocupado por varios empleados a la misma vez. Esta interrelacin la
representamos como A n: n B.
No se deben definir relaciones de este tipo en un sistema de bases de datos,
debido a su complejidad a la hora de su mantenimiento, por este motivo se
debe transformar este tipo de relacin es dos interrelaciones de tipo 1: n,
empleando para ello una tabla que denominaremos puente y que estar
formada por las claves de ambas tablas. Esta tabla puente debe contener una
nica clave compuesta formada por los campos clave de las tablas primeras.
Empleados

Puestos

Cdigo Empleado

Empleado

Cdigo Puesto

Puesto

103

Juan

52

Comercial
Claudio Casares

31

ProInf.net, SCP
www.proinf.net

105

Luisa

73

251

Martn

736

Ana Mara

Administrativo

Tabla Puente
Cdigo
Empleado

Cdigo
Puesto

103

52

103

73

105

73

251

52

736

52

736

73

Ahora existe una relacin 1: n entre Empleados y Tabla Puente y otra relacin
1: n entre Puestos y Tabla Puente ya que un empleado posee varios cdigos de
empleado en la tabla puente pero cada elemento de la tabla puente pertenece
a un nico empleado.
Por otro la un puesto de trabajo posee varios elementos relacionados en la
tabla puente, pero cada elemento de la tabla puente est relacionado con un
nico elemento de la tabla puestos.

3.3.4. Problemas con las interrelaciones


A la hora de establecer las interrelaciones existentes en un sistema de bases
de datos nos podemos encontrar dos problemas:
1. Interrelaciones recursivas: un elemento se relaciona consigo mismo
directamente.
2. Interrelaciones circulares o cclicas: A se relaciona con B, B se relaciona
con C y C se relaciona con A.
Ambos casos pueden suponer un grave problema si definimos una relacin con
integridad referencial y decimos eliminar en cascada (al eliminar una clave de
la tabla A se eliminan los elementos relacionados en la tabla B). Supongamos
la relacin recursiva existen en la relacin Empleado y Supervisor (ambos son
empleados de la empresa). Est claro que un empleado est supervisado por
otro empleado. Veamos la forma de solucionarlo:
Empleados
Cdigo

Nombre

Supervisor
Claudio Casares

32

ProInf.net, SCP
www.proinf.net

102

Juan

NO

105

Luis

SI

821

Mara

NO

956

Martn

SI

Para solucionar la relacin debemos crear una tabla formada por dos campos.
Ambos campos deben ser el cdigo del empleado pero como no podemos tener
dos campos con el mismo nombre a uno de ellos le llamaremos cdigo
supervisor.
Tabla Puente
Cdigo
Empleado

Cdigo
Supervisor

102

105

105

956

821

105

956

105

Para terminar de resolver la interrelacin recursiva basta con definir dos


interrelaciones entre la tabla empleados y la tabla puente de tipo 1: n. La
primera relacin se crea utilizando las claves Empleados[Cdigo] y Tabla
Puente[Cdigo Empleado]. La segunda entre Empleados[Cdigo] y Tabla
Puente [Cdigo Supervisor].
Las interrelaciones cclicas o circulares no son muy frecuentes y no existe una
metodologa estndar para su eliminacin, normalmente son debidas a errores
de diseo en la base de datos, principalmente en el diseo conceptual del
sistema de datos. Por tanto si llegamos a este punto hay que volver a
replantearse todo el diseo de la base de datos.

3.3.5. Atributos de las interrelaciones


En la mayora de las interrelaciones definidas ser conveniente exigir
integridad relacional entre las claves. Exigiendo la integridad referencial se
consigue que en una relacin de tipo 1: n o de tipo 1: 1, no se puede aadir
ningn valor en la tabla destino si no existe en la tabla origen. Dicho con un
ejemplo: en la relacin Clientes y Pedidos la tabla Pedidos contiene un campo
que se corresponde con el cdigo del Cliente, si se exige la integridad
referencial no se podr escribir un cdigo de cliente en la tabla Pedidos que no
exista en la tabla Clientes; de no exigir la integridad referencial se podrn
crear pedidos con cdigos de clientes que no existen, generando incongruencia
de datos en la base de datos.
Definida la integridad referencial (siempre necesaria) podemos exigir la
actualizacin en cascada (siempre necesaria); esta actualizacin implica que si
Claudio Casares

ProInf.net, SCP
www.proinf.net

33

cambiamos el cdigo a un cliente, debemos actualizar dicho cdigo en la tabla


de pedidos, de no ser as, al cambiar el cdigo a un cliente, perderemos los
pedidos que tena realizados.
Para concluir debemos hablar de la eliminacin en cascada (NO siempre
necesaria), la eliminacin en cascada consiste en eliminar todos los datos
dependientes de una clave. En nuestro ejemplo implica que al borrar un cliente
hay que eliminar todos los pedidos que ha realizado. En muchas ocasiones no
interesa realizar esta operacin de eliminacin en cascada por motivos
diversos. Si en el caso de clientes y pedidos no se exige eliminacin en cascada
no se podr borrar ningn cliente en tanto en cuanto tenga realizado algn
pedido (de lo contrario tendramos incongruencia de datos).

3.4.

Algebra relacional
Las operaciones de lgebra relacional manipulan relaciones. Esto significa que
estas operaciones usan uno o dos relaciones existentes para crear una nueva
relacin. Esta nueva relacin puede entonces usarse como entrada para una
nueva operacin. Este poderoso concepto - la creacin de una nueva relacin a
partir de relaciones existentes hace considerablemente ms fcil la solucin de
las consultas, debido a que se puede experimentar con soluciones parciales
hasta encontrar la proposicin con la que se trabajar.
El lgebra relacional consta de nueve operaciones:
1.
2.
3.
4.
5.
6.
7.
8.
9.

Unin
Interseccin
Diferencia
Producto
Seleccin
Proyeccin
Reunin
Divisin
Asignacin

Las cuatro primeras se toman de la teora de conjunto de las matemticas; las


cuatro siguientes son operaciones propias del lgebra relacional y la ltima es
la operacin estndar de dar un valor a un elemento.

3.4.1. Unin
La operacin de unin permite combinar datos de varias relaciones.
Supongamos que una determinada empresa internacional posee una tabla de
empleados para cada uno de los pases en los que opera. Para conseguir un
listado completo de todos los empleados de la empresa tenemos que realizar
una unin de todas las tablas de empleados de todos los pases.

Claudio Casares

34

ProInf.net, SCP
www.proinf.net

No siempre es posible realizar consultas de unin entre varias tablas, para


poder realizar esta operacin es necesario e imprescindible que las tablas a
unir tengan las mismas estructuras, que sus campos sean iguales.

3.4.2. Interseccin
La operacin de interseccin permite identificar filas que son comunes en dos
relaciones. Supongamos que tenemos una tabla de empleados y otra tabla con
los asistentes que han realizado un curso de ingls (los asistentes pueden ser
empleados o gente de la calle). Queremos crear una figura virtual en la tabla
denominada "Empleados que hablan Ingls", esta figura podemos crearla
realizando una interseccin de empleados y curso de ingls, los elementos que
existan en ambas tablas sern aquellos empleados que han asistido al curso.

3.4.3. Diferencia
La operacin diferencia permite identificar filas que estn en una relacin y no
en otra. Tomando como referencia el caso anterior, deberamos aplicar una
diferencia entre la tabla empleados y la tabla asistentes al curso para saber
aquellos asistentes externos a la organizacin que han asistido al curso.

3.4.4. Producto
La operacin producto consiste en la realizacin de un producto cartesiano
entre dos tablas dando como resultado todas las posibles combinaciones entre
los registros de la primera y los registros de la segunda. Esta operacin se
entiende mejor con el siguiente ejemplo:
Tabla A

Tabla B

10

22

33

54

11

25

37

98

42

100

El producto de A * B dara como resultado la siguiente tabla:


Tabla A * Tabla B
X

10

22

33

54

10

22

37

98

10

22

42

100

11

25

33

54

11

25

37

98

11

25

42

100
Claudio Casares

ProInf.net, SCP
www.proinf.net

35

3.4.5. Seleccin
La operacin seleccin consiste en recuperar un conjunto de registros de una
tabla o de una relacin indicando las condiciones que deben cumplir los
registros recuperados, de tal forma que los registros devueltos por la seleccin
han de satisfacer todas las condiciones que se hayan establecido. Esta
operacin es la que normalmente se conoce como consulta.
Podemos emplearla para saber que empleados son mayores de 45 aos, o
cuales viven en Madrid, incluso podemos averiguar los que son mayores de 45
aos y residen en Madrid, los que son mayores de 45 aos y no viven en
Madrid, etc..
En este tipo de consulta se emplean los diferentes operadores de comparacin
(=,>, <, >=, <=, <>), los operadores lgicos (and, or, xor) o la negacin
lgica (not).

3.4.6. Proyeccin
Una proyeccin es un caso concreto de la operacin seleccin, esta ltima
devuelve todos los campos de aquellos registros que cumplen la condicin que
he establecido. Una proyeccin es una seleccin en la que seleccionamos
aquellos campos que deseamos recuperar. Tomando como referencia el caso de
la operacin seleccin es posible que lo nico que nos interese recuperar sea el
nmero de la seguridad social, omitiendo as los campos telfono, direccin,
etc.. Este ltimo caso, en el que seleccionamos los campos que deseamos, es
una proyeccin.

3.4.7. Reunin
La reunin se utiliza para recuperar datos a travs de varias tablas conectadas
unas con otras mediante clusulas JOIN, en cualquiera de sus tres variantes
INNER, LEFT, RIGHT. La operacin reunin se puede combinar con las
operaciones seleccin y proyeccin.
Un ejemplo de reunin es conseguir los pedidos que nos han realizado los
clientes nacionales cuyo importe supere 15.000 unidades de producto,
generando un informe con el nombre del cliente y el cdigo del pedido. En este
caso se da por supuesto que la tabla clientes es diferente a la tabla pedidos y
que hay que conectar ambas mediante, en este caso, un INNER JOIN.

3.4.8. Divisin
La operacin divisin es la contraria a la operacin producto y quizs sea la
ms compleja de explicar, por tanto comenzar con directamente con un
ejemplo. Una determinada empresa posee una tabla de comerciales, otra tabla
de productos y otra con las ventas de los comerciales. Queremos averiguar que
comerciales han vendido todo tipo de producto.
Lo primero que hacemos es extraer en una tabla todos los cdigos de todos los
productos, a esta tabla la denominamos A.

Claudio Casares

36

ProInf.net, SCP
www.proinf.net

Tabla A
Cdigo Producto
1035
2241
2249
5818

En una segunda tabla extraemos, de la tabla de ventas, el cdigo del producto


y el comercial que lo ha vendido, lo hacemos con una proyeccin y evitamos
traer valores duplicados. El resultado podra ser el siguiente:
Tabla B
Cdigo Comercial

Cdigo Producto

10

2241

23

2518

23

1035

39

2518

37

2518

10

2249

23

2249

23

2241

Si dividimos la tabla B entre la tabla A obtendremos como resultado una


tercera tabla que:
1. Los campos que contiene son aquellos de la tabla B que no existen en la
tabla A. En este caso el campo Cdigo Comercial es el nico de la tabla B
que no existen en la tabla A.
2. Un registro se encuentra en la tabla resultado si y slo si est asociado en
tabla B con cada fila de la tabla A
Tabla Resultado
Cdigo Comercial
23

Por qu el resultado es 23?. El comercial 23 es el nico de la tabla B que tiene


asociados todos los posibles cdigos de producto de la tabla A.

3.4.9. Asignacin
Claudio Casares

ProInf.net, SCP
www.proinf.net

37

Esta operacin algebraica consiste en asignar un valor a uno o varios campos


de una tabla.

3.5.

Clculo relacional
El clculo relacional usa un enfoque completamente diferente al lgebra
relacional. No obstante, los dos lenguajes son lgicamente equivalentes. Esto
significa que cualquier consulta que pueda resolverse en un lenguaje puede
resolverse en el otro. La solucin para toda consulta en este tipo de clculo se
define por:
1. Una lista de resultados
2. Una sentencia de cualificacin
La lista de resultados est clara, son aquellos registros que cumplen las
condiciones que deseamos. La sentencia de cualificacin contiene las
condiciones que deseamos que cumplan los registros de la lista de resultados.
La diferencia entre el clculo y el lgebra radica en que el clculo realiza la
operacin en un nico paso, sin necesidad de tener que obtener tablas
intermedias, el lgebra realiza las operaciones paso a paso.
Normalmente el clculo relacional se apoya en algn lenguaje de interrogacin
de bases de datos como puede ser el SQL y que desarrollar ms adelante.
El clculo relacional incluye un concepto nuevo denominado cuantificador, los
cuantificadores tratan de averiguar el nmero de registros afectados por una
determinada operacin, incluso antes de realizarla. Segn su naturaleza los
podemos dividir en dos grupos:

Cuantificadores existenciales
Son aquellos que tratan de averiguar el nmero de registros que devolvera un
tipo de consulta. Por ejemplo: saber el nmero de clientes de Madrid que han
comprado el producto 2015. Si el nmero de registros que satisfacen esta
relacin es mayor que cero, podemos generar la consulta para lanzar
posteriormente un informe, en caso contrario se puede enviar un mensaje al
usuario para que sepa que no hay ningn cliente con estas caractersticas.

Cuantificadores universales
Son aquellos que indican que una condicin se aplica a todas las filas de algn
tipo. Se usa para brindar la misma capacidad que la operacin divisin del
lgebra relacional.

Claudio Casares

ProInf.net, SCP
www.proinf.net

38

Claudio Casares

ProInf.net, SCP
www.proinf.net

39

4. Lenguaje SQL
4.1.

Introduccin
El lenguaje de consulta estructurado (SQL) es un lenguaje de base de datos
normalizado, utilizado por los diferentes motores de bases de datos para
realizar determinadas operaciones sobre los datos o sobre la estructura de los
mismos. Pero como sucede con cualquier sistema de normalizacin hay
excepciones para casi todo; de hecho, cada motor de bases de datos tiene sus
peculiaridades y lo hace diferente de otro motor, por lo tanto, el lenguaje SQL
normalizado (ANSI) no nos servir para resolver todos los problemas, aunque
si se puede asegurar que cualquier sentencia escrita en ANSI ser interpretable
por cualquier motor de datos.

4.1.1. Breve historia


La historia de SQL (que se pronuncia deletreando en ingls las letras que lo
componen, es decir "ese-cu-ele" y no "siquel" como se oye a menudo) empieza
en 1974 con la definicin, por parte de Donald Chamberlin y de otras personas
que trabajaban en los laboratorios de investigacin de IBM, de un lenguaje
para la especificacin de las caractersticas de las bases de datos que
adoptaban el modelo relacional. Este lenguaje se llamaba SEQUEL (Structured
English Query Language) y se implement en un prototipo llamado SEQUELXRM entre 1974 y 1975. Las experimentaciones con ese prototipo condujeron,
entre 1976 y 1977, a una revisin del lenguaje (SEQUEL/2), que a partir de
ese momento cambi de nombre por motivos legales, convirtindose en SQL.
El prototipo (System R), basado en este lenguaje, se adopt y utiliz
internamente en IBM y lo adoptaron algunos de sus clientes elegidos. Gracias
al xito de este sistema, que no estaba todava comercializado, tambin otras
compaas empezaron a desarrollar sus productos relacionales basados en
SQL. A partir de 1981, IBM comenz a entregar sus productos relacionales y
en 1983 empez a vender DB2. En el curso de los aos ochenta, numerosas
compaas (por ejemplo Oracle y Sybase, slo por citar algunos)
comercializaron productos basados en SQL, que se convierte en el estndar
industrial de hecho por lo que respecta a las bases de datos relacionales.
En 1986, el ANSI adopt SQL (sustancialmente adopt el dialecto SQL de IBM)
como estndar para los lenguajes relacionales y en 1987 se transfom en
estndar ISO. Esta versin del estndar va con el nombre de SQL/86. En los
aos siguientes, ste ha sufrido diversas revisiones que han conducido primero
a la versin SQL/89 y, posteriormente, a la actual SQL/92.
El hecho de tener un estndar definido por un lenguaje para bases de datos
relacionales abre potencialmente el camino a la intercomunicabilidad entre
todos los productos que se basan en l. Desde el punto de vista prctico, por
desgracia las cosas fueron de otro modo. Efectivamente, en general cada
productor adopta e implementa en la propia base de datos slo el corazn del
lenguaje SQL (el as llamado Entry level o al mximo el Intermediate level),
extendindolo de manera individual segn la propia visin que cada cual tenga
del mundo de las bases de datos.
Claudio Casares

40

ProInf.net, SCP
www.proinf.net

Actualmente, est en marcha un proceso de revisin del lenguaje por parte de


los comits ANSI e ISO, que debera terminar en la definicin de lo que en este
momento se conoce como SQL3. Las caractersticas principales de esta nueva
encarnacin de SQL deberan ser su transformacin en un lenguaje stand-alone
(mientras ahora se usa como lenguaje hospedado en otros lenguajes) y la
introduccin de nuevos tipos de datos ms complejos que permitan, por
ejemplo, el tratamiento de datos multimediales.

4.1.2. Componentes del SQL


El lenguaje SQL est compuesto por comandos, clusulas, operadores y
funciones de agregado. Estos elementos se combinan en las instrucciones para
crear, actualizar y manipular las bases de datos.

Comandos
Existen dos tipos de comandos SQL:
DLL que permiten crear y definir nuevas bases de datos, campos e
ndices.
DML que permiten generar consultas para ordenar, filtrar y extraer datos
de la base de datos.
Comandos DLL
Comando

Descripcin

CREATE

Utilizado para crear nuevas tablas, campos e ndices

DROP

Empleado para eliminar tablas e ndices

ALTER

Utilizado para modificar las tablas agregando campos o


cambiando la definicin de los campos.
Comandos DML

Comando

Descripcin

SELECT

Utilizado para consultar registros de la base de datos que


satisfagan un criterio determinado

INSERT

Utilizado para cargar lotes de datos en la base de datos en


una nica operacin.

UPDATE

Utilizado para modificar los valores de los campos y registros


especificados

DELETE

Utilizado para eliminar registros de una tabla de una base de


datos

Claudio Casares

41

ProInf.net, SCP
www.proinf.net

Clusulas
Las clusulas son condiciones de modificacin utilizadas para definir los datos
que desea seleccionar o manipular.
Clusula

Descripcin

FROM

Utilizada para especificar la tabla de la cual se van a


seleccionar los registros

WHERE

Utilizada para especificar las condiciones que deben reunir los


registros que se van a seleccionar

GROUP BY

Utilizada para separar los registros seleccionados en grupos


especficos

HAVING

Utilizada para expresar la condicin que debe satisfacer cada


grupo

ORDER BY

Utilizada para ordenar los registros seleccionados de acuerdo


con un orden especfico

Operadores Lgicos
Operador

Uso

AND

Es el "y" lgico. Evala dos condiciones y devuelve un valor


de verdad slo si ambas son ciertas.

OR

Es el "o" lgico. Evala dos condiciones y devuelve un valor


de verdad si alguna de las dos es cierta.

NOT

Negacin lgica. Devuelve el valor contrario de la expresin.

Operadores de Comparacin
Operador

Uso

<

Menor que

>

Mayor que

<>

Distinto de

<=

Menor o igual que

>=

Mayor o igual que

Igual que

BETWEEN

Utilizado para especificar un intervalo de valores.

LIKE

Utilizado en la comparacin de un modelo

IN

Utilizado para especificar registros de una base de datos


Claudio Casares

42

ProInf.net, SCP
www.proinf.net

Funciones de Agregado
Las funciones de agregado se usan dentro de una clusula SELECT en grupos
de registros para devolver un nico valor que se aplica a un grupo de registros.
Funcin

Descripcin

AVG

Utilizada para calcular el promedio de los valores de un


campo determinado

COUNT

Utilizada para devolver el nmero de registros de la seleccin

SUM

Utilizada para devolver la suma de todos los valores de un


campo determinado

MAX

Utilizada para devolver el valor ms alto de un campo


especificado

MIN

Utilizada para devolver el valor ms bajo de un campo


especificado

Orden de ejecucin de los comandos


Dada una sentencia SQL de seleccin que incluye todas las posibles clusulas,
el orden de ejecucin de las mismas es el siguiente:
1.
2.
3.
4.
5.
6.

4.2.

Clusula
Clusula
Clusula
Clusula
Clusula
Clusula

SELECT
FROM
WHERE
GROUP BY
HAVING
ORDER BY

Consultas de Seleccin
Las consultas de seleccin se utilizan para indicar al motor de datos que
devuelva informacin de las bases de datos, esta informacin es devuelta en
forma de conjunto de registros que se pueden almacenar en un objeto
recordset. Este conjunto de registros puede ser modificable.

4.2.1. Consultas bsicas


La sintaxis bsica de una consulta de seleccin es la siguiente:
SELECT
Campos
FROM
Tabla
En donde campos es la lista de campos que se deseen recuperar y tabla es el
origen de los mismos, por ejemplo:
SELECT
Nombre, Telfono
Claudio Casares

43

ProInf.net, SCP
www.proinf.net

FROM
Clientes
Esta sentencia devuelve un conjunto de resultados con el campo nombre y
telfono de la tabla clientes.

4.2.2. Devolver literales


En determinadas ocasiones nos puede interesar incluir una columna con un
texto fijo en una consulta de seleccin, por ejemplo, supongamos que tenemos
una tabla de empleados y deseamos recuperar las tarifas semanales de los
electricistas, podramos realizar la siguiente consulta:
SELECT
Empleados.Nombre, 'Tarifa semanal: ', Empleados.TarifaHora * 40
FROM
Empleados
WHERE
Empleados.Cargo = 'Electricista'

4.2.3. Ordenar los registros


Adicionalmente se puede especificar el orden en que se desean recuperar los
registros de las tablas mediante la clusula ORDER BY Lista de Campos. En
donde Lista de campos representa los campos a ordenar. Ejemplo:
SELECT
CodigoPostal, Nombre, Telefono
FROM
Clientes
ORDER BY
Nombre
Esta consulta devuelve los campos CodigoPostal, Nombre, Telefono de la tabla
Clientes ordenados por el campo Nombre.
Se pueden ordenar los registros por mas de un campo, como por ejemplo:
SELECT
CodigoPostal, Nombre, Telefono
FROM
Clientes
ORDER BY
CodigoPostal, Nombre
Incluso se puede especificar el orden de los registros: ascendente mediante la
clusula (ASC - se toma este valor por defecto) descendente (DESC)
SELECT
CodigoPostal, Nombre, Telefono
Claudio Casares

44

ProInf.net, SCP
www.proinf.net

FROM
Clientes
ORDER BY
CodigoPostal DESC, Nombre ASC

4.2.4. Uso de Indices de las tablas


Si deseamos que la sentecia SQL utilice un ndice para mostrar los resultados
se puede utilizar la palabra reservada INDEX de la siguiente forma:
SELECT ... FROM Tabla (INDEX=Indice) ...
Normalmente los motores de las bases de datos deciden que indice se debe
utilizar para la consulta, para ello utilizan criterios de rendimiento y sobre todo
los campos de bsqueda especificados en la clusula WHERE. Si se desea
forzar a no utilizar ningn ndice utilizaremos la siguiente sintaxis:
SELECT ... FROM Tabla (INDEX=0) ...

4.2.5. Consultas con Predicado


El predicado se incluye entre la clusula y el primer nombre del campo a
recuperar, los posibles predicados son:
Predicado

Descripcin

ALL

Devuelve todos los campos de la tabla

TOP

Devuelve un determinado nmero de registros de la tabla

DISTINCT

Omite los registros cuyos campos seleccionados coincidan


totalmente

DISTINCTOW

Omite los registros duplicados basandose en la totalidad


del registro y no slo en los campos seleccionados.

ALL
Si no se incluye ninguno de los predicados se asume ALL. El Motor de base de
datos selecciona todos los registros que cumplen las condiciones de la
instruccin SQL y devuelve todos y cada uno de sus campos. No es
conveniente abusar de este predicado ya que obligamos al motor de la base de
datos a analizar la estructura de la tabla para averiguar los campos que
contiene, es mucho ms rpido indicar el listado de campos deseados.
SELECT ALL
FROM
Empleados
SELECT *
FROM
Empleados
Claudio Casares

ProInf.net, SCP
www.proinf.net

45

TOP
Devuelve un cierto nmero de registros que entran entre al principio o al final
de un rango especificado por una clusula ORDER BY. Supongamos que
queremos recuperar los nombres de los 25 primeros estudiantes del curso
1994:
SELECT TOP 25
Nombre, Apellido
FROM
Estudiantes
ORDER BY
Nota DESC
Si no se incluye la clusula ORDER BY, la consulta devolver un conjunto
arbitrario de 25 registros de la tabla de Estudiantes. El predicado TOP no elige
entre valores iguales. En el ejemplo anterior, si la nota media nmero 25 y la
26 son iguales, la consulta devolver 26 registros. Se puede utilizar la palabra
reservada PERCENT para devolver un cierto porcentaje de registros que caen al
principio o al final de un rango especificado por la clusula ORDER BY.
Supongamos que en lugar de los 25 primeros estudiantes deseamos el 10 por
ciento del curso:
SELECT TOP 10 PERCENT
Nombre, Apellido
FROM
Estudiantes
ORDER BY
Nota DESC
El valor que va a continuacin de TOP debe ser un entero sin signo. TOP no
afecta a la posible actualizacin de la consulta.

DISTINCT
Omite los registros que contienen datos duplicados en los campos
seleccionados. Para que los valores de cada campo listado en la instruccin
SELECT se incluyan en la consulta deben ser nicos. Por ejemplo, varios
empleados listados en la tabla Empleados pueden tener el mismo apellido. Si
dos registros contienen Lpez en el campo Apellido, la siguiente instruccin
SQL devuelve un nico registro:
SELECT DISTINCT
Apellido
FROM
Empleados
Con otras palabras el predicado DISTINCT devuelve aquellos registros cuyos
campos indicados en la clusula SELECT posean un contenido diferente. El
resultado de una consulta que utiliza DISTINCT no es actualizable y no refleja
los cambios subsiguientes realizados por otros usuarios.
Claudio Casares

46

ProInf.net, SCP
www.proinf.net

DISTINCTROW
Este predicado no es compatible con ANSI. Que yo sepa a da de hoy slo
funciona con ACCESS.
Devuelve los registros diferentes de una tabla; a diferencia del predicado
anterior que slo se fijaba en el contenido de los campos seleccionados, ste lo
hace en el contenido del registro completo independientemente de los campos
indicados en la clusula SELECT.
SELECT DISTINCTROW
Apellido
FROM Empleados
Si la tabla empleados contiene dos registros: Antonio Lpez y Marta Lpez el
ejemplo del predicado DISTINCT devuelve un nico registro con el valor Lpez
en el campo Apellido ya que busca no duplicados en dicho campo. Este ltimo
ejemplo devuelve dos registros con el valor Lpez en el apellido ya que se
buscan no duplicados en el registro completo.

ALIAS
En determinadas circunstancias es necesario asignar un nombre a alguna
columna determinada de un conjunto devuelto, otras veces por simple capricho
o porque estamos recuperando datos de diferentes tablas y resultan tener un
campo con igual nombre. Para resolver todas ellas tenemos la palabra
reservada AS que se encarga de asignar el nombre que deseamos a la columna
deseada. Tomado como referencia el ejemplo anterior podemos hacer que la
columna devuelta por la consulta, en lugar de llamarse apellido (igual que el
campo devuelto) se llame Empleado. En este caso procederamos de la
siguiente forma:
SELECT
Apellido AS Empleado
FROM Empleados
AS no es una palabra reservada de ANSI, existen diferentes sistemas de
asignar los alias en funcin del motor de bases de datos. En ORACLE para
asignar un alias a un campo hay que hacerlo de la siguiente forma:
SELECT
Apellido AS "Empleado"
FROM Empleados
Tambin podemos asignar alias a las tablas dentro de la consulta de seleccin,
en esta caso hay que tener en cuenta que en todas las referencias que
deseemos hacer a dicha tabla se ha de utilizar el alias en lugar del nombre.
Esta tcnica ser de gran utilidad ms adelante cuando se estudien las
vinculaciones entre tablas. Por ejemplo:
SELECT
Claudio Casares

47

ProInf.net, SCP
www.proinf.net

Apellido
FROM
Empleados AS Trabajadores
Para asignar alias a las tablas en ORACLE y SQL-SERVER los alias se asignan
escribiendo el nombre de la tabla, dejando un espacio en blanco y escribiendo
el Alias (se asignan dentro de la clusula FROM).
SELECT
Trabajadores.Apellido AS Empleado
FROM
Empleados Trabajadores
(1)Esta nomenclatura [Tabla].[Campo] se debe utilizar cuando se est
recuperando un campo cuyo nombre se repite en varias de las tablas que se
utilizan en la sentencia. No obstante cuando en la sentencia se emplean varias
tablas es aconsejable utilizar esta nomenclatura para evitar el trabajo que
supone al motor de datos averiguar en que tabla est cada uno de los campos
indicados en la clusua SELECT.

4.2.6. Recuperar Informacin de una base de Datos Externa


Para concluir este captulo se debe hacer referencia a la recuperacin de
registros de bases de datos externas. Es ocasiones es necesario la
recuperacin de informacin que se encuentra contenida en una tabla que no
se encuentra en la base de datos que ejecutar la consulta o que en ese
momento no se encuentra abierta, esta situacin la podemos salvar con la
palabra reservada IN de la siguiente forma:
SELECT
Apellido AS Empleado
FROM
Empleados IN 'c:\databases\gestion.mdb'
En donde c:\databases\gestion.mdb es la base de datos que contiene la tabla
Empleados. Esta tcnica es muy sencilla y comn en bases de datos de tipo
ACCESS en otros sistemas como SQL-SERVER u ORACLE, la cosa es ms
complicada la tener que existir relaciones de confianza entre los servidores o al
ser necesaria la vinculacin entre las bases de datos. Este ejemplo recupera la
informacin de una base de datos de SQL-SERVER ubicada en otro servidor (se
da por supuesto que los servidores estn lincados):
SELECT
Apellido
FROM
Servidor1.BaseDatos1.dbo.Empleados

4.3.

Consultas de Accin
Las consultas de accin son aquellas que no devuelven ningn registro, son las
encargadas de acciones como aadir y borrar y modificar registros. Tanto las
Claudio Casares

48

ProInf.net, SCP
www.proinf.net

sentencias de actualizacin como las de borrado desencadern (segn el motor


de datos) las actualizaciones en cascada, borrados en cascada, restricciones y
valores por defecto definidos para los diferentes campos o tablas afectadas por
la consulta.

4.3.1. DELETE
Crea una consulta de eliminacin que elimina los registros de una o ms de las
tablas listadas en la clusula FROM que satisfagan la clusula WHERE. Esta
consulta elimina los registros completos, no es posible eliminar el contenido de
algn campo en concreto. Su sintaxis es:
DELETE FROM Tabla WHERE criterio
Una vez que se han eliminado los registros utilizando una consulta de borrado,
no puede deshacer la operacin. Si desea saber qu registros se eliminarn,
primero examine los resultados de una consulta de seleccin que utilice el
mismo criterio y despus ejecute la consulta de borrado. Mantenga copias de
seguridad de sus datos en todo momento. Si elimina los registros equivocados
podr recuperarlos desde las copias de seguridad.
DELETE
FROM
Empleados
WHERE
Cargo = 'Vendedor'

4.3.2. INSERT INTO


Agrega un registro en una tabla. Se la conoce como una consulta de datos
aadidos. Esta consulta puede ser de dos tipo: Insertar un nico registro
Insertar en una tabla los registros contenidos en otra tabla.

Para insertar un nico Registro


En este caso la sintaxis es la siguiente:
INSERT INTO Tabla (campo1, campo2, ..., campoN)
VALUES (valor1, valor2, ..., valorN)
Esta consulta graba en el campo1 el valor1, en el campo2 y valor2 y as
sucesivamente.

Para seleccionar registros e insertarlos en una tabla nueva


En este caso la sintaxis es la siguiente:
SELECT campo1, campo2, ..., campoN
INTO nuevatabla
FROM tablaorigen [WHERE criterios]

Claudio Casares

49

ProInf.net, SCP
www.proinf.net

Se pueden utilizar las consultas de creacin de tabla para archivar registros,


hacer copias de seguridad de las tablas o hacer copias para exportar a otra
base de datos o utilizar en informes que muestren los datos de un periodo de
tiempo concreto. Por ejemplo, se podra crear un informe de Ventas mensuales
por regin ejecutando la misma consulta de creacin de tabla cada mes.

Para insertar Registros de otra Tabla


En este caso la sintaxis es:
INSERT INTO Tabla [IN base_externa] (campo1, campo2, , campoN)
SELECT TablaOrigen.campo1, TablaOrigen.campo2,,TablaOrigen.campoN
FROM Tabla Origen
En este caso se seleccionarn los campos 1,2,..., n de la tabla origen y se
grabarn en los campos 1,2,.., n de la Tabla. La condicin SELECT puede incluir
la clusula WHERE para filtrar los registros a copiar. Si Tabla y Tabla Origen
poseen la misma estructura podemos simplificar la sintaxis a:
INSERT INTO Tabla SELECT Tabla Origen.* FROM Tabla Origen
De esta forma los campos de Tabla Origen se grabarn en Tabla, para realizar
esta operacin es necesario que todos los campos de Tabla Origen estn
contenidos con igual nombre en Tabla. Con otras palabras que Tabla posea
todos los campos de Tabla Origen (igual nombre e igual tipo).
En este tipo de consulta hay que tener especial atencin con los campos
contadores o autonumricos puesto que al insertar un valor en un campo de
este tipo se escribe el valor que contenga su campo homlogo en la tabla
origen, no incrementndose como le corresponde.
Se puede utilizar la instruccin INSERT INTO para agregar un registro nico a
una tabla, utilizando la sintaxis de la consulta de adicin de registro nico tal y
como se mostr anteriormente. En este caso, su cdigo especifica el nombre y
el valor de cada campo del registro. Debe especificar cada uno de los campos
del registro al que se le va a asignar un valor as como el valor para dicho
campo. Cuando no se especifica dicho campo, se inserta el valor
predeterminado o Null. Los registros se agregan al final de la tabla.
Tambin se puede utilizar INSERT INTO para agregar un conjunto de registros
pertenecientes a otra tabla o consulta utilizando la clusula SELECT... FROM
como se mostr anteriormente en la sintaxis de la consulta de adicin de
mltiples registros. En este caso la clusula SELECT especifica los campos que
se van a agregar en la tabla destino especificada.
La tabla destino u origen puede especificar una tabla o una consulta. Si la tabla
destino contiene una clave principal, hay que asegurarse que es nica, y con
valores no nulos; si no es as, no se agregarn los registros. Si se agregan
Claudio Casares

50

ProInf.net, SCP
www.proinf.net

registros a una tabla con un campo Contador, no se debe incluir el campo


Contador en la consulta. Se puede emplear la clusula IN para agregar
registros a una tabla en otra base de datos.
Se pueden averiguar los registros que se agregarn en la consulta ejecutando
primero una consulta de seleccin que utilice el mismo criterio de seleccin y
ver el resultado. Una consulta de adicin copia los registros de una o ms
tablas en otra. Las tablas que contienen los registros que se van a agregar no
se vern afectadas por la consulta de adicin. En lugar de agregar registros
existentes en otra tabla, se puede especificar los valores de cada campo en un
nuevo registro utilizando la clusula VALUES. Si se omite la lista de campos, la
clusula VALUES debe incluir un valor para cada campo de la tabla, de otra
forma fallar INSERT.

Ejemplos
INSERT INTO
Clientes
SELECT
ClientesNuevos.*
FROM
ClientesNuevos
SELECT
Empleados.*
INTO Programadores
FROM
Empleados
WHERE
Categoria = 'Programador'
Esta consulta crea una tabla nueva llamada programadores con igual
estructura que la tabla empleado y copia aquellos registros cuyo campo
categoria se programador
INSERT INTO
Empleados (Nombre, Apellido, Cargo)
VALUES ('Luis', 'Snchez', 'Becario' )
INSERT INTO
Empleados
SELECT
Vendedores.*
FROM
Vendedores
WHERE
Provincia = 'Madrid'

4.3.3. UPDATE
Claudio Casares

51

ProInf.net, SCP
www.proinf.net

Crea una consulta de actualizacin que cambia los valores de los campos de
una tabla especificada basndose en un criterio especfico. Su sintaxis es:
UPDATE Tabla SET Campo1=Valor1, Campo2=Valor2, CampoN=ValorN
WHERE Criterio
UPDATE es especialmente til cuando se desea cambiar un gran nmero de
registros o cuando stos se encuentran en mltiples tablas. Puede cambiar
varios campos a la vez. El ejemplo siguiente incrementa los valores Cantidad
pedidos en un 10 por ciento y los valores Transporte en un 3 por ciento para
aquellos que se hayan enviado al Reino Unido.:
UPDATE
Pedidos
SET
Pedido = Pedidos * 1.1,
Transporte = Transporte * 1.03
WHERE
PaisEnvo = 'ES'
UPDATE no genera ningn resultado. Para saber qu registros se van a
cambiar, hay que examinar primero el resultado de una consulta de seleccin
que utilice el mismo criterio y despus ejecutar la consulta de actualizacin.
UPDATE
Empleados
SET
Grado = 5
WHERE
Grado = 2
UPDATE
Productos
SET
Precio = Precio * 1.1
WHERE
Proveedor = 8
AND
Familia = 3
Si en una consulta de actualizacin suprimimos la clusula WHERE todos los
registros de la tabla sealada sern actualizados.
UPDATE
Empleados
SET
Salario = Salario * 1.1

Claudio Casares

52

ProInf.net, SCP
www.proinf.net

4.4.

Consultas de Unin Internas


4.4.1. Consultas de Combinacin entre tablas
Las vinculaciones entre tablas se realizan mediante la clusula INNER que
combina registros de dos tablas siempre que haya concordancia de valores en
un campo comn. Su sintaxis es:
SELECT campos FROM tb1 INNER JOIN tb2 ON
tb1.campo1 comp tb2.campo2
En donde:
tb1, tb2

Son los nombres de las tablas desde las que se combinan los
registros.

campo1,
campo2

Son los nombres de los campos que se combinan. Si no son


numricos, los campos deben ser del mismo tipo de datos y
contener el mismo tipo de datos, pero no tienen que tener el
mismo nombre.

comp

Es cualquier operador de comparacin relacional: =, <,<>,


<=, =>, >.

Se puede utilizar una operacin INNER JOIN en cualquier clusula FROM. Esto
crea una combinacin por equivalencia, conocida tambin como unin interna.
Las combinaciones equivalentes son las ms comunes; stas combinan los
registros de dos tablas siempre que haya concordancia de valores en un campo
comn a ambas tablas. Se puede utilizar INNER JOIN con las tablas
Departamentos y Empleados para seleccionar todos los empleados de cada
departamento. Por el contrario, para seleccionar todos los departamentos
(incluso si alguno de ellos no tiene ningn empleado asignado) se emplea LEFT
JOIN o todos los empleados (incluso si alguno no est asignado a ningn
departamento), en este caso RIGHT JOIN.
Si se intenta combinar campos que contengan datos Memo u Objeto OLE, se
produce un error. Se pueden combinar dos campos numricos cualesquiera,
incluso si son de diferente tipo de datos. Por ejemplo, puede combinar un
campo Numrico para el que la propiedad Size de su objeto Field est
establecida como Entero, y un campo Contador.
El ejemplo siguiente muestra cmo podra combinar las tablas Categoras y
Productos basndose en el campo IDCategoria:
SELECT
NombreCategoria, NombreProducto
FROM
Categorias
INNER JOIN
Productos
ON
Claudio Casares

53

ProInf.net, SCP
www.proinf.net

Categorias.IDCategoria = Productos.IDCategoria
En el ejemplo anterior, IDCategoria es el campo combinado, pero no est
incluido en la salida de la consulta ya que no est incluido en la instruccin
SELECT. Para incluir el campo combinado, incluir el nombre del campo en la
instruccin SELECT, en este caso, Categorias.IDCategoria.
Tambin se pueden enlazar varias clusulas ON en una instruccin JOIN,
utilizando la sintaxis siguiente:
SELECT campos FROM tabla1 INNER JOIN tabla2
ON (tb1.campo1 comp tb2.campo1 AND ON tb1.campo2 comp tb2.campo2)
OR ON (tb1.campo3 comp tb2.campo3)
Tambin puede anidar instrucciones JOIN utilizando la siguiente sintaxis:
SELECT campos FROM tb1 INNER JOIN (tb2 INNER JOIN [( ]tb3
[INNER JOIN [( ]tablax [INNER JOIN ...)]
ON tb3.campo3 comp tbx.campox)]
ON tb2.campo2 comp tb3.campo3)
ON tb1.campo1 comp tb2.campo2
Un LEFT JOIN o un RIGHT JOIN puede anidarse dentro de un INNER JOIN, pero
un INNER JOIN no puede anidarse dentro de un LEFT JOIN o un RIGHT JOIN.
Ejemplo:
SELECT DISTINCT
Sum(PrecioUnitario * Cantidad) AS Sales,
(Nombre + ' ' + Apellido) AS Name
FROM
Empleados
INNER JOIN(
Pedidos
INNER JOIN
DetallesPedidos
ON
Pedidos.IdPedido = DetallesPedidos.IdPedido)
ON
Empleados.IdEmpleado = Pedidos.IdEmpleado
GROUP BY
Nombre + ' ' + Apellido
(Crea dos combinaciones equivalentes: una entre las tablas Detalles de
pedidos y Pedidos, y la otra entre las tablas Pedidos y Empleados. Esto es
necesario ya que la tabla Empleados no contiene datos de ventas y la tabla
Detalles de pedidos no contiene datos de los empleados. La consulta produce
una lista de empleados y sus ventas totales.)

Claudio Casares

54

ProInf.net, SCP
www.proinf.net

Si empleamos la clusula INNER en la consulta se seleccionarn slo aquellos


registros de la tabla de la que hayamos escrito a la izquierda de INNER JOIN
que contengan al menos un registro de la tabla que hayamos escrito a la
derecha. Para solucionar esto tenemos dos clusulas que sustituyen a la
palabra clave INNER, estas clusulas son LEFT y RIGHT. LEFT toma todos los
registros de la tabla de la izquierda aunque no tengan ningn registro en la
tabla de la izquierda. RIGHT realiza la misma operacin pero al contrario, toma
todos los registros de la tabla de la derecha aunque no tenga ningn registro
en la tabla de la izquierda.
La sintaxis expuesta anteriormente pertenece a ACCESS, en donde todas las
sentencias con la sintaxis funcionan correctamente. Los manuales de SQLSERVER dicen que esta sintaxis es incorrecta y que hay que aadir la palabra
reservada OUTER: LEFT OUTER JOIN y RIGHT OUTER JOIN. En la prctica
funciona correctamente de una u otra forma.
No obstante, los INNER JOIN ORACLE no es capaz de interpretarlos, pero
existe una sintaxis en formato ANSI para los INNER JOIN que funcionan en
todos los sistemas. Tomando como referencia la siguiente sentencia:
SELECT
Facturas.*,
Albaranes.*
FROM
Facturas
INNER JOIN
Albaranes
ON
Facturas.IdAlbaran = Albaranes.IdAlbaran
WHERE
Facturas.IdCliente = 325
La transformacin de esta sentencia a formato ANSI sera la siguiente:
SELECT
Facturas.*,
Albaranes.*
FROM
Facturas, Albaranes
WHERE
Facturas.IdAlbaran = Albaranes.IdAlbaran
AND
Facturas.IdCliente = 325
Como se puede observar los cambios realizados han sido los siguientes:
1. Todas las tablas que intervienen en la consulta se especifican en la
clusula FROM.
2. Las condiciones que vinculan a las tablas se especifican en la clusula
WHERE y se vinculan mediante el operador lgico AND.
Claudio Casares

ProInf.net, SCP
www.proinf.net

55

Referente a los OUTER JOIN, no funcionan en ORACLE y adems conozco una


sintaxis que funcione en los tres sistemas. La sintaxis en ORACLE es igual a la
sentencia anterior pero aadiendo los caracteres (+) detrs del nombre de la
tabla en la que deseamos aceptar valores nulos, esto equivale a un LEFT JOIN:
SELECT
Facturas.*,
Albaranes.*
FROM
Facturas, Albaranes
WHERE
Facturas.IdAlbaran = Albaranes.IdAlbaran (+)
AND
Facturas.IdCliente = 325
Y esto a un RIGHT JOIN:
SELECT
Facturas.*,
Albaranes.*
FROM
Facturas, Albaranes
WHERE
Facturas.IdAlbaran (+) = Albaranes.IdAlbaran
AND
Facturas.IdCliente = 325
En SQL-SERVER se puede utilizar una sintaxis parecida, en este caso no se
utiliza los caracteres (+) sino los caracteres =* para el LEFT JOIN y *= para el
RIGHT JOIN.

4.4.2. Consultas de Autocombinacin


La autocombinacin se utiliza para unir una tabla consigo misma, comparando
valores de dos columnas con el mismo tipo de datos. La sintaxis en la
siguiente:
SELECT
alias1.columna, alias2.columna, ...
FROM
tabla1 as alias1, tabla2 as alias2
WHERE
alias1.columna = alias2.columna
AND
otras condiciones
Por ejemplo, para visualizar el nmero, nombre y puesto de cada empleado,
junto con el nmero, nombre y puesto del supervisor de cada uno de ellos se
utilizara la siguiente sentencia:
Claudio Casares

ProInf.net, SCP
www.proinf.net

56

SELECT
t.num_emp, t.nombre, t.puesto, t.num_sup,s.nombre, s.puesto
FROM
empleados AS t, empleados AS s
WHERE
t.num_sup = s.num_emp

4.4.3. Consultas de Combinaciones no Comunes


La mayora de las combinaciones estn basadas en la igualdad de valores de
las columnas que son el criterio de la combinacin. Las no comunes se basan
en otros operadores de combinacin, tales como NOT, BETWEEN, <>, etc.
Por ejemplo, para listar el grado salarial, nombre, salario y puesto de cada
empleado ordenando el resultado por grado y salario habra que ejecutar la
siguiente sentencia:
SELECT
grados.grado,empleados.nombre, empleados.salario, empleados.puesto
FROM
empleados, grados
WHERE
empleados.salario BETWEEN grados.salarioinferior And
grados.salariosuperior
ORDER BY
grados.grado, empleados.salario
Para listar el salario medio dentro de cada grado salarial habra que lanzar esta
otra sentencia:
SELECT
grados.grado, AVG(empleados.salario)
FROM
empleados, grados
WHERE
empleados.salario BETWEEN grados.salarioinferior And
grados.salariosuperior
GROUP BY
grados.grado

4.4.4. CROSS JOIN (SQL-SERVER)


Se utiliza en SQL-SERVER para realizar consultas de unin. Supongamos que
tenemos una tabla con todos los autores y otra con todos los libros. Si
deseramos obtener un listado combinar ambas tablas de tal forma que cada
autor apareciera junto a cada ttulo, utilizaramos la siguiente sintaxis:
SELECT
Autores.Nombre, Libros.Titulo
FROM
Claudio Casares

57

ProInf.net, SCP
www.proinf.net

Autores CROSS JOIN Libros

4.4.5. SELF JOIN


SELF JOIN es una tcnica empleada para conseguir el producto cartesiano de
una tabla consigo misma. Su utilizacin no es muy frecuente, pero pongamos
algn ejemplo de su utilizacin.
Supongamos la siguiente tabla (El campo autor es numrico, aunque para
ilustrar el ejemplo utilice el nombre):
Autores
Cdigo (Cdigo del libro)

Autor (Nombre del Autor)

B0012

1. Francisco Lpez

B0012

2. Javier Alonso

B0012

3. Marta Rebolledo

C0014

1. Francisco Lpez

C0014

2. Javier Alonso

D0120

2. Javier Alonso

D0120

3. Marta Rebolledo

Queremos obtener, para cada libro, parejas de autores:


SELECT
A.Codigo, A.Autor, B.Autor
FROM
Autores A, Autores B
WHERE
A.Codigo = B.Codigo
El resultado es el siguiente:
Cdigo

Autor

Autor

B0012

1. Francisco Lpez

1. Francisco Lpez

B0012

1. Francisco Lpez

2. Javier Alonso

B0012

1. Francisco Lpez

3. Marta Rebolledo

B0012

2. Javier Alonso

2. Javier Alonso

B0012

2. Javier Alonso

1. Francisco Lpez
Claudio Casares

58

ProInf.net, SCP
www.proinf.net

B0012

2. Javier Alonso

3. Marta Rebolledo

B0012

3. Marta Rebolledo

3. Marta Rebolledo

B0012

3. Marta Rebolledo

2. Javier Alonso

B0012

3. Marta Rebolledo

1. Francisco Lpez

C0014

1. Francisco Lpez

1. Francisco Lpez

C0014

1. Francisco Lpez

2. Javier Alonso

C0014

2. Javier Alonso

2. Javier Alonso

C0014

2. Javier Alonso

1. Francisco Lpez

D0120

2. Javier Alonso

2. Javier Alonso

D0120

2. Javier Alonso

3. Marta Rebolledo

D0120

3. Marta Rebolledo

3. Marta Rebolledo

D0120

3. Marta Rebolledo

2. Javier Alonso

Como podemos observar, las parejas de autores se repiten en cada uno de los
libros, podemos omitir estas repeticiones de la siguiente forma:
SELECT
A.Codigo, A.Autor, B.Autor
FROM
Autores A, Autores B
WHERE
A.Codigo = B.Codigo AND A.Autor < B.Autor
El resultado ahora es el siguiente:
Cdigo

Autor

Autor

B0012

1. Francisco Lpez

2. Javier Alonso

B0012

1. Francisco Lpez

3. Marta Rebolledo

C0014

1. Francisco Lpez

2. Javier Alonso

D0120

2. Javier Alonso

3. Marta Rebolledo

Ahora tenemos un conjunto de resultados en formato Autor - CoAutor.


Si en la tabla de empleados quisiramos extraer todas las posibles parejas que
podemos realizar, utilizaramos la siguiente sentencia:
SELECT
Hombres.Nombre, Mujeres.Nombre
Claudio Casares

59

ProInf.net, SCP
www.proinf.net

FROM
Empleados Hombre, Empleados Mujeres
WHERE
Hombre.Sexo = 'Hombre' AND
Mujeres.Sexo = 'Mujer' AND
Hombres.Id <> Mujeres.Id
Para concluir supongamos la tabla siguiente:
Empleados
Id

Nombre

SuJefe

Marcos

Lucas

Ana

Eva

Juan

Antonio

Queremos obtener un conjunto de resultados con el nombre del empleado y el


nombre de su jefe:
SELECT
Emple.Nombre, Jefes.Nombre
FROM
Empleados Emple, Empleados Jefe
WHERE
Emple.SuJefe = Jefes.Id

4.4.6. FULL JOIN


Este tipo de operador se utiliza para devolver todas las filas de una
combinacin tengan o no correspondencia. Es el equivalente a la utilizacin de
LEFT JOIN y RIGHT JOIN a la misma vez. Mediante este operador se obtendrn
por un lado las filas que tengan correspondencia en ambas tablas y tambin
aquellas que no tengan correspondencia sean de la tabla que sean.
Si desearamos obtener un listado que incluyera todos los autores con sus libros
correspondientes, pero adems todos los autores que no han escrito ningn
libro y todos aquellos libros sin autor (devemos suponer que no existe un autor
llamado annimo):
SELECT
Autores.*, Libros.*
Claudio Casares

ProInf.net, SCP
www.proinf.net

60

FROM
Autores FULL Libros
ON
Autores.IdAutor = Libros.IdAutor

4.5.

Consultas de Unin Externas


Se utiliza la operacin UNION para crear una consulta de unin, combinando
los resultados de dos o ms consultas o tablas independientes. Su sintaxis es:
[TABLE] consulta1 UNION [ALL] [TABLE]
consulta2 [UNION [ALL] [TABLE] consultan [ ... ]]
En donde:
consulta 1,
consulta 2,
consulta n

Son instrucciones SELECT, el nombre de una consulta


almacenada o el nombre de una tabla almacenada precedido
por la palabra clave TABLE.

Puede combinar los resultados de dos o ms consultas, tablas e instrucciones


SELECT, en cualquier orden, en una nica operacin UNION. El ejemplo
siguiente combina una tabla existente llamada Nuevas Cuentas y una
instruccin SELECT:
TABLE
NuevasCuentas
UNION ALL
SELECT *
FROM
Clientes
WHERE
CantidadPedidos > 1000
Si no se indica lo contrario, no se devuelven registros duplicados cuando se
utiliza la operacin UNION, no obstante puede incluir el predicado ALL para
asegurar que se devuelven todos los registros. Esto hace que la consulta se
ejecute ms rpidamente. Todas las consultas en una operacin UNION deben
pedir el mismo nmero de campos, no obstante los campos no tienen porqu
tener el mismo tamao o el mismo tipo de datos.
Se puede utilizar una clusula GROUP BY y/o HAVING en cada argumento
consulta para agrupar los datos devueltos. Puede utilizar una clusula ORDER
BY al final del ltimo argumento consulta para visualizar los datos devueltos en
un orden especfico.
SELECT
NombreCompania, Ciudad
FROM
Claudio Casares

61

ProInf.net, SCP
www.proinf.net

Proveedores
WHERE
Pais = 'Brasil'
UNION
SELECT NombreCompania, Ciudad
FROM Clientes
WHERE Pais = 'Brasil'
(Recupera los nombres y las ciudades de todos proveedores y clientes de
Brasil)
SELECT
NombreCompania, Ciudad
FROM
Proveedores
WHERE
Pais = 'Brasil'
UNION
SELECT NombreCompania, Ciudad
FROM Clientes
WHERE Pais = 'Brasil'
ORDER BY Ciudad
(Recupera los nombres y las ciudades de todos proveedores y clientes
radicados en Brasil, ordenados por el nombre de la ciudad)
SELECT
NombreCompania, Ciudad
FROM
Proveedores
WHERE
Pais = 'Brasil'
UNION
SELECT NombreCompania, Ciudad
FROM Clientes
WHERE Pais = 'Brasil'
UNION
SELECT Apellidos, Ciudad
FROM Empleados
WHERE Region = 'Amrica del Sur'
(Recupera los nombres y las ciudades de todos los proveedores y clientes de
brasil y los apellidos y las ciudades de todos los empleados de Amrica del Sur)
TABLE
Lista_Clientes
UNION TABLE
ListaProveedores
(Recupera los nombres y cdigos de todos los proveedores y clientes)

Claudio Casares

62

ProInf.net, SCP
www.proinf.net

4.6.

Consultas de Referencias Cruzadas


4.6.1. ACCESS
Una consulta de referencias cruzadas es aquella que nos permite visualizar los
datos en filas y en columnas, estilo tabla, por ejemplo:
Producto / Ao
Pantalones
Camisas
Zapatos

1996
1.250
8.560
4.369

1997
3.000
1.253
2.563

Si tenemos una tabla de productos y otra tabla de pedidos, podemos visualizar


en total de productos pedidos por ao para un artculo determinado, tal y como
se visualiza en la tabla anterior. La sintaxis para este tipo de consulta es la
siguiente:
TRANSFORM funcin agregada instruccin select PIVOT campo pivot
[IN (valor1[, valor2[, ...]])]
En donde:
funcin
agregada

Es una funcin SQL agregada que opera sobre los datos


seleccionados.

instruccin
select

Es una instruccin SELECT.

campo pivot

Es el campo o expresin que desea utilizar para crear las


cabeceras de la columna en el resultado de la consulta.

valor1, valor2

Son valores fijos utilizados para crear las cabeceras de la


columna.

Para resumir datos utilizando una consulta de referencia cruzada, se


seleccionan los valores de los campos o expresiones especificadas como
cabeceras de columnas de tal forma que pueden verse los datos en un formato
ms compacto que con una consulta de seleccin.
TRANSFORM es opcional pero si se incluye es la primera instruccin de una
cadena SQL. Precede a la instruccin SELECT que especifica los campos
utilizados como encabezados de fila y una clusula GROUP BY que especifica el
agrupamiento de las filas. Opcionalmente puede incluir otras clusulas como
por ejemplo WHERE, que especifica una seleccin adicional o un criterio de
ordenacin.
Claudio Casares

ProInf.net, SCP
www.proinf.net

63

Los valores devueltos en campo pivot se utilizan como encabezados de


columna en el resultado de la consulta. Por ejemplo, al utilizar las cifras de
ventas en el mes de la venta como pivot en una consulta de referencia cruzada
se crearan 12 columnas. Puede restringir el campo pivot para crear
encabezados a partir de los valores fijos (valor1, valor2) listados en la clusula
opcional IN.
Tambin puede incluir valores fijos, para los que no existen datos, para crear
columnas adicionales.
Ejemplos
TRANSFORM
Sum(Cantidad) AS Ventas
SELECT
Producto, Cantidad
FROM
Pedidos
WHERE
Fecha Between #01-01-1998# And #12-31-1998#
GROUP BY
Producto
ORDER BY
Producto
PIVOT
DatePart("m", Fecha)
(Crea una consulta de tabla de referencias cruzadas que muestra las ventas de
productos por mes para un ao especfico. Los meses aparecen de izquierda a
derecha como columnas y los nombres de los productos aparecen de arriba
hacia abajo como filas.)
TRANSFORM
Sum(Cantidad) AS Ventas
SELECT
Compania
FROM
Pedidos
WHERE
Fecha Between #01-01-1998# And #12-31-1998#
GROUP BY
Compania
ORDER BY
Compania
PIVOT
"Trimestre " &
DatePart("q", Fecha)
In ('Trimestre1', 'Trimestre2', 'Trimestre 3', 'Trimestre 4')

Claudio Casares

64

ProInf.net, SCP
www.proinf.net

(Crea una consulta de tabla de referencias cruzadas que muestra las ventas de
productos por trimestre de cada proveedor en el ao indicado. Los trimestres
aparecen de izquierda a derecha como columnas y los nombres de los
proveedores aparecen de arriba hacia abajo como filas.)
Un caso prctico:
Se trata de resolver el siguiente problema: tenemos una tabla de productos
con dos campos, el cdigo y el nombre del producto, tenemos otra tabla de
pedidos en la que anotamos el cdigo del producto, la fecha del pedido y la
cantidad pedida. Deseamos consultar los totales de producto por ao,
calculando la media anual de ventas.
Estructura y datos de las tablas:
ARTICULOS

PEDIDOS

ID

Nombre

ID

Fecha

Cantidad

Zapatos

11/11/1996

250

Pantalones

11/11/1996

125

Blusas

11/11/1996

520

12/10/1996

50

04/10/1996

250

05/08/1996

100

01/01/1997

40

02/08/1997

60

05/10/1997

70

12/12/1997

15/12/1997

520

17/10/1997

1.250

Para resolver la consulta planteamos la siguiente consulta:


TRANSFORM
Sum(Pedidos.Cantidad) AS Resultado
SELECT
Nombre AS Producto, Pedidos.Id AS Cdigo,
Sum(Pedidos.Cantidad) AS TOTAL,
Avg(Pedidos.Cantidad) AS Media
FROM
Claudio Casares

65

ProInf.net, SCP
www.proinf.net

Pedidos, Artculos
WHERE
Pedidos.Id = Artculos.Id
GROUP BY
Pedidos.Id, Artculos.Nombre
PIVOT
Year(Fecha)
Y obtenemos el siguiente resultado:
Producto

Cdigo

Total

Media

1996

1997

Zapatos

348

87

300

48

Pantalones

955

238,75

375

580

Blusas

1940

485

620

1320

Comentarios a la consulta:
La clusula TRANSFORM indica el valor que deseamos visualizar en las
columnas que realmente pertenecen a la consulta, en este caso 1996 y 1997,
puesto que las dems columnas son opcionales. SELECT especifica el nombre
de las columnas opcionales que deseamos visualizar, en este caso Producto,
Cdigo, Total y Media, indicando el nombre del campo que deseamos mostrar
en cada columna o el valor de la misma. Si incluimos una funcin de clculo el
resultado se har basndose en los datos de la fila actual y no al total de los
datos.
FROM especifica el origen de los datos. La primera tabla que debe figurar es
aquella de donde deseamos extraer los datos, esta tabla debe contener al
menos tres campos, uno para los ttulos de la fila, otros para los ttulos de la
columna y otro para calcular el valor de las celdas.
En este caso en concreto se deseaba visualizar el nombre del producto, como
en la tabla de pedidos slo figuraba el cdigo del mismo se aadi una nueva
columna en la clusula select llamada Producto que se corresponda con el
campo Nombre de la tabla de artculos. Para vincular el cdigo del artculo de
la tabla de pedidos con el nombre del mismo de la tabla artculos se insert la
clusula INNER JOIN.
La clusula GROUP BY especifica el agrupamiento de los registros,
contrariamente a los manuales de instruccin esta clusula no es opcional ya
que debe figurar siempre y debemos agrupar los registros por el campo del
cual extraemos la informacin. En este caso existen dos campos de los que
extraemos la informacin: pedidos.cantidad y artculos.nombre, por ello
agrupamos por los campos.
Para finalizar la clusula PIVOT indica el nombre de las columnas no
opcionales, en este caso 1996 y 1997 y como vamos a el dato que aparecer
Claudio Casares

66

ProInf.net, SCP
www.proinf.net

en las columnas, en este caso empleamos el ao en que se produjo el pedido,


extrayndolo del campo pedidos.fecha.
Otras posibilidades de fecha de la clusula pivot son las siguientes:
1. Para agrupamiento por Trimestres:
PIVOT "Tri " & DatePart("q",[Fecha]);
2. Para agrupamiento por meses (sin tener en cuenta el ao)
PIVOT Format([Fecha],"mmm") In ("Ene", "Feb", "Mar", "Abr", "May",
"Jun", "Jul", "Ago", "Sep", "Oct", "Nov", "Dic");
3. Para agrupar por das
PIVOT Format([Fecha],"Short Date");

4.7.

Criterios de Seleccin
En el apartado anterior se vio la forma de recuperar los registros de las tablas,
las formas empleadas devolvan todos los registros de la mencionada tabla. A
lo largo de este apartado se estudiarn las posibilidades de filtrar los registros
con el fin de recuperar solamente aquellos que cumplan unas condiciones
preestablecidas.
Antes de comenzar el desarrollo de este apartado hay que recalcar tres
detalles de vital importancia. El primero de ellos es que cada vez que se desee
establecer una condicin referida a un campo de texto la condicin de
bsqueda debe ir encerrada entre comillas simples; la segunda es que no es
posible establecer condiciones de bsqueda en los campos memo y; la tercera
y ltima hace referencia a las fechas. A da de hoy no he sido capaz de
encontrar una sintaxis que funcione en todos los sistemas, por lo que se hace
necesario particularizarlas segn el banco de datos:
Banco de Datos

Sintaxis

SQL-SERVER

Fecha = #mm-dd-aaaa#

ORACLE

Fecha = to_date('YYYYDDMM','aaaammdd',)

ACCESS

Fecha = #mm-dd-aaaa#
Ejemplo

Banco de Datos

Ejemplo (para grabar la fecha 18 de mayo de 1969)

SQL-SERVER

Fecha = #05-18-1969#
Fecha = 19690518

ORACLE

Fecha = to_date('YYYYDDMM', '19690518')

ACCESS

Fecha = #05-18-1969#

Claudio Casares

67

ProInf.net, SCP
www.proinf.net

Referente a los valores lgicos True o False cabe destacar que no son
reconocidos en ORACLE, ni en este sistema de bases de datos ni en SQLSERVER existen los campos de tipo "SI/NO" de ACCESS; en estos sistemas se
utilizan los campos BIT que permiten almacenar valores de 0 1.
Internamente, ACCESS, almacena en estos campos valores de 0 -1, as que
todo se complica bastante, pero aprovechando la coincidencia del 0 para los
valores FALSE, se puede utilizar la sintaxis siguiente que funciona en todos los
casos: si se desea saber si el campo es falso "... CAMPO = 0" y para saber los
verdaderos "CAMPO <> 0".

4.7.1. Operadores Lgicos


Los operadores lgicos soportados por SQL son: AND, OR, XOR, Eqv, Imp, Is y
Not. A excepcin de los dos ltimos todos poseen la siguiente sintaxis:
<expresin1> operador <expresin2>
En donde expresin1 y expresin2 son las condiciones a evaluar, el resultado
de la operacin vara en funcin del operador lgico. La tabla adjunta muestra
los diferentes posibles resultados:
<expresin1>

Operador

<expresin2>

Resultado

Verdad

AND

Falso

Falso

Verdad

AND

Verdad

Verdad

Falso

AND

Verdad

Falso

Falso

AND

Falso

Falso

Verdad

OR

Falso

Verdad

Verdad

OR

Verdad

Verdad

Falso

OR

Verdad

Verdad

Falso

OR

Falso

Falso

Verdad

XOR

Verdad

Falso

Verdad

XOR

Falso

Verdad

Falso

XOR

Verdad

Verdad

Falso

XOR

Falso

Falso

Verdad

Eqv

Verdad

Verdad

Verdad

Eqv

Falso

Falso

Falso

Eqv

Verdad

Falso

Falso

Eqv

Falso

Verdad

Verdad

Imp

Verdad

Verdad
Claudio Casares

68

ProInf.net, SCP
www.proinf.net

Verdad

Imp

Falso

Falso

Verdad

Imp

Null

Null

Falso

Imp

Verdad

Verdad

Falso

Imp

Falso

Verdad

Falso

Imp

Null

Verdad

Null

Imp

Verdad

Verdad

Null

Imp

Falso

Null

Null

Imp

Null

Null

Si a cualquiera de las anteriores condiciones le anteponemos el operador NOT


el resultado de la operacin ser el contrario al devuelto sin el operador NOT.
El ltimo operador denominado Is se emplea para comparar dos variables de
tipo objeto <Objeto1> Is <Objeto2>. este operador devuelve verdad si los dos
objetos son iguales.
SELECT *
FROM
Empleados
WHERE
Edad > 25 AND Edad < 50
SELECT *
FROM
Empleados
WHERE
(Edad > 25 AND Edad < 50)
OR
Sueldo = 100
SELECT *
FROM
Empleados
WHERE
NOT Estado = 'Soltero'
SELECT *
FROM
Empleados
WHERE
(Sueldo > 100 AND Sueldo < 500)
OR
(Provincia = 'Madrid' AND Estado = 'Casado')

4.7.2. Valores Nulos


Claudio Casares

69

ProInf.net, SCP
www.proinf.net

En muchas ocasiones es necesario emplear como criterio de seleccion valores


nulos en los campos. Podemos emplear el operacion IS NULL para realizar esta
operacin. Por ejemplo:
SELECT *
FROM
Empleados
WHERE
DNI IS NULL
Este operador no est reconocido en ACCESS y por ello hay que utilizar la
siguiente sintaxis:
SELECT *
FROM
Empleados
WHERE
IsNull(DNI)=True

4.7.3. Intervalos de Valores


Para indicar que deseamos recuperar los registros segn el intervalo de valores
de un campo emplearemos el operador Between cuya sintaxis es:
campo [Not] Between valor1 And valor2 (la condicin Not es opcional)
En este caso la consulta devolvera los registros que contengan en "campo" un
valor incluido en el intervalo valor1, valor2 (ambos inclusive). Si anteponemos
la condicin Not devolver aquellos valores no incluidos en el intervalo.
SELECT *
FROM
Pedidos
WHERE
CodPostal Between 28000 And 28999
(Devuelve los pedidos realizados en la provincia de Madrid)

4.7.4. El Operador Like


Se utiliza para comparar una expresin de cadena con un modelo en una
expresin SQL. Su sintaxis es:
expresin Like modelo
En donde expresin es una cadena modelo o campo contra el que se compara
expresin. Se puede utilizar el operador Like para encontrar valores en los
campos que coincidan con el modelo especificado. Por modelo puede
especificar un valor completo (Ana Mara), o se puede utilizar una cadena de
Claudio Casares

70

ProInf.net, SCP
www.proinf.net

caracteres comodn como los reconocidos por el sistema operativo para


encontrar un rango de valores (Like An*).
El operador Like se puede utilizar en una expresin para comparar un valor de
un campo con una expresin de cadena. Por ejemplo, si introduce Like C* en
una consulta SQL, la consulta devuelve todos los valores de campo que
comiencen por la letra C. En una consulta con parmetros, puede hacer que el
usuario escriba el modelo que se va a utilizar.
El ejemplo siguiente devuelve los datos que comienzan con la letra P seguido
de cualquier letra entre A y F y de tres dgitos:
Like 'P[A-F]###'
Este ejemplo devuelve los campos cuyo contenido empiece con una letra de la
A a la D seguidas de cualquier cadena.
Like '[A-D]*'
En la tabla siguiente se muestra cmo utilizar el operador Like para comprobar
expresiones con diferentes modelos.
ACCESS
Tipo de coincidencia

Modelo Planteado

Coincide

No coincide

Varios caracteres

'a*a'

'aa', 'aBa', 'aBBBa'

'aBC'

Carcter especial

'a[*]a'

'a*a'

'aaa'

Varios caracteres

'ab*'

'abcdefg', 'abc'

'cab', 'aab'

Un solo carcter

'a?a'

'aaa', 'a3a', 'aBa'

'aBBBa'

Un solo dgito

'a#a'

'a0a', 'a1a', 'a2a'

'aaa', 'a10a'

Rango de caracteres

'[a-z]'

'f', 'p', 'j'

'2', '&'

Fuera de un rango

'[!a-z]'

'9', '&', '%'

'b', 'a'

Distinto de un dgito

'[!0-9]'

'A', 'a', '&', '~'

'0', '1', '9'

Combinada

'a[!b-m]#'

'An9', 'az0', 'a99'

'abc', 'aj0'

SQL-SERVER
Ejemplo

Descripcin

LIKE 'A%'

Todo lo que comience por A

LIKE '_NG'

Todo lo que comience por cualquier carcter y luego siga


NG
Claudio Casares

71

ProInf.net, SCP
www.proinf.net

LIKE '[AF]%'

Todo lo que comience por A F

LIKE '[A-F]%'

Todo lo que comience por cualquier letra comprendida


entre la A y la F

LIKE '[A^B]%'

Todo lo que comience por A y la segunda letra no sea


una B

En determinado motores de bases de datos, esta clusula, no reconoce el


asterisco como carcter comodn y hay que sustituirlo por el carcter tanto por
ciento (%).

4.7.5. El Operador In
Este operador devuelve aquellos registros cuyo campo indicado coincide con
alguno de los en una lista. Su sintaxis es:
expresin [Not] In(valor1, valor2, . . .)

SELECT *
FROM
Pedidos
WHERE
Provincia In ('Madrid', 'Barcelona', 'Sevilla')

4.7.6. La clusula WHERE


La clusula WHERE puede usarse para determinar qu registros de las tablas
enumeradas en la clusula FROM aparecern en los resultados de la instruccin
SELECT. Despus de escribir esta clusula se deben especificar las condiciones
expuestas en los apartados anteriores. Si no se emplea esta clusula, la
consulta devolver todas las filas de la tabla. WHERE es opcional, pero cuando
aparece debe ir a continuacin de FROM.
SELECT
Apellidos, Salario
FROM
Empleados
WHERE
Salario = 21000
SELECT
IdProducto, Existencias
FROM
Productos
WHERE
Existencias <= NuevoPedido
SELECT *
Claudio Casares

ProInf.net, SCP
www.proinf.net

72

FROM
Pedidos
WHERE
FechaEnvio = #05-30-1994#
SELECT
Apellidos, Nombre
FROM
Empleados
WHERE
Apellidos = 'King'
SELECT
Apellidos, Nombre
FROM
Empleados
WHERE
Apellidos Like 'S*'
SELECT
Apellidos, Salario
FROM
Empleados
WHERE
Salario Between 200 And 300
SELECT
Apellidos, Salario
FROM
Empleados
WHERE
Apellidos Between 'Lon' And 'Tol'
SELECT
IdPedido, FechaPedido
FROM
Pedidos
WHERE
FechaPedido Between #01-01-1994# And #12-31-1994#
SELECT
Apellidos, Nombre, Ciudad
FROM
Empleados
WHERE
Ciudad In ('Sevilla', 'Los Angeles', 'Barcelona')

4.8.

Agrupamiento de Registros
4.8.1. GROUP BY
Combina los registros con valores idnticos, en la lista de campos
especificados, en un nico registro. Para cada registro se crea un valor sumario
si se incluye una funcin SQL agregada, como por ejemplo Sum o Count, en la
instruccin SELECT. Su sintaxis es:
Claudio Casares

ProInf.net, SCP
www.proinf.net

73

SELECT campos FROM tabla WHERE criterio GROUP BY campos del grupo
GROUP BY es opcional. Los valores de resumen se omiten si no existe una
funcin SQL agregada en la instruccin SELECT. Los valores Null en los campos
GROUP BY se agrupan y no se omiten. No obstante, los valores Null no se
evalan en ninguna de las funciones SQL agregadas.
Se utiliza la clusula WHERE para excluir aquellas filas que no desea agrupar, y
la clusula HAVING para filtrar los registros una vez agrupados.
A menos que contenga un dato Memo u Objeto OLE, un campo de la lista de
campos GROUP BY puede referirse a cualquier campo de las tablas que
aparecen en la clusula FROM, incluso si el campo no esta incluido en la
instruccin SELECT, siempre y cuando la instruccin SELECT incluya al menos
una funcin SQL agregada.
Todos los campos de la lista de campos de SELECT deben o bien incluirse en la
clusula GROUP BY o como argumentos de una funcin SQL agregada.
SELECT
IdFamilia, Sum(Stock) AS StockActual
FROM
Productos
GROUP BY
IdFamilia
Una vez que GROUP BY ha combinado los registros, HAVING muestra cualquier
registro agrupado por la clusula GROUP BY que satisfaga las condiciones de la
clusula HAVING.
HAVING es similar a WHERE, determina qu registros se seleccionan. Una vez
que los registros se han agrupado utilizando GROUP BY, HAVING determina
cuales de ellos se van a mostrar.
SELECT
IdFamilia, Sum(Stock) AS StockActual
FROM
Productos
GROUP BY
IdFamilia
HAVING
StockActual > 100
AND
NombreProducto Like BOS*

4.8.2. AVG
Calcula la media aritmtica de un conjunto de valores contenidos en un campo
especificado de una consulta. Su sintaxis es la siguiente
Claudio Casares

ProInf.net, SCP
www.proinf.net

74

Avg(expr)
En donde expr representa el campo que contiene los datos numricos para los
que se desea calcular la media o una expresin que realiza un clculo
utilizando los datos de dicho campo. La media calculada por Avg es la media
aritmtica (la suma de los valores dividido por el nmero de valores). La
funcin Avg no incluye ningn campo Null en el clculo.
SELECT
Avg(Gastos) AS Promedio
FROM
Pedidos
WHERE
Gastos > 100

4.8.3. Count
Calcula el nmero de registros devueltos por una consulta. Su sintaxis es la
siguiente
Count(expr)
En donde expr contiene el nombre del campo que desea contar. Los operandos
de expr pueden incluir el nombre de un campo de una tabla, una constante o
una funcin (la cual puede ser intrnseca o definida por el usuario pero no otras
de las funciones agregadas de SQL). Puede contar cualquier tipo de datos
incluso texto.
Aunque expr puede realizar un clculo sobre un campo, Count simplemente
cuenta el nmero de registros sin tener en cuenta qu valores se almacenan
en los registros. La funcin Count no cuenta los registros que tienen campos
null a menos que expr sea el carcter comodn asterisco (*). Si utiliza un
asterisco, Count calcula el nmero total de registros, incluyendo aquellos que
contienen campos null. Count(*) es considerablemente ms rpida que
Count(Campo). No se debe poner el asterisco entre dobles comillas ('*').
SELECT
Count(*) AS Total
FROM
Pedidos
Si expr identifica a mltiples campos, la funcin Count cuenta un registro slo
si al menos uno de los campos no es Null. Si todos los campos especificados
son Null, no se cuenta el registro. Hay que separar los nombres de los campos
con ampersand (&).
SELECT
Count(FechaEnvo & Transporte) AS Total
FROM
Claudio Casares

ProInf.net, SCP
www.proinf.net

75

Pedidos
Podemos hacer que el gestor cuente los datos diferentes de un determinado
campo
SELECT
Count(DISTINCT Localidad) AS Total
FROM
Pedidos

4.8.4. Max, Min


Devuelven el mnimo o el mximo de un conjunto de valores contenidos en un
campo especifico de una consulta. Su sintaxis es:
Min(expr)
Max(expr)
En donde expr es el campo sobre el que se desea realizar el clculo. Expr
pueden incluir el nombre de un campo de una tabla, una constante o una
funcin (la cual puede ser intrnseca o definida por el usuario pero no otras de
las funciones agregadas de SQL).
SELECT
Min(Gastos) AS ElMin
FROM
Pedidos
WHERE
Pais = 'Espaa'
SELECT
Max(Gastos) AS ElMax
FROM
Pedidos
WHERE
Pais = 'Espaa'

4.8.5. StDev, StDevP


Devuelve estimaciones de la desviacin estndar para la poblacin (el total de
los registros de la tabla) o una muestra de la poblacin representada (muestra
aleatoria). Su sintaxis es:
StDev(expr)
StDevP(expr)
En donde expr representa el nombre del campo que contiene los datos que
desean evaluarse o una expresin que realiza un clculo utilizando los datos de
dichos campos. Los operandos de expr pueden incluir el nombre de un campo
Claudio Casares

76

ProInf.net, SCP
www.proinf.net

de una tabla, una constante o una funcin (la cual puede ser intrnseca o
definida por el usuario pero no otras de las funciones agregadas de SQL).
StDevP evala una poblacin, y StDev evala una muestra de la poblacin. Si
la consulta contiene menos de dos registros (o ningn registro para StDevP),
estas funciones devuelven un valor Null (el cual indica que la desviacin
estndar no puede calcularse).
SELECT
StDev(Gastos) AS Desviacin
FROM
Pedidos
WHERE
Pas = 'Espaa'
SELECT
StDevP(Gastos) AS Desviacin
FROM
Pedidos
WHERE
Pas = 'Espaa'

4.8.6. Sum
Devuelve la suma del conjunto de valores contenido en un campo especifico de
una consulta. Su sintaxis es:
Sum(expr)
En donde expr representa el nombre del campo que contiene los datos que
desean sumarse o una expresin que realiza un clculo utilizando los datos de
dichos campos. Los operandos de expr pueden incluir el nombre de un campo
de una tabla, una constante o una funcin (la cual puede ser intrnseca o
definida por el usuario pero no otras de las funciones agregadas de SQL).
SELECT
Sum(PrecioUnidad * Cantidad) AS Total
FROM
DetallePedido

4.8.7. Var, VarP


Devuelve una estimacin de la varianza de una poblacin (sobre el total de los
registros) o una muestra de la poblacin (muestra aleatoria de registros) sobre
los valores de un campo. Su sintaxis es:
Var(expr)
VarP(expr)
Claudio Casares

ProInf.net, SCP
www.proinf.net

77

VarP evala una poblacin, y Var evala una muestra de la poblacin. Expr el
nombre del campo que contiene los datos que desean evaluarse o una
expresin que realiza un clculo utilizando los datos de dichos campos. Los
operandos de expr pueden incluir el nombre de un campo de una tabla, una
constante o una funcin (la cual puede ser intrnseca o definida por el usuario
pero no otras de las funciones agregadas de SQL)
Si la consulta contiene menos de dos registros, Var y VarP devuelven Null (esto
indica que la varianza no puede calcularse). Puede utilizar Var y VarP en una
expresin de consulta o en una Instruccin SQL.
SELECT
Var(Gastos) AS Varianza
FROM
Pedidos
WHERE
Pas = 'Espaa'
SELECT
VarP(Gastos) AS Varianza
FROM
Pedidos
WHERE
Pas = 'Espaa'

4.8.8. COMPUTE de SQL-SERVER


Esta clusula aade una fila en el conjunto de datos que se est recuperando,
se utiliza para realizar clculos en campos numricos. COMPUTE acta siempre
sobre un campo o expresin del conjunto de resultados y esta expresin debe
figurar exactamente igual en la clusula SELECT y siempre se debe ordenar el
resultado por la misma o al memos agrupar el resultado. Esta expresin no
puede utilizar ningn ALIAS.
SELECT
IdCliente, Count(IdPedido)
FROM
Pedidos
GROUP BY
IdPedido
HAVING
Count(IdPedido) > 20
COMPUTE
Sum(Count(IdPedido))
SELECT
IdPedido, (PrecioUnidad * Cantidad - Descuento)
FROM
[Detalles de Pedidos]
ORDER BY
Claudio Casares

78

ProInf.net, SCP
www.proinf.net

IdPedido
COMPUTE
Sum((PrecioUnidad * Cantidad - Descuento)) // Calcula el Total
BY IdPedido // Calcula el Subtotal

4.9.

Tipos de Datos
Los tipos de datos SQL se clasifican en 13 tipos de datos primarios y de varios
sinnimos vlidos reconocidos por dichos tipos de datos. Los tipos de datos
primarios son:
Datos

Longitud

Descripcin

BINARY

1 byte

Para consultas sobre tabla adjunta de productos


de bases de datos que definen un tipo de datos
Binario.

BIT

1 byte

Valores Si/No True/False

BYTE

1 byte

Un valor entero entre 0 y 255.

COUNTER

4 bytes

Un nmero incrementado automticamente (de


tipo Long)

CURRENCY

8 bytes

Un entero escalable entre


922.337.203.685.477,5808 y
922.337.203.685.477,5807.

DATETIME

8 bytes

Un valor de fecha u hora entre los aos 100 y


9999.

4 bytes

Un valor en punto flotante de precisin simple con


un rango de - 3.402823*1038 a -1.401298*10-45
para valores negativos, 1.401298*10- 45 a
3.402823*1038 para valores positivos, y 0.

DOUBLE

8 bytes

Un valor en punto flotante de doble precisin con


un rango de - 1.79769313486232*10 308 a
-4.94065645841247*10-324 para valores
negativos, 4.94065645841247*10-324 a
1.79769313486232*10308 para valores positivos,
y 0.

SHORT

2 bytes

Un entero corto entre -32,768 y 32,767.

LONG

4 bytes

Un entero largo entre -2,147,483,648 y


2,147,483,647.

LONGTEXT

1 byte
por
carcter

De cero a un mximo de 1.2 gigabytes.

SINGLE

LONGBINARY Segn se De cero 1 gigabyte. Utilizado para objetos OLE.


Claudio Casares

79

ProInf.net, SCP
www.proinf.net

necesite
TEXT

1 byte
por
carcter

De cero a 255 caracteres.

La siguiente tabla recoge los sinnimos de los tipos de datos definidos:


Tipo de Dato

Sinnimos

BINARY

VARBINARY

BIT

BOOLEAN
LOGICAL
LOGICAL1
YESNO

BYTE

INTEGER1

COUNTER

AUTOINCREMENT

CURRENCY

MONEY

DATETIME

DATE
TIME
TIMESTAMP

SINGLE

FLOAT4
IEEESINGLE
REAL

DOUBLE

FLOAT
FLOAT8
IEEEDOUBLE
NUMBER
NUMERIC

SHORT

INTEGER2
SMALLINT

LONG

INT
INTEGER
INTEGER4

LONGBINARY

GENERAL
OLEOBJECT

LONGTEXT

LONGCHAR
MEMO
NOTE

TEXT

ALPHANUMERIC
CHAR - CHARACTER
Claudio Casares

80

ProInf.net, SCP
www.proinf.net

STRING - VARCHAR
VARIANT
(No Admitido)

4.10.

VALUE

Subconsultas
Una subconsulta es una instruccin SELECT anidada dentro de una instruccin
SELECT, SELECT...INTO, INSERT...INTO, DELETE, o UPDATE o dentro de otra
subconsulta. Puede utilizar tres formas de sintaxis para crear una subconsulta:
comparacin [ANY | ALL | SOME] (instruccin sql)
expresin [NOT] IN (instruccin sql)
[NOT] EXISTS (instruccin sql)
En donde:
comparacin

Es una expresin y un operador de comparacin que


compara la expresin con el resultado de la subconsulta.

expresin

Es una expresin por la que se busca el conjunto resultante


de la subconsulta.

instruccin
SQL

Es una instruccin SELECT, que sigue el mismo formato y


reglas que cualquier otra instruccin SELECT. Debe ir entre
parntesis.

Se puede utilizar una subconsulta en lugar de una expresin en la lista de


campos de una instruccin SELECT o en una clusula WHERE o HAVING. En
una subconsulta, se utiliza una instruccin SELECT para proporcionar un
conjunto de uno o ms valores especificados para evaluar en la expresin de la
clusula WHERE o HAVING.
Se puede utilizar el predicado ANY o SOME, los cuales son sinnimos, para
recuperar registros de la consulta principal, que satisfagan la comparacin con
cualquier otro registro recuperado en la subconsulta. El ejemplo siguiente
devuelve todos los productos cuyo precio unitario es mayor que el de cualquier
producto vendido con un descuento igual o mayor al 25 por ciento:
SELECT *
FROM
Productos
WHERE
PrecioUnidad
ANY
(
SELECT
PrecioUnidad
FROM
Claudio Casares

ProInf.net, SCP
www.proinf.net

81

DetallePedido
WHERE
Descuento = 0 .25
)
El predicado ALL se utiliza para recuperar nicamente aquellos registros de la
consulta principal que satisfacen la comparacin con todos los registros
recuperados en la subconsulta. Si se cambia ANY por ALL en el ejemplo
anterior, la consulta devolver nicamente aquellos productos cuyo precio
unitario sea mayor que el de todos los productos vendidos con un descuento
igual o mayor al 25 por ciento. Esto es mucho ms restrictivo.
El predicado IN se emplea para recuperar nicamente aquellos registros de la
consulta principal para los que algunos registros de la subconsulta contienen
un valor igual. El ejemplo siguiente devuelve todos los productos vendidos con
un descuento igual o mayor al 25 por ciento:
SELECT *
FROM
Productos
WHERE
IDProducto
IN
(
SELECT
IDProducto
FROM
DetallePedido
WHERE
Descuento = 0.25
)
Inversamente se puede utilizar NOT IN para recuperar nicamente aquellos
registros de la consulta principal para los que no hay ningn registro de la
subconsulta que contenga un valor igual.
El predicado EXISTS (con la palabra reservada NOT opcional) se utiliza en
comparaciones de verdad/falso para determinar si la subconsulta devuelve
algn registro. Supongamos que deseamos recuperar todos aquellos clientes
que hayan realizado al menos un pedido:
SELECT
Clientes.Compaa, Clientes.Telfono
FROM
Clientes
WHERE EXISTS (
SELECT
FROM
Pedidos
WHERE
Claudio Casares

ProInf.net, SCP
www.proinf.net

82

Pedidos.IdPedido = Clientes.IdCliente
)
Esta consulta es equivalente a esta otra:
SELECT
Clientes.Compaa, Clientes.Telfono
FROM
Clientes
WHERE
IdClientes
IN
(
SELECT
Pedidos.IdCliente
FROM
Pedidos
)
Se puede utilizar tambin alias del nombre de la tabla en una subconsulta para
referirse a tablas listadas en la clusula FROM fuera de la subconsulta. El
ejemplo siguiente devuelve los nombres de los empleados cuyo salario es igual
o mayor que el salario medio de todos los empleados con el mismo ttulo. A la
tabla Empleados se le ha dado el alias T1:
SELECT
Apellido, Nombre, Titulo, Salario
FROM
Empleados AS T1
WHERE
Salario =
(
SELECT
Avg(Salario)
FROM
Empleados
WHERE
T1.Titulo = Empleados.Titulo
)
ORDER BY Titulo
En el ejemplo anterior, la palabra reservada AS es opcional.
SELECT
Apellidos, Nombre, Cargo, Salario
FROM
Empleados
WHERE
Cargo LIKE 'Agente Ven*'
Claudio Casares

83

ProInf.net, SCP
www.proinf.net

AND
Salario ALL
(
SELECT
Salario
FROM
Empleados
WHERE
Cargo LIKE '*Jefe*'
OR
Cargo LIKE '*Director*'
)
(Obtiene una lista con el nombre, cargo y salario de todos los agentes de
ventas cuyo salario es mayor que el de todos los jefes y directores.)
SELECT DISTINCT
NombreProducto, Precio_Unidad
FROM
Productos
WHERE
PrecioUnidad =
(
SELECT
PrecioUnidad
FROM
Productos
WHERE
NombreProducto = 'Almbar anisado'
)
(Obtiene una lista con el nombre y el precio unitario de todos los productos con
el mismo precio que el almbar anisado.)
SELECT DISTINCT
NombreContacto, NombreCompania, CargoContacto, Telefono
FROM
Clientes
WHERE
IdCliente IN (
SELECT DISTINCT IdCliente
FROM Pedidos
WHERE FechaPedido <#07/01/1993#
)
(Obtiene una lista de las compaas y los contactos de todos los clientes que
han realizado un pedido en el segundo trimestre de 1993.)
SELECT
Nombre, Apellidos
FROM
Empleados AS E
Claudio Casares

ProInf.net, SCP
www.proinf.net

84

WHERE EXISTS
(
SELECT *
FROM
Pedidos AS O
WHERE O.IdEmpleado = E.IdEmpleado
)
(Selecciona el nombre de todos los empleados que han reservado al menos un
pedido.)
SELECT DISTINCT
Pedidos.Id_Producto, Pedidos.Cantidad,
(
SELECT
Productos.Nombre
FROM
Productos
WHERE
Productos.IdProducto = Pedidos.IdProducto
) AS ElProducto
FROM
Pedidos
WHERE
Pedidos.Cantidad = 150
ORDER BY
Pedidos.Id_Producto
(Recupera el Cdigo del Producto y la Cantidad pedida de la tabla pedidos,
extrayendo el nombre del producto de la tabla de productos.)
SELECT
NumVuelo, Plazas
FROM
Vuelos
WHERE
Origen = 'Madrid'
AND Exists (
SELECT T1.NumVuelo FROM Vuelos AS T1
WHERE T1.PlazasLibres > 0 AND T1.NumVuelo=Vuelos.NumVuelo
)
(Recupera nmeros de vuelo y capacidades de aquellos vuelos con destino
Madrid y plazas libres
Supongamos ahora que tenemos una tabla con los identificadores de todos
nuestros productos y el stock de cada uno de ellos. En otra tabla se encuentran
todos los pedidos que tenemos pendientes de servir. Se trata de averiguar que
productos no se podemos servir por falta de stock.
SELECT
PedidosPendientes.Nombre
Claudio Casares

85

ProInf.net, SCP
www.proinf.net

FROM
PedidosPendientes
GROUP BY
PedidosPendientes.Nombre
HAVING
SUM (PedidosPendientes.Cantidad <
(
SELECT
Productos.Stock
FROM
Productos
WHERE
Productos.IdProducto = PedidosPendientes.IdProducto
)
)
Supongamos que en nuestra tabla de empleados deseamos buscar todas las
mujeres cuya edad sea mayor a la de cualquier hombre:
SELECT
Empleados.Nombre
FROM
Empleados
WHERE
Sexo = 'M' AND Edad > ANY (
SELECT Empleados.Edad FROM Empleados WHERE Sexo ='H'
)
lo que sera lo mismo:
SELECT
Empleados.Nombre
FROM
Empleados
WHERE
Sexo = 'M' AND Edad >
(SELECT Max( Empleados.Edad )FROM Empleados WHERE Sexo ='H')
La siguiente tabla muestra algn ejemplo del operador ANY y ALL
Valor 1

Operador

Valor 2

Resultado

> ANY

(2,5,7)

Cierto

= ANY

(2,5,7)

Falso

= ANY

(2,3,5,7)

Cierto

> ALL

(2,5,7)

Falso

< ALL

(5,6,7)

Falso

Claudio Casares

86

ProInf.net, SCP
www.proinf.net

El operacion =ANY es equivalente al operador IN, ambos devuelven el mismo


resultado.
Para concluir este apartado comentar que: la clusula EXISTS se puede
emplear para generar la interseccin entre dos consultas y, por tanto, la
clusula NOT EXISTS para generar la diferencia entre consultas.

4.11.

Estructuras de las Tablas


Una base de datos en un sistema relacional est compuesta por un conjunto de
tablas, que corresponden a las relaciones del modelo relacional. En la
terminologa usada en SQL no se alude a las relaciones, del mismo modo que
no se usa el trmino atributo, pero s la palabra columna, y no se habla de
tupla, sino de lnea.

4.11.1. Creacin de Tablas Nuevas


CREATE TABLE tabla (
campo1 tipo (tamao) ndice1,
campo2 tipo (tamao) ndice2,... ,
ndice multicampo , ... )
En donde:

tabla

Es el nombre de la tabla que se va a crear.

campo1
campo2

Es el nombre del campo o de los campos que se van a crear


en la nueva tabla. La nueva tabla debe contener, al menos,
un campo.

tipo

Es el tipo de datos de campo en la nueva tabla. (Ver Tipos


de Datos)

tamao

Es el tamao del campo slo se aplica para campos de tipo


texto.

ndice1
ndice2

Es una clusula CONSTRAINT que define el tipo de ndice a


crear. Esta clusula en opcional.

ndice
multicampos

Es una clusula CONSTRAINT que define el tipo de ndice


multicampos a crear. Un ndice multicampo es aquel que
est indexado por el contenido de varios campos. Esta
clusula en opcional.

CREATE TABLE
Empleados (
Nombre TEXT (25),
Apellidos TEXT (50)
)
(Crea una nueva tabla llamada Empleados con dos campos, uno llamado
Nombre de tipo texto y longitud 25 y otro llamado apellidos con longitud 50).
CREATE TABLE
Claudio Casares

87

ProInf.net, SCP
www.proinf.net

Empleados (
Nombre TEXT (10),
Apellidos TEXT,
FechaNacimiento DATETIME
)
CONSTRAINT
IndiceGeneral
UNIQUE (
Nombre, Apellidos, FechaNacimiento
)
(Crea una nueva tabla llamada Empleados con un campo Nombre de tipo texto
y longitud 10, otro con llamado Apellidos de tipo texto y longitud
predeterminada (50) y uno ms llamado FechaNacimiento de tipo Fecha/Hora.
Tambin crea un ndice nico - no permite valores repetidos - formado por los
tres campos.)
CREATE TABLE
Empleados (
IdEmpleado INTEGER CONSTRAINT IndicePrimario PRIMARY,
Nombre TEXT,
Apellidos TEXT,
FechaNacimiento DATETIME
)
(Crea una tabla llamada Empleados con un campo Texto de longitud
predeterminada (50) llamado Nombre y otro igual llamado Apellidos, crea otro
campo llamado FechaNacimiento de tipo Fecha/Hora y el campo IdEmpleado de
tipo entero el que establece como clave principal.)

4.11.2. La clusula CONSTRAINT


Se utiliza la clusula CONSTRAINT en las instrucciones ALTER TABLE y CREATE
TABLE para crear o eliminar ndices. Existen dos sintaxis para esta clusula
dependiendo si desea Crear Eliminar un ndice de un nico campo o si se
trata de un campo multindice. Si se utiliza el motor de datos de Microsoft, slo
podr utilizar esta clusula con las bases de datos propias de dicho motor. Para
los ndices de campos nicos:
CONSTRAINT nombre {PRIMARY KEY | UNIQUE | REFERENCES tabla externa
[(campo externo1, campo externo2)]}
Para los ndices de campos mltiples:
CONSTRAINT nombre {PRIMARY KEY (primario1[, primario2 [,...]]) |
UNIQUE (nico1[, nico2 [, ...]]) |
FOREIGN KEY (ref1[, ref2 [,...]]) REFERENCES tabla externa
[(campo externo1 ,campo externo2 [,...])]}
En donde:
Claudio Casares

88

ProInf.net, SCP
www.proinf.net

nombre

Es el nombre del ndice que se va a crear.

primarioN

Es el nombre del campo o de los campos que forman el


ndice primario.

nicoN

Es el nombre del campo o de los campos que forman el


ndice de clave nica.

refN

Es el nombre del campo o de los campos que forman el


ndice externo (hacen referencia a campos de otra tabla).

tabla
externa

Es el nombre de la tabla que contiene el campo o los campos


referenciados en refN

campos
externos

Es el nombre del campo o de los campos de la tabla externa


especificados por ref1, ref2,... , refN

Si se desea crear un ndice para un campo cuando se esta utilizando las


instrucciones ALTER TABLE o CREATE TABLE la clusula CONTRAINT debe
aparecer inmediatamente despus de la especificacin del campo indexado.
Si se desea crear un ndice con mltiples campos cuando se est utilizando las
instrucciones ALTER TABLE o CREATE TABLE la clusula CONSTRAINT debe
aparecer fuera de la clusula de creacin de tabla.
Indice

Descripcin

UNIQUE

Genera un ndice de clave nica. Lo que implica que los


registros de la tabla no pueden contener el mismo valor en los
campos indexados.

PRIMARY
KEY

Genera un ndice primario el campo o los campos especificados.


Todos los campos de la clave principal deben ser nicos y no
nulos, cada tabla slo puede contener una nica clave principal.

Genera un ndice externo (toma como valor del ndice campos


contenidos en otras tablas). Si la clave principal de la tabla
externa consta de ms de un campo, se debe utilizar una
definicin de ndice de mltiples campos, listando todos los
campos de referencia, el nombre de la tabla externa, y los
FOREIGN nombres de los campos referenciados en la tabla externa en el
KEY
mismo orden que los campos de referencia listados. Si los
campos referenciados son la clave principal de la tabla externa,
no tiene que especificar los campos referenciados,
predeterminado por valor, el motor Jet se comporta como si la
clave principal de la tabla externa estuviera formada por los
campos referenciados.

4.11.3. Creacin de ndices


Claudio Casares

89

ProInf.net, SCP
www.proinf.net

Si se utiliza el motor de datos Jet de Microsoft slo se pueden crear ndices en


bases de datos del mismo motor. La sintaxis para crear un ndice en ua tabla
ya definida en la siguiente:
CREATE [ UNIQUE ] INDEX ndice
ON Tabla (campo [ASC|DESC][, campo [ASC|DESC], ...])
[WITH { PRIMARY | DISALLOW NULL | IGNORE NULL }]
En donde:
ndice

Es el nombre del ndice a crear.

tabla

Es el nombre de una tabla existente en la que se crear el


ndice.

campo

Es el nombre del campo o lista de campos que constituyen el


ndice.

ASC|DESC

Indica el orden de los valores de los campos ASC indica un


orden ascendente (valor predeterminado) y DESC un orden
descendente.

UNIQUE

Indica que el ndice no puede contener valores duplicados.

DISALLOW
NULL

Prohibe valores nulos en el ndice

IGNORE
NULL

Excluye del ndice los valores nulos incluidos en los campos


que lo componen.

PRIMARY

Asigna al ndice la categora de clave principal, en cada tabla


slo puede existir un nico ndice que sea "Clave Principal". Si
un ndice es clave principal implica que no puede contener
valores nulos ni duplicados.

En el caso de ACCESS, se puede utilizar CREATE INDEX para crear un pseudo


ndice sobre una tabla adjunta en una fuente de datos ODBC tal como SQL
Server que no tenga todava un ndice. No necesita permiso o tener acceso a
un servidor remoto para crear un pseudo ndice, adems la base de datos
remota no es consciente y no es afectada por el pseudo ndice. Se utiliza la
misma sintaxis para las tablas adjuntas que para las originales. Esto es
especialmente til para crear un ndice en una tabla que sera de slo lectura
debido a la falta de un ndice.
CREATE INDEX
MiIndice
ON
Empleados (Prefijo, Telefono)
(Crea un ndice llamado MiIndice en la tabla empleados con los campos Prefijo
y Telfono.)
CREATE UNIQUE INDEX
Claudio Casares

90

ProInf.net, SCP
www.proinf.net

MiIndice
ON
Empleados (IdEmpleado)
WITH DISALLOW NULL
(Crea un ndice en la tabla Empleados utilizando el campo IdEmpleado,
obligando que el campo IdEmpleado no contenga valores nulos ni repetidos.)

4.11.4. Modificar el Diseo de una Tabla


Modifica el diseo de una tabla ya existente, se pueden modificar los campos o
los ndices existentes. Su sintaxis es:
ALTER TABLE tabla {ADD {COLUMN tipo de campo[(tamao)]
[CONSTRAINT ndice]
CONSTRAINT ndice multicampo} |
DROP {COLUMN campo I CONSTRAINT nombre del ndice}}
En donde:
tabla

Es el nombre de la tabla que se desea modificar.

campo

Es el nombre del campo que se va a aadir o eliminar.

tipo

Es el tipo de campo que se va a aadir.

tamao

Es el tamao del campo que se va a aadir (slo para


campos de texto).

ndice

Es el nombre del ndice del campo (cuando se crean


campos) o el nombre del ndice de la tabla que se desea
eliminar.

ndice
multicampo

Es el nombre del ndice del campo multicampo (cuando se


crean campos) o el nombre del ndice de la tabla que se
desea eliminar.

Operacin

Descripcin

ADD
COLUMN

Se utiliza para aadir un nuevo campo a la tabla, indicando el


nombre, el tipo de campo y opcionalmente el tamao (para
campos de tipo texto).

ADD

Se utiliza para agregar un ndice de multicampos o de un


nico campo.

DROP
COLUMN

Se utiliza para borrar un campo. Se especifica nicamente el


nombre del campo.

DROP

Se utiliza para eliminar un ndice. Se especifica nicamente el


nombre del ndice a continuacin de la palabra reservada
CONSTRAINT.

Claudio Casares

ProInf.net, SCP
www.proinf.net

91

ALTER TABLE
Empleados
ADD COLUMN
Salario CURRENCY
(Agrega un campo Salario de tipo Moneda a la tabla Empleados.)
ALTER TABLE
Empleados
DROP COLUMN
Salario
(Elimina el campo Salario de la tabla Empleados.)
ALTER TABLE
Pedidos
ADD CONSTRAINT
RelacionPedidos
FOREIGN KEY
(IdEmpleado)
REFERENCES
Empleados (IdEmpleado)
(Agrega un ndice externo a la tabla Pedidos. El ndice externo se basa en el
campo IdEmpleado y se refiere al campo IdEmpleado de la tabla Empleados.
En este ejemplo no es necesario indicar el campo junto al nombre de la tabla
en la clusula REFERENCES, pues ID_Empleado es la clave principal de la tabla
Empleados.)
ALTER TABLE
Pedidos
DROP CONSTRAINT
RelacionPedidos
(Elimina el ndice de la tabla Pedidos.)

4.12.

Problemas resueltos: Registros duplicados


Para generar este tipo de consultas lo ms sencillo es utilizar el asistente de
consultas de Access, editar la sentencia SQL de la consulta y pegarla en
nuestro cdigo. No obstante este tipo de consulta se consigue de la siguiente
forma:
SELECT DISTINCT Lista de Campos a Visualizar FROM Tabla
WHERE CampoDeBusqueda In
(SELECT CampoDeBusqueda FROM Tabla As psudnimo
GROUP BY CampoDeBusqueda HAVING Count(*) > 1 )
ORDER BY CampoDeBusqueda
Un caso prctico, si deseamos localizar aquellos empleados con igual nombre y
visualizar su cdigo correspondiente, la consulta sera la siguiente:
SELECT DISTINCT
Empleados.Nombre, Empleados.IdEmpleado
Claudio Casares

92

ProInf.net, SCP
www.proinf.net

FROM
Empleados
WHERE
Empleados.Nombre
In (
SELECT Nombre FROM Empleados As Tmp GROUP BY Nombre HAVING
Count(*) > 1)
ORDER BY
Empleados.Nombre

4.13.

Problemas resueltos: Registros no relacionados


Este tipo de consulta se emplea en situaciones tales como saber que productos
no se han vendido en un determinado periodo de tiempo:
SELECT DISTINCT
Productos.IdProducto, Productos.Nombre
FROM
Productos LEFT JOINPedidos ON
Productos.IdProducto = Pedidos.IdProducto
WHERE
(Pedidos.IdProducto Is Null)
AND
(Pedidos.Fecha Between #01-01-1998# And #01-30-1998#)
La sintaxis es sencilla, se trata de realizar una unin interna entre dos tablas
seleccionadas mediante un LEFT JOIN, estableciendo como condicin que el
campo relacionado de la segunda sea NULL.

4.14.

Cursores
En algunos SGDB es posible la abertura de cursores de datos desde el propio
entorno de trabajo, para ello se utilizan, normalmente procedimientos
almacenados. La sintaxis para definir un cursor es la siguiente:
DECLARE
nombre-cursor
FOR
especificacion-consulta
[ORDER BY]
Por ejemplo:
DECLARE
Mi_Cursor
FOR
SELECT num_emp, nombre, puesto, salario
FROM empleados
WHERE num_dept = 'informatica'
Claudio Casares

93

ProInf.net, SCP
www.proinf.net

Este comando es meramente declarativo, simplemente especifica las filas y


columnas que se van a recuperar. La consulta se ejecuta cuando se abre o se
activa el cursor. La clusula [ORDER BY] es opcional y especifica una
ordenacin para las filas del cursor; si no se especifica, la ordenacin de las
filas es definida el gestor de SGBD.
Para abrir o activar un cursor se utiliza el comando OPEN del SQL, la sintaxis
en la siguiente:
OPEN
nombre-cursor
[USING lista-variables]
Al abrir el cursor se evala la consulta que aparece en su definicin, utilizando
los valores actuales de cualquier parmetro referenciado en la consulta, para
producir una coleccin de filas. El puntero se posiciona delante de la primera
fila de datos (registro actual), esta sentencia no recupera ninguna fila.
Una vez abierto el cursos se utiliza la clusula FETCH para recuperar las filas
del cursor, la sintaxis es la siguiente:
FETCH
nombre-cursor
INTO
lista-variables
Lista - variables son las variables que van a contener los datos recuperados de
la fila del cursor, en la definicin deben ir separadas por comas. En la lista de
variables se deben definir tantas variables como columnas tenga la fila a
recuperar.
Para cerrar un cursor se utiliza el comando CLOSE, este comando hace
desaparecer el puntero sobre el registro actual. La sintaxis es:
CLOSE
nombre-cursor
Por ltimo, y para eliminar el cursor se utiliza el comando DROP CURSOR. Su
sintaxis es la siguiente:
DROP CURSOR
nombre-cursor
Ejemplo (sobre SQL-SERVER):
'Abrir un cursor y recorrelo
DECLARE Employee_Cursor CURSOR FOR
SELECT LastName, FirstName
FROM Northwind.dbo.Employees
Claudio Casares

ProInf.net, SCP
www.proinf.net

94

WHERE LastName like 'B%'


OPEN Employee_Cursor
FETCH NEXT FROM Employee_Cursor
WHILE @@FETCH_STATUS = 0
BEGIN
FETCH NEXT FROM Employee_Cursor
END
CLOSE Employee_Cursor
DEALLOCATE Employee_Cursor
'Abrir un cursor e imprimir su contenido
SET NOCOUNT ON
DECLARE
@au_id varchar(11),
@au_fname varchar(20),
@au_lname varchar(40),
@message varchar(80),
@title varchar(80)
PRINT "-------- Utah Authors report --------"
DECLARE authors_cursor CURSOR FOR
SELECT au_id, au_fname, au_lname
FROM authors
WHERE state = "UT"
ORDER BY au_id
OPEN authors_cursor
FETCH NEXT FROM authors_cursor
INTO @au_id, @au_fname, @au_lname
WHILE @@FETCH_STATUS = 0
BEGIN
PRINT " "
SELECT
@message = "----- Books by Author: " +
@au_fname + " " + @au_lname
PRINT @message
DECLARE titles_cursor CURSOR FOR
SELECT t.title
FROM titleauthor ta, titles t
WHERE ta.title_id = t.title_id AND ta.au_id = au_id
OPEN titles_cursor
FETCH NEXT FROM titles_cursor INTO @title
IF @@FETCH_STATUS <> 0
Claudio Casares

95

ProInf.net, SCP
www.proinf.net

PRINT " <<No Books>>"


WHILE @@FETCH_STATUS = 0
BEGIN
SELECT @message = " " + @title
PRINT @message
FETCH NEXT FROM titles_cursor INTO @title
END
CLOSE titles_cursor
DEALLOCATE titles_cursor
FETCH NEXT FROM authors_cursor
INTO @au_id, @au_fname, @au_lname
END
CLOSE authors_cursor
DEALLOCATE authors_cursor
GO
'Recorrer un cursor
USE pubs
GO
DECLARE authors_cursor CURSOR FOR
SELECT au_lname
FROM authors
WHERE au_lname LIKE "B%"
ORDER BY au_lname
OPEN authors_cursor
FETCH NEXT FROM authors_cursor
WHILE @@FETCH_STATUS = 0
BEGIN
FETCH NEXT FROM authors_cursor
END
CLOSE authors_cursor
DEALLOCATE authors_cursor
'Recorrer un cursor guardando los valores en variables
USE pubs
GO
DECLARE @au_lname varchar(40)
DECLARE @au_fname varchar(20)
DECLARE authors_cursor CURSOR FOR
SELECTau_lname, au_fname
FROM authors
WHERE au_lname LIKE "B%"
ORDER BY au_lname, au_fname
OPEN authors_cursor
FETCH NEXT FROM authors_cursor INTO @au_lname, @au_fname
WHILE @@FETCH_STATUS = 0
Claudio Casares

96

ProInf.net, SCP
www.proinf.net

BEGIN
PRINT "Author: " + @au_fname + " " + @au_lname
FETCH NEXT FROM authors_cursor
INTO @au_lname, @au_fname
END
CLOSE authors_cursor
DEALLOCATE authors_cursor

4.15.

FREETEXT y CONTAINS (FULLTEXT SQL-SERVER)


4.15.1. FULL TEXT SEARCH
Se utilizan en campos de texto de gran tamao utilizando unos ndices
denominados catlogos. Estos catlogos slo se pueden utilizar con tablas que
tengan definidas claves primarias y almacenan todas las palabras del contenido
de las tablas a excepcin de los artculos, preposiciones, etc.
Los catlogos no se actualizan automticamente ni se guardan junto con la
base de datos y cada tabla puede tener un nico catlogo.
Para la utilizacin de estos catlogos dentro de una consulta, podemos utilizar
dos mtodos, el primero consiste en incluir los criterios dentro de una clusula
WHERE (CONTAINS FREETEXT) y la segunda es utilizando una tabla temporal
que contiene el ratio de acierto en la consulta (CONTAINSTABLE
FREETEXTTABLE).

El predicado CONTAINS
Se utiliza este predicado para buscar un texto especfico en una tabla. Su
funcionamiento es similar al predicado LIKE, a diferencia que ste no puede
realizar bsquedas en los campos grandes de texto. CONTAINS no diferencia
entre maysculas y minsculas.
Sintaxis:
SELECT <Campos> FROM <Tabla>
WHERE CONTAINS(<Campo>,<Cadena>) OR/AND
CONTAINS(<Campo>,<Cadena>)
El predicado CONTAINS soporta sintaxis complejas para buscar:

Una o ms palabras utilizando los operadores lgicos AND/OR.


Familias de palabras
Una palabra o una frase que comiencen por un determinado texto.
Palabras o frases que estn unas cerca de otra.

Para buscar una palabra en un campo:


SELECT title_id, title, notes FROM titles
WHERE CONTAINS(notes,business)
Claudio Casares

97

ProInf.net, SCP
www.proinf.net

Para localizar una frase en un campo:


SELECT title_id, titles, notes FROM titles
WHERE CONTAINS(notes, "common business applications" )
Para localizar una frase en todos los campos habilitados:
SELECT title_id, titles, notes FROM titles
WHERE CONTAINS(*, "common business applications" )
Utilizando AND, OR y NOT
SELECT title, notes FROM titles
WHERE CONTAINS(notes, "favorite recipes" OR "gourmet recipes" )
SELECT titles, notes FROM titles
WHERE CONTAINS(notes, cooking AND NOT ("computer*") )
SELECT titles, notes FROM titles
WHERE CONTAINS(notes, beer AND ales )
SELECT titles, notes FROM titles
WHERE CONTAINS(*, ("ice skating" OR hockey) AND NOT olympics)
Utilizando caracteres comodines
SELECT titles, notes FROM titles
WHERE CONTAINS(notes, "ice*" )
SELECT titles, notes FROM titles
WHERE CONTAINS(notes, "light bread*" )
Bsqueda de palabras o frases indicando la importancia de las palabras:
Esta bsqueda permite indicar el peso que tendr cada una de las palabras o
frases que se buscan sobre el resultado de la bsqueda, el peso oscila entre el
valor ms bajo 0.0 y el valor ms alto 1.0.
SELECT Cliente, Nombre, Direccion FROM Cliente
WHERE CONTAINS (Direccion, ISABOUT ( "Calle*", Velazquez WEIGHT(0.5),
Serrano(0.9))
(Se encontrarn todos aquellos registros que en el campo direccin exista la
cadena calle seguida de cualquier valor, ordenando primero los de "Calle
Serrano", luego los de "Calle Velzquez" y despus el resto.
Bsqueda de palabras cercanas:
Podemos realizar bsquedas por dos palabras e indicar que se encuentren
prximas una de otra. El orden de las palabras no altera el resultado de la
bsqueda.
SELECT titulo, notas FROM libros
Claudio Casares

98

ProInf.net, SCP
www.proinf.net

WHERE CONTAINS (notas, "usuario NEAR computadora")


SELECT titulo, notas FROM libros
WHERE CONTAINS (notas, "usuario ~ computadora")
Se pueden indicar tres palabras, de tal forma que la segunda y la primera
deben estar prximas al igual que la segunda y la tercera.
SELECT titulo, notas FROM libros
WHERE CONTAINS (notas, "usuario ~ principiante ~ computadora")
Bsquedas con frases:
... WHERE CONTAINS(Descripcion, " salsas ~ "mezcl*" ")
... WHERE CONTAINS(Descripcion, " "carne*" ~ "salsa empanada*" ")

El predicado FREETEXT
Al utilizar este predicado se analizan todas las palabras de las frases y nos
devuelve como resultado, aquellos registros que contiene la frase completa o
algn fragmento de la misma. La sintaxis es igual que el predicado CONTAINS.
... FREETEXT(descripcion, "En un lugar de la mancha de cuyo nombre no
quiero acordarme" )

El predicado CONTAINSTABLE
Este predicado tiene igual funcionamiento y sintaxis que CONTAINS a
diferencia que en este caso devuelve una tabla con dos columnas, la primera
llamada [KEY] contiene el valor de la clave primaria de la tabla que la que
buscamos, la segunda llamada RANK devuelve un valor indicando el porcentaje
de acierto en la bsqueda para cada registro.
SELECT Preguntas.Pregunta, Preguntas.Respuesta, Resultado.RANK
FROM Preguntas, CONTAINSTABLE(Respuesta, " SQL Server") AS Resultado
WHERE Preguntas.IdPregunta = Resultado.[KEY]
ORDER BY Resultado.RANK Desc
SELECT Preguntas.Pregunta, Preguntas.Respuesta, Resultado.RANK
FROM Preguntas INNER JOIN CONTAINSTABLE (Respuesta, "SQL Server") AS
Resultado
ON Preguntas.IdPregunta = Resultados.KEY

El predicado FREETEXTTABLE
Es el equivalente a CONTAINSTABLE pero realizando bsquedas de FREETEXT.

4.15.2. Consultas e ndices de texto


El principal requisito de diseo de los ndices, consultas y sincronizacin de
texto es la presencia de una columna de clave exclusiva de texto (o clave
principal de columna nica) en todas las tablas que se registren para realizar
bsquedas de texto. Un ndice de texto realiza el seguimiento de las palabras
significativas que ms se usan y dnde se encuentran.
Claudio Casares

99

ProInf.net, SCP
www.proinf.net

Por ejemplo, imagine un ndice de texto para la tabla DevTools. Un ndice de


texto puede indicar que la palabra "Microsoft" se encuentra en la palabra
nmero 423 y en la palabra 982 de la columna Abstract para la fila asociada
con el ProductID igual a 6. Esta estructura de ndices admite una bsqueda
eficiente de todos los elementos que contengan palabras indizadas y
operaciones de bsqueda avanzadas, como bsquedas de frases y bsquedas
de proximidad.
Para impedir que los ndices de texto se inunden con palabras que no ayudan
en la bsqueda, las palabras innecesarias (vacas de significado), como "un",
"y", "es" o "el", se pasan por alto. Por ejemplo, especificar la frase "los
productos pedidos durante estos meses de verano" es lo mismo que especificar
la frase "productos pedidos durante meses verano". Se devuelven las filas que
contengan alguna de las cadenas.
En el directorio \Mssql7\Ftdata\Sqlserver\Config se proporcionan listas de
palabras que no son relevantes en las bsquedas de muchos idiomas. Este
directorio se crea, y los archivos de palabras no relevantes se instalan, cuando
se instala Microsoft SQL Server con la funcionalidad de bsqueda de texto.
Los archivos de palabras no relevantes se pueden modificar. Por ejemplo, los
administradores del sistema de las empresas de alta tecnologa podran
agregar la palabra "sistema" a su lista de palabras no relevantes. (Si modifica
un archivo de palabras no relevantes, debe volver a rellenar los catlogos de
texto para que los cambios surtan efecto). Consulte la ayuda de SQL-SERVER
para conocer los correspondientes ficheros.
Cuando se procesa una consulta de texto, el motor de bsqueda devuelve a
Microsoft SQL Server los valores de clave de las filas que coinciden con los
criterios de bsqueda. Imagine una tabla CienciaFiccin en la que la columna
NmLibro es la columna de clave principal:
NmLibro

Escritor

Ttulo

A025

Asimov

Los lmites de la fundacin

A027

Asimov

Fundacin e imperio

C011

Clarke

El fin de la infancia

V109

Verne

La isla misteriosa

Suponga que desea usar una consulta de recuperacin de texto para buscar los
ttulos de los libros que incluyen la palabra Fundacin. En este caso, del ndice
de texto se obtienen los valores A025 y A027. SQL Server usa, a continuacin,
estas claves y el resto de la informacin de los campos para responder a la
consulta.

4.15.3. Componentes de las consultas de texto de Transact-SQL


Claudio Casares

100

ProInf.net, SCP
www.proinf.net

Microsoft SQL Server proporciona estos componentes de Transact-SQL para


las consultas de texto:
Predicados de Transact-SQL:

CONTAINS
FREETEXT

Los predicados CONTAINS y FREETEXT se pueden usar en cualquier condicin


de bsqueda (incluida una clusula WHERE) de una instruccin SELECT.
Funciones de conjuntos de filas de Transact-SQL:

CONTAINSTABLE
FREETEXTTABLE

Las funciones CONTAINSTABLE y FREETEXTTABLE se pueden usar en la


clusula FROM de una instruccin SELECT.
Propiedades de texto de Transact-SQL:
stas son algunas de las propiedades que se usan con las consultas de texto y
las funciones que se utilizan para obtenerlas:

La propiedad IsFullTextEnabled indica si una base de datos est


habilitada para texto y se encuentra disponible mediante la funcin
DatabaseProperty.
La propiedad TableHasActiveFulltextIndex indica si una tabla est
habilitada para texto y se encuentra disponible mediante la funcin
ObjectProperty.
La propiedad IsFullTextIndexed indica si una columna est habilitada
para texto y se encuentra disponible mediante la funcin
ColumnProperty.
La propiedad TableFullTextKeyColumn proporciona el identificador de la
columna de clave exclusiva de texto y se encuentra disponible mediante
la funcin ObjectProperty.

Procedimientos de texto almacenados del sistema de Transact-SQL:

Los procedimientos almacenados que definen los ndices de texto e


inician el relleno de los ndices de texto, como, por ejemplo,
sp_fulltext_catalog, sp_fulltext_table y sp_fulltext_column.
Los procedimientos almacenados que consultan los metadatos de los
ndices de texto que se han definido mediante los procedimientos
almacenados del sistema mencionados anteriormente, como, por
ejemplo, sp_help_fulltext_catalogs, sp_help_fulltext_tables,
sp_help_fulltext_columns, y una variacin de stos que permite utilizar
cursores sobre los conjuntos de resultados devueltos.
Claudio Casares

101

ProInf.net, SCP
www.proinf.net

Estos procedimientos almacenados se pueden usar en conjuncin con la


escritura de una consulta. Por ejemplo, puede usarlos para buscar los nombres
de las columnas indizadas de texto de una tabla y el identificador de una
columna de clave nica de texto antes de especificar una consulta.

4.15.4. Funciones de conjunto de filas CONTAINSTABLE y


FREETEXTTABLE
Las funciones CONTAINSTABLE y FREETEXTTABLE se usan para especificar las
consultas de texto que devuelve la clasificacin por porcentaje de aciertos de
cada fila. Estas funciones son muy similares a los predicados de texto
CONTAINS y FREETEXT, pero se utilizan de forma diferente.
Aunque tanto los predicados de texto como las funciones de conjunto de filas
de texto se usan para las consultas de texto y la instruccin TRANSACT-SQL
usada para especificar la condicin de bsqueda de texto es la misma en los
predicados y en las funciones, hay importantes diferencias en la forma en la
que stas se usan:
CONTAINS y FREETEXT devuelven ambos el valor TRUE o FALSE, con lo que
normalmente se especifican en la clusula WHERE de una instruccin SELECT.
Slo se pueden usar para especificar los criterios de seleccin, que usa
Microsoft SQL SERVER para determinar la pertenencia al conjunto de
resultados.
CONTAINSTABLE y FREETEXTTABLE devuelven ambas una tabla de cero,
una o ms filas, con lo que deben especificarse siempre en la clusula
FROM.Se usan tambin para especificar los criterios de seleccin. La tabla
devuelta tiene una columna llamada KEY que contiene valores de claves de
texto. Cada tabla de texto registrada tiene una columna cuyos valores se
garantizan como nicos. Los valores devueltos en la columna KEY de
CONTAINSTABLE o FREETEXTTABLE son los valores nicos, procedentes de la
tabla de texto registrada, de las filas que coinciden con los criterios de
seleccin en la condicin de bsqueda de texto.
Adems, la tabla que producen CONTAINSTABLE y FREETEXTTABLE tiene una
columna denominada RANK, que contiene valores de 0 a 1000. Estos valores
se utilizan para ordenar las filas devueltas de acuerdo al nivel de coincidencia
con los criterios de seleccin.
Las consultas que usan las funciones CONTAINSTABLE y FREETEXTTABLE son
ms complejas que las que usan los predicados CONTAINS y FREETEXT porque
las filas que cumplen los criterios y que son devueltas por las funciones deben
ser combinadas explcitamente con las filas de la tabla original de SQL
SERVER.

4.15.5. CONTAINSTABLE (T-SQL)


Devuelve una tabla con cero, una o ms filas para aquellas columnas de tipos
de datos carcter que contengan palabras o frases en forma precisa o
Claudio Casares

ProInf.net, SCP
www.proinf.net

102

"aproximada" (menos precisa), la proximidad de palabras medida como


distancia entre ellas, o coincidencias medidas. A CONTAINSTABLE se le puede
hacer referencia en una clusula FROM de una instruccin SELECT como si
fuera un nombre de tabla normal.
Las consultas que utilizan CONTAINSTABLE especifican consultas de texto
contenido que devuelven un valor de distancia (RANK) por cada fila. La funcin
CONTAINSTABLE utiliza las mismas condiciones de bsqueda que el predicado
CONTAINS.

Sintaxis
CONTAINSTABLE (tabla, {columna | *}, '<condicinBsquedaContenido>')
<condicinBsqueda> ::=
{
| <trminoGeneracin>
| <trminoPrefijo>
| <trminoProximidad>
| <trminoSimple>
| <trminoPeso>
}
| { (<condicinBsqueda>)
{AND | AND NOT | OR} <condicinBsqueda> [...n]
}
<trminoPeso> ::=
ISABOUT
({{
<trminoGeneracin>)
| <trminoPrefijo>)
| <trminoProximidad>)
| <trminoSimple>)
}
[WEIGHT (valorPeso)]
} [,...n]
)
<trminoGeneracin> ::=
FORMSOF (INFLECTIONAL, <trminoSimple> [,...n] )
<trminoPrefijo> ::=
{ "palabra * " | "frase * " }
<trminoProximidad> ::=
{<trminoSimple> | <trminoPrefijo>}
{ {NEAR | ~} {<trminoSimple> | <trminoPrefijo>} } [n]
<trminoSimple> ::=
palabra | " frase "

Argumentos
Argumento
tabla

Descripcin
Es el nombre de la tabla que ha sido registrada para
bsquedas de texto. tabla puede ser el nombre de un
Claudio Casares

ProInf.net, SCP
www.proinf.net

103
objeto de una base de datos de una sola parte o el
nombre de un objeto de una base de datos con varias
partes. Para obtener ms informacin, consulte
Convenciones de sintaxis de Transact-SQL.

columna

Es el nombre de la columna que se va a examinar, que


reside en tabla. Las columnas de tipos de datos de
cadena de caracteres son columnas vlidas para
bsquedas de texto.

Especifica que todas las columnas de la tabla que se


hayan registrado para bsquedas de texto se deben
utilizar en las condiciones de bsqueda.

<condicinBsqueda> Especifica el texto que se va a buscar en columna. En la


condicin de bsqueda no se puede utilizar variables.
palabra

Es una cadena de caracteres sin espacios ni signos de


puntuacin.

frase

Es una o varias palabras con espacios entre cada una


de ellas.
Nota: Algunos idiomas, como los orientales, pueden
tener frases que contengan una o varias palabras sin
espacios entre ellas.
Especifica que las filas coincidentes (devueltas por la
consulta) coincidan con una lista de palabras y frases a
las que se asigna opcionalmente un valor de peso.
Especifica la palabra clave <trminoPeso>.

<trminoPeso>
ISABOUT
WEIGHT (valorPeso)

Especifica el valor de peso como nmero entre 0,0 y


1,0. Cada componente de <trminoPeso> puede incluir
un valorPeso. valorPeso es una forma de modificar
cmo varias partes de una consulta afectan al valor de
distancia asignado a cada fila de la consulta. El peso
hace una medida diferente de la distancia de un valor
porque todos los componentes de <trminoPeso> se
utilizan para determinar la coincidencia. Se devuelven
las filas que contengan una coincidencia con cualquiera
de los parmetros ISABOUT, aunque no tengan un peso
asignado.

AND | AND NOT | OR

Especifica una operacin lgica entre dos condiciones


de bsqueda. Cuando <condicinBsqueda> contiene
grupos entre parntesis, dichos grupos entre parntesis
se evalan primero. Despus de evaluar los grupos
entre parntesis, se aplican las reglas siguientes
cuando se utilizan estos operadores lgicos con
condiciones de bsqueda:
Claudio Casares

104

ProInf.net, SCP
www.proinf.net

NOT se aplica antes que AND.


NOT slo puede estar a continuacin de AND,
como en AND NOT. No se acepta el operador OR
NOT. No se puede especificar NOT antes del
primer trmino (por ejemplo,
CONTAINS(mycolumn, 'NOT "fraseBuscada" ' ).
AND se aplica antes que OR.
Los operadores booleanos del mismo tipo (AND,
OR) son asociativos y, por tanto, se pueden
aplicar en cualquier orden.
<trminoGeneracin> Especifica la coincidencia de palabras cuando los
trminos simples incluyen variaciones de la palabra
original que se busca.
INFLECTIONAL

Especifica que se acepten las coincidencias de las


formas plurales y singulares de los nombres y los
distintos tiempos verbales. Un <trminoSimple> dado
dentro de un &lttrminoGeneracin> no coincide con
nombres y verbos a la vez.

<trminoPrefijo>

Especifica la coincidencia de palabras o frases que


comiencen con el texto especificado. Enmarque el
prefijo entre comillas dobles ("") y un asterisco (*)
antes de la segunda comilla doble. Coincide todo el
texto que comience por el trmino simple especificado
antes del asterisco. El asterisco representa cero, uno o
varios caracteres (de la palabra o palabras raz de la
palabra o la frase). Cuando <trminoPrefijo> es una
frase, todas las palabras de dicha frase se consideran
prefijos. Por tanto, una consulta que especifique el
prefijo "local wine *" hace que se devuelvan todas las
filas que contengan el texto "local winery", "locally
wined and dined", etc.

<trminoProximidad> Especifica la coincidencia de palabras o frases que


estn cercanas entre ellas. <trminoProximidad> opera
de forma similar al operador AND: ambos requieren que
existan varias palabras o frases en la columna
examinada. Cuanto ms prximas estn las palabras de
<trminoProximidad>, mejor ser la coincidencia.
NEAR | ~

Indica que la palabra o frase del lado izquierdo del


operador NEAR o ~ tiene que estar bastante cerca de la
palabra o frase del lado derecho del operador NEAR o
~. Se pueden encadenar varios trminos de
proximidad, por ejemplo:
a NEAR b NEAR c
Claudio Casares

ProInf.net, SCP
www.proinf.net

<trminoSimple>

105
Esto significa que la palabra o frase a tiene que estar
cerca de la palabra o frase b, que, a su vez, tiene que
estar cerca de la palabra o frase c.
Microsoft SQL Server mide la distancia entre la
palabra o frase izquierda y derecha. Un valor de
distancia bajo (por ejemplo, 0) indica una distancia
grande entre las dos. Si las palabras o frases
especificadas estn lejos unas de las otras, satisfacen la
condicin de la consulta; sin embargo, la consulta tiene
un valor de distancia muy bajo (0). Sin embargo, si
<condicinBsqueda> slo consta de uno o varios
trminos de proximidad NEAR, SQL Server no devuelve
filas con un valor de distancia de 0.
Especifica la coincidencia con una palabra exacta (uno o
varios caracteres sin espacios o signos de puntuacin
en idiomas con caracteres de un solo byte) o una frase
(una o varias palabras consecutivas separadas por
espacios y signos de puntuacin opcionales en idiomas
con caracteres de un solo byte). Ejemplos de trminos
simples vlidos son "blue berry", blueberry y "Microsoft
SQL Server". Las frases tienen que ir entre comillas
dobles (""). Las palabras de una frase tienen que
aparecer en la columna de la base de datos en el
mismo orden que el especificado en
<condicinBsqueda>. La bsqueda de caracteres en la
palabra o la frase distingue entre maysculas y
minsculas. Las palabras de una sola slaba (como un,
y, la) de las columnas de texto indizadas no se
almacenan en los ndices de los textos. Si nicamente
se utiliza una de estas palabras en una bsqueda, SQL
Server devuelve un mensaje de error indicando que en
la consulta slo hay monoslabos. SQL Server incluye
una lista estndar de palabras monoslabas en el
directorio \Mssql7\Ftdata\Sqlserver\Config.
Los signos de puntuacin se omiten. Por lo tanto, el
valor "Dnde est mi equipo? satisface la condicin
CONTAINS(testing, "fallo del equipo") El fallo de la
bsqueda sera grave.".
Es un marcador de posicin que indica que se pueden
especificar varias condiciones y trminos de bsqueda.

Observaciones
CONTAINS no se reconoce como palabra clave si el nivel de compatibilidad es
menor de 70. Para obtener ms informacin, consulte sp_dbcmptlevel.
La tabla devuelta por la funcion CONTAINSTABLE tiene una columna llamada
KEY que contiene valores de claves de texto. Todas las tablas con textos
Claudio Casares

106

ProInf.net, SCP
www.proinf.net

indizados tienen una columna cuyos valores se garantizan que son nicos y los
valores devueltos en la columna KEY son los valores de claves de textos de las
filas que satisfacen los criterios de seleccin especificados en la condicin de
bsqueda. La propiedad TableFulltextKeyColumn, obtenida mediante la funcin
OBJECTPROPERTY, proporciona la identidad de esta columna de clave nica.
Para obtener las filas de la tabla original que desee, especifique una
combinacin con las filas de CONTAINSTABLE. La forma tpica de la clusula
FROM de una instruccin SELECT que utilice CONTAINSTABLE es:
SELECT select_list
FROM table AS FT_TBL INNER JOIN
CONTAINSTABLE(table, column, contains_search_condition) AS KEY_TBL
ON FT_TBL.unique_key_column = KEY_TBL.[KEY]
La tabla que produce CONTAINSTABLE incluye una columna llamada RANK. La
columna RANK es un valor (entre 0 y 1000) que para cada fila indica lo bien
que cada una de ellas satisface los criterios de seleccin. Este valor de
distancia se suele utilizar en las instrucciones SELECT de una de estas
maneras:

En la clusula ORDER BY, para devolver las filas de mayor valor al


principio.
En la lista de seleccin, para ver el valor de distancia asignado a cada
fila.
En la clusula WHERE, para filtrar las filas con valores de distancia
bajos.

CONTAINSTABLE no se reconoce como palabra clave si el nivel de


compatibilidad es menor de 70. Para obtener ms informacin, consulte
sp_dbcmptlevel.

Ejemplos
A. Devolver valores de distancia mediante CONTAINSTABLE
Este ejemplo busca todos los nombres de productos que contengan las
palabras "breads", "fish" o "beers", y los distintos pesos asignados a cada
palabra. Por cada fila devuelta que cumpla los criterios de la bsqueda, se
muestra la precisin relativa (valor de distancia) de la coincidencia. Adems,
las filas de mayor valor de distancia se devuelven primero.
USE Northwind
GO
SELECT FT_TBL.CategoryName, FT_TBL.Description, KEY_TBL.RANK
FROM Categories AS FT_TBL INNER JOIN
CONTAINSTABLE(Categories, Description,
'ISABOUT (breads weight (.8),
fish weight (.4), beers weight (.2) )' ) AS KEY_TBL
ON FT_TBL.CategoryID = KEY_TBL.[KEY]
ORDER BY KEY_TBL.RANK DESC
Claudio Casares

ProInf.net, SCP
www.proinf.net

107

GO
B. Devolver valores de distancia mayores que uno especificado mediante
CONTAINSTABLE
Este ejemplo devuelve la descripcin y el nombre de la categora de todas las
categoras de alimentos en las que la columna Description contenga las
palabras "sweet" y "savory" cerca de la palabra "sauces" o de la palabra
"candies". Todas las filas cuya categora sea "Seafood" no se devuelven. Slo
se devuelven las filas cuyo grado de coincidencia sea igual o superior a 2.
USE Northwind
GO
SELECT FT_TBL.Description,
FT_TBL.CategoryName,
KEY_TBL.RANK
FROM Categories AS FT_TBL INNER JOIN
CONTAINSTABLE (Categories, Description,
'("sweet and savory" NEAR sauces) OR
("sweet and savory" NEAR candies)'
) AS KEY_TBL
ON FT_TBL.CategoryID = KEY_TBL.[KEY]
WHERE KEY_TBL.RANK > 2
AND FT_TBL.CategoryName <> 'Seafood'
ORDER BY KEY_TBL.RANK DESC
C. Utilizar CONTAINS con <trminoSimple>
Este ejemplo busca todos los productos cuyo precio sea $15,00 que contengan
la palabra "bottles".
USE Northwind
GO
SELECT ProductName
FROM Products
WHERE UnitPrice = 15.00
AND CONTAINS(QuantityPerUnit, 'bottles')
GO
D. Utilizar CONTAINS y una frase en <trminoSimple>
Este ejemplo devuelve todos los productos que contengan la frase "sasquatch
ale" o "steeleye stout".
USE Northwind
GO
SELECT ProductName
FROM Products
WHERE CONTAINS(ProductName, ' "Sasquatch ale" OR "steeleye stout" ')
GO
E. Utilizar CONTAINS con <trminoPrefijo>
Claudio Casares

108

ProInf.net, SCP
www.proinf.net

Este ejemplo devuelve todos los nombres de productos que tengan al menos
una palabra que empiece por el prefijo "choc" en la columna ProductName.
USE Northwind
GO
SELECT ProductName
FROM Products
WHERE CONTAINS(ProductName, ' "choc*" ')
GO
F. Utilizar CONTAINS y OR con <trminoPrefijo>
Este ejemplo devuelve todas las descripciones de categoras que contengan las
cadenas "sea" o "bread".
USE Northwind
SELECT CategoryName
FROM Categories
WHERE CONTAINS(Description, '"sea*" OR "bread*"')
GO
G. Utilizar CONTAINS con <trminoProximidad>
Este ejemplo devuelve todos los nombres de los productos que tengan la
palabra "Boysenberry" cerca de la palabra "spread".
USE Northwind
GO
SELECT ProductName
FROM Products
WHERE CONTAINS(ProductName, 'spread NEAR Boysenberry')
GO
H. Utilizar CONTAINS con <trminoGeneracin>
Este ejemplo busca todos los productos que tengan palabras derivadas de
"dry": "dried", "drying", etc.
USE Northwind
GO
SELECT ProductName
FROM Products
WHERE CONTAINS(ProductName, ' FORMSOF (INFLECTIONAL, dry) ')
GO
I. Utilizar CONTAINS con <trminoPeso>
Este ejemplo busca todos los nombres de productos que contengan las
palabras "spread", "sauces" o "relishes", y los distintos pesos asignados a cada
palabra.
USE Northwind
GO
Claudio Casares

109

ProInf.net, SCP
www.proinf.net

SELECT CategoryName, Description


FROM Categories
WHERE CONTAINS(Description, 'ISABOUT (spread weight (.8),
sauces weight (.4), relishes weight (.2) )' )
GO

4.15.6. FREETEXTTABLE
Devuelve una tabla de cero, una o varias filas cuyas columnas contienen datos
de tipo carcter cuyos valores coinciden con el significado, no literalmente, con
el texto especificado en cadenaTexto. Se puede hacer referencia a
FREETEXTTABLE en las clusula FROM de las instrucciones SELECT como a otro
nombre de tabla normal.
Las consultas que utilizan FREETEXTTABLE especifican consultas de texto que
devuelven el valor de coincidencia (RANK) de cada fila.

Sintaxis
FREETEXTTABLE (tabla, {columna | *}, 'cadenaTexto')

Argumentos
tabla

Es el nombre de la tabla que se ha marcado para bsquedas


de texto. tabla puede ser el nombre de un objeto de una base
de datos de una sola parte o el nombre de un objeto de una
base de datos con varias partes.

columna

Es el nombre de la columna de tabla en la que se va a buscar.


Las columnas cuyos datos sean del tipo de cadena de
caracteres son columnas vlidas para buscar texto.

Especifica que todas las columnas que hayan sido registradas


para la bsqueda de texto se tienen que utilizar para buscar la
cadenaTexto dada.

cadenaTexto

Es el texto que se va a buscar en la columna especificada. No


se pueden utilizar variables.

Observaciones
FREETEXTTABLE utiliza las mismas condiciones de bsqueda que el predicado
FREETEXT.Al igual que en CONTAINSTABLE, la tabla devuelta tiene columnas
llamadas KEY y RANK, a las que se hace referencia en la consulta para obtener
las filas apropiadas y utilizar los valores de distancia. FREETEXTTABLE no se
reconoce como palabra clave si el nivel de compatibilidad es menor que 70.
Para obtener ms informacin, consulte sp_dbcmptlevel.

Claudio Casares

ProInf.net, SCP
www.proinf.net

110

Ejemplos
En este ejemplo se devuelve el nombre y la descripcin de todas las categoras
relacionadas con sweet, candy, bread, dry y meat.
USE Northwind
SELECT FT_TBL.CategoryName,
FT_TBL.Description,
KEY_TBL.RANK
FROM Categories AS FT_TBL INNER JOIN
FREETEXTTABLE(Categories, Description,
'sweetest candy bread and dry meat') AS KEY_TBL
ON FT_TBL.CategoryID = KEY_TBL.[KEY]
GO

4.15.7. Utilizar el predicado CONTAINS


Puede usar el predicado CONTAINS para buscar una determinada frase en una
base de datos. Por supuesto, dicha consulta puede escribirse con el predicado
LIKE. Sin embargo, algunas formas de CONTAINS proporcionan mayor
variedad de consultas de texto que la que se puede obtener con LIKE. Adems,
al contrario que cuando se utiliza el predicado LIKE, una bsqueda con
CONTAINS no distingue entre maysculas y minsculas.
Nota. Las consultas de bsqueda de texto se comportan de forma que no
distinguen entre maysculas y minsculas en aquellos idiomas
(mayoritariamente los latinos) en los que tiene sentido distinguir entre
maysculas y minsculas. Sin embargo, en japons, hay muchas ortografas
fonticas en las que el concepto de normalizacin ortogrfica implica no
distinguir las maysculas de las minsculas (por ejemplo, las letras kana no
tienen maysculas y minsculas). Este tipo de normalizacin ortogrfica no se
admite.
Suponga que desea buscar en la base de datos Northwind la frase "bean curd".
Si usa el predicado CONTAINS, sta es una consulta bastante fcil.
USE Northwind USE Northwind
GO
SELECT Description
FROM Categories
WHERE Description LIKE '%bean curd%'
GO
O, con CONTAINS:
USE Northwind
GO
SELECT Description
FROM Categories
WHERE CONTAINS(Description, ' "bean curd" ')
Claudio Casares

111

ProInf.net, SCP
www.proinf.net

GO
El predicado CONTAINS usa una notacin funcional en la que el primer
parmetro es el nombre de la columna que se est buscando y el segundo
parmetro es una condicin de bsqueda de texto. La condicin de bsqueda,
en este caso "bean curd", puede ser bastante compleja y est formada por uno
o ms elementos, que se describen posteriormente.
El predicado CONTAINS admite una sintaxis compleja para buscar en las
columnas basadas en caracteres:

Una o ms palabras y frases especficas (trminos simples). Una palabra


est compuesta por uno o ms caracteres sin espacios ni signos de
puntuacin. Una frase vlida consta de varias palabras con espacios y
con o sin signos de puntuacin entre ellas. Por ejemplo, croissant es una
palabra y caf au lait es una frase. Las palabras y frases como stas se
llaman trminos simples.
Forma no flexionada de una palabra determinada (trmino de
generacin). Por ejemplo, buscar la forma no flexionada de la palabra
"conducir". Si hay varias filas en la tabla que incluyen las palabras
"conducir", "conduce", "condujo", "conduciendo" y "conducido", todas
estaran en el conjunto de resultados porque cada una de estas palabras
se puede generar de forma inflexiva a partir de la palabra "conducir".
Una palabra o frase en la que las palabras empiezan con un texto
determinado (trmino prefijo). En el caso de una frase, cada palabra de
la frase se considera un prefijo. Por ejemplo, el trmino "tran* auto"
coincide con "transmisin automtica" y "transductor de automvil".
Palabras o frases que usan valores ponderados (trmino ponderado). Por
ejemplo, podra desear encontrar una palabra que tuviera un peso
designado superior a otra palabra. Devuelve resultados de consulta
clasificados.
Una palabra o frase que est cerca de otra palabra o frase (trmino de
proximidad). Por ejemplo, podra desear encontrar las filas en las que la
palabra "hielo" aparece cerca de la palabra "hockey" o en las que la
frase "patinaje sobre hielo" se encuentra prxima a la frase "hockey
sobre hielo".

Un predicado CONTAINS puede combinar varios de estos trminos si usa AND y


OR, por ejemplo, podra buscar todas las filas con "leche" y "caf al estilo de
Toledo" en la misma columna de base datos habilitada para texto . Adems, los
trminos se pueden negar con el uso de AND NOT, por ejemplo, "pastel AND
NOT queso de untar".
Cuando use CONTAINS, recuerde que SQL Server rechaza las palabras vacas
de los criterios de bsqueda. Las palabras irrelevantes son aquellas como "un",
"y", "es" o "el", que aparecen con frecuencia pero que, en realidad, no ayudan
en la bsqueda de un texto determinado.

4.15.8. Utilizar el predicado FREETEXT


Claudio Casares

112

ProInf.net, SCP
www.proinf.net

Con un predicado FREETEXT, puede escribir cualquier conjunto de palabras o


frases, e incluso una frase completa. El motor de consultas de texto examina
este texto, identifica todas las palabras y frases de nombres significativas y
construye internamente una consulta con esos trminos. En este ejemplo se
usa un predicado FREETEXT en una columna llamada description.
FREETEXT (description, ' "The Fulton County Grand Jury said Friday an
investigation of Atlanta's recent primary election produced no evidence that
any irregularities took place." ')
El motor de bsqueda identifica palabras y frases nominales tales como las
siguientes:

Palabras:
Fulton, county, grand, jury, Friday, investigation, Atlanta, recent, primary,
election, produce, evidence, irregularities

Frases:
Fulton county grand jury, primary election, grand jury, Atlanta's recent
primary election
Las palabras y frases de la cadena FREETEXT (y sus variaciones generadas de
forma inflexiva) se combinan internamente en una consulta, ponderada para
clasificarla adecuadamente y, a continuacin, se realiza la bsqueda real.

4.15.9. Funciones de conjunto de filas CONTAINSTABLE y


FREETEXTTABLE
Las funciones CONTAINSTABLE y FREETEXTTABLE se usan para especificar las
consultas de texto que devuelve la clasificacin por porcentaje de aciertos de
cada fila. Estas funciones son muy similares a los predicados de texto
CONTAINS y FREETEXT, pero se utilizan de forma diferente.

Los predicados de texto de las funciones


Aunque tanto los predicados de texto como las funciones de conjunto de filas
de texto se usan para las consultas de texto y la instruccin TRANSACT-SQL
usada para especificar la condicin de bsqueda de texto es la misma en los
predicados y en las funciones, hay importantes diferencias en la forma en la
que stas se usan:

CONTAINS y FREETEXT devuelven ambos el valor TRUE o FALSE, con lo


que normalmente se especifican en la clusula WHERE de una
instruccin SELECT.
CONTAINSTABLE y FREETEXTTABLE devuelven ambas una tabla de cero,
una o ms filas, con lo que deben especificarse siempre en la clusula
FROM.
CONTAINS y FREETEXT slo se pueden usar para especificar los criterios
de seleccin, que usa Microsoft SQL SERVER para determinar la
Claudio Casares

113

ProInf.net, SCP
www.proinf.net

pertenencia al conjunto de resultados.


CONTAINSTABLE y FREETEXTTABLE se usan tambin para especificar los
criterios de seleccin. La tabla devuelta tiene una columna llamada KEY
que contiene valores de claves de texto. Cada tabla de texto registrada
tiene una columna cuyos valores se garantizan como nicos. Los valores
devueltos en la columna KEY de CONTAINSTABLE o FREETEXTTABLE son
los valores nicos, procedentes de la tabla de texto registrada, de las
filas que coinciden con los criterios de seleccin en la condicin de
bsqueda de texto.
Adems, la tabla que producen CONTAINSTABLE y FREETEXTTABLE tiene
una columna denominada RANK, que contiene valores de 0 a 1000.
Estos valores se utilizan para ordenar las filas devueltas de acuerdo al
nivel de coincidencia con los criterios de seleccin.
Las consultas que usan las funciones CONTAINSTABLE y FREETEXTTABLE son
ms complejas que las que usan los predicados CONTAINS y FREETEXT porque
las filas que cumplen los criterios y que son devueltas por las funciones deben
ser combinadas explcitamente con las filas de la tabla original de SQL
SERVER.
Este ejemplo devuelve la descripcin y el nombre de categora de todas las
categoras de alimentos en las que la columna Description contenga las
palabras "sweet and savory" cerca de la palabra "sauces" o de la palabra
"candies". Todas las filas cuyo nombre de categora sea "Seafood" no se
devuelven. Slo se devuelven las filas cuyo valor de distancia sea igual o
superior a 2.
USE Northwind
GO
SELECT FT_TBL.Description, FT_TBL.CategoryName, KEY_TBL.RANK
FROM Categories AS FT_TBL INNER JOIN
CONTAINSTABLE (Categories, Description,
'("sweet and savory" NEAR sauces) OR
("sweet and savory" NEAR candies)') AS KEY_TBL
ON FT_TBL.CategoryID = KEY_TBL.[KEY]
WHERE KEY_TBL.RANK > 2 AND FT_TBL.CategoryName <> 'Seafood'
ORDER BY KEY_TBL.RANK DESC
Este ejemplo devuelve la descripcin y el nombre de categora de las 10
categoras superiores de alimentos donde la columna Description contenga las
palabras "sweet and savory" cerca de la palabra "sauces" o de la palabra
"candies".
SELECT FT_TBL.Description, FT_TBL.CategoryName, KEY_TBL.RANK
FROM Categories AS FT_TBL INNER JOIN
CONTAINSTABLE (Categories, Description,
'("sweet and savory" NEAR sauces) OR
("sweet and savory" NEAR candies)', 10) AS KEY_TBL
ON FT_TBL.CategoryID = KEY_TBL.[KEY]
Claudio Casares

114

ProInf.net, SCP
www.proinf.net

Comparacin entre CONTAINSTABLE y CONTAINS


La funcin CONTAINSTABLE y el predicado CONTAINS utilizan condiciones de
bsqueda similares.
Sin embargo, en CONTAINSTABLE se especifica la tabla en la que tendr lugar
la bsqueda de texto, la columna (o todas las columnas) de la tabla en las que
se buscar y la condicin de bsqueda. Un cuarto parmetro, opcional, hace
posible que el usuario indique que se devuelva slo el nmero ms alto
especificado de coincidencias. Para obtener ms informacin, consulte la
seccin Limitar los conjuntos de resultados.
CONTAINSTABLE devuelve una tabla que incluye una columna denominada
RANK. Esta columna RANK contiene un valor para cada fila que indica el grado
de coincidencia de cada fila con los criterios de seleccin.
En esta consulta se especifica la utilizacin de CONTAINSTABLE para devolver
un valor de clasificacin por cada fila.
USE Northwind
GO
SELECT K.RANK, CompanyName, ContactName, Address
FROM Customers AS C
INNER JOIN
CONTAINSTABLE(Customers,Address,
'ISABOUT ("des*", Rue WEIGHT(0.5), Bouchers WEIGHT(0.9))') AS K
ON C.CustomerID = K.[KEY]

Comparacin entre FREETEXTTABLE y FREETEXT


En la consulta siguiente se ampla una consulta FREETEXTTABLE para que
devuelva primero las filas con clasificacin superior y agregue la clasificacin
de cada fila a la lista de seleccin. Para especificar la consulta, debe saber que
CategoryID es la columna de clave nica de la tabla Categories.
USE Northwind
GO
SELECT KEY_TBL.RANK, FT_TBL.Description
FROM Categories AS FT_TBL
INNER JOIN
FREETEXTTABLE(Categories, Description,
'How can I make my own beers and ales?') AS KEY_TBL
ON FT_TBL.CategoryID = KEY_TBL.[KEY]
ORDER BY KEY_TBL.RANK DESC
GO

Claudio Casares

115

ProInf.net, SCP
www.proinf.net

La nica diferencia en la sintaxis de FREETEXTTABLE y FREETEXT es la


insercin del nombre de la tabla como el primer parmetro.
Esto es una ampliacin de la misma consulta que slo devuelve las filas con un
valor de clasificacin de 10 o superior:
USE Northwind
GO
SELECT KEY_TBL.RANK, FT_TBL.Description
FROM Categories FT_TBL
INNER JOIN
FREETEXTTABLE (Categories, Description,
'How can I make my own beers and ales?') AS KEY_TBL
ON FT_TBL.CategoryID = KEY_TBL.[KEY]
WHERE KEY_TBL.RANK >= 10
ORDER BY KEY_TBL.RANK DESC
GO

4.15.10.

Identificacin del nombre de la columna de la clave nica

Las consultas que usan funciones que toman valores de conjuntos de filas son
complicadas porque es necesario saber el nombre de la columna de clave
exclusiva. Cada tabla habilitada para texto tiene la propiedad
TableFulltextKeyColumn que contiene el nmero de ID de la columna que ha
sido seleccionada para tener filas nicas en la tabla. En este ejemplo se
muestra cmo se puede obtener el nombre de la columna de clave y usarse en
la programacin.
USE Northwind
GO
DECLARE @key_column sysname
SET @key_column = Col_Name(Object_Id('Categories'),
ObjectProperty(Object_id('Categories'),
'TableFulltextKeyColumn')
)
print @key_column
EXECUTE ('SELECT Description, KEY_TBL.RANK
FROM Categories FT_TBL
INNER JOIN
FreetextTable (Categories, Description,
''How can I make my own beers and ales?'') AS KEY_TBL
ON FT_TBL.'
+ @key_column
+' = KEY_TBL.[KEY]
WHERE KEY_TBL.RANK >= 10
ORDER BY KEY_TBL.RANK DESC
')
GO

Claudio Casares

116

ProInf.net, SCP
www.proinf.net

Puede evitar la complejidad de la utilizacin de CONTAINSTABLE y


FREETEXTTABLE si escribe procedimientos almacenados que acepten unos
cuantos supuestos acerca de la consulta y, a continuacin, creen y ejecuten la
consulta adecuada. A continuacin se muestra un procedimiento simplificado
que emite una consulta FREETEXTTABLE. La tabla muestra los parmetros del
procedimiento (todas las entradas).
Parmetros

Opciona
Descripcin
l

Si hay algn predicado adicional, ste se


agrega con AND detrs del predicado
@additional_predicates Opcional
FREETEXT. KEY_TBL.RANK se puede usar
en expresiones.
@freetext_column

SI

@freetext_search

SI

@from_table

SI

@order_by_list

Opcional

KEY_TBL.RANK puede ser una de las


columnas especificadas.

@select_list

SI

KEY_TBL.RANK puede ser una de las


columnas especificadas.

Condicin de Bsqueda

El cdigo del procedimiento es el siguiente:


CREATE PROCEDURE freetext_rank_proc
@select_list nvarchar(1000),
@from_table nvarchar(517),
@freetext_column sysname,
@freetext_search nvarchar(1000),
@additional_predicates nvarchar(500) = '',
@order_by_list nvarchar(500) = ''
AS
BEGIN
DECLARE @table_id integer,
@unique_key_col_name sysname,
@add_pred_var nvarchar(510),
@order_by_var nvarchar(510)
-- Get the name of the unique key column for this table.
SET @table_id = Object_Id(@from_table)
SET @unique_key_col_name =
Col_Name( @table_id,
ObjectProperty(@table_id, 'TableFullTextKeyColumn') )
-- If there is an additional_predicate, put AND() around it.
Claudio Casares

ProInf.net, SCP
www.proinf.net

117

IF @additional_predicates <> ''


SET @add_pred_var = 'AND (' + @additional_predicates + ')'
ELSE
SET @add_pred_var = ''
-- Insert ORDER BY, if needed.
IF @order_by_list <> ''
SET @order_by_var = 'ORDER BY ' + @order_by_var
ELSE
SET @order_by_var = ''
-- Execute the SELECT statement.
EXECUTE ( 'SELECT '
+ @select_list
+ ' FROM '
+ @from_table
+ ' AS FT_TBL, FreetextTable('
+ @from_table
+ ','
+ @freetext_column
+ ','''
+ @freetext_search
+ ''') AS KEY_TBL '
+ 'WHERE FT_TBL.'
+ @unique_key_col_name
+ ' = KEY_TBL.[KEY] '
+ @add_pred_var
+''
+ @order_by_var
)
END
Este procedimiento se puede usar para emitir la consulta:
USE Northwind
GO
EXECUTE freetext_rank_proc
'Description, KEY_TBL.RANK', -- Select list
'Categories', -- From
'Description', -- Column
'How can I make my own beers and ales?', -- Freetext search
'KEY_TBL.RANK >= 10', -- Additional predicate
'KEY_TBL.RANK DESC' -- Order by
GO

Limitar los conjuntos de resultados


En muchas consultas de texto, el nmero de elementos que coinciden con la
condicin de bsqueda es muy grande. Para evitar que las consultas devuelvan
demasiadas coincidencias, utilice el argumento opcional, top_n_by_rank, en
Claudio Casares

118

ProInf.net, SCP
www.proinf.net

CONTAINSTABLE y FREETEXTTABLE para especificar el nmero de


coincidencias, ordenadas, que desea que se devuelvan.
Con esta informacin, Microsoft SQL SERVER ordena las coincidencias y
devuelve slo hasta completar el nmero especificado. Esta opcin puede
aumentar significativamente el rendimiento. Por ejemplo, una consulta que por
lo general devolvera 100.000 filas de una tabla de 1 milln se procesar de
forma ms rpida si slo se piden las 100 primeras filas.
Si slo se desea que se devuelvan las 3 coincidencias mayores del ejemplo
anterior, mediante CONTAINSTABLE, la consulta tendr esta forma:
USE Northwind
GO
SELECT K.RANK, CompanyName, ContactName, Address
FROM Customers AS C
INNER JOIN
CONTAINSTABLE(Customers,Address, 'ISABOUT ("des*",
Rue WEIGHT(0.5),
Bouchers WEIGHT(0.9))', 3) AS K
ON C.CustomerID = K.[KEY]

4.15.11.
Buscar palabras o frases con valores ponderados
(trmino ponderado)
Puede buscar palabras o frases y especificar un valor ponderado. El peso, un
nmero entre 0,0 y 1,0, indica el grado de importancia de cada palabra o frase
en un conjunto de palabras y frases. El valor 0,0 es el peso ms pequeo
disponible, y el valor 1,0 es el peso ms grande. Por ejemplo, en esta consulta
se buscan todas las direcciones de los clientes, con valores ponderados, en los
que cualquier texto que comience con la cadena "des" est cerca de Rue o
Bouchers. Microsoft SQL SERVER da una clasificacin superior a aquellas
filas que contienen la mayor cantidad de palabras especificadas. Por tanto, SQL
SERVER da una clasificacin superior a una fila que contiene des Rue Bouchers
que a una fila que contiene des Rue.
USE Northwind
GO
SELECT CompanyName, ContactName, Address
FROM Customers
WHERE CONTAINS(Address, 'ISABOUT ("*des*",
Rue WEIGHT(0.5),
Bouchers WEIGHT(0.9)
)')
GO
Un trmino ponderado se puede usar en conjuncin con cualquiera de los otros
cuatro tipos de trminos.
Claudio Casares

ProInf.net, SCP
www.proinf.net

119

4.15.12.
Combinar predicados de texto con otros predicados de
TRANSACT-SQL
Los predicados CONTAINS y FREETEXT se pueden combinar con el resto de
predicados de TRANSACT-SQL, como, por ejemplo, LIKE y BETWEEN; tambin
se pueden usar en una subconsulta. En este ejemplo se buscan descripciones
cuya categora no sea Seafood y que contengan la palabra "sauces" y la
palabra "seasonings".
USE Northwind
GO
SELECT Description
FROM Categories
WHERE CategoryName <> 'Seafood' AND
CONTAINS(Description, ' sauces AND seasonings ')
GO
En la siguiente consulta se usa CONTAINS dentro de una subconsulta. Con la
base de datos pubs, la consulta obtiene el valor del ttulo de todos los libros de
la tabla titles del publicador que se encuentra prximo al platillo volante de
Moonbeam, Ontario. (Esta informacin acerca del publicador se encuentra en la
columna pr_info de la tabla pub_info y slo hay uno de estos publicadores.)
USE pubs
GO
-- Add some interesting rows to some tables.
INSERT INTO publishers
VALUES ('9970', 'Penumbra Press', 'Moonbeam', 'ON', 'Canada')
INSERT INTO pub_info (pub_id, pr_info)
VALUES ('9970',
'Penumbra press is located in the small village of Moonbeam. Moonbeam is well
known as the flying saucer capital of Ontario. You will often find one or more
flying saucers docked close to the tourist information centre on the north side
of highway 11.')
INSERT INTO titles
VALUES ('FP0001', 'Games of the World', 'crafts', '9970', 9.85,
0.00, 20, 213, 'A crafts book! A sports book! A history book! The fun and
excitement of a world at play beautifully described and lavishly illustrated', '1977/09/15')
GO
-- Given the full-text catalog for these tables is pubs_ft_ctlg,
-- repopulate it so new rows are included in the full-text indexes.
sp_fulltext_catalog 'pubs_ft_ctlg', 'start_full'
WAITFOR DELAY '00:00:30' -- Wait 30 seconds for population.
GO
-- Issue the query.
SELECT T.title, P.pub_name
Claudio Casares

120

ProInf.net, SCP
www.proinf.net

FROM publishers P,
titles T
WHERE P.pub_id = T.pub_id
AND P.pub_id = (SELECT pub_id
FROM pub_info
WHERE CONTAINS (pr_info,
' moonbeam AND
ontario AND
"flying saucer" '))
GO

4.15.13.
Utilizar predicados de texto para consultar columnas de
tipo IMAGE
Los predicados CONTAINS y FREETEXT pueden utilizarse para buscar columnas
IMAGE indizadas.
En una sola columna IMAGE es posible almacenar muchos tipos de
documentos. Microsoft SQL SERVER admite ciertos tipos de documento y
proporciona filtros para los mismos. Esta versin proporciona filtros para
documentos de Office, archivos de texto y archivos HTML.
Cuando una columna IMAGE participa en un ndice de texto, el servicio de
texto comprueba las extensiones de los documentos de la columna IMAGE y
aplica el filtro correspondiente, para interpretar los datos binarios y extraer la
informacin de texto necesaria para la indizacin y la consulta.
As, cuando configure la indizacin de texto sobre una columna IMAGE de una
tabla, deber crear una columna separada para que contenga la informacin
relativa al documento. Esta columna de tipo debe ser de cualquier tipo de
datos basado en caracteres y contendr la extensin del archivo, como por
ejemplo DOC para los documentos de Microsoft Word. Si el tipo de columna es
NULL, el servicio de texto asumir que el documento es un archivo de texto.

En el Asistente para indizacin de texto, si selecciona una columna


IMAGE para la indizacin, deber especificar tambin una Columna de
enlace para que contenga el tipo de documento.
El procedimiento almacenado sp_fulltext_column acepta tambin un
argumento para la columna que contendr los tipos de documento.
El procedimiento almacenado sp_help_fulltext_columns devuelve
tambin el nombre de columna y el Id. de columna de la columna de
tipo de documento.

Una vez indizada, podr consultar la columna IMAGE como lo hara con
cualquier otra columna de la tabla, mediante los predicados CONTAINS y
FREETEXT.

Claudio Casares

ProInf.net, SCP
www.proinf.net

4.16.

121

Access: Bases externas


Para el acceso a bases de datos externas se utiliza la clusula IN. Se puede
acceder a bases de datos dBase, Paradox o Btrieve. Esta clusula slo permite
la conexin de una base de datos externa a la vez. Una base de datos externa
es una base de datos que no sea la activa. Aunque para mejorar los
rendimientos es mejor adjuntarlas a la base de datos actual y trabajar con
ellas.
Para especificar una base de datos que no pertenece a Access Basic, se agrega
un punto y coma (;) al nombre y se encierra entre comillas simples. Tambin
puede utilizar la palabra reservada DATABASE para especificar la base de datos
externa. Por ejemplo, las lneas siguientes especifican la misma tabla:
FROM Tabla IN '[dBASE IV; DATABASE=C: \DBASE\DATOS\VENTAS;]';
FROM Tabla IN 'C: \DBASE\DATOS\VENTAS' 'dBASE IV;'

Acceso a una base de datos externa de Microsoft Access:


SELECT
IdCliente
FROM
Clientes
IN 'C:\MISDATOS.MDB'
WHERE
IDCliente Like 'A*'
(En donde MISDATOS.MDB es el nombre de una base de datos de Microsoft
Access que contiene la tabla Clientes.)

Acceso a una base de datos externa de dBASE III o IV:


SELECT
IdCliente
FROM
Clientes
IN 'C:\DBASE\DATOS\VENTAS' 'dBASE IV';
WHERE
IDCliente Like 'A*'
(Para recuperar datos de una tabla de dBASE III+ hay que utilizar 'dBASE
III+;' en lugar de 'dBASE IV;'.)

Acceso a una base de datos de Paradox 3.x o 4.x:


SELECT
IdCliente
FROM
Clientes
IN 'C:\PARADOX\DATOS\VENTAS' 'Paradox 4.x;'
WHERE
IDCliente Like 'A*'
(Para recuperar datos de una tabla de Paradox versin 3.x, hay que sustituir
'Paradox 4.x;' por 'Paradox 3.x;'.)
Claudio Casares

122

ProInf.net, SCP
www.proinf.net

Acceso a una base de datos de Btrieve:


SELECT
IdCliente
FROM
Clientes
IN 'C:\BTRIEVE\DATOS\VENTAS\FILE.DDF' 'Btrieve;'
WHERE
IDCliente Like 'A*'
(C:\BTRIEVE\DATOS\VENTAS\FILE.DDF es la ruta de acceso y nombre de
archivo del archivo de definicin de datos de Btrieve.)

4.17.

Access: Parmetros
Las consultas con parmetros son aquellas cuyas condiciones de bsqueda se
definen mediante parmetros. Si se ejecutan directamente desde la base de
datos donde han sido definidas aparecer un mensaje solicitando el valor de
cada uno de los parmetros. Si deseamos ejecutarlas desde una aplicacin hay
que asignar primero el valor de los parmetros y despus ejecutarlas. Su
sintaxis es la siguiente:
PARAMETERS nombre1 tipo1, nombre2 tipo2, ... , nombreN tipoN Consulta
En donde:
nombre

Es el nombre del parmetro

tipo

Es el tipo de datos del parmetro

consulta

Una consulta SQL

Se pueden utilizar nombres pero no tipos de datos en una clusula WHERE o


HAVING.
PARAMETERS
PrecioMinimo Currency,
FechaInicio DateTime;
SELECT
IdPedido, Cantidad
FROM
Pedidos
WHERE
Precio = PrecioMinimo
AND
FechaPedido = FechaInicio

4.18.

Access: Omitir permisos


En entornos de bases de datos con permisos de seguridad para grupos de
trabajo se puede utilizar la clusula WITH OWNERACCESS OPTION para que el
usuario actual adquiera los derechos de propietario a la hora de ejecutar la
consulta. Su sintaxis es:
Claudio Casares

123

ProInf.net, SCP
www.proinf.net

instruccin sql WITH OWNERACCESS OPTION


SELECT
Apellido, Nombre, Salario
FROM
Empleados
ORDER BY
Apellido
WITH OWNERACCESS OPTION
Esta opcin requiere que est declarado el acceso al fichero de grupo de
trabajo (generalmente system.mda system .mdw) de la base de datos
actual.

4.19.

Access: Clusula PROCEDURE


Esta clusula es poco usual y se utiliza para crear una consulta a la misma vez
que se ejecuta, opcionalmente define los parmetros de la misma. Su sintaxis
es la siguiente:
PROCEDURE NombreConsulta Parmetro1 tipo1, .... ,
ParmetroN tipon ConsultaSQL
En donde:
NombreConsulta

Es el nombre con se guardar la consulta en la base de


datos.

Parmetro

Es el nombre de parmetro o de los parmetros de dicha


consulta.

tipo

Es el tipo de datos del parmetro

ConsultaSQL

Es la consulta que se desea grabar y ejecutar.

PROCEDURE
ListaCategorias;
SELECT DISTINCTROW
NombreCategoria, IdCategoria
FROM
Categorias
ORDER BY
NombreCategoria
(Asigna el nombre Lista_de_categoras a la consulta y la ejecuta.)
PROCEDURE
Resumen
FechaInicio DATETIME,
FechaFinal DATETIME;
SELECT DISTINCTROW
Claudio Casares

ProInf.net, SCP
www.proinf.net

124

FechaEnvio, IdPedido, ImportePedido, Format(FechaEnvio, "yyyy") AS Ao


FROM
Pedidos
WHERE
FechaEnvio Between FechaInicio And FechaFinal
(Asigna el nombre Resumen a la consulta e incluye dos parmetros.)

4.20.

Optimizar Sentencias
Introduccin
El lenguaje SQL es no procedimental, es decir, en las sentencias se indica que
queremos conseguir y no como lo tiene que hacer el interprete para
conseguirlo. Esto es pura teora, pues en la prctica a todos los gestores de
SQL hay que especificar sus propios truquitos para optimizar el rendimiento.
Por tanto, muchas veces no basta con especificar una sentencia SQL correcta,
sino que adems, hay que indicarle como tiene que hacerlo si queremos que el
tiempo de respuesta sea el mnimo. En este apartado veremos como mejorar el
tiempo de respuesta de nuestro interprete ante unas determinadas
situaciones:

Diseo de las tablas

Normaliza las tablas, al menos hasta la tercera forma normal, para asegurar
que no hay duplicidad de datos y se aprovecha al mximo el
almacenamiento en las tablas. Si hay que desnormalizar alguna tabla
piensa en la ocupacin y en el rendimiento antes de proceder.
Los primeros campos de cada tabla deben ser aquellos campos requeridos y
dentro de los requeridos primero se definen los de longitud fija y despus
los de longitud variable.
Ajusta al mximo el tamao de los campos para no desperdiciar espacio.
Es muy habitual dejar un campo de texto para observaciones en las tablas.
Si este campo se va a utilizar con poca frecuencia o si se ha definido con
gran tamao, por si acaso, es mejor crear una nueva tabla que contenga la
clave primaria de la primera y el campo para observaciones.

Gestin y eleccin de los ndices


Los ndices son campos elegidos arbitrariamente por el constructor de la base
de datos que permiten la bsqueda a partir de dicho campo a una velocidad
notablemente superior. Sin embargo, esta ventaja se ve contrarrestada por el
hecho de ocupar mucha ms memoria (el doble ms o menos) y de requerir
para su insercin y actualizacin un tiempo de proceso superior.
Evidentemente, no podemos indexar todos los campos de una tabla extensa ya
que doblamos el tamao de la base de datos. Igualmente, tampoco sirve de
mucho el indexar todos los campos en una tabla pequea ya que las
selecciones pueden efectuarse rpidamente de todos modos.
Un caso en el que los ndices pueden resultar muy tiles es cuando realizamos
peticiones simultneas sobre varias tablas. En este caso, el proceso de
Claudio Casares

ProInf.net, SCP
www.proinf.net

125

seleccin puede acelerarse sensiblemente si indexamos los campos que sirven


de nexo entre las dos tablas.
Los ndices pueden resultar contraproducentes si los introducimos sobre
campos triviales a partir de los cuales no se realiza ningn tipo de peticin ya
que, adems del problema de memoria ya mencionado, estamos ralentizando
otras tareas de la base de datos como son la edicin, insercin y borrado. Es
por ello que vale la pena pensarselo dos veces antes de indexar un campo que
no sirve de criterio para bsquedas o que es usado con muy poca frecuencia
por razones de mantenimiento.

Campos a Seleccionar

En la medida de lo posible hay que evitar que las sentencias SQL estn
embebidas dentro del cdigo de la aplicacin. Es mucho ms eficaz usar
vistas o procedimientos almacenados por que el gestor los guarda
compilados. Si se trata de una sentencia embebida el gestor debe
compilarla antes de ejecutarla.
Seleccionar exclusivamente aquellos que se necesiten
No utilizar nunca SELECT * por que el gestor debe leer primero la
estructura de la tabla antes de ejecutar la sentencia
Si utilizas varias tablas en la consulta especifica siempre a que tabla
pertenece cada campo, le ahorras al gestor el tiempo de localizar a que
tabla pertenece el campo. En lugar de SELECT Nombre, Factura FROM
Clientes, Facturacion WHERE IdCliente = IdClienteFacturado, usa: SELECT
Clientes.Nombre, Facturacion.Factura WHERE Clientes.IdCliente =
Facturacion.IdClienteFacturado.

Campos de Filtro

Se procurar elegir en la clusula WHERE aquellos campos que formen


parte de la clave del fichero por el cual interrogamos. Adems se
especificarn en el mismo orden en el que estn definidos en la clave.
Interrogar siempre por campos que sean clave.
Si deseamos interrogar por campos pertenecientes a indices compuestos es
mejor utilizar todos los campos de todos los indices. Supongamos que
tenemos un ndice formado por el campo NOMBRE y el campo APELLIDO y
otro ndice formado por el campo EDAD. La sentencia WHERE
NOMBRE='Juan' AND APELLIDO Like '%' AND EDAD = 20 sera ms optima
que WHERE NOMBRE = 'Juan' AND EDAD = 20 por que el gestor, en este
segundo caso, no puede usar el primer ndice y ambas sentencias son
equivalentes por que la condicin APELLIDO Like '%' devolvera todos los
registros.

Orden de las Tablas

Cuando se utilizan varias tablas dentro de la consulta hay que tener cuidado
con el orden empleado en la clausula FROM. Si deseamos saber cuantos
alumnos se matricularon en el ao 1996 y escribimos: FROM Alumnos,
Matriculas WHERE Alumno.IdAlumno = Matriculas.IdAlumno AND
Matriculas.Ao = 1996 el gestor recorrer todos los alumnos para buscar
Claudio Casares

ProInf.net, SCP
www.proinf.net

126

sus matriculas y devolver las correspondientes. Si escribimos FROM


Matriculas, Alumnos WHERE Matriculas.Ao = 1996 AND
Matriculas.IdAlumno = Alumnos.IdAlumnos, el gestor filtra las matrculas y
despus selecciona los alumnos, de esta forma tiene que recorrer menos
registros.

Claudio Casares

127

ProInf.net, SCP
www.proinf.net

5. APNDICES
5.1.

Las 12 reglas de Codd que determinan la fidelidad de un


sistema relacional al modelo relacional
En la dcada de los 80 comenzaron a aparecer numerosos SGBD que se
anunciaban como "relacionales". Sin embargo estos sistemas carecan de
muchas caractersticas que se consideran importantes en un sistema
relacional, perdiendo muchas ventajas del modelo relacional. Como ejemplo
extremo de esto "sistemas relacionales" eran simplemente sistemas que
utilizaban tablas para almacenar la informacin, no disponiendo de elementos
como claves primarias, etc.
En 1984 Codd public 12 reglas que un verdadero sistema relacional debera
de cumplir. En la prctica algunas de ellas son difciles de realizar.
Un sistema podr considerarse "ms relacional" cuanto ms siga estas reglas.

Regla 0
Para que un sistema se denomine sistema de gestin de bases de datos
relacionales, este sistema debe usar (exclusivamente) sus capacidades
relacionales para gestionar la base de datos.

Regla 1: Regla de la informacin


Toda la informacin en una base de datos relacional se representa
explcitamente en el nivel lgico exactamente de una manera: con valores en
tablas.
Por tanto los metadatos (diccionario, catlogo) se representan exactamente
igual que los datos de usuario.
Y puede usarse el mismo lenguaje (ej. SQL) para acceder a los datos y a los
metadatos (regla 4)
Un valor posible es el valor nulo, con sus dos interpretaciones:
Valor desconocido (ej. direccin desconocida)
Valor no aplicable (ej. empleado soltero no tiene esposa).

Regla 2: Regla del acceso garantizado


Para todos y cada uno de los datos (valores atmicos) de una BDR se garantiza
que son accesibles a nivel lgico utilizando una combinacin de nombre de
tabla, valor de clave primaria y nombre de columna.
Cualquier dato almacenado en una BDR tiene que poder ser direccionado
univocamente. Para ello hay que indicar en qu tabla est, cul es la
columna y cul es la fila (mediante la clave primaria).
Por tanto se necesita el concepto de clave primaria, que no es soportado en
muchas implementaciones. En estos casos, para lograr un efecto similar se
puede hacer lo siguiente:
Hacer que los atributos clave primaria no puedan ser nulos (NOT NULL).
Crear un ndice nico sobre la clave primaria.
Claudio Casares

ProInf.net, SCP
www.proinf.net

128

No eliminar nunca el ndice.

Regla 3: Tratamiento sistemtico de valores nulos


Los valores nulos (que son distintos de la cadena vaca, blancos, 0, ...) se
soportan en los SGBD totalmente relacionales para representar informacin
desconocida o no aplicable de manera sistemtica, independientemente del
tipo de datos.
Se reconoce la necesidad de la existencia de valores nulos, para un
tratamiento sistemtico de los mismos.
Hay problemas para soportar los valores nulos en las operaciones
relacionales, especialmente en las operaciones lgicas.
o Lgica trivaluada. Es una posible solucin. Existen tres (no dos) valores
de verdad: Verdadero, Falso y Desconocido (null). Se crean tablas de
verdad para las operaciones lgicas:
- null Y null = null
- Verdadero Y null = null
- Falso Y null = Falso
- Verdadero O null = Verdadero
- etc.
Un inconveniente es que de cara al usuario el manejo de los lenguajes
relacionales se complica pues es ms difcil de entender.

Regla 4: Catlogo dinmico en lnea basado en el modelo relacional


La descripcin de la base de datos se representa a nivel lgico de la misma
manera que los datos normales, de modo que los usuarios autorizados pueden
aplicar el mismo lenguaje relacional a su consulta, igual que lo aplican a los
datos normales.
Es una consecuencia de la regla 1 que se destaca por su importancia. Los
metadatos se almacenan usando el modelo relacional, con todas las
consecuencias.

Regla 5: Regla del sublenguaje de datos completo


Un sistema relacional debe soportar varios lenguajes y varios modos de uso de
terminal (ej: rellenar formularios, etc.). Sin embargo, debe existir al menos un
lenguaje cuyas sentencias sean expresables, mediante una sintaxis bien
definida, como cadenas de caracteres y que sea completo, soportando:
Definicin de datos
Definicin de vistas
Manipulacin de datos (interactiva y por programa)
Limitantes de integridad
Limitantes de transaccin (iniciar, realizar, deshacer) (Begin, commit,
rollback).
Adems de poder tener interfaces ms amigables para hacer consultas, etc.
siempre debe de haber una manera de hacerlo todo de manera textual, que
es tanto como decir que pueda ser incorporada en un programa tradicional.
Un lenguaje que cumple esto en gran medida es SQL.

Claudio Casares

ProInf.net, SCP
www.proinf.net

129

Regla 6: Regla de actualizacin de vistas


Todas las vistas que son tericamente actualizables se pueden actualizar por el
sistema.
El problema es determinar cules son las vistas tericamente actualizables,
ya que no est muy claro.
Cada sistema puede hacer unas suposiciones particulares sobre las vistas
que son actualizables.

Regla 7: Insercin, actualizacin y borrado de alto nivel


La capacidad de manejar una relacin base o derivada como un solo operando
se aplica no slo a la recuperacin de los datos (consultas), si no tambin a la
insercin, actualizacin y borrado de datos.
Esto es, el lenguaje de manejo de datos tambin debe ser de alto nivel (de
conjuntos). Algunas bases de datos inicialmente slo podian modificar las
tuplas de la base de datos de una en una (un registro de cada vez).

Regla 8: independencia fsica de datos


Los programas de aplicacin y actividades del terminal permanecen inalterados
a nivel lgico cuandoquiera que se realicen cambios en las representaciones de
almacenamiento o mtodos de acceso.
El modelo relacional es un modelo lgico de datos, y oculta las
caractersticas de su representacin fsica.

Regla 9: Independencia lgica de datos


Los programas de aplicacin y actividades del terminal permanecen inalterados
a nivel lgico cuandoquiera que se realicen cambios a las tablas base que
preserven la informacin.
Cuando se modifica el esquema lgico preservando informacin (no valdra
p.ej. eliminar un atributo) no es necesario modificar nada en niveles
superiores.
Ejemplos de cambios que preservan la informacin:
o Aadir un atributo a una tabla base.
o Sustituir dos tablas base por la unin de las mismas. Usando vistas de la
unin puedo recrear las tablas anteriores...

Regla 10: Independencia de integridad


Los limitantes de integridad especficos para una determinada base de datos
relacional deben poder ser definidos en el sublenguaje de datos relacional, y
almacenables en el catlogo, no en los programas de aplicacin.
El objetivo de las bases de datos no es slo almacenar los datos, si no
tambin sus relaciones y evitar que estas (limitantes) se codifiquen en los
programas. Por tanto en una BDR se deben poder definir limitantes de
integridad.
Cada vez se van ampliando ms los tipos de limitantes de integridad que se
pueden utilizar en los SGBDR, aunque hasta hace poco eran muy escasos.
Como parte de los limitantes inherentes al modelo relacional (forman parte
de su definicin) estn:
Claudio Casares

ProInf.net, SCP
www.proinf.net

o
o

130

Una BDR tiene integridad de entidad. Es decir, toda tabla debe tener una
clave primaria.
Una BDR tiene integridad referencial. Es decir, toda clave externa no
nula debe existir en la relacin donde es primaria.

Regla 11: Independencia de distribucin


Una BDR tiene independencia de distribucin.
Las mismas rdenes y programas se ejecutan igual en una BD centralizada
que en una distribuida.
Las BDR son fcilmente distribuibles:
Se parten las tablas en fragmentos que se distribuyen.
Cuando se necesitan las tablas completas se recombinan usando
operaciones relacionales con los fragmentos.
Sin embargo se complica ms la gestin interna de la integridad, etc.
Esta regla es responsable de tres tipos de transparencia de distribucin:
Transparencia de localizacin. El usuario tiene la impresin de que
trabaja con una BD local. (aspecto de la regla de independencia fsica)
Transparencia de fragmentacin. El usuario no se da cuenta de que la
relacin con que trabaja est fragmentada. (aspecto de la regla de
independencia lgica de datos).
Transparencia de replicacin. El usuario no se da cuenta de que pueden
existir copias (rplicas) de una misma relacin en diferentes lugares.

Regla 12: regla de la no subversin


Si un sistema relacional tiene un lenguaje de bajo nivel (un registro de cada
vez), ese bajo nivel no puede ser usado para saltarse (subvertir) las reglas de
integridad y los limitantes expresados en los lenguajes relacionales de ms alto
nivel (una relacin (conjunto de registros) de cada vez).
Algunos problemas no se pueden solucionar directamente con el lenguaje
de alto nivel.
Normalmente se usa SQL inmerso en un lenguaje anfitrin para solucionar
estos problemas. Se utiliza el concepto de cursor para tratar
individualmente las tuplas de una relacin. En cualquier caso no debe ser
posible saltarse los limitantes de integridad impuestos al tratar las tuplas a
ese nivel.

Claudio Casares

Anda mungkin juga menyukai