Anda di halaman 1dari 32

Estudio sobre Restricciones de Integridad para Bases de datos de grafo Paula A.

Ramos Alczar a Introduccin o Marco terico o Desarrollo de la memoria Conclusiones Trabajo futuro

Estudio sobre Restricciones de Integridad para Bases de datos de grafo


Paula A. Ramos Alczar a
Universidad de Talca - Campus Los Niches

Marzo 2012

1 / 32

Motivacin y Problema o
Estudio sobre Restricciones de Integridad para Bases de datos de grafo Paula A. Ramos Alczar a Introduccin o Marco terico o Desarrollo de la memoria Conclusiones Trabajo futuro

Existen algunas nociones de Restricciones de Integridad para bases de datos de grafo, pero es muy poco lo que ha sido denido de manera formal. Cules son las restricciones de integridad pertenecientes a a los diferentes modelos de bases de datos? Cules de las restricciones estudiadas pueden ser a aplicadas sobre grafos? De qu forma pueden ser aplicadas? e

2 / 32

Objetivos
Objetivo General
Estudio sobre Restricciones de Integridad para Bases de datos de grafo Paula A. Ramos Alczar a Introduccin o Marco terico o Desarrollo de la memoria Conclusiones Trabajo futuro

Estudiar y proponer nociones de restricciones de integridad para bases de datos de grafos.

3 / 32

Objetivos
Objetivos Espec cos
Estudio sobre Restricciones de Integridad para Bases de datos de grafo Paula A. Ramos Alczar a Introduccin o Marco terico o Desarrollo de la memoria Conclusiones Trabajo futuro

Estudiar las restricciones de integridad usadas en distintos modelos de B.D. Seleccionar Restricciones de Integridad que puedan aplicarse a una Base de datos de grafo. Denir nociones de restricciones de integridad para bases de datos de grafos. Estudiar como vericar restricciones de integridad usando SPARQL.

4 / 32

Metodolog a
Estudio sobre Restricciones de Integridad para Bases de datos de grafo Paula A. Ramos Alczar a Introduccin o Marco terico o Desarrollo de la memoria Conclusiones Trabajo futuro

Estudio de conceptos tales como: Base de datos de grafo, RDF, RDF-Schema y SPARQL. Estudio detallado del modelo de base de datos de grafo y restricciones de integridad en diferentes modelos de bases de datos. Seleccin de restricciones de integridad que pueden ser o aplicadas en bases de datos de grafos. Denicin formal de restricciones de integridad para bases o de datos de grafo. Prueba de concepto para evaluar o validar sintcticamente a las nociones de restricciones de integridad planteadas dentro de la solucin propuesta seleccionada. o

5 / 32

Base de datos de grafo


Estudio sobre Restricciones de Integridad para Bases de datos de grafo Paula A. Ramos Alczar a Introduccin o Marco terico o Desarrollo de la memoria Conclusiones Trabajo futuro

Representa la informacin que contiene basndose en una o a estructura de grafo. Como una de las formas ms generales de representacin de a o datos, el grafo representa fcilmente las entidades, sus a atributos y sus relaciones con otras entidades.

6 / 32

Restricciones de integridad
Estudio sobre Restricciones de Integridad para Bases de datos de grafo Paula A. Ramos Alczar a Introduccin o Marco terico o Desarrollo de la memoria Conclusiones Trabajo futuro

Son declaraciones o reglas que permiten mantener la consistencia en una base de datos. Por ejemplo: Restricciones de Dominio Integridad Referencial Asertos y Disparadores Dependencias Funcionales

7 / 32

RDF, RDF Schema y SPARQL


Estudio sobre Restricciones de Integridad para Bases de datos de grafo Paula A. Ramos Alczar a Introduccin o Marco terico o Desarrollo de la memoria Conclusiones Trabajo futuro

Aunque una base de datos RDF, no es considerada precisamente una base de datos de grafo RDF: proviene de la sigla del ingls Resource Description e Framework, Plataforma para Descripcin de Recursos, un o lenguaje de descripcin del W3C. o RDF-Schema: Es un lenguaje que proporciona los elementos bsicos para la descripcin de vocabularios y provee adems a o a mecanismos para la descripcin de grupos de recursos o relacionados y las relaciones entre estos recursos. SPARQL: SPARQL es el lenguaje de consulta para RDF recomendado por la W3C. Est basado en comparacin de a o patrones de grafo (triples).

8 / 32

Restricciones de integridad existentes en bases de datos


Modelo Relacional
Estudio sobre Restricciones de Integridad para Bases de datos de grafo Paula A. Ramos Alczar a Introduccin o Marco terico o Desarrollo de la memoria Conclusiones Trabajo futuro

9 / 32

Restricciones de integridad existentes en bases de datos


Modelo Orientado a Objetos
Estudio sobre Restricciones de Integridad para Bases de datos de grafo Paula A. Ramos Alczar a Introduccin o Marco terico o Desarrollo de la memoria Conclusiones Trabajo futuro

10 / 32

Restricciones de integridad existentes en bases de datos


Modelo Semiestructurado
Estudio sobre Restricciones de Integridad para Bases de datos de grafo Paula A. Ramos Alczar a Introduccin o Marco terico o Desarrollo de la memoria Conclusiones Trabajo futuro

11 / 32

Restricciones de integridad existentes en bases de datos


Modelo Deductivo
Estudio sobre Restricciones de Integridad para Bases de datos de grafo Paula A. Ramos Alczar a Introduccin o Marco terico o Desarrollo de la memoria Conclusiones Trabajo futuro

12 / 32

Restricciones de integridad existentes en bases de datos


Modelo de Grafos
Estudio sobre Restricciones de Integridad para Bases de datos de grafo Paula A. Ramos Alczar a Introduccin o Marco terico o Desarrollo de la memoria Conclusiones Trabajo futuro

13 / 32

Restricciones de integridad aplicables a grafos


Estudio sobre Restricciones de Integridad para Bases de datos de grafo Paula A. Ramos Alczar a Introduccin o Marco terico o Desarrollo de la memoria Conclusiones Trabajo futuro

Restriccin de tipo de dato: Restricciones de dominio del o modelo relacional. Atributo obligatorio: Incluida dentro de las restricciones de dominio. Dato Not Null del Modelo relacional. Atributo de valor unico: Integridad referencial - clave primaria del Modelo relacional.

14 / 32

Restricciones de integridad aplicables a grafos


Estudio sobre Restricciones de Integridad para Bases de datos de grafo Paula A. Ramos Alczar a Introduccin o Marco terico o Desarrollo de la memoria Conclusiones Trabajo futuro

Atributo no nulo: Restriccin de objeto del Modelo o Orientado a Objetos. Integridad de relaciones: Integridad de relaciones del Modelo Orientado a Objetos. Lenguaje de Ontolog Web as (OWL). Restriccin de Patrn: Modelo de Grafo. o o

15 / 32

Denicin formal de restricciones o


Estudio sobre Restricciones de Integridad para Bases de datos de grafo Paula A. Ramos Alczar a Introduccin o Marco terico o Desarrollo de la memoria Conclusiones Trabajo futuro

Nombre Restriccin: Restriccin de tipo de dato. o o Referencia: Restricciones de dominio del modelo relacional. Trmino: ic:dataType e Semntica: ic:dataType es usado para vericar el formato a de datos del valor de una propiedad. El triple P ic:dataType T , establece que el valor de la propiedad P, satisface el formato del tipo de dato T. Ejemplo: fb:id rdf:type ic:dataType .

16 / 32

Denicin formal de restricciones o


Estudio sobre Restricciones de Integridad para Bases de datos de grafo Paula A. Ramos Alczar a Introduccin o Marco terico o Desarrollo de la memoria Conclusiones Trabajo futuro

Nombre Restriccin: Atributo obligatorio. o Referencia: Incluida dentro de las restricciones de dominio. Dato Not Null del Modelo relacional. Trmino: ic:mandatory e Semntica: El triple C ic:mandatory P, establece que P es a una propiedad obligatoria para todo recurso perteneciente a la clase C, es decir, para todo recurso R1, tal que existe R1 rdf:type C1 se cumple que existe R1 P1 V1 donde V1 es rdfs:range de P1 Ejemplo: fb:name rdf:type ic:mandatory .

17 / 32

Denicin formal de restricciones o


Estudio sobre Restricciones de Integridad para Bases de datos de grafo Paula A. Ramos Alczar a Introduccin o Marco terico o Desarrollo de la memoria Conclusiones Trabajo futuro

Nombre Restriccin: Atributo de valor unico. o Referencia: Integridad referencial - clave primaria del Modelo relacional. Trmino: ic:primaryKey e Semntica: El triple C ic:primaryKey P, establece que P es a una propiedad de valor unico para toda entidad de una clase C. Es decir, para todo recurso R1 y R2, tal que existe R1 rdf:type C y R2 rdf:type C se cumple que, si existe R1 P1 V1 y R2 P1 V2 donde V1 y V2 son ambas rdfs:range de P1, entonces V1 y V2 deben ser diferentes entre si. Ejemplo: fb:username rdf:type ic:primaryKey .

18 / 32

Denicin formal de restricciones o


Estudio sobre Restricciones de Integridad para Bases de datos de grafo Paula A. Ramos Alczar a Introduccin o Marco terico o Desarrollo de la memoria Conclusiones Trabajo futuro

Nombre Restriccin: Atributo no nulo. o Referencia: Restriccin de objeto del Modelo Orientado a o Objetos. Trmino: ic:notEmpty e Semntica: El triple C ic:notEmpty P, establece que P es a una propiedad que debe contener un valor Literal, para todo recurso perteneciente a la clase C, es decir, para todo recurso R1, tal que existe R1 rdf:type C1 se cumple que, si existe R1 P1 V1 donde V1 es rdfs:range de P1, entonces V1 no puede contener la cadena vac a. Ejemplo: fb:email rdf:type ic:notEmpty .

19 / 32

Denicin formal de restricciones o


Estudio sobre Restricciones de Integridad para Bases de datos de grafo Paula A. Ramos Alczar a Introduccin o Marco terico o Desarrollo de la memoria Conclusiones Trabajo futuro

Nombre Restriccin: Integridad de relaciones. o Referencia: Integridad de relaciones del Modelo Orientado a Objetos. Lenguaje de Ontolog Web (OWL) as Trmino: ic:SymmetricProperty e Semntica: El triple P1 ic:SymmetricProperty P2, donde a P1 y P2 son instancias de rdf:Property, C1 y C2 son instancias de rdfs:Class, P1 es ic:SymmetricProperty de P2 Para todo recurso R1 y R2, tal que existen R1 rdf:type C1 y R2 rdf:type C2, si el par (R1, R2) es una instancia de P1, entonces el par (R2, R1) es tambin una instancia de P1. e Ejemplo: fb:mother ic:SymmetricProperty fb:daughter .

20 / 32

Denicin caso de prueba o


Estudio sobre Restricciones de Integridad para Bases de datos de grafo Paula A. Ramos Alczar a Introduccin o Marco terico o Desarrollo de la memoria Conclusiones Trabajo futuro

Para denir un caso de prueba: Se utiliz la informacin contenida en la red social o o Facebook, generando una denicin de su vocabulario o con RDF-Schema Se gener una instancia que contiene los datos de cada o personas, en RDF En base a esto se generaron los ejemplos presentados en la denicin de las restricciones. o

21 / 32

Evaluacin o validacin sintctica o o a


Restriccin de tipo de dato o
Estudio sobre Restricciones de Integridad para Bases de datos de grafo Paula A. Ramos Alczar a Introduccin o Marco terico o Desarrollo de la memoria Conclusiones Trabajo futuro

Considerando una propiedad P y un trmino T: e Restriccin: P ic:dataType T o Consulta SPARQL: ASK FROM archivo WHERE{?x fb:id ?y}FILTER(regex(?y,[0-9]$)) Respuesta: falso, la restriccin no se cumple. o

22 / 32

Evaluacin o validacin sintctica o o a


Atributo obligatorio
Estudio sobre Restricciones de Integridad para Bases de datos de grafo Paula A. Ramos Alczar a Introduccin o Marco terico o Desarrollo de la memoria Conclusiones Trabajo futuro

Considerando una clase C y una propiedad P: Restriccin: C ic:mandatory P o Consulta SPARQL: ASK FROM archivo WHERE{{?x rdf:type C} OPTIONAL{?x P ?y}}FILTER(bound(?y)) Respuesta: verdadero, la restriccin no se cumple. o

23 / 32

Evaluacin o validacin sintctica o o a


Atributo de valor unico
Estudio sobre Restricciones de Integridad para Bases de datos de grafo Paula A. Ramos Alczar a Introduccin o Marco terico o Desarrollo de la memoria Conclusiones Trabajo futuro

Considerando una clase C y una propiedad P: Restriccin: C ic:primaryKey P o Consulta SPARQL: ASK FROM archivo WHERE{{?x rdf:type C . ?y rdf:type C} . {?x P ?v1 . ?y P ?v2 }} FILTER(?x != ?y && ?v1 =?v2 ) Respuesta: verdadero, la restriccin no se cumple. o

24 / 32

Evaluacin o validacin sintctica o o a


Atributo no nulo
Estudio sobre Restricciones de Integridad para Bases de datos de grafo Paula A. Ramos Alczar a Introduccin o Marco terico o Desarrollo de la memoria Conclusiones Trabajo futuro

Considerando una clase C y una propiedad P: Restriccin: C ic:notEmpty P o Consulta SPARQL: ASK FROM archivo WHERE{?x P ?y}FILTER(?y = ) Respuesta: verdadero, la restriccin no se cumple. o

25 / 32

Evaluacin o validacin sintctica o o a


Integridad de relaciones
Estudio sobre Restricciones de Integridad para Bases de datos de grafo Paula A. Ramos Alczar a Introduccin o Marco terico o Desarrollo de la memoria Conclusiones Trabajo futuro

Considerando dos propiedades P1 y P2 : Restriccin: Integridad de relaciones o (P1 ic:SymmetricProperty P2 ) Consulta SPARQL: ASK FROM archivo WHERE{{?x P1 ?y}MINUS{{?x P1 ?y}AND{?y P2 ?x}} Respuesta: verdadero, la restriccin no se cumple. o

26 / 32

Prototipo validador de restricciones


Estudio sobre Restricciones de Integridad para Bases de datos de grafo Paula A. Ramos Alczar a Introduccin o Marco terico o Desarrollo de la memoria Conclusiones Trabajo futuro

Arquitectura del prototipo.

27 / 32

Prototipo validador de restricciones


Estudio sobre Restricciones de Integridad para Bases de datos de grafo Paula A. Ramos Alczar a Introduccin o Marco terico o Desarrollo de la memoria Conclusiones Trabajo futuro

28 / 32

Prototipo validador de restricciones


Estudio sobre Restricciones de Integridad para Bases de datos de grafo Paula A. Ramos Alczar a Introduccin o Marco terico o Desarrollo de la memoria Conclusiones Trabajo futuro

Respuesta entregada

29 / 32

Conclusiones
Estudio sobre Restricciones de Integridad para Bases de datos de grafo Paula A. Ramos Alczar a Introduccin o Marco terico o Desarrollo de la memoria Conclusiones Trabajo futuro

Similitud del modelo de grafos con los otros modelos de datos permiti que la seleccin de restricciones de o o integridad fuera ms acertiva al momento de realizar la a denicin formal. o Se logr identicar y denir varias Restricciones de o Integridad. Demostracin de la utilidad de RDF Schema como o lenguaje para representar vocabularios en contextos espec cos. Adems, la expresividad del lenguaje SPARQL a permiti una validacin automtica ms simple. o o a a

30 / 32

Trabajo futuro
Estudio sobre Restricciones de Integridad para Bases de datos de grafo Paula A. Ramos Alczar a Introduccin o Marco terico o Desarrollo de la memoria Conclusiones Trabajo futuro

Permitir validacin de tipos de datos ms complejas o a Permitir validacin de restricciones complejas (de patrn) o o Investigar restricciones de integridad adicionales Desarrollar una aplicacin ad-hoc para vericar las o restricciones Estudiar la complejidad de vericar las restricciones de integridad

31 / 32

Estudio sobre Restricciones de Integridad para Bases de datos de grafo Paula A. Ramos Alczar a Introduccin o Marco terico o Desarrollo de la memoria Conclusiones Trabajo futuro

Gracias por su atencin. o

32 / 32

Anda mungkin juga menyukai