Nuestro objetivo aqu es obtener una forma rpida de estimar el nmero de accesos a disco DA necesaria para responder a una consulta de rango
Lema 1 :
Para una consulta de rango Con un radio que cubre , el Nmero promedio de accesos a disco en un determinado subconjunto del Conjunto M de los nodos de un rbol mtrico viene dada por:
Donde
es una constante
La probabilidad esperada de cualquier punto de consulta que trae un nodo Dado se puede medir mediante la adopcin de la (hper-) volumen que cubre ese nodo dividido por el volumen global cubierto por el rbol metrico que es: Suponemos que el conjunto de datos se comporta como un colector con dimensionalidad intrnseca asi : Entonces podemos generalizar para predecir el numero promedio de accesos a disco necesarios para recuperar un nodo por un punto de consulta asi : El nmero esperado de acceso a disco en cualquier subconjunto del Conjunto de nodos del arbol es la suma de las probabilidades
Un rango de consulta de radio rp es equivalente una consulta de puntos sobre un Arbol Metrico modificado en el que el radio que cubre cada nodo se amplia + radio de busquedad rq asi :
Lema 2:
El nmero de objetos que se pueden almacenar en cada nivel del rbol es:
en cada nodo
En una mtrica-rbol, cada objeto se copia en los nodos hoja Es decir, considerando h = H-1 para los nodos hoja, Luego, usando el Lema 2 tenemos:
Suponemos que el algoritmo para construir el mtrica-rbol es "bueno", es decir: que el nmero de objetos en cualquier nodo es aproximadamente el mismo, que cada nodo cubre los objetos ms cercanos en cada regin, y que hay una superposicin mnima de la zona que abarca entre los nodos "hermanos" en el mismo nivel. Teniendo en cuenta esto, podemos indicar los siguientes dos lemas.
Demostracin: Partimos esta prueba calculando el radio de cobertura de los nodos hoja. Teniendo en cuenta el nmero total de objetos No en el rbol metrico, el nmero aproximado de nodos de hoja se puede expresar como:
Siempre con el supuesto que los arboles son buenos, es decir, los nodos corresponden a las formas (rectngulos delimitadores, esferas, etc.) que son bien cerrados. Dejar es el radio medio de los nodos en el nivel de hoja. Un exponente de la distancia implica que el conjunto de objetos se comporte como un colector de la dimensionalidad En ese caso, el nmero de esferas de radio que se requieren para cubrir el No objetos seran
Lema 4:
Para un rbol -mtrico ptimo, el nmero total de accesos a disco en todos los nodos de arbol-mtrico que son necesarios para responder a las consultas de rango qr con la cubertura de radio r puede calcularse como:
Demostracion : el lema 1 nos da el nmero previsto de los accesos al disco para cualquier subconjunto de nodos del rbol - mtrico, como el conjunto de los nodos o los nodos de hojas. Combinando Lema 1 con : se puede estimar el nmero medio de acceso en nodos de hoja del rbol para una consulta qr