Anda di halaman 1dari 5

La frmula propuesta para la estimacin de accesos a disco para consultas de rango

Nuestro objetivo aqu es obtener una forma rpida de estimar el nmero de accesos a disco DA necesaria para responder a una consulta de rango

Apuntando a este objetivo, se presenta los siguientes lemas:

Lema 1 :
Para una consulta de rango Con un radio que cubre , el Nmero promedio de accesos a disco en un determinado subconjunto del Conjunto M de los nodos de un rbol mtrico viene dada por:

Prueba: El volumen de una hper-esfera de la dimensin D y el radio R es

Donde

es una constante

La probabilidad esperada de cualquier punto de consulta que trae un nodo Dado se puede medir mediante la adopcin de la (hper-) volumen que cubre ese nodo dividido por el volumen global cubierto por el rbol metrico que es: Suponemos que el conjunto de datos se comporta como un colector con dimensionalidad intrnseca asi : Entonces podemos generalizar para predecir el numero promedio de accesos a disco necesarios para recuperar un nodo por un punto de consulta asi : El nmero esperado de acceso a disco en cualquier subconjunto del Conjunto de nodos del arbol es la suma de las probabilidades
Un rango de consulta de radio rp es equivalente una consulta de puntos sobre un Arbol Metrico modificado en el que el radio que cubre cada nodo se amplia + radio de busquedad rq asi :

Lema 2:
El nmero de objetos que se pueden almacenar en cada nivel del rbol es:

Prueba: Asumiendo un rbol con fan-out

en cada nodo

En una mtrica-rbol, cada objeto se copia en los nodos hoja Es decir, considerando h = H-1 para los nodos hoja, Luego, usando el Lema 2 tenemos:

Suponemos que el algoritmo para construir el mtrica-rbol es "bueno", es decir: que el nmero de objetos en cualquier nodo es aproximadamente el mismo, que cada nodo cubre los objetos ms cercanos en cada regin, y que hay una superposicin mnima de la zona que abarca entre los nodos "hermanos" en el mismo nivel. Teniendo en cuenta esto, podemos indicar los siguientes dos lemas.

Lema 3: El radio de cobertura media rh de un nodo en un nivel h viene dada por:

Demostracin: Partimos esta prueba calculando el radio de cobertura de los nodos hoja. Teniendo en cuenta el nmero total de objetos No en el rbol metrico, el nmero aproximado de nodos de hoja se puede expresar como:

Siempre con el supuesto que los arboles son buenos, es decir, los nodos corresponden a las formas (rectngulos delimitadores, esferas, etc.) que son bien cerrados. Dejar es el radio medio de los nodos en el nivel de hoja. Un exponente de la distancia implica que el conjunto de objetos se comporte como un colector de la dimensionalidad En ese caso, el nmero de esferas de radio que se requieren para cubrir el No objetos seran

Lema 4:
Para un rbol -mtrico ptimo, el nmero total de accesos a disco en todos los nodos de arbol-mtrico que son necesarios para responder a las consultas de rango qr con la cubertura de radio r puede calcularse como:

Demostracion : el lema 1 nos da el nmero previsto de los accesos al disco para cualquier subconjunto de nodos del rbol - mtrico, como el conjunto de los nodos o los nodos de hojas. Combinando Lema 1 con : se puede estimar el nmero medio de acceso en nodos de hoja del rbol para una consulta qr

Anda mungkin juga menyukai