Combinando Clustering con Aproximación Espacial para Búsquedas en Espacios Métricos

Marcelo Barroso, Gonzalo Navarro and Nora Reyes

El modelo de espacios métricos permite abstraer muchos de los problemas de búsqueda por proximidad. La búsqueda por proximidad tiene múltiples aplicaciones especialmente en el área de bases de datos multimedia. La idea es construir un índice para la base de datos de manera tal de acelerar las consultas por proximidad o similitud. Aunque existen varios índices prometedores, pocos de ellos son dinámicos, es decir, una vez creados muy pocos permiten realizar inserciones y eliminaciones de elementos a un costo razonable.

El Árbol de Aproximación Espacial (dsa-tree) es un índice recientemente propuesto, que ha demostrado tener buen desempeño en las búsquedas y que además es totalmente dinámico. En este trabajo nos proponemos obtener una nueva estructura de datos para búsqueda en espacios métricos, basada en el dsa-tree, que mantenga sus virtudes y que aproveche que en muchos espacios existen clusters de elementos y que además pueda hacer un mejor uso de la memoria disponible para mejorar las búsquedas. Detallaremos el funcionamiento de esta nueva estructura de datos y mostraremos experimentalmente que nuestra estructura es competitiva para búsquedas en espacios métricos.