Algoritmos y Estructuras de Datos para Búsqueda de Objetos Similares

V. Cuquejo, R. Baeza-Yates and G. Navarro

La búsqueda de objetos similares a un objeto dado dentro de una base de datos de objetos, bajo un cierto criterio de similaridad conocido de antemano, tiene varias aplicaciones en computación. Varios algoritmos existen para resolver esta búsqueda utilizando para la indexación los modelos de semejanza que definen un espacio vectorial y un espacio métrico.

En el espacio vectorial sobresale la estructura K-d tree, método de acceso en memoria principal, ya que propuso ideas qur han sido utilizadas en varios métodos de acceso a datos en disco. Por otro lado, el R-tree es un método de memoria secundaria que ha sido implementado en sistemas académicos y comerciales como POSTGRES e ILLUSTRA. Desafortunadamente, cuando la dimension del objeto crece, ambas estructuras requieren más espacio y las consultas se hacen más lentas, por lo que realizamos pruebas empíricas sobre las consultas del vecino más próximo en cuanto al tiempo de CPU y la cantidad de cálculos de distancia realizadas según el incremento de la dimensión.