El algoritmo más importante para hacer el clustering es COBWEB, un algoritmo diseñado por Fisher [21] en 1987. Tal algoritmo se basa en ciertas reglas:
Un buen clustering se identifica por
La estructura de Datos utilizada para la construcción de este algoritmo de clustering es la que sigue:
En 1987, Gluck y Corter [22] propusieron una función de utilidad categórica. Su utilidad reside en el hecho de poder cuantificar lo "próximo" que es un elemento a otro(s). Se puede visualizar como la siguiente función:
La aplicación de tal función cambia ciertos aspectos del aprendizaje lógico asociado con la inteligencia artificial, y lo lleva a un concepto más bien probabilístico.
En general se basa en que la incorporación de un elemento nuevo depende en el recorrido del árbol, y la aplicación de ciertas operaciones en cada nivel, tales como:
Para determinar que clase mejor describe al elemento nuevo, COBWEB tentativamente prueba en cada categoría. Para evaluar la colocación del elemento en la categoría, se utiliza la función categórica. Al nodo que provee el mas alto índice, se le entrega el elemento.
La calidad de la partición, con el elemento puesto en la mejor categoría existente es comparada con la inserción en una categoría nueva
Dos nodos en un nivel son juntados en la esperanza de que la partición resultante sea de mejor calidad
El nodo padre puede ser borrado, y sus hijos promovidos al nivel del padre
Copyright Nelson Flores 2001.
Departamento de Ciencias de la Computacion, Universidad de Chile.