4.1.2 ## ##lusterers

4.1.2 Clusterers

4.1.2.1 Cobweb

El algoritmo más importante para hacer el clustering es COBWEB, un algoritmo diseñado por Fisher [21] en 1987. Tal algoritmo se basa en ciertas reglas:

Un buen clustering se identifica por

Poca distancia entre los elementos dentro de un cluster, y por mucha distancia entre clusters.
Mucha similitud entre elementos de un cluster, y poca similitud entre elementos de distintos clusters.

La estructura de Datos utilizada para la construcción de este algoritmo de clustering es la que sigue:

En 1987, Gluck y Corter [22] propusieron una función de utilidad categórica. Su utilidad reside en el hecho de poder cuantificar lo "próximo" que es un elemento a otro(s). Se puede visualizar como la siguiente función:

Ilustración 13 : Función de Utilidad Categórica

La aplicación de tal función cambia ciertos aspectos del aprendizaje lógico asociado con la inteligencia artificial, y lo lleva a un concepto más bien probabilístico.

4.1.2.1.1 Funcionamiento del algoritmo COBWEB

En general se basa en que la incorporación de un elemento nuevo depende en el recorrido del árbol, y la aplicación de ciertas operaciones en cada nivel, tales como:

La Clasificación de los objetos con respecto a una clase existente

Para determinar que clase mejor describe al elemento nuevo, COBWEB tentativamente prueba en cada categoría. Para evaluar la colocación del elemento en la categoría, se utiliza la función categórica. Al nodo que provee el mas alto índice, se le entrega el elemento.

La creación de una clase nueva

La calidad de la partición, con el elemento puesto en la mejor categoría existente es comparada con la inserción en una categoría nueva

La Combinación de dos clases en una nueva

Dos nodos en un nivel son juntados en la esperanza de que la partición resultante sea de mejor calidad

La división de una clase en varias clases distintas

El nodo padre puede ser borrado, y sus hijos promovidos al nivel del padre

Ilustración 14 : Clasificación de los objetos con respecto a una clase existente

Ilustración 15 : Combinación de dos clases en una nueva

Ilustración 16 : División de una clase en varias clases distintas

4.1.2.1.2 Seudo Código de Algoritmo COBWEB

Departamento de Ciencias de la Computacion, Universidad de Chile.