Previous Next

4.1.5 Extractores de Reglas de Asociación

 

 

 

4.1.5.1 Algoritmo Apriori

 

 

El algoritmo Apriori tienen como objeto, la extracción de un conjunto de reglas, inducidas desde un conjunto de prueba, entregado como entrada. Reglas de asociación son:

 

 

"Reglas que muestran una correlación estadística entre la ocurrencia de ciertos atributos, en una tabla, dentro de una Base de Datos"

 

Tal definición define lo que es la intuición de la ocurrencia de cierto parámetro dado la ocurrencia de otros parámetros en sus alrededores.

Ej.

 

Defecto_Ocular = Miopía usa_Lentes = SI

 

La regla general:

 

 

Donde son atributos de una transacción dada.

 

 

Se dice que predicen a

Hay varios parámetros asociados al algoritmo Apriori. Estos incluyen

 

Un ejemplo de lo anterior sería

 

 

ID 

Items

 

 

 

 

1 

 

A B E 

 

2 

 

A C D E 

 

3 

 

B C D E 

 

4 

 

A B D E 

 

5 

 

B D E 

 

6 

 

A B C 

 

7 

 

A B D 

 

 

 

 

Dada la regla

 

El soporte es : 3/7

La confianza es : 3/4

¿Cómo se extrae un conjunto de reglas significativas de un conjunto de transacciones?

 

Dado un conjunto de transacciones, generalmente extraídos desde una Base de Datos, se sigue los siguientes pasos

 

Se leen todas las transacciones, encontrando todas los ítems que tienen soporte sobre el valor definido como mínimo. Este conjunto se denominará L1.

 

Se construye pares desde el conjunto L1. Este será el Conjunto C2. Se leen las transacciones otra vez, y se encuentran todos los pares con ocurrencias frecuentes en C2. Este será L2.

 

El algoritmo sigue de manera idéntica, construyendo vectores de tamaño K desde el conjunto Lk-1, el cual se denominará Ck. Se leen las transacciones otra vez, y se encuentran los vectores de ocurrencias frecuentes, denominando a este Lk.

 

Se encuentran todos los conjuntos posibles de la misma manera.

 

El algoritmo se detalla a continuación

 

 

 

 

 

 

Apriori ()

{

 

F = Æ ;

 

Lk = {conjuntos unarios frecuentes};

 

k = 2;

 

while (Lk-1 != Æ )

{

 

F = F U Lk ;

 

Ck = Nuevos candidatos de tamaño k generado desde Lk-1 ;

 

for todas las transacciones t Î D

incrementar el conteo de todos los candidatos dentro de Ck que estan contenidos en t ;

 

Lk = Todos los candidatos en Ck con el soporte mínimo;

 

k++ ;

}

return ( F ) ;

}

 

 

 

 

 

 

 

 

 

 

 


Previous Next

 

Copyright Nelson Flores 2001.

Departamento de Ciencias de la Computacion, Universidad de Chile.