|
|||||||||
| PREV CLASS NEXT CLASS | FRAMES NO FRAMES | ||||||||
| SUMMARY: NESTED | FIELD | CONSTR | METHOD | DETAIL: FIELD | CONSTR | METHOD | ||||||||
java.lang.Objectmain.Laboratory
public class Laboratory
Programa para realizar pruebas del sistema de segmentacion de articulos RSS.
Este programa permite invocar al sistema desde consola, y entrega un conjunto de resultados para fines experimentales.
Entrada: Laboratory [source] [nclusters] [operation]
- source: fuente de carga de datos... size o rango de fechas
- nclusters: numero de clusters a generar
- operation: wordlist | clustering | all
| Constructor Summary | |
|---|---|
Laboratory()
|
|
| Method Summary | |
|---|---|
static int |
findTopic(java.util.List clusters,
int item_id)
encuentra el id del cluster que contiene al item_id dado |
static Article |
getNextArticle(java.sql.Connection con)
para debug, retorna el proximo articulo a clasificar |
static float |
jaccardQuality(java.util.List clustersref,
java.util.List clusters)
este metodo calcula la calidad de la segmentacion realizada. |
static void |
main(java.lang.String[] args)
|
static float |
quality(java.util.List clustersref,
java.util.List clusters)
este metodo calcula la calidad de la segmentacion... version 3. |
static float |
qualityA(java.util.List clustersref,
java.util.List clusters)
este metodo calcula la calidad de la segmentacion contando los topicos correctos. |
| Methods inherited from class java.lang.Object |
|---|
clone, equals, finalize, getClass, hashCode, notify, notifyAll, toString, wait, wait, wait |
| Constructor Detail |
|---|
public Laboratory()
| Method Detail |
|---|
public static void main(java.lang.String[] args)
throws java.lang.Exception
java.lang.Exception
public static float jaccardQuality(java.util.List clustersref,
java.util.List clusters)
Este metodo compara la similitud entre dos conjuntos de clusters, que hayan sido realizados sobre el mismo conjunto de documentos.
clustersref - el conjunto de referenciaclusters - el conjunto a testear
public static float qualityA(java.util.List clustersref,
java.util.List clusters)
Esta es una neuva implementacion del metodo para medir calidad de la clusterizacion. En este caso, se revisara el conjunto de los primeros k (10,25) topicos encontrados, y para cada uno, se determinara a que topico corresponde, de entre los topicos de referencia (mediante conteo simple de mayoria). Finalmente, se determinara a que distancia quedo cada topico encontrado, de la posicion de referencia.. y se sumara el resultado.
clustersref - el conjunto de referenciaclusters - el conjunto a testear
public static int findTopic(java.util.List clusters,
int item_id)
clusters - el conjunto sobre el que se buscaraitem_id - el id a buscar
public static float quality(java.util.List clustersref,
java.util.List clusters)
Esta funcion calcula la calidad de la segmentacion, contabilizando la cantidad de aciertos en el conjunto de resultados, sumado a un valor (ponderado) por cada no-acierto.
Para cada topico en los topten del conjunto de referencia, se cuenta si aparece en los topten del conjunto resultado. Si aparece,se cuenta un punto. Si aparece mas abajo, se cuenta un valor de 10/su_posicion.
La misma cuenta se hace al reves: para cada topico en los topten del resultado, se cuenta si corresponde a un topten del conjto de referencia. En caso contrario, se asigna un puntaje proporcional a su posicion.
Ambos resultados se suman... y se divide por el total = 20.
clustersref - el conjunto de referenciaclusters - el conjunto a testear
public static Article getNextArticle(java.sql.Connection con)
|
|||||||||
| PREV CLASS NEXT CLASS | FRAMES NO FRAMES | ||||||||
| SUMMARY: NESTED | FIELD | CONSTR | METHOD | DETAIL: FIELD | CONSTR | METHOD | ||||||||