La herramienta Mineset se basa en la siguiente arquitectura Cliente/Servidor [12]:
Mineset es una herramienta que mezcla una gran cantidad de técnicas del Minado de Datos, con la reconocida capacidad gráfica de las estaciones de trabajo de Silicon Graphics, aunque Mineset, en la actualidad, también está disponible bajo la plataforma Microsoft con la agregación de algunas bibliotecas gráficas.
Mineset es una herramienta Cliente / servidor para la extracción de información de Data Warehouse, y la revelación de los pertinentes patrones escondidos. Todo esto, se visualiza mediante despliegues visuales consistentes y fáciles de usar (usando servidores SGI como el Origin)
Usando tal herramienta, entregado por Mineset, se puede explorar un conjunto de datos elegidos de un Data Warehouse, aplicarles una serie de transformaciones, elegir un conjunto de procesos de minado de datos, y elegir el método de visualización. Todo se encuentra encapsulado en una sola herramienta, por lo que el tiempo asociado a llegar al punto donde se pueden sacar conclusiones sobre la información, es drásticamente reducido.
Mineset le entrega al usuario un conjunto de técnicas de Minado de Datos. Soporta la generación y análisis de reglas de asociación y modelos de clasificación. Combinando tales métodos y la reconocida interfaz gráfica, se tiene un conjunto completo de herramientas para el análisis de la información.
Roche es una de las empresas líderes en el mercado de la investigación y desarrollo de productos farmacéuticos y de sistemas de diagnóstico. Mayoritariamente, se interesan en Genotech, una de las empresas líderes en la biotecnología, y subsidiaria de Roche.
Investigadores en Roche utilizaron Mineset para el análisis y comprensión de expresiones genéticas. La meta, en la lectura de la información genética, es saber cuáles genes han sido modificados a partir de cambios en el experimento. El valor de explorar la información visualmente se muestra en la ilustración 8.
En la imagen, los ejes son como sigue:
Si los puntos están a la izquierda o la derecha, entonces tales genes se han visto cambiado hacia arriba o hacia abajo respectivamente. El tamaño del punto indica la reproducibilidad del experimento.
Analizando la ilustración 8, se ve que una gran cantidad de genes han sido cambiados hacia abajo (están a la derecha), y después de aplicar un filtro que elimina los genes de poca reproducibilidad (los de pequeño tamaño) se tiene la ilustración 9.
Al tener un scatter diagram [9]con estos resultados, se puede analizar y consultar la información importante, dado que ahora se conoce a los genes cambiados por el experimento. Esto era importante para Roche, dado que la cantidad de genes es enorme, y la inherente dificultad en identificar a los genes cambiados influye en un alto costo de análisis, dada la cantidad de información a mano.
Copyright Nelson Flores 2001.
Departamento de Ciencias de la Computacion, Universidad de Chile.