Extensión UML para Clustering Difuso en Data Warehouse

Autores/as

  • Livia Borjas
  • Rosseline Rodríguez
  • Betzaida Romero

Palabras clave:

Minería de Datos, Clustering Difuso, Data Warehouses, UML, KDD

Resumen

La Minería de Datos (MD) aplica métodos que generan modelos inteligibles desde grandes volúmenes de datos, usando técnicas de análisis introspectivo para descubrir patrones y relaciones ocultos. Ésta es una fase importante del proceso conocido como Descubrimiento de Conocimiento en Bases de Datos (KDD). Clustering es una técnica de aprendizaje no supervisado, ampliamente utilizada para encontrar “comportamientos” en una larga colección de datos, popularmente usada en KDD. Esta técnica ha sido mejorada aplicando conjuntos difusos, surgiendo los algoritmos de Clustering Difuso que permiten descubrir “clusters” que se solapan en la frontera. El problema con la aplicación de estas técnicas es que se hace en niveles bajos de abstracción en donde la información es compleja. Sería ideal modelar el proceso de extracción de conocimiento desde niveles altos de abstracción donde los datos son sencillos, inteligible y cuyos modelos no dependen de las herramientas subyacentes para su implementación. Además, se pueden aprovechar los beneficios que ofrecen los modelos multidimensionales que facilitan el modelado del KDD disminuyendo su complejidad de las fases de recopilación e integración de los datos. En el presente artículo se propone una extensión por medio de perfiles UML para la modelación de Minería de Datos, basada en Clustering Difuso.

Descargas

Los datos de descargas todavía no están disponibles.

Descargas

Número

Sección

Artículos