Modelos descriptivos basados en aprendizaje supervisado para el tratamiento de big data y flujos continuos de datos

GARCÍA VICO, ÁNGEL MIGUEL

Modelos descriptivos basados en aprendizaje supervisado para el tratamiento de big data y flujos continuos de datos

GARCÍA VICO, ÁNGEL MIGUEL

Dirigida por:

Cristóbal José Carmona del Jesús Director
Pedro González García Codirector/a

Universidad de defensa: Universidad de Jaén

Fecha de defensa: 28 de abril de 2020

Tribunal:

Francisco Herrera Triguero Presidente/a
Antonio Jesús Rivera Rivas Secretario/a
Isaac Triguero Velázquez Vocal

Tipo: Tesis

Teseo: 647474 DIALNET

Resumen

En esta tesis se analizan en profundidad las tareas de descubrimiento de subgrupos y minería de patrones emergentes enfocadas a la resolución de problemas complejos, como big data y flujos continuos de datos, entre otros. Además, se destacan diferentes problemas abiertos en este área. En particular, para descubrimiento de subgrupos se presenta un análisis de la influencia de ruido en los datos en los principales sistemas difusos evolutivos desarrollados; un paquete software para la plataforma R con los principales algoritmos basados en sistemas difusos evolutivos; y un análisis del comportamiento de los principales enfoques a problemas multi-instancia, mediante la realización de adaptaciones de los mismos. Con respecto a la minería de patrones emergentes, se presenta una revisión de los principales enfoques desarrollados en la tarea desde el punto de vista descriptivo y tres propuestas basadas en sistemas difusos evolutivos: una enfocada a mejorar la calidad del conocimiento extraído desde el punto de vista descriptivo; otra enfocada a realizar esta extracción en el ámbito big data y un último método enfocado al contexto de la minería de flujo de datos. Los resultados obtenidos muestran que los métodos propuestos permiten obtener conocimiento de calidad capaz de ayudar a la toma de decisiones por parte de los expertos en problemas complejos. In this thesis the subgroup discovery and emerging pattern mining tasks for the resolution of complex problems, such as big data and data stream mining, among others, are analysed in depth. Different methods and tools are proposed in order to extract descriptive knowledge from these types of environments. In addition, different open problems in this area are highlighted. In particular, for subgroup discovery an analysis of the influence of data noise on the main evolutionary fuzzy systems developed is presented; a software package for the R platform with the main algorithms based on evolutionary fuzzy systems is proposed; and an initial analysis of the behaviour of the main approaches adapted to multi-instance problems, a complex problem on the rise, is shown. With respect to emerging pattern mining, a review of the main approaches developed in the task from a descriptive point of view is presented, together with three developments based on evolutionary fuzzy systems: one focused on improving the quality of the extracted knowledge from a descriptive point of view; another focused on performing this extraction in the big data domain and a last method focused on the context of data stream mining.