Fusión methods for unsupervised learning ensembles

  1. Bruno Baruque Zanón
Supervised by:
  1. Emilio Santiago Corchado Rodríguez Director

Defence university: Universidad de Burgos

Year of defence: 2009

Committee:
  1. Francisco Herrera Triguero Chair
  2. Javier Sedano Franco Secretary
  3. Luis Alonso Romero Committee member
  4. Bodgan Gabrys Committee member
  5. José Manuel Molina López Committee member

Type: Thesis

Teseo: 283086 DIALNET

Abstract

La presente tesis está dedicada al estudio de la aplicación de técnicas conocidas como comités de expertos o en inglés Ensemble Learning a Redes Neuronales Artificiales cuyo método de aprendizaje es no supervisado, Se presenta una técnica empleada en la combinación de algoritmos de aprendizaje en ensembles con Análisis de Componentes Principales cuyo propósito es ser empleada tanto para determinar la existencia o no de outliers en un conjunto de datos como para que el efecto de la inclusión de dicho outliers tenga el menor efecto posible sobre las componentes resultantes del análisis. La contribución principal de esta tesis es la presentación de un algoritmo para la fusión de un ensemble de mapas de preservación de la topografía - llamado Weighted Voting Sumarization (WeVoS) -. El algoritmo ha sido diseñado para el incremento de la facilidad de la exploración de conjuntos de datos multi-dimensionales por medio de la idealización en 2-D de dichos datos. Este algoritmo, implementado de forma genérica permite su empleo junto con otros algoritmos basados en la preservación de la topología. En el caso de los experimentos realizados en la tesis se ha empalado en combinación con los siguientes modelos: SOM, ViSOM, SIM y Max-SIM. El rendimiento del modelo presentado se ha validado empleando varias medidas de calidad de los mapas de preservación de la topografía publicadas previamente y ampliamente empleadas en estudios similares y comparándolas con las medidas obtenidas por otros algoritmos. Los experimentos realizados prueban que el uso del algoritmo WeVoS puede superar, en la mayoría de los casos, la calidad de los resultados obtenidos por otros algoritmos para la fusión de mapas o las versiones simples de los algoritmos empleados. Todos los algoritmos presentados en la tesis han sido probados empleado conjuntos de datos de prueba incluyendo diferentes características tanto generados artificialmente como extraídos de casos reales de entre los más utilizados en el campo de la Inteligencia Artificial (IA). Así mismo, se incluye el análisis de un conjunto de datos propio, cedido por investigadores en el campo de la tecnología de los alimentos, como prueba de la utilidad de los modelos propuestos.