New techniques for semi-supervised learning with ensembles and constraints
- César García Osorio Director
- Jesús M. Maudes Raedo Director
Defence university: Universidad de Burgos
Fecha de defensa: 22 July 2024
Type: Thesis
Abstract
En los últimos años, el campo del aprendizaje semisupervisado (SSL) ha ganado una práctica significativa debido a su potencial para aprovechar tanto datos etiquetados como no etiquetados, abordando así los desafíos asociados con conjuntos de datos parcialmente etiquetados. Esta tesis doctoral explora nuevas técnicas para el SSL, centrándose específicamente en métodos con multiclasificadores y la integración de restricciones para mejorar el rendimiento de la clasificación. La investigación desarrollada tiene como objetivo avanzar en el estado del arte en SSL mediante el desarrollo de nuevos algoritmos, evaluando su efectividad a través de la experimentación y proponiendo una biblioteca de código abierto para una mayor accesibilidad y aplicabilidad. La tesis comienza con una revisión exhaustiva de los métodos actuales en el SSL, destacando la escasez en la literatura en cuanto al rendimiento comparativo de varias técnicas de SSL. Luego, se introducen enfoques innovadores con multiclasificadores que combinan múltiples modelos para mejorar la precisión y el comportamiento en escenarios muy escasamente etiquetados. Una contribución significativa de este trabajo es la aplicación de clasificación con restricciones en el marco de SSL. Al incorporar restricciones de «cannot-link» y «mustlink», los métodos propuestos pueden mejorar la confiabilidad de los resultados de la clasificación. Este enfoque se valida a través de extensos experimentos en tareas de reidentificación de animales utilizando datos de vídeo, demostrando un rendimiento superior en comparación con los clasificadores que no toman en cuenta estas restricciones. Además, la tesis aborda los desafíos prácticos de implementación, desarrolló una biblioteca de código abierto que incluye los nuevos algoritmos propuestos. Esta biblioteca tiene como objetivo facilitar la investigación y aplicación adicional de las técnicas de SSL en varios dominios. Resumiendo, esta tesis trata de contribuir a aumentar el conocimiento en el SSL, proporcionando nuevas ideas, metodologías y herramientas que mejoran la efectividad y aplicabilidad de SSL en escenarios del mundo real.