Minería de datos sobre series temporales multivariableclasificación y clustering

  1. Prieto Izquierdo, Óscar Javier
Zuzendaria:
  1. Carlos Javier Alonso González Zuzendaria
  2. Juan José Rodríguez Diez Zuzendaria

Defentsa unibertsitatea: Universidad de Valladolid

Fecha de defensa: 2009(e)ko apirila-(a)k 14

Epaimahaia:
  1. Antonio Bahamonde Rionda Presidentea
  2. Quiliano Isaac Moro Sancho Idazkaria
  3. José Cristobal Riquelme Santos Kidea
  4. Cecilio Angulo Bahón Kidea
  5. Rafael Martínez Gasca Kidea

Mota: Tesia

Teseo: 214181 DIALNET

Laburpena

El desarrollo de técnicas de minería de datos sobre datos de naturaleza temporal es un área de investigación en pleno apogeo, debido tanto a la cantidad de datos de este tipo relacionados con problemas de interés para la comunidad de minería de datos, como a la importancia que estas técnicas pueden tener para su aplicación en la solución de problemas reales; algunos ejemplos de estos problemas pueden aparecer en la economía, la medicina, la industria, etcétera, El presente trabajo se centra en el estudio y propuesta de técnicas de minería de datos sobre series temporales multivariable. Las tareas consideradas son las de clasificación y clustering. Para la tarea de clasificación uno de los objetivos es el de comprobar si la descomposición del problema multivariable en problemas univariable supone una mejora en la tasa de acierto de los clasificadores que abordan el problema multivariable de manera directa. Para llevar a cabo esta propuesta se utilizan técnicas de combinación de clasificadores (ensembles). Esta técnica utiliza clasificadores univariable en un primer nivel para luego combinar las salidas de cada uno de ellos en un nivel superior. Esta propuesta se basa en la técnica de combinación de clasificadores Stacking [Wolpert92]. Para la tarea de clustering el objetivo era el de estudiar el funcionamiento de los algoritmos clásicos para su uso con series multivariable. Para llevar a cabo dicho estudio fue necesaria la adaptación de algunos de los algoritmos considerados para que fuera posible su aplicación junto con técnicas específicas de las series temporales como Alineamiento Dinámico Temporal (DTW). Para ambas tareas también se planteaba como objetivo comparar los resultados del uso de medidas de disimilitud propias de las series temporales, como DTW, con los resultados obtenidos al utilizar las características extraídas propuestas en [Rodriguez04]. Se ha realizado un estudio experimental de distintas configuraciones de los métodos de clasificación y clustering considerados. Para la tarea de clasificación el método propuesto ha obtenido tasas de acierto más altas que los métodos con los que se ha comparado en seis de los ocho conjunto de datos tenidos en cuenta. En clustering se ha observado que los métodos jerárquicos aglomerativos son los que mejores índices de Rand ajustado obtienen en líneas generales. [Wolpert92] Wolpert,D.H. Stacked generalization. Neural Networks, 1992, 5, 241-259 [Rodriguez04] Rodríguez Diez, J.J. Técnicas de Aprendizaje Automático para la Clasificación de Series. Tesis Doctoral. Departamento de Informática. Universidad de Valladolid, 2004