Utilidad de la quimiometría para la autentificación, el modelado y el control en viticultura y enología

MELÉNDEZ ÁLVAREZ, MARÍA ELENA

Utilidad de la quimiometría para la autentificación, el modelado y el control en viticultura y enología

MELÉNDEZ ÁLVAREZ, MARÍA ELENA

unter der Leitung von:

María Cruz Ortiz Fernández Doktormutter
Luis Antonio Sarabia Peinador Co-Doktorvater

Universität der Verteidigung: Universidad de Burgos

Fecha de defensa: 21 von Dezember von 2015

Gericht:

Rafael Pardo Almudí Präsident/in
Silvia Sanllorente Méndez Sekretärin
Silvia Lanteri Vocal
Ricard Boqué Martí Vocal
José Manuel Andrade Garda Vocal

Fachbereiche:

QUIMICA

Art: Dissertation

Teseo: 420484 DIALNET

Zusammenfassung

Esta tesis tiene como idea rectora la conversión de los datos analíticos de las uvas y los vinos, obtenidos en la Estación Enológica de Haro, en información relevante sobre los vinos y el proceso de maduración de la uva. Para ello, se han utilizado métodos multivariantes de análisis de datos propios del modelado algorítmico habitual en Quimiometría. Se han abordado siete cuestiones de viticultura y enología cuya descripción y resultados se resumen a continuación 1.- El análisis cluster y en componentes principales permite afirmar que la información contenida en las variables colorimétricas (a*, b*, L*, C, H* y S*) es apropiada para distinguir los vinos rosados y los claretes. Con un modelo SIMCA (Soft Independent Modeling Class Analogy) se tiene sensibilidades y especificidades superiores al 90% en ajuste y en predicción (con la excepción de la sensibilidad de la clase de los rosados en predicción). Es notable la especificidad de la clase de los rosados superior al 95% tanto en ajuste como en predicción. Todos los valores obtenidos (con la misma excepción anterior) son próximos a los alcanzados con la red neuronal GINN (Genetic Inside Neural Network), de modo que el modelo SIMCA puede considerarse óptimo. El análisis de los dos modelos SIMCA muestra que la estructura de color de los vinos rosados es más compleja que la de los claretes. Finalmente se concluye que las 77 mezclas fraudulentas de vino blanco con vino tinto así como los 7 claretes incluidos en el conjunto test se rechazan correctamente por el modelo SIMCA construido para los rosados. 2.- Se han considerado dos casos: 1) los vinos claretes y rosados 2) vinos tintos jóvenes clasificados como aceptables o no, por cata sensorial del color. El modelado de las clases en ambos casos, demuestra la necesidad de considerar las magnitudes derivadas (C, H* y S*) del color junto con los parámetros CieLab (a*, b*, L*) para conseguir modelos con alta sensibilidad, especificidad y estabilidad en predicción. En el primer caso, tanto CART (técnica discriminante) como SIMCA (técnica de modelado) señalan que el tono (H*) es el parámetro con mayor capacidad discriminante. Además en este caso la mayor consecuencia de utilizar únicamente los parámetros CieLab es la pérdida de especificidad de ambas clases, pero sobre todo la de los rosados, frente a mezclas de tinto con vino blanco. En el segundo caso si sólo se consideran los parámetros CieLab la especificidad del modelo UNEQ (Unequal Covariance Matrix) para la categoría de los vinos rechazados baja del 69 al 41% mientras que la de los aceptados baja también del 81 al 75%. Las sensibilidades son similares. El modelado de clases mediante GINN permite establecer una frontera para cada clase sin ninguna restricción geométrica, por ello, la sensibilidad y especificidad calculadas con GINN se utilizan como referencia para construir modelos más informativos, pero también más rígidos como es el modelo SIMCA. La metodología GINN-SIMCA como técnica de modelado híbrida puede aplicarse a cualquier problema de modelado de clase. 3.- La descomposición PARAFAC del tensor de datos formado por los parámetros fisico-químicos de las uvas, tiene solución única, y permite una detallada descripción del complejo proceso que es la maduración de la uva. A pesar de la amplia distribución espacial (16 parcelas en la Rioja Alta y Rioja Baja) y temporal (cuatro semanas de septiembre de 2009) de las muestras de uva, la descomposición PARAFAC modela el efecto de la parcela y de la variedad. De los dos factores PARAFAC, uno describe la evolución común de la maduración. El otro muestra en el perfil físico-químico la maduración fenólica y tecnológica, lo que permite una interpretación enológica del perfil muestral. El análisis de este perfil muestra la maduración diferencial de la uva dependiendo de la situación de la parcela (zona y altitud) y de la variedad de uva (garnacha, tempranillo y graciano). Esta información permite evaluar la calidad alcanzable en función de la zona y variedad. 4.- Los datos sobre el contenido en aminas biógenas de los vinos españoles (más de 600) han de analizarse mediante procedimientos libres de distribución porque los parámetros no tienen distribución normal ni relaciones lineales entre ellos. Los intervalos de tolerancia de β-contenido permiten determinar la proporción de vinos que están por debajo de un límite prestablecido. De este modo se tiene que, con una confianza del 95%, no exceden de 10 mg L-1 en histamina el 53.9, 74.6 y 90.2 % de los vinos tintos en los años 2010, 2014 and 2015 respectivamente. La tendencia observada para el contenido en histamina desde 2010 a 2015, confirma los esfuerzos hechos en el sector vitivinícola para alcanzar una mayor calidad en los vinos. La distribución de probabilidad, del contenido en histamina y en tiramina de los vinos, ha sido modelada mediante una cópula de Clayton con distribuciones marginales estimadas con un kernel Gausiano. Con esta distribución se ha calculado la región de confianza al 95% que es más adecuada que la usual región de confianza basada en la normalidad bivariante. La estructura de la relación entre estas dos aminas es similar en los tres años analizados. Obtener una distribución de probabilidad conjunta correctamente estimada es útil para identificar vinos con un perfil de aminas biógenas que se aparta de la población de los vinos. 5.- Los modelos PLS para calibrar el grado alcohólico en los tres conjuntos de vinos (anidados de menor a mayor homogeneidad) son adecuados en términos de precisión (SEP igual a 0.132, 0.125 y 0.107 respectivamente) y de veracidad (BIAS igual a -0.010, -0.006 y -0.004 respectivamente). Sin embargo, se encuentran dos estructuras en relación con los datos anómalos. La primera está relacionada con la respuesta y es detectada por PLS usando los índices Q y T2, que son capaces de detectar muestras diferentes de las de calibrado, de modo que el modelo PLS no puede ser aplicado a ellas. La segunda se obtiene mediante análisis de agrupamiento (K-medias) que explora la similaridad de los espectros. Esta segunda estructura no está relacionada con la estructura espectro-grado alcohólico detectada por PLS. Al analizar la composición de cada cluster se comprueba que solo los datos anómalos detectados en la etapa de pretratamiento se identifican aunque parcialmente. Incluso, en el conjunto más homogéneo, K-medias también identifica parte de los datos anómalos detectados en la etapa de validación del modelo PLS. Pero en ningún caso se identifican a través del análisis cluster los datos anómalos detectados en la etapa de construcción del modelo. Los resultados muestran que si no se considera la estructura en cuanto a similaridad de los espectros para distribuir los objetos en el conjunto de calibrado y en el de evaluación puede ocurrir que un número alto de muestras sean erróneamente declaradas anómalas con los índice Q, T2 del modelo PLS. 6.- El calibrado PLS de las señales MIR obtenidas en más de 600 vinos tintos ha permitido determinar el grado alcohólico, la acidez total, el pH, la densidad, el contenido en azúcares reductores, la acidez volátil y el contenido de ácido málico con modelos muy estables. Algunos de los parámetros tienen que cumplir con un límite mínimo (grado alcohólico y acidez total) y otros con un límite máximo (azúcares reductores y acidez volátil). Generalizando los conceptos establecidos por la norma ISO y la IUPAC al caso del calibrado PLS y valores límite distintos de cero, se han obtenido valores muy satisfactorios del límite de decisión (CDα) y del límite de detección (CDβ) que garantizan una probabilidad de falso no cumplimiento y de falso cumplimiento iguales a 0.05. 7.- Se ha utilizado una rotación varimax para el análisis de las variables latentes del modelo PLS que relaciona 12 variables fisico-químicas determinadas en la uva, con la media de la cata sensorial de la misma uva en el mes previo a la vendimia. Las malas condiciones climatológicas del año 2008 se reflejan en una clara deformación de la estructura latente. Este hecho cambia considerablemente algunas correlaciones entre las variables físico-químicas. La estructura latente rotada identifica claramente la maduración fenólica y la tecnológica, sin embargo esta estructura no puede ser obtenida mediante un análisis en componentes principales de los mismos datos. Esto indica que es la relación impuesta por PLS entre las variables físico-químicas y el valor cata, la que permite asociar cada tipo de maduración a una variable latente rotada. Cuando se proyectan las muestras sobre ambas variables latentes la posición de las muestras de uva es perfectamente concordante con la madurez alcanzada según la puntuación individual de cata. PALABRAS CLAVE Vino; maduración fenólica ; maduración tecnológica; cata sensorial de la uva; parámetros físico-químicos; parámetros CieLab; CART; SIMCA; GINN; análisis cluster; PCA; PLS; datos anómalos; rotación varimax; Cópula; Intervalo de tolerancia con contenido β; métodos libres de distribución; PARAFAC; falsa no conformidad; falsa conformidad.