Proyecto CICyT DPI2002-03225

METODOLOGÍAS HÍBRIDAS DE SOFT COMPUTING Y SU APLICACIÔN A LA DETECCIÔN DE ANOMALIAS EN ESTACIONES DEPURADORAS DE AGUAS RESIDUALES

English Version
Informe
Duración:
Del 1 de diciembre de 2002 al 30 de noviembre de 2005
INVESTIGADOR RESPONSABLE:
Ángela Nebot Castells
PALABRAS CLAVE:
Sistemas dinßmicos complejos; análisis y predicción de series temporales; razonamiento inductivo borroso; redes neuronales heterogéneas; redes neuronales delta; monitorización de fallos; red de distribución de agua;
RESUMEN:
Partiendo del trabajo desarrollado en el proyecto anterior (TAP1999-0474), este proyecto tiene como objetivo profundizar en el desarrollo de metodologías híbridas de soft computing para la detección e identificación de anomalías en sistemas dinámicos complejos. En el proyecto anterior se depuraron metodologias basadas en técnicas difusas y conexionistas (razonamiento inductivo difuso, redes neuronales feed-forward, recurrentes, delta y heterogéneas), y se llevó acabo un estudio comparativo de dichas metodologías para detectar los puntos fuertes de cada una de ellas. En este proyecto se propone investigar posibles hibridaciones de estas metodologías así como su combinación mediante métodos de cooperación con la finalidad de predecir el comportamiento futuro de sistemas reales y detectar posibles anomalías o fallos en su funcionamiento. Los resultados se validarán sobre benchmarks, maquetas de laboratorio y finalmente se aplicarán a una estación depuradora de aguas residuales.
OBJETIVOS:
Partiendo del trabajo desarrollado en el proyecto anterior (TAP1999-0474), este proyecto tiene como objetivo profundizar en el desarrollo de metodologías híbridas de soft computing basadas en sistemas difusos y conexionistas para la detección e identificación de anomalías en sistemas dinámicos complejos. Concretamente, se propone investigar en métodos de selección de variables (reducción de dimensión) y desarrollar metodologías producto de la fusión (hibridación) de otras: el razonamiento inductivo difuso (FIR), las redes neuronales feed-forward (FNN), recurrentes (RNN) y heterogéneas (HNN) y las máquinas de soporte vectorial (SVM). Los resultados se validarán sobre benchmarks, maquetas de laboratorio y finalmente se aplicarán a distintos procesos de una estación depuradora de aguas residuales. Los objetivos concretos que se plantean en este proyecto pueden dividirse en tres apartados:
  • Selección de variables relevantes y reducción de la dimensionalidad

    Al utilizar una gran cantidad de variables en un proceso de aprendizaje inductivo, existe la posibilidad de que algunas de ellas no aporten suficiente información útil para el proceso. Por ello, desde la década de los sesenta, las investigaciones relacionadas con la selección de variables (feature selection) intentan reducir el espacio de hipótesis en un intento de encontrar subconjuntos de variables que den lugar a un mejor rendimiento de los algoritmos de inducción.

    El propósito fundamental que se busca al reducir variables es mejorar la velocidad de aprendizaje, la capacidad de generalización y/o la simplicidad de la representación, para así comprender mejor los resultados obtenidos, disminuir el volumen de almacenamiento, reducir ruidos generados por aquellas variables que no aportan información y eliminar conocimiento inútil para la solución del problema.

    Se pretende trabajar en el desarrollo de un meta-algoritmo de selección de variables (MASA). La idea subyacente consiste en coordinar varios algoritmos de selección bajo diferentes criterios de evaluación (entropía, consistencia, precisión, etc) de tal manera que se obtenga un mejor rendimiento que si se aplicase cada algoritmo de forma separada e independiente.

  • Hibridaciones de métodos y técnicas de Soft Computing
    Dentro del soft computing existen diferentes disciplinas, técnicas, metodologías que por separado han demostrado sus buenas cualidades en mucho dominios de aplicación. Cada una tiene, por supuesto, ventajas e inconvenientes. El cruce de ideas y técnicas puede por tanto producir metodologías que manteniendo las ventajas comunes, reduzca los inconvenientes, al verse mutuamente reforzadas. Esto es de gran interés teórico y práctico.

    En este proyecto se propone trabajar en las siguientes hibridaciones:

    • Redes neuronales feed-forward (FNN) y support vector machines (SVM)

      La semejanza de las arquitecturas de una SVM y una FNN permite combinar las diferentes estrategias de aprendizaje de ambos modelos. En particular, la idea de vector soporte para maximizar el margen en SVMs permite minimizar funciones de coste de FNNs basadas en el error cuadrático en las que se observase el mismo comportamiento. La mayor flexibilidad del modelo de FNNs puede dar lugar a mejores rendimientos.

    • Redes neuronales difusas

      Si se considera información difusa en algunas de las entradas a una red neuronal, nos encontramos en las denominadas redes neuronales difusas. Éstas son redes que usan métodos difusos para mejorar o extender las capacidades de aprendizaje o para aprender mejor en un sentido genérico, y donde el objetivo primordial es perfeccionar la red neuronal. La propia red y sus algoritmos de aprendizaje se obtienen como las versiones difusas de los convencionales. Estas redes ofrecen un número de ventajas de entre las cuales destacan la posibilidad de procesar directamente información imprecisa y de aproximar funciones difusas. El objetivo es la concepción, estudio teórico y diseño de una nueva clase de red neuronal difusa, dentro del marco conceptual de las redes neuronales heterogéneas. Se pretende además concebir mecanismos de control del error de generalización (el criterio más importante en una aplicación práctica de redes neuronales).

    • Razonamiento inductivo difuso y sistemas neuro-difusos

      Los sistemas neuro-difusos surgen de la necesidad de combinar el modelado empírico y el cualitativo. Estas técnicas permiten tanto las descripciones lingüísticas de los sistemas como la utilización de los datos para ajustar el modelo (entre los que se encuentran los parámetros de las funciones de pertenencia que conforman las variables de entrada) durante la fase de identificación. Contrariamente, la metodología FIR no permite una adaptación de las funciones de pertenencia durante el proceso de identificación del modelo. En este caso, se realiza una discretización inicial que se mantiene fija durante todo el proceso de aprendizaje.

      El objetivo es la adaptación en FIR de la distribución de los datos entre las diferentes clases de manera automática durante la fase de identificación del modelo mediante algoritmos de entrenamiento comúnmente usados por las redes neuronales. Este método híbrido permitiría refinar los landmarks entre clases y la forma de las funciones de pertenencia.

    • Selección de datos relevantes para razonamiento inductivo difuso y redes neuronales

      El utilizar todos los datos de entrenamiento de que se dispone en un sistema automático de aprendizaje puede resultar en ocasiones contraproducente en términos de eficiencia o de eficacia en la posterior capacidad de generalización. Por ello, es un objetivo disponer de técnicas que permitan seleccionar aquellos datos más relevantes (como centroides o puntos frontera) para obtener un buen rendimiento del sistema. Estas técnicas deben adaptarse a las características propias de cada metodología inductiva, en nuestro caso, FIR y redes neuronales.

    • Cooperación de expertos locales para razonamiento inductivo difuso y redes neuronales

      Cuando la tarea que se desea aprender está representada por una función que tiene una forma diferente en regiones distintas del espacio de entradas, es de esperar que la cooperación de expertos locales (p.ej. redes neuronales o modelos estadísticos), cada uno encargado de una región diferente, resulte en una mejora del rendimiento con respecto a un modelo global para toda la función. Es un objetivo descomponer automáticamente el espacio de entradas en regiones, inferir los modelos para cada región y determinar la forma de cooperación entre ellos para tomar decisiones.

    • Construcción y entrenamiento de redes neuronales recurrentes LSTM mediante algoritmos evolutivos

      Las redes neuronales LSTM son las redes recurrentes que han obtenido mejores resultados de predicción y clasificación de secuencias en tareas benchmark, pero como en otros tipos de redes existe el problema de fijar a priori su tamaño y su topología exacta. El objetivo es adaptar la metodología SAOCIF de construcción incremental de redes feed-forward a redes recurrentes LSTM usando algoritmos evolutivos como método de búsqueda de los pesos óptimos de la red.

  • Aplicación a una estación depuradora de aguas residuales

    La composición característica de las aguas residuales (elevada presencia de microorganismos patógenos, actividad microbiana, etc.) supone que su vertimiento directo a un medio acuático pueda producir consecuencias nocivas para la vida en el entorno. Se requieren diversas operaciones y procesos químicos, físicos y biológicos para tratar adecuadamente este tipo de aguas, siguiendo una secuencia relativamente compleja desde el punto de vista de funcionamiento global de la estación.

    El buen funcionamiento de una estación depuradora de aguas residuales urbanas viene condicionado, en gran medida, por la estabilidad de las diferentes etapas especialmente de la etapa biológica donde se lleva a cabo la eliminación de la materia orgánica. Cualquier cambio en las condiciones de operación puede provocar el desequilibrio de la comunidad microbiana y la proliferación no deseada de bacterias que comporten problemas operacionales de la estación. En este sentido, la detección de posibles anomalías en cualquiera de los procesos que conforman la planta o estación y la predicción de posibles fallos o desequilibrios con anterioridad a que sucedan resultan de gran utilidad para evitar riesgos ambientales en el entorno y problemas en la estación global.

PARTICIPANTES:
Investigadores de las siguientes instituciones:
  • Departamento de Lenguajes y Sistemas Informáticos (UPC)
  • Departamento de Ingeniería de Sistemas, Automática e Informática Industrial (UPC)
  • Departamento de Estadística e Investigación Operativa (UPC)
  • Instituto de Robótica e Informática Industrial (UPC)
  • Departament d'Enginyeria Química, Agrària, i Tecnologia Agroalimentària (Universitat de Girona)

TITLE:

HIBRID METHODOLOGIES OF SOFT COMPUTING AND ITS APLICATION TO FAULT DETECTION IN WASTEWATER TREATMENT PLANTS


DURATION:

From 1st of December 2002 to 30th November 2005

CHIEF RESEARCHER:

Ángela Nebot Castells

KEYWORDS:

Large-scale dynamical systems; time series: analysis and forecasting; fuzzy inductive reasoning; heterogeneous neural networks; delta neural networks; fault monitoring systems; water distribution network.

SUMMARY

Starting from the work done in the previous project (TAP1999-0474), the objective of this project is the deepening into the development of hybrid methodologies of soft computing for fault detection and identification in complex dynamical systems. In the previous project some methodologies based on fuzzy and connectionist techniques were refined (fuzzy inductive reasoning, feed-forward, recurrent, delta and heterogeneous neural networks), and a comparative study was performed in order to identify the strong points of every methodology. In this project the research of possible hybridizations of these techniques is proposed, together with their combination by means of cooperation methods, in order to predict the future behaviour of real systems and detect possible faults in their work. The results will be validated on standard benchmarks, laboratory models, and finally will be applied to a wastewater treatment plant