Leak detection and localization in pipeline networks using machine learning and principal component analysis

Author

Santos Ruiz, Ildeberto de los

Director

Puig Cayuela, Vicenç

Codirector

López Estrada, Francisco Ronay

Date of defense

2021-06-11

Pages

165 p.



Department/Institute

Universitat Politècnica de Catalunya. Departament d'Enginyeria de Sistemes, Automàtica i Informàtica Industrial

Doctorate programs

DOCTORAT EN AUTOMÀTICA, ROBÒTICA I VISIÓ (Pla 2013)

Abstract

(English) This thesis presents a methodology to locate leaks in pipeline networks, with a focus on water distribution networks. Leak localization techniques using classifiers are proposed by associating the different classes with branches or nodes where the leaks occur. The classifiers are fed with pressure measurements at specific sensor nodes in the network and learn to recognize the leak positions through supervised learning from a data-set obtained by the network model simulations. The analysis of the results includes tests in different leak scenarios and considers measurement noise in the pressures. The proposed classification techniques’ performance is analyzed in a didactic network and with physical measurements in an experimental prototype’s real networks. Performance metrics, classification loss (or its counterpart, accuracy), and topological error (measuring the distance between the leak’s real position and the position where it is detected) are used to validate the methods’ performance and applicability. Unlike other works as reported in the literature, this study improves the classifiers’ performance when a non-linear transformation is applied on the pressure residuals to extract only the information about their direction so that the classifiers use “direction cosines” as features. However, it was also found that performance using direction cosines can be considerably affected by uncalibrated models or sensors. This research also addresses a fundamental problem in leak localization-related to find-ing an optimal placement for the pressure sensors. This is a significant finding because the number of sensors to place is limited in real networks due to technological and economic problems. Two algorithms are proposed to select the nodes where it is most useful to place the sensors to capture as much information as possible about the location of the leaks within the network. The first is a supervised approach based on information theory that seeks maximum relevance and minimum redundancy of the sensor set in terms of mutual information. The second is an unsupervised method based on principal component analysis that aims to maximize the pressure variance associated with leaks captured by the sensors. Both are iterative algorithms independent of the leak localization method and are econom-ical in computational time compared to other proposals because they do not perform leak localization calculations in the iterations. The effectiveness of these methods was tested by an exhaustive analysis of a network model. Finally, this work proposed a leak detection and localization technique for single and branched pipelines. In single pipelines, the problem of leak detection and sizing is addressed through dynamic principal component analysis. In branched pipelines, only the leak pre-localization problem is addressed through classifiers, identifying the sector or branch where the leak occurs. However, it is essential to note that these methods are limited to estimate the leak position with a certain margin of error. Despite this limitation, the method shows its effectiveness and can be applied in real networks where the exact position is determined by physical inspection using specialized instruments.


(Español) Esta tesis presenta una metodología para localizar fugas en redes de tuberías, con un enfoque en las redes de distribución de agua. La propuesta consiste principalmente en la localización de fugas mediante clasificadores que asocian las diferentes clases con las ramas o nodos donde ocurren las fugas dentro de la red. Los clasificadores se alimentan con las mediciones de presión en ciertos nodos sensores de la red y aprenden a reconocer las posiciones de las fugas a través del aprendizaje supervisado a partir de un conjunto de datos obtenido mediante simulaciones con el modelo de red. El análisis de los resultados incluye pruebas en diferentes escenarios de fugas y considera el ruido de medición en las presiones. El rendimiento de las técnicas de clasificación propuestas se analiza exhaustivamente con simulaciones en una red didáctica pero también con mediciones físicas en redes reales y en un prototipo experimental. Como métricas de rendimiento, se utilizan la pérdida de clasificación (o su contraparte, la exactitud) y el error topológico (que mide la distancia entre la posición real de la fuga y la posición donde se detecta). El principal hallazgo en este trabajo es la mejora obtenida en el desempeño de los clasificadores, respecto a otras propuestas en la literatura, cuando se aplica una transformación no lineal sobre los residuales de presión para extraer sólo la información de su dirección, de modo que los clasificadores usan los “cosenos directores” como features. Sin embargo, también se encontró que el desempeño usando cosenos directores puede verse considerablemente afectado por el uso de modelos o sensores descalibrados. La tesis también aborda un problema fundamental en la localización de fugas: encontrar una ubicación óptima para los sensores de presión. Se proponen dos algoritmos para seleccionar los nodos donde resulta más útil colocar los sensores, de modo que el conjunto de sensores capture la mayor cantidad de información posible sobre la ubicación de las fugas dentro de la red. El primero es un método supervisado basado en la teoría de la información que busca maximizar la relevancia y minimizar la redundancia del conjunto de sensores en términos de la información mutua. El segundo es un método no supervisado basado en el análisis en componentes principales que busca maximizar la varianza de presión asociada a las fugas capturada por los sensores. Ambos son algoritmos iterativos independientes del método de localización de fugas y son económicos en tiempo de computación respecto a otras propuestas, debido a que no efectúan cálculos de localización de fugas en las iteraciones. La efectividad de estos métodos se probó por análisis exhaustivo en un modelo de red. La tesis también aborda la detección y localización de fugas en tuberías simples y ramificadas sin una estructura de lazo. En tuberías simples se aborda el problema de la detección y el dimensionamiento de las fugas, mediante análisis de componentes principales. En tuberías ramificadas sólo se aborda el problema de la prelocalización de fugas mediante clasificadores, la cual consiste en identificar el sector o ramal donde la fuga se presenta. En ningún caso se aborda la localización exacta (final) de las fugas, debido a que esta tarea suele requerir otros métodos como observadores basados en el comportamiento transitorio del flujo y la inspección física mediante instrumentos especializados.

Keywords

Àrees temàtiques de la UPC::Informàtica; Àrees temàtiques de la UPC::Enginyeria mecànica

Subjects

004 - Computer science and technology. Computing. Data processing; 621 - Mechanical engineering in general. Nuclear technology. Electrical engineering. Machinery; 628 - Public health engineering. Water. Sanitation. Illuminating engineering

Note

Tesi en modalitat de cotutela: Universitat Politècnica de Catalunya i Instituto Tecnológico de Tuxtla Gutiérrez

Documents

TISR1de1.pdf

9.505Mb

 

Rights

ADVERTIMENT. Tots els drets reservats. L'accés als continguts d'aquesta tesi doctoral i la seva utilització ha de respectar els drets de la persona autora. Pot ser utilitzada per a consulta o estudi personal, així com en activitats o materials d'investigació i docència en els termes establerts a l'art. 32 del Text Refós de la Llei de Propietat Intel·lectual (RDL 1/1996). Per altres utilitzacions es requereix l'autorització prèvia i expressa de la persona autora. En qualsevol cas, en la utilització dels seus continguts caldrà indicar de forma clara el nom i cognoms de la persona autora i el títol de la tesi doctoral. No s'autoritza la seva reproducció o altres formes d'explotació efectuades amb finalitats de lucre ni la seva comunicació pública des d'un lloc aliè al servei TDX. Tampoc s'autoritza la presentació del seu contingut en una finestra o marc aliè a TDX (framing). Aquesta reserva de drets afecta tant als continguts de la tesi com als seus resums i índexs.

This item appears in the following Collection(s)