banner

Blog

Jun 29, 2023

Prédire le risque de défaillance des canalisations à l'aide d'arbres de décision améliorés par gradient et d'une analyse des risques pondérée

npj Clean Water volume 5, Numéro d'article : 22 (2022) Citer cet article

3751 Accès

2 citations

3 Altmétrique

Détails des métriques

Les modèles de prévision des défaillances de canalisations sont essentiels pour éclairer les décisions de gestion proactives. Cette étude vise à établir un modèle de prédiction fiable renvoyant la probabilité de défaillance des canalisations à l'aide d'un modèle arborescent à gradient boosté, ainsi qu'une segmentation et un regroupement spécifiques des canalisations sur une grille de 1 km qui associent des caractéristiques localisées. Le modèle est appliqué à un vaste réseau britannique comprenant environ 40 000 km de pipelines et un historique de défaillances de 14 ans. Le modèle a été évalué à l'aide de la courbe de l'opérateur récepteur et de la zone sous la courbe (0,89), du score de Briers (0,007) et du coefficient de corrélation de Mathews (0,27) pour la précision, indiquant des prédictions acceptables. Une analyse de risque pondérée est utilisée pour identifier les conséquences d'une défaillance de canalisation et fournir une représentation graphique des canalisations à haut risque aux décideurs. L’analyse des risques pondérés a constitué une étape importante dans la compréhension des conséquences de la défaillance prévue. Le modèle peut être utilisé directement dans la planification stratégique, qui définit les décisions clés à long terme concernant la maintenance et le remplacement potentiel des canalisations.

De nombreux réseaux de distribution d'eau (RDE) vieillissent et sont dans la phase finale de leur durée de vie nominale, ce qui entraîne des pannes de canalisations, des fuites et un gaspillage d'eau, entraînant des impacts environnementaux, économiques et sociétaux. Face à la pression croissante provoquée par l’augmentation de la demande en eau et les impacts du changement climatique, qui entraînent une pression sur l’approvisionnement en eau, et avec les régulateurs de l’eau qui imposent de lourdes amendes en cas de non-respect des objectifs de performance1, il est urgent de réduire les effets des pannes de canalisations grâce à une gestion proactive appropriée. La gestion proactive est l'approche souhaitée pour gérer les WDN, cherchant à anticiper les problèmes et à définir des niveaux de risque acceptables. Traditionnellement, la gestion proactive est obtenue en donnant la priorité au remplacement ou à la réparation des canalisations à l'aide de modèles de probabilité de rang simplistes, de jugements d'experts et de connaissances détaillées du réseau pour cibler les zones critiques du réseau qui ont historiquement échoué régulièrement2. Cependant, cette approche simpliste n'est pas adaptée à la gestion des réseaux de distribution d'eau présentant des mécanismes complexes de défaillance des canalisations et des risques associés, notamment la perte d'eau causant des dommages aux propriétés et aux infrastructures, les perturbations potentielles pendant la réparation, la discontinuité de l'approvisionnement en eau et les coûts économiques de réparation et de remplacement. Une gestion proactive nécessite de comprendre les performances futures des canalisations et d’évaluer les risques potentiels3.

Les modèles statistiques de défaillance des canalisations fournissent un moyen de prendre en charge une gestion proactive, en prédisant les performances futures en discernant les modèles de défaillance à partir des données historiques et de leurs facteurs causals4. Shamir et Howard (1979)5 ont développé l'un des premiers modèles sur un petit WDN de canalisations, avec un modèle exponentiel dans le temps à une seule variable utilisant l'âge des canalisations pour prédire le nombre de défaillances par an pour 1 000 pieds de canalisation. Les modèles à variable unique sont limités dans la mesure où plusieurs facteurs agissent souvent simultanément pour former des mécanismes de défaillance complexes qui aboutissent à différents modes de défaillance. Ces facteurs peuvent être globalement classés en facteurs intrinsèques aux canalisations, environnementaux et opérationnels6. Des progrès supplémentaires ont été réalisés en utilisant des modèles multivariés, incluant des variables statiques (conduites et sol) et dynamiques liées au temps (météo) pour prédire le nombre de défaillances ou les taux de défaillance7, qui peuvent être utilisés pour classer les canalisations les unes par rapport aux autres8. Prédire le nombre de défaillances de canalisations au niveau des actifs est mathématiquement problématique car les incidents se produisent rarement9. Par conséquent, les études basées sur le taux de défaillance se concentrent sur le regroupement des défaillances de canalisations selon des caractéristiques similaires sur un réseau, fournissant ainsi suffisamment de défaillances par longueur de canalisation regroupée pour une signification statistique10,11. Cependant, le regroupement des canalisations au niveau du réseau suppose que toutes les canalisations ayant des caractéristiques similaires partagent des conditions localisées similaires (influences localisées telles que les conditions d'assise, la charge de trafic et les travaux du réseau local) et des taux de défaillance, ce qui est rarement le cas.

0.9 is outstanding34. Figure 1 shows the ROC curve for the test dataset close to the top left-hand corner and an AUC value of 0.89, suggesting the model has an excellent discriminative ability to distinguish between the classes, and the TPR and FPR appear robust enough to predict failures on the unseen test data./p> {\rm{threshold}}} \end{array}} \right.\). The default probability threshold within the model is 0.536. By this definition, there remains a practical need to optimise the probability threshold specifically to the behaviour of pipe failures within the imbalanced test data. An optimal probability threshold typically strikes a balance between sensitivity and specificity. However, there is a trade-off between TPR and FPR when altering the threshold, where increasing or decreasing the TPR typically results in the same for the FPR and vice versa. Probability threshold optimisation is an important step in the decision-making process and is specific to each problem. In the case of pipe replacement, expert judgement should be used by reasoning that water companies would seek to avoid unnecessarily replacing pipes that may have a longevity of several decades more, resulting in wasted maintenance effort and cost. Furthermore, only 0.5–1% of the network is typically replaced each year due to budget constraints37. It is therefore important to only identify pipes with the highest probability of failure. Considering this, the optimal threshold is set to reduce the FNs (i.e., pipes predicted to fail when they have not). This reduces the number of TPs predicted as discussed above but targets those pipes most likely to fail./p>0.02; ≤0.06] and high [>0.06; ≤0.92]. In this scenario, the length of pipe in the high-risk category is 13.9 km of the 300.7 km or 4.6% of the pipe network present in Fig. 4, a useful percentage of the network to target for management decisions. The choropleth risk map approach is an important means of visualising individual pipes or clusters of pipes with the highest risk in the WDN, evidenced in Fig. 4. Figure 4 also highlights how many pipes in this section of the network have a low risk, which is to be expected since many pipes have a low probability of failure and have small diameters, potentially causing less damage if they fail./p> 200. (iii) second condition for partitioning data by variable x1 at both 30 and 60 to create two more disjoint region R3 and R4 (Taken from Barton et al.55)./p>

PARTAGER