project

Deep Explorations: een verkennend onderzoek naar deep learning-toepassingen in de watersector

Dit project betreft een verkennend onderzoek om de waarde van ‘deep learning’ (DL) voor KWR en de watersector te beoordelen. De verschillende types van deep learning, hun sterktes en zwaktes, zullen worden onderzocht en overwogen. De techniek wordt toegepast op twee case studies: (1) datamining in klantenberichten die drinkwaterbedrijven van klanten ontvangen, en (2) datamining in infrarood spectroscopie voor microplastics analyse en polymeer classificatie, die later kan worden uitgebreid naar andere gebieden, zoals chromatografie, UV adsorptie en patroonherkenning in datasets.

Wat is deep learning?

Deep learning (DL) is een familie van machine learning (ML) algoritmen op basis van kunstmatige neurale netwerken, die in staat zijn complexere relaties tussen input en output af te leiden dan andere ML-technieken. Als gevolg daarvan blijkt DL zeer effectief te zijn in toepassingen zoals beeld- en spraakverwerking. In deze toepassingen verslaan DL-technieken meer traditionele kunstmatige neurale netwerken (ANN) die berusten op een beperkt aantal verborgen lagen of andere algoritmen zoals Random Forest of Support Vector Machine (SVM).

De waarde van deep learning voor de watersector

In dit project onderzoeken we de potentie en waarde van DL voor de watersector. Dit past zeer goed binnen de trend bij KWR en de watersector als geheel, waar steeds vaker ML-benaderingen worden gebruikt om (onderzoeks)vragen te beantwoorden. Om deze technologie te onderzoeken, stellen we een overzicht op van de verschillende soorten DL en hun sterke en zwakke punten. Hiermee kunnen onderwerpen of problemen worden aangeduid waarin DL een grote potentiële bijdrage kan leveren. Verder worden twee cases geselecteerd op basis van de eigenschappen van DL, namelijk dat het uitblinkt wanneer complexe relaties bestaan tussen input en output en/of wanneer grote hoeveelheden gegevens beschikbaar zijn.

Deze cases zijn:

  • De analyse van tekstgegevens van klantencommunicatie met de waterleidingbedrijven, en het automatisch extraheren van het onderwerp van het bericht. Deze onderwerpen kunnen worden vergeleken met gegevens over leidingstoringen en netwerkonderhoud, indien beschikbaar. Dit maakt een vroegtijdige opsporing van diverse problemen en verminderde dienstverlening in het waterdistributienet mogelijk. Tegelijkertijd zou dit helpen om het contact met de klant te verbeteren.
  • De analyse van infraroodspectroscopiegegevens op het gebied van de identificatie van microplastics. De output van deze casestudy bestaat uit verschillende deep- en ensemble-learningmodellen voor een nauwkeurige classificatie van polymeren van microplastics die in het milieu worden aangetroffen, alsook uit de kennis en vaardigheden om deze modellen af te leiden. Dit maakt het mogelijk om geavanceerde data-analyse en classificatie-algoritmen toe te passen op complexe chemische data. De impact van dit onderzoek zal aanzienlijk zijn, aangezien de opgedane ervaring relevant is voor tal van andere onderzoeksgebieden binnen KWR (bijvoorbeeld andere chemische analyses, voorspelling van de toxiciteit van chemische stoffen, evenals de verwijderingsefficiëntie op basis van kwantitatieve structuur-activiteitrelatie (QSAR)-modellen).

Een nieuwe tool voor onderzoekers?

Met de ervaring die we met deze casestudy opdoen, krijgen we inzicht in de mogelijke toepassingen van DL binnen het onderzoek van KWR en de watersector. Duidelijk zal worden wanneer DL een geschikt instrument is om verschillende problemen in de watersector aan te pakken. Vanwege de aard van de techniek lopen de mogelijke toepassingen dwars door meerdere disciplines heen. Als resultaat zullen we DL toegankelijker maken binnen de organisatie. Op die manier kunnen onderzoekers van KWR met een nieuwe tool onze klanten in de watersector beter van dienst zijn.