Nieuws

Nieuws

Data-analyse nuttige aanvulling op fysisch onderzoek

Binnen het thema ‘Smart Water Systems’ van TKI Watertechnologie heeft drinkwaterbedrijf Brabant Water met hulp van drie kennispartners data van diverse bronnen en parameters slim gecombineerd met big data-technieken. Het project DiAMANT-Water laat zien dat datagedreven analyses een nuttige aanvulling zijn op het onderzoek naar fysische processen: twee uitgewerkte casussen lieten onder meer zien dat bruin water correleert met temperatuur, geluidsklachten over watermeters met het bouwjaar van de woning en storingen in cementhoudende leidingen met grote drukverschillen over de dag. Er is echter geen kant-en-klaar recept: voor Knowledge Discovery in Databases (KDD) is in elke case maatwerk nodig.

Drinkwaterbedrijven gebruiken steeds meer online sensoren, automatisering en informatisering bij productie en distributie. Daarmee genereren zij ook een steeds groter wordende hoeveelheid ‘water’-data. Tegelijkertijd neemt ook het aanbod toe aan zogenaamde ‘open data’: datasets van diverse instanties die publiek toegankelijk zijn. Denk daarbij bijvoorbeeld aan de demografische kenmerken van openbare ruimte of datasets met omgevingstemperatuur en grondwaterstanden. Met de analysemethodiek Knowledge Discovery in Databases (KDD) is het vaak mogelijk waardevolle kennis te destilleren uit combinaties van dergelijke databronnen. Die kennis kan vervolgens worden ingezet om op operationeel niveau de informatievergaring en besluitvorming te verbeteren. Drinkwaterbedrijf Brabant Water wilde weten of het met datamining en KDD de bedrijfsvoering van de drinkwaterlevering kon verbeteren. Een consortium van KWR, Nelen en Schuurmans en Witteveen+Bos heeft daarom twee casussen uitgewerkt. KWR heeft voor de twee casussen een proof-of-principle van inzet en nut van deze technieken neergezet. Nelen en Schuurmans heeft de data en modelresultaten gevisualiseerd met het platform Lizard™. Witteveen+Bos had een adviserende rol.

Correlaties klantmeldingen

In de eerste casus is onderzocht hoe KDD kan worden toegepast op klantmeldingen, gegevens over het leidingnet, panden, omgevingstemperatuur en de demografie van buurten en wijken. Daarbij werd een correlatie gevonden tussen temperatuur en het aantal meldingen over bruin water en een correlatie tussen geluidsklachten over watermeters in woningen en het bouwjaar van die woning: een indicatie dat de locatie van een watermeter binnen een woning van doorslaggevend belang kan zijn.

Figuur: Gecombineerde visualisatie van verschillende databronnen in Lizard: waterverbruik in geel-oranje-rood (van laag naar hoog) en geclusterde klantmeldingen van geluidsoverlast (groene bolletjes met daarin de aantallen meldingen).

Figuur: Gecombineerde visualisatie van verschillende databronnen in Lizard: waterverbruik in geel-oranje-rood (van laag naar hoog) en geclusterde klantmeldingen van geluidsoverlast (groene bolletjes met daarin de aantallen meldingen).

Storingen gecorreleerd aan drukverschillen

In de tweede casus is onderzocht of KDD te gebruiken is om uit storingsregistratie, real time data uit het procesinformatiesysteem (druk- en volumestroomgegevens) en gegevens van het leidingnet inzicht te krijgen en hypotheses te verifiëren over storingsfrequenties. Daarbij bleek onder meer dat cementhoudende leidingen meer storen bij grote drukverschillen, terwijl andere leidingen vooral bij gangbare drukverschillen storen.

Nuttige aanvulling

Datagedreven analyses blijken een nuttige aanvulling te zijn op het onderzoek naar fysische processen, bijvoorbeeld als eerste screening voor een veelvoud aan mogelijke verklaringen die nader (fysisch) onderzoek vragen. Ook zijn met behulp van KDD bruikbare parameters te extraheren uit hoogfrequente metingen én klantmeldingen, waarbij visualisatie en ondersteuning met statistische methoden belangrijke bijdragen leveren. Degelijk datamanagement, bedrijfstakbreed delen van data (over storingen en meldingen én operationele data) en data-visualisatie kunnen de inzet van KDD en statistiek ondersteunen en de analyse versnellen. Kennis over het leidingnet en kennis over de manier waarop informatie wordt verzameld, geaggregeerd en gecombineerd is essentieel om KDD en datamining goed in te zetten: er is geen kant-en-klaar recept, het vraagt om maatwerk.