Nieuws

Data-explosie – omgaan met een overload aan data

Eerste kennisuitwisselingsbijeenkomst Platform Hydroinformatica in 2022 bespreekt noodzaak tot strategieplan databeheer

Tijdens de eerste kennisuitwisselingsbijeenkomst van het Platform Hydroinformatica van dit jaar werden de algemene problematiek van data-overload en de mogelijke gevolgen hiervan voor de datastrategie van de waterbedrijven besproken. De wereld verkeert in een digitale transformatie, iets waar ook de waterbedrijven mee te maken hebben. Er komen enorm veel data (‘big data’) beschikbaar; in volume, snelheid en verscheidenheid. Als hier niet goed op wordt ingespeeld, ligt een vertraging van de digitale transformatie op de loer. Als conclusie van de bijeenkomst werd vastgesteld dat een duidelijk strategieplan noodzakelijk is om de digitale transformatie van waterbedrijven vorm te geven.

Uitdagingen van ‘big data’

Aan de zogenoemde ‘big data’ kleven drie notoire uitdagingen, die door KWR-onderzoekster Tessa Pronk werden toegelicht. Big data is de aanduiding voor zeer grote hoeveelheden data, die snel of continue worden gegenereerd en met een grote variëteit aan vormen. Allereerst moet de architectuur waarin de data worden vastgelegd aan de nodige eisen voldoen. Daarbij kan met name de snelheid van datatransport een knelpunt zijn. Innovatieve oplossingen om dit knelpunt te omzeilen zijn bijvoorbeeld ‘Linked Data’ of een ‘Datatrein’. Met een ‘Datatrein’ reist de software langs de data, in plaats van andersom. Een tweede uitdaging betreft het bruikbaar maken van de data. Als de datastroom zo groot, snel en divers is, is het lastig om de kwaliteit ervan goed te waarborgen. Tot slot is het gebruik van de data zelf ook nog een uitdaging. Er zijn zo enorm veel mogelijkheden om data in te zetten, dat het noodzakelijk is hiervoor een duidelijk gedefinieerd doel te hebben.

Figuur 1 – Verbetering gegevens verplaatsing.

 

Data-strategie Waternet

Omdat de kennisuitwisselingsbijeenkomsten vooral ook zijn bedoeld om praktijkervaringen met elkaar te delen, gaf Eljakim Koopman van Waternet een toelichting op de datastrategie van het waterbedrijf. Bij Waternet wordt gewerkt met een Object Type Library (OTL), die de basis vormt voor de datastrategie. In de OTL zijn alle ‘assets’, zoals pompen en dijken, in informatiemodellen beschreven als objecten, met voor elk object alle benodigde informatie. De ‘Linked data’ in de OTL kan flexibel allerlei informatie met elkaar verbinden. Dit betekent een drastische vermindering van het aantal losse applicaties die voorheen voor de dataopslag nodig waren. Met de data op één plek, hoeven deze bij wijzigingen ook maar één keer te worden aangepast. Ook data die bijvoorbeeld worden gegenereerd door een sensor kunnen op deze manier beschreven worden. Voor het eenvoudig, snel en geautomatiseerd binnenhalen van sensordata wordt gebruikgemaakt van een Application Programming Interface (API).

Figuur 2 – Overzicht van het IT-product binnen Waternet.

Verschillen tussen waterbedrijven

De bijeenkomst werd afgesloten met een interactieve discussie over verschillende aspecten van databeheer bij de waterbedrijven. Daarbij draaide het vooral om de ervaringen en knelpunten. Naar voren kwam dat sommige waterbedrijven al ervaring hebben opgedaan met een strategie rond databeheer. Andere waterbedrijven staan nog aan het begin hiervan. Voor beginnende partijen is het belangrijk te starten om helderheid te krijgen rond definities en verantwoordelijkheden. Wanneer in deze basisbeginselen voldoende wordt geïnvesteerd, levert dat uiteindelijk tijd en geld op. Een inzicht vanuit het Vlaamse waterbedrijf liet zien dat verplichtingen vanuit de overheid kunnen helpen om dit proces in gang te zetten.

Tijd, geld en menskracht

De discussie bracht verder aan het licht dat het structureren van data een grote investering vraagt in tijd, geld en menskracht. Zo kwamen de aanwezigen tot de slotsom dat het moeilijk is om een financiële kosten-batenanalyse voor een gestructureerd databeheerplan op te stellen. Het punt is dat de kansen die data bieden lastig in geld zijn uit te drukken. Wel werd geconcludeerd dat het in deze tijd ondenkbaar is om géén databeheerplan te hebben. Wanneer waterbedrijven de ‘best practices’ van gestructureerd databeheer met elkaar delen kan dit de potentiële meerwaarde ervan inzichtelijk maken. Klein beginnen kan dan leiden tot meer. Als voorbeeld van een centraal beheer van informatiemodellen werd het Waterschapshuis van de waterschappen aangehaald. Voor de waterbedrijven zou een vergelijkbare aanpak een grote efficiëntieslag betekenen.

Beheersen van veiligheidsrisico’s

Tot slot werd ook nog gesproken over de bijdrage van databeheerplannen aan het tegengaan van catastrofes zoals een data-infarct of een veiligheidsbreuk. Door het aantal geïnstalleerde applicaties binnen een waterbedrijf te beperken, blijven de veiligheidsrisico’s beheersbaar. Na het bespreken van al deze verschillende facetten van databeheer werd vastgesteld dat een duidelijk strategieplan noodzakelijk is om de digitale transformatie van waterbedrijven vorm te geven.

delen