project

Implementatiepilot datavalidatie

Expert(s):
dr. Mario Castro-Gama MSc, dr.ir. Dirk Vries, Erwin Vonk MSc

  • Startdatum
    01 jan 2019
  • Einddatum
    31 dec 2019
  • Opdrachtgever
    Bedrijfstakonderzoek
  • samenwerkingspartner(s)

Slechte datakwaliteit wordt vaak genoemd als een van de  hindernissen voor succesvolle exploitatie van dataminingtechnieken (bijv. VO datamining) voor bijvoorbeeld analyse, monitoring, procesbesturing of beslissingsondersteuning. In 2018 is binnen het platform Hydroinformatica een onderzoeksproject aan dit onderwerp gewijd. Hierin zijn huidige praktijken en kansen voor verbetering gerapporteerd, en is het belang van het samenbrengen van domein- en expertkennis bij datavalidatie onderstreept.

Verbetering datakwaliteit nodig

Drinkwaterbedrijven passen op data gebaseerde modellen en technieken toe in bijvoorbeeld hun analyse, monitoring, procesbesturing of als ondersteuning van beslissingen. Vaak belemmert een slechte datakwaliteit een succesvolle exploitatie van deze technieken. Daarom is een belangrijke eerste stap in het toepassen van deze technieken het verbeteren van de datakwaliteit. Dit project beoogt een strategie te ontwikkelen waarmee binnen een bestaande dataomgeving een datakwaliteitscontrole kan worden toegepast.

Pilot in validatie en borging van data

Bij een waterbedrijf wordt een pilot gedefinieerd en uitgevoerd. Verbetering in de validatie en borging van een geselecteerde datastroom moet tot een beter databeheersysteem leiden. Een dergelijk systeem is zeer gewenst voor bijvoorbeeld anomaliedetectie, algoritmes voor predictief onderhoud en intelligente (early warning) monitoring- en/of regelsystemen. Met een goed functionerend databeheersysteem zijn waterbedrijven beter in staat om met (bestaande) data hun bedrijfsvoering te optimaliseren op operationeel, tactisch of strategisch niveau.

Strategie voor datakwaliteitscontrole

Binnen de geformuleerde pilot wordt een strategie voor datakwaliteitscontrole gerealiseerd door middel van:

  • een demonstratie van de operationele toepassing van (meer) geavanceerde datavalidatietechnieken;
  • een weergave van de ontwikkelde werkwijze in een stappenplan waarmee andere waterbedrijven het generieke raamwerk kunnen toepassen;
  • kennisoverdracht door middel van rapportage, een broncode, een publicatie in een vakblad en een presentatie die door leden van het platform Hydroinformatica kan worden gebruikt.