project

Text-mining voor vroege detectie van relevante waterverontreinigingen

Lang voordat stoffen in regelgeving en meetprogramma’s terechtkomen, kunnen er in tekstbronnen zoals rapporten, sociale media, nieuwsberichten, websites van toezichthoudende instanties of wetenschappelijke literatuur aanwijzingen zijn dat deze mogelijk naar het watersysteem kunnen worden geëmitteerd.

Het lezen van alle mogelijk relevante informatie is tijdrovend, zeker omdat de beschikbaarheid van digitale informatie elk jaar toeneemt en informatie versnipperd is. Met een ‘text mining’ (TM) aanpak kunnen stoffen waarvoor een indicatie is van (toekomstige) emissie naar water semiautomatisch worden ontdekt. Deze stoffen kunnen vervolgens extra onder de loep worden genomen.

Het onderzoeksproject heeft tot doel een methodologie op te bouwen met betrekking tot text-mining om nieuwe potentieel problematische chemicaliën voor de Nederlandse wateren te identificeren op basis van verschillende informatiebronnen. Deze informatie gaat over mogelijke nieuwe emissies die relevant zijn voor Nederland door bijvoorbeeld industrie, huishoudens, of landbouw. Dit kan worden beschouwd als onderdeel van een vroegtijdig waarschuwingssysteem om (nieuwe) processen te detecteren en te identificeren die stoffen zullen uitstoten die problemen kunnen veroorzaken voor de waterkwaliteit. Daarnaast kan het gebruikt worden om meetprogramma’s uit te breiden.