project

Datamining in brede screeningsgegevens; zoeken naar relevante nieuwe stoffen in verschillende watertypen

Brede screeningsanalyses die gedurende de afgelopen jaren zijn verzameld, bevatten een schat aan informatie. De gegevens zijn afkomstig van monsters van drinkwater, grondwater, oppervlaktewater en afvalwater effluenten. Het is echter niet makkelijk om uit al deze data de informatie en kennis te destilleren die erin ligt opgesloten. Nieuwe software maakt het mogelijk om grote aantallen monsters onderling te vergelijken en om deze gelijktijdig te screenen op meerdere (on)bekende stoffen (‘datamining’).

In dit onderzoek wordt uit de reeds aanwezige grote hoeveelheid brede screeningsdata meer bruikbare informatie gehaald. Ten eerste is het doel van het onderzoek om in de data te zoeken naar allerlei relevante stoffen die op basis van hun productievolumina, gebruik of toxicologische eigenschappen mogelijk relevant zijn voor de (drink) waterketen. Ten tweede heeft dit onderzoek als doel om de waterkwaliteit van uiteenlopende watertypen te typeren.

Datamining in brede screeningsgegevens ten behoeve van het zoeken naar relevante stoffen en het herkennen van patronen/relaties van het voorkomen van stoffen in verschillende watertypen.

De verschillen in somconcentratie van de stoffen per monster (in interne standaard equivalenten) tussen de verschillende watertypen. EFF = effluent, OW= oppervlaktewater, GW=grondwater, DW = drinkwater, n=aantal monsters)

De verschillen in somconcentratie van de stoffen per monster (in interne standaard equivalenten) tussen de verschillende watertypen. EFF = effluent, OW= oppervlaktewater, GW=grondwater, DW = drinkwater, n=aantal monsters)

Suspect screening en statistische analyse

De eerste fase van het onderzoek bestond uit het screenen van een grote hoeveelheid aan brede screeningsgegevens (151 monsters) bij een voorselectie van relevante antropogene stoffen op de Europese markt (5.200 stoffen). Vervolgens werden in een andere studie de gevonden stoffen geprioriteerd (BTO 2015.003). In de tweede fase van het onderzoek lag de focus op het herkennen van patronen in de aanwezigheid van stoffen in verschillende watertypen. Met behulp van statistische methoden zijn de monsters onderling vergeleken. Zowel de grootschalige suspect screening (koppeling van (onbekende) stoffen uit brede screeningsdata aan potentiële kandidaten) als de gebruikte statistische methoden zijn nieuw voor data-analyse van breed screenend chemisch onderzoek.

Waardevolle methode bij interpretatie van screeningsdata

Suspect screening blijkt een krachtige techniek te zijn voor het opsporen van nieuwe antropogene stoffen, mits verdere identificatie wordt uitgevoerd. Van de 5.200 ‘suspects’ werden 1.260 potentiële kandidaatstoffen benoemd.

Toepassing van suspect screening is mogelijk als invulling van de doelstelling van het bestuderen van “overige antropogene stoffen” uit het Drinkwaterbesluit. Het identificeren van nieuwe stoffen geeft richting aan monitoring en het waarborgen van de waterkwaliteit.

Na identificatie van de suspects is het in principe mogelijk om op basis van chemische eigenschappen relaties tussen een specifiek watertype en het voorkomen van een stof te bepalen. Dergelijke relaties helpen bij het inschatten van het gedrag van niet-geanalyseerde stoffen in water.