Machine learning toegepast op de toevoer van afvalwater
- Opdrachtgever
- Hoogheemraadschap Hollands Noorderkwartier
- Jaar
- 2020
- Locatie
- Texel
Hoogheemraadschap Hollands Noorderkwartier wil klimaatneutraal haar objecten aansturen en is daarom in 2018 gestart met een proeftuin op het eiland Texel. Voor het Hoogheemraadschap is de rioolwaterzuivering Everstekoog de grootste afnemer van elektriciteit. Om dit verbruik te compenseren heeft Hollands Noorderkwartier een zonnepark gerealiseerd dat op jaarbasis evenveel energie produceert als alle objecten op het eiland gezamenlijk afnemen. Vanzelfsprekend werkt het zonnepark enkel energie op als er zonnestraling op valt en dit is niet 24 uur per dag het geval. Om zoveel mogelijk gebruik te maken van de beschikbare zonne-energie is een real-time control systeem geïmplementeerd die de water beheertaken en het energievraagstuk integraal oplost in een energieoptimalisatie. Daarbij kijkt het systeem 36 uur vooruit.
De uitdaging
Het verbruik van de rioolwaterzuivering wordt grotendeels bepaald door de hoeveelheid afvalwater aangevoerd vanuit de rioolgemalen. Het real-time control systeem vraagt om een verwachting van het afvalwater bij de energieoptimalisatie. Afvalwater bestaat uit de hemelwatertoevoer (neerslag) en droogweerafvoer (bijv. douchewater). De toevoer van afvalwater naar de zuivering wordt traditioneel afgeleid met analyses als de DWAASHAAS methodiek. Op Texel is de DWAASHAAS methodiek minder geschikt, vanwege de variatie in het aantal toeristen op het eiland. Texel kent ruim 13.000 inwoners, maar kan tijdens hoogtijdagen het onderdak bieden aan ruim 45.000 toeristen. Hierdoor bestaat er ook een grote variatie in de toevoer van afvalwater. Daarnaast kennen toeristen een ander water verbruikspatroon dan ‘normale’ bewoners, doordat ze gemiddeld later op staan en veelal douchen na een dagje strand. Al deze aspecten hebben invloed op het bepalen van de verwachte hoeveelheid afvalwater over de dag. Met behulp van data-gedreven modellen zijn deze verbanden impliciet mee te nemen.
Met machine learning is het mogelijk om modellen te trainen op verbanden zonder deze vooraf expliciet in kaart te brengen. Daarbij is het als eerst belangrijk om gevoel te krijgen bij de problematiek. Samen met de assetmanager afvalwaterketen van HHNK en medewerker riolering van de gemeente Texel zijn in een workshop use-cases uitgewerkt die effect hebben op de toevoer van afvalwater. Een voorbeeld daarvan is “In het zomerseizoen zijn er veel badgasten, om vier uur ‘s middags verlaten velen het strand en stappen daarna direct onder de douche om zich af te spoelen”.
De use cases geven inzicht in de benodigde data voor het model. De uitdaging zit in het feit dat voor ons model geen dataset beschikbaar is over de hoeveelheid badgasten die per uur van het strand loopt en onder de douche staan. Niet in het verleden, laat staan dat we daar verwachting van hebben.
Onze oplossing
Ondanks dat er over een use case zoals het gedrag douche gedrag van badgasten geen data bestaat kunnen we deze toch mee te nemen in het model. Dit doen we door gebruik te maken van proxy data.
De term proxy data komt uit de paleoklimatologie waar klimaatwetenschappers indirecte waarnemingen gebruiken om het historische klimaat uit af te leiden. Ze gebruiken bijvoorbeeld de dikte van de jaarringen van bomen als indirecte meting voor de temperatuur en de CO2 concentratie in de lucht.
Voor het bepalen van de watertoevoer hebben we een machine learning model getraind op zowel directe waarnemingen als proxy data. Door het model te trainen op deze gecombineerde dataset gaat het zelf opzoek naar de verbanden. Er is gebruik gemaakt van de volgende data:
- Voortschrijdende gemiddelde verpompte volumes van het vuilwater
- Maand van het jaar
- Dag van de week
- Uur van de dag
- Schoolvakanties
- Meerdere voortschrijdende neerslagsommen van de regenradar ruimtelijk uitgemiddeld over het bemalingsgebied.
Als machine learning model is gekozen om een (feedforward) neuraal netwerk toe te passen. Een neuraal netwerk is in staat om op basis van een trainingsset bestaande uit invoer- en uitvoer data zelf de verbanden te leggen. Deze verbanden staan beschreven in een netwerk van nodes en gewichten. Bij het leggen van de verbanden wordt de afwijking tussen model en meting geminimaliseerd. Het model is ontwikkeld in Python met behulp van de Keras bibliotheek. Daarbij is in het feedforward neuraal netwerk een drop-out toegevoegd om overfitting van het model te voorkomen.
De invoerdata bestaat uit zowel continue data als neerslag, als categorische data met bijvoorbeeld de dag van de week. De categorische data is voorbewerkt tot een one-hot encoding zodat niet onbewust een gradatie in deze gegevens wordt meegenomen. Het model is getraind op een dataset van uurlijkse gegevens over de periode april 2013 tot juni 2020 en gevalideerd over vijf maanden van juli tot november 2020. De model performance over de training- en validatieperiode is gekwantificeerd met behulp van een gemiddelde absolute fout (mae) in verpompte m3 afvalwater per uur tussen de meting en simulatie en de verklarende variatie (r2).
mae training: 4.36 r2 training: 0.67
mae validatie: 0.81 r2 validatie: 0.99
Met dit eenvoudig opgezette machine learning model resulteert dit bij een gemiddeld verpompt debiet van 14.9m³ per uur een afwijking van ruim 28% over de trainingsperiode en ruim 5% over de validatieperiode. De kleinere afwijking over de validatieperiode is te verklaren doordat gedurende de trainingsperiode van zeven jaar meer variatie in te waterafvoer plaatsvindt. Oorzaken zijn o.a. de nieuwbouw van vakantiewoningen en aanpassingen aan de gemaalinstellingen. De kleine afwijking over de validatieperiode geeft daarnaast een goede indicatie dat het model niet overtraind is en geen overfitting optreedt.
Het resultaat
In dit project is een nauwkeurige voorspelling opgezet voor de toevoer van afvalwater bij twaalf rioolgemalen. Hiermee is het energieverbruik van de RWZI Everstekoog sterk teruggedrongen en afgestemd op energieproductie vanuit het zonnepark. Het Hoogheemraadschap Hollands Noorderkwartier heeft hiermee goede voortgang geboekt in het klimaatneutraal aansturen van objecten. In de toekomst kan een doorontwikkeld zelf-lerend model het systeem nog weer een slag efficiënter maken.
Alle cases