DigiShape Open Source Platform (D-OSP)
Samenvatting project
Voor het ontwikkelen van AI en Machine Learning algoritmen is het verbinden en combineren van meerdere
datasets essentieel. Deze ontwikkeling gaat nog niet vanzelf. Alhoewel iedereen ervan overtuigd lijkt te zijn dat
gedeelde data tot betere oplossingen leidt, blijken er in de praktijk allerlei belemmeringen te bestaan die ons
ervan weerhouden om daadwerkelijk data gaan delen. Denk hierbij aan praktische zaken als de omvang van de
datasets en de diversiteit aan platforms en cloud-omgevingen, maar ook aan ethische aspecten,
privacyoverwegingen en wederzijds vertrouwen.
Dit geldt mogelijk nog sterker voor de toepassing van AI-oplossingen. Alhoewel iedereen er over praat zijn de
concrete toepassingen van AI in de praktijk nagenoeg nog op één hand te tellen. Ook hier is blijkbaar een grote
drempel die praktische toepassing in de weg staat. Hoeveel vertrouwen hebben we werkelijk in AI?
In de portfolio analyse die is uitgevoerd in opdracht van de TKI Watertechnologie is geconstateerd dat er nog
niet of nauwelijks wordt ingezet op èchte datascience innovaties voor de watersector, met name waar het gaat
om ontwikkeling en toepassing van AI en machine learning. DigiShape heeft geconstateerd dat het
belangrijkste knelpunt bestaat uit de beschikbaarheid van goede data voor de ontwikkeling van nieuwe
algoritmen en het vertrouwen in data en algoritmen van andere partijen binnen (en buiten) de sector.
Daardoor wordt er slechts in zeer beperkte mate ‘op de schouders’ van andere ontwikkelingen gestaan.
Het onderhavige voorstel richt zich daarom op het samenspel tussen drie belangrijke aspecten: vertrouwen,
interoperabiliteit en (faciliterende) infrastructuur. Aan de hand van deze aspecten en door middel van een
aantal concrete cases ontwikkelen we een nieuwe manier van werken. Dit kent zowel harde aspecten
(technische infrastructuur, modellen, datastructuren) als zachtere aspecten (training, workshops en dialoog).
Het D-OSP brengt deze zaken bij elkaar en borgt het delen van kennis en ervaring.
De verbinding met DigiShape (zowel de partners als de community) waarborgt een brede betrokkenheid van de
watersector, technologie- en kennisleveranciers en eindgebruikers.
Doel van het project
Als de Nederlandse watersector haar mondiale koploperspositie niet wil verliezen, is het noodzakelijk een
versnelling aan te brengen in de digitale transitie van de sector. Individueel maken veel bedrijven al een slag
naar digitalisering, echter de samenhang binnen de sector blijft hierbij achter. Om hierin een slag te maken
hebben bedrijfsleven, overheid en kennisinstellingen gezamenlijk het initiatief genomen tot de oprichting van
DigiShape, een innovatieplatform ten behoeve van de digitale transitie van de watersector.
Uit de gesprekken en initiatieven tussen de partners onderling en met de brede DigiShape community is
gebleken dat de toepassing van AI-technieken en de daarvoor essentiële uitwisseling van data als
problematisch wordt ervaren. Binnen de organisatie lukt het vaak goed om effectief te werken, maar vooral bij
samenwerking tussen organisaties wordt de voortgang tegengehouden door een drietal drempels. Dit voorstel
beoogt te faciliteren bij het overgaan van deze drempels: vertrouwen (onderling en in de methoden),
interoperabiliteit (van data en algoritmen) en het gebrek aan gedeelde infrastructuur.
Door deze uitdagingen op te lossen kunnen we de time to market voor gedeelde initiatieven substantieel
verkorten. Enkele voorbeelden:
- Vertrouwen: Hoe werk ik op een veilige en efficiënte manier met de data van een ander? Organisaties
zijn bereid om toegang te geven tot hun data voor bepaalde modellen en algoritmen, maar niet voor
breder gebruik. Hoe kan je toegang geven tot je data zonder de data weg te geven?
- Explainable AI (XAI): Toepassingen op basis van AI zijn voor de meeste mensen een black box: het
wordt steeds minder duidelijk langs welk proces tot conclusies of resultaten wordt gekomen en welke
afwegingen hierbij zijn gemaakt. Voor het behoud en vergroten van het vertrouwen is het daarom van
cruciaal belang dat de stakeholders worden meegenomen in de berekeningen: leg uit hoe de AI werkt
en tot conclusies komt in de specifieke toepasssing.
- Interoperabiliteit: Er zit altijd veel tijd in het opwerken, converteren en valideren van data. Hoe kan je
je samen optrekken en zo dubbelingen voorkomen?
- Hoe kan ik mijn AI draaien tegen grote datasets? Veel datasets zijn zo groot dat je ze niet meer wil
downloaden of dupliceren. Als we data op een gezamenlijke plek neerzetten, dan hoeft niemand meer
te downloaden. Op welke plekken gaan we deze data delen?
Motivatie
Het voorgestelde project draagt bij aan prioriteit 49 van Sleuteltechnologie 1 (‘Connected AI voor robotica en
digitale innovatie’). Binnen deze prioriteit is opgenomen dat behoefte is aan het verbinden van meerdere
databronnen aan een diversiteit van (o.m.) AI algoritmes. Het beschikbaar en toegankelijk maken van
trainingssets en big data collecties is daarbij specifiek benoemd.
De prioriteit is in de calltekst vanuit een technisch perspectief beschreven. De technische problemen zijn veelal
direct oplosbaar (en zullen dan ook binnen dit project worden geadresseerd). De sociale en gedragsaspecten
zijn minstens zo belangrijk, maar veel complexer om op te lossen: vertrouwelijkheid van gegevens, vertrouwen
in partners, en vertrouwen in data, AI routines en -resultaten. Analytische modellen kunnen we ‘begrijpen’; de
black-box van AI is veel moeilijker. De eigen tools en modellen worden vaak vertrouwd, maar bij samenwerking
ligt de lat hoger. Binnen de context van dit project zullen we daarom inzetten op ontwikkelingen zoals
reproduceerbaarheid, Explainable AI (XAI) en het gebruik van blockchain ter verificatie van input, tools en
outputversies. De impact (en bijsturing) hiervan wordt getoetst aan toeleveranciers (privaat) en eindgebruikers
(hoofdzakelijk publiek) binnen de watersector in de workshops en dialogen die we gaan organiseren.
Daarnaast draagt het voorgestelde project bij aan prioriteit 47, missie F4 (‘toepassing AI en Machine Learning
op watervraagstukken’), dat is gericht op het uitvoeren van concrete, kort cyclische experimenten met AI en
machine learning in de watersector. Dit is precies de wijze waarop in het voorgestelde project gewerkt zal
worden aan methode ontwikkeling (ahv concrete cases). De verbinding met DigiShape waarborgt een brede
betrokkenheid van de watersector, technologie- en kennisleveranciers en eindgebruikers.
In de portfolio analyse die is uitgevoerd in opdracht van de TKI Watertechnologie is geconstateerd dat er nog
niet of nauwelijks wordt ingezet op èchte datascience innovaties voor de watersector, met name waar het gaat
om ontwikkeling en toepassing van AI en machine learning. DigiShape heeft geconstateerd dat het
belangrijkste knelpunt bestaat uit de beschikbaarheid van goede data voor de ontwikkeling van nieuwe
algoritmen. 80% of meer van de inzet gaat verloren aan het zoeken naar en beschikbaar maken van goede
datasets. Daarnaast is gebleken dat er slechts in beperkte mate ‘op de schouders’ van andere ontwikkelingen
wordt gestaan. Uit peilingen in diverse communities is gebleken dat er een grote behoefte bestaat aan de
ontwikkeling van een open source platform waarin, zoals beschreven in de doelstelling, datasets en algoritmen
worden ontwikkeld, ontsloten en gedeeld. In deze behoefte wordt nog niet voorzien.
In “Nederland digitaal waterland” is het slim combineren van databronnen een belangrijke voorwaarde. Door
meer data beter te combineren komen innovatieve oplossingen binnen handbereik. Doordat we het
grootschalig delen van data, modellen en tools, faciliteren kunnen de organisaties hun gezamenlijke
oplossingen beter opschalen naar het buitenland. Vooral de toepassingen die globaal dekken en lokaal relevant
zijn kunnen hiervan profiteren. Door de het combineren van open en gesloten datasets beter te faciliteren
kunnen we zowel inclusieve open oplossingen als commerciële oplossingen voor specifieke markten faciliteren
met dezelfde basis. Dit aspect was dan ook een belangrijk criterium bij de selectie van de use-cases.
Valorisatie
Het platform dat we ontwikkelen, om digitale samenwerking binnen de sector te faciliteren, zal na afronding
van het project via het DigiShape innovatieplatform worden opengesteld voor de hele sector. Het is de
overtuiging van DigiShape en haar partners dat juist door open innovatie en breed delen, snelheid kan worden
gemaakt, waarmee de sector haar internationale koppositie kan behouden en versterken. DigiShape zal het
platform daarom beheren en onderhouden zodat het nog langjarig ingezet kan worden binnen de watersector
(en wellicht ook daarbuiten). Als onderdeel van dit project zal een beheer- en onderhoudsplan worden
opgesteld, waarin ook de financiële randvoorwaarden worden opgenomen (WP7).
Naast de ontwikkeling van het D-OSP zullen we in het project, zoals eerder uitvoerig beschreven, inzetten op de
dialoog tussen partijen in de watersector over de drie grote drempels die versnelling van digitalisering in de
weg staan: vertrouwen, interoperabiliteit en infrastructuur. Deze dialoog voeren we met alle geïnteresseerde
partijen binnen (en buiten) de watersector. De kennis uit dit project komt daarmee rechtstreeks terecht bij de
eindgebruikers. Dit is de hoofdtaak van WP1, waarin daarmee de kern van de disseminatie (en daarmee tevens
de basis voor de valorisatie) is belegd.
Voor een succesvolle implementatie is betrokkenheid van diverse stakeholders essentieel. Deze betrokkenheid
wordt mede gecreëerd door met de stakeholders van de verschillende use-cases, maar ook de DigiShape
community de dialoog te starten bij de start van de implementatie en te continueren gedurende de
implementatie. Naast deze dialoog worden er trainingen ontwikkeld waarin de stakeholders kunnen leren hoe
het platform van meerwaarde is en hoe het platform gebruikt kan worden. Door deze betrokken aanpak
borgen we de implementatie. Daarnaast wordt tenminste eenmaal een Hackaton georganiseerd en een
‘pizzacursus’ voor studenten van de TU Delft, UU en UT, alsmede voor geïnteresseerde studenten uit het hoger
beroepsonderwijs. Daar waar mogelijk zullen geschikte afstudeerders en/of stagiairs worden betrokken bij het
project
Tijdens de Implementatie worden concrete projecten (de use-cases; WP2-5) gebruikt om het platform te
ontwikkelen en om de meerwaarde van het platform aan te tonen. Door gebruik te maken van use cases uit
verschillende sectoren (o.a. scheepvaart, building with nature, waterveiligheid en agricultuur) wordt de
verbinding gelegd met deze verschillende (deel-)sectoren.
Door in te zetten op een open dialoog met zowel de stakeholders van de use-cases als ook de brede (en open)
DigiShape Community, zullen partijen die niet betrokken zijn in dit project snel de mogelijkheid hebben te
profiteren van de kennis die in dit project wordt opgedaan. Het lerend vermogen van een deel van de
watersector wordt vergroot door alle stakeholders in aanraking te laten komen met nieuwe technologie,
hetgeen tot vragen en kennisbehoeften van individuen en organisaties zal leiden, alsmede een mogelijke vraag
naar nieuwe competenties, zoals bijvoorbeeld het begrip omtrent en omgang met kunstmatige intelligentie.
DigiShape is, als onafhankelijk, samenwerkingsverband van de NL-watersector op het gebied van digitalisering
en digitale technieken, initiatiefnemer van dit project. Hierdoor wordt meteen de aansluiting met een groot
deel van het netwerk van de Nederlandse watersector gerealiseerd. DigiShape is op haar beurt weer onderdeel
van verschillende nationale gremia, waaronder de NL_AIC (Nationale AI Coalitie). Binnen haar netwerk en via
de reguliere social media kanalen en haar nieuwsbrief zal DigiShape actief communiceren over de activiteiten
en de resultaten van het D-OSP project. Elke organisatie kan zonder drempel toegang krijgen tot en actief
participeren binnen de DigiShape community. Op deze wijze wordt elke drempel tot het delen van kennis en
informatie weggenomen.
Verder sluiten we aan op reguliere samenwerking met belangrijke partijen in de ICT sector. Zo werken partners
samen met Microsoft in de Open Earth ontwikkelingen en met Google (waarmee o.m. wordt gewerkt aan de
Global Water Watch). De visie van deze mondiale spelers en de trends die door hen worden gesignaleerd zullen
eenvoudig meegenomen kunnen worden in D-OSP. Ook zullen deze (en andere) partijen gericht worden
uitgenodigd om deel te nemen in onze dialoog sessies.
Tot slot zal, als onderdeel van de DigiShape website (www.DigiShape.nl) een eigen projectpagina worden
ingericht, waar de voortgang en resultaten, alsmede ontwikkelde tools worden gedeeld. Hiervoor wordt onder
meer een git-hub respository ingezet.