Als je succesvol wilt zijn met AI, zul je je eerst moeten focussen op je data. SynerScope inventariseert en wijst de weg in wat bij veel bedrijven en organisaties is uitgegroeid tot een onoverzichtelijke databerg.
‘Goed gelabelde data verhoogt de kwaliteit van de uitkomst van AI. Je kunt er AI mee temmen’
Enig inzicht in alle data op je laptop? De vraag is lastig, het antwoord zou een eyeopener moeten zijn. ‘Wat we vandaag of vorige week hebben opgeslagen, dat weten we nog wel,’ zegt Jan-Kees Buenen, ceo bij SynerScope. ‘We kennen de inhoud en het belang ervan. Maar ga je verder terug in de tijd, dan wordt het allemaal diffuus. Welke data is er? Waar vind je het? Wat is belangrijk en wat kun je weggooien?’ Buenen wil maar zeggen: als je op microniveau al worstelt met dit soort vraagstukken, dan mag je terecht vrezen dat het binnen je organisatie of onderneming niet anders zal zijn. ‘De mensen van IT zorgen dat het technisch beheerd wordt, niet inhoudelijk. Lage opslagkosten, zonder actief sorteren en weggooien, laat de onoverzichtelijk berg data steeds sneller groeien.’ Niemand kent het geheel en de vraag is of de losse details goed gekend zijn. En overal vind je de zogenaamde ‘dark data’, gegevens waarvan een organisatie of onderneming niet eens meer weet dat het bestaat. Het is een weerbarstig probleem, betoogt Buenen: ‘Kijk naar de toeslagenaffaire. Waarom denk je dat de afhandeling daarvan zo lang duurt? Omdat er gespit moet worden in een enorme databerg: oude dossiers, correspondentie, allerlei stukken in vervuilde mappen. Dan kun je wel geautomatiseerd zijn, maar dit is dus ouderwets handwerk. Je moet domweg heel veel mensen inschakelen die niets anders doen dan bestanden inzien en inventariseren.’
Alles start met data
Het grote misverstand is dat AI ons kan helpen met het wegwerken van dataproblemen. ‘Dat klopt niet,’ zegt Buenen. ‘Het is juist andersom. AI presteert het beste op basis van gestructureerde en gecategoriseerde data. Met andere woorden: als je als bedrijf of organisatie je datahuishouding niet op orde hebt, kun je ook niet goed gebruikmaken van AI-toepassingen. Je mist dus al meteen aan het begin van de AI-revolutie de boot. ChatGTP inzetten in je bedrijfscommunicatie? AI toepassen bij een eerste selectieprocedure voor een vacature? Dat functioneert alleen goed als je het systeem voedt of traint met een diversiteit van betrouwbare data. Die moet je kennen, anders injecteer je onbewust al heel snel forse bias in je AI. Als je succesvol wilt zijn met AI, zul je je eerst moeten focussen op je data. Omdat alles start met data.’
Betere bedrijfsresultaten
SynerScope, in 2011 opgericht als spin-off van de Universiteit Eindhoven, heeft een visuele scanner ontwikkeld die data inventariseert. ‘Wat we in wezen doen,’ zegt Buenen, ‘is het maken van een kaart. Daar zijn we in Nederland altijd al goed in geweest. Tegenwoordig reizen we van A naar B met een GPS-kaart in de auto. Maar waar is de kaart die ons door onze data leidt? Met SynerScope kun je de data – inclusief de ‘dark data’ – van je organisatie automatisch sorteren, labelen en clusteren. Dat sorteren gaat in een heel snel proces op inhoud. Op basis daarvan worden voor elk cluster mogelijke labels berekend.’ Waarmee je, zegt Buenen, als bedrijf of organisatie je eigen data en kennis weer volledig onder controle hebt. Zodra je ontdekt welke data je onderneming of organisatie heeft kun je veel meer (of beter) geïnformeerde beslissingen nemen. En bij een digitale transformatie naar de cloud in Microsoft Azure, neem je precies mee wat van belang is. Buenen: ‘Goed gelabelde data verhoogt de kwaliteit van de uitkomst van AI. Je kunt er AI mee temmen. En dan bedoel ik: écht inzetten voor jouw doel, met meer succes, minder risico en tegen veel lagere kosten. Je verbetert je bedrijfsresultaten door je (dark) data met SynerScope te ontsluiten.’