Data-hamsters zijn een blok aan het been van vooruitgang
Veel organisaties zien data als de heilige graal. Dé sleutel naar een succesvolle toekomst. Helaas hanteren ze op dit gebied niet allemaal de meest effectieve strategie, zegt Patrick Klink, de oprichter van ONBRDNG. Hij adviseert organisaties om een heldere datastrategie te definiëren en hiermee keuzes te maken uit de beschikbare bedrijfsdata.
Aan het begin van de coronacrisis werden toiletpapier en andere ‘primaire levensmiddelen’ massaal gehamsterd in de supermarkten, omdat mensen bang waren dat de voorraden op zouden raken. Achteraf bleek dit helemaal niet nodig, waardoor veel mensen nu opgescheept zitten met enorme voorraden blikvoer, koffie en bloem, omwille van een schaarste die nooit kwam.
In het digitale domein werkt dit net zo. Veel organisaties zijn zich bewust van de ‘waarde van data’ in algemene zin, maar hebben op dit moment niet de kennis of middelen in huis om die eruit te halen. Om diezelfde reden weten ze ook niet welke data ze op een later moment nodig gaan hebben. Voor de zekerheid besluiten ze daarom maar alle gegevens te hamsteren die ze kunnen vinden. Want je weet maar nooit, zo is de rationale dan vaak.
Naarmate de tijd vordert, wordt de databerg van deze organisaties groter en groter. Net als de kosten voor de opslag en het beheren ervan. Zodra een organisatie uiteindelijk de kennis in huis heeft om met data-analytics en machine learning aan de slag te gaan, blijkt vaak dat het datavolume te groot, te complex en soms te verouderd is geworden om er iets effectiefs mee te doen.
Dit maakt digitaal hamsteren een zeer slechte langetermijnstrategie voor datagedreven digitale transformatie. Door het probleem op deze manier voor je uit te schuiven, creëer je geen kansen op lange termijn. Integendeel, het leidt tot hogere kosten en maakt het extraheren van waarde uit je gegevens lastiger. Daarnaast wordt het heel verleidelijk om vanuit de verzamelde data te redeneren (wat kunnen we met onze datacollectie bereiken) in plaats van te denken vanuit de behoeften van de gebruiker (wat willen we bereiken).
Digitale strategie bepalen
Elk bedrijf is anders en daarom verschilt ook welke gegevens de meeste waarde hebben voor hun bedrijfsvoering. Kijk alleen al naar de giganten Google, Amazon en Facebook. Die hebben heel verschillende businessmodellen. Bij Google ligt de nadruk op zoekgedrag, bij Amazon op koopgedrag en bij Facebook op sociaal gedrag. Dat heeft invloed op het bepalen van hun datastrategie, en welke gegevens daarbinnen van belang zijn.
Deze organisaties hebben weliswaar de luxe dat ze beschikken over ruime kennis en middelen om zoveel mogelijk data te verzamelen én daar waardevolle inzichten uit te halen. Dat geldt natuurlijk niet voor elk bedrijf. Maar wel universeel is dat ook zij keuzes maken, en beginnen bij het formuleren van een digitale strategie. Nadat de doelstelling is bepaald volgt de keuze voor de juiste analyse-soort, en ten slotte pas de selectie van de juiste data.
Het doel van data-analyse
Ook het kiezen van de juiste data-analyse hangt af van het doel. Om te beginnen zijn er vier categorieën van data-analyse, opeenvolgend van eenvoudig tot complex. In algemene zin neemt de waarde toe met de complexiteit van de analyse. Of complexe inzichten ook rendabel kunnen worden, hangt sterk af van de organisatie en het businessmodel.
1. Beschrijvende analyse
Dit is de meest eenvoudige analysevorm, waarmee je op basis van diverse historische databronnen antwoord kunt krijgen op de vraag “wat is er gebeurd?”. Een beschrijvende analyse zorgt dus voor een terugblik. Het laat bijvoorbeeld zien hoeveel de verkoop van een bepaald product netto heeft opgeleverd, wat de historische trend is, of welk aandeel van de omzet het heeft vertegenwoordigd binnen het gehele productaanbod in een afgelopen periode.
Deze traditionele analysevorm heeft zeker waarde, maar resultaten uit het verleden bieden geen garantie voor de toekomst.
2. Diagnostische analyse
Bij deze analysevorm worden historische bedrijfsgegevens naast andere (externe) data gelegd om daarmee antwoord te krijgen op de vraag waarom iets is gebeurd. Hiermee kun je bijvoorbeeld ontdekken waarom sales bepaalde targets heeft gemist, ondanks investeringen in marketing. Voor diagnostische analyses wordt doorgaans gebruik gemaakt van een combinatie van eigen bedrijfsgegevens en externe databronnen, bijvoorbeeld via LinkedIn of Google.
Doordat deze analyse erop gericht is gebeurtenissen te verklaren levert het interessante inzichten in factoren waarmee rekening moet worden gehouden in de toekomst.
3. Voorspellende analyse
Met voorspellende analyse kun je bepalen wat er mogelijk gaat gebeuren door de resultaten en trends van beschrijvende met de facturen uit de diagnostische analyse te combineren, en daarmee toekomstige trends te voorspellen. Deze analysevorm is heel nuttig voor forecasting en is de laatste jaren steeds krachtiger geworden door de vooruitgang in geavanceerde technieken, zoals machine learning.
Het moet echter gezegd worden deze voorspellingen altijd een inschatting zijn. Allereerst gaan ze uit van een stabiele marktsituatie. Daarnaast is de kwaliteit van de voorspelling sterk afhankelijk van de datakwaliteit en hoe volledig het inzicht in invloedsfactoren is.
4. Normatieve analyse
Deze vorm van analyse is gericht op het maken van aanbevelingen over welke maatregelen in bepaalde situaties het beste genomen kunnen worden. Deze categorie kun je zien als een voorspellende analyse waarin een aantal opties zijn doorgerekend, en binnen vooraf bepaalde parameters de beste optie aanmerken. Normatieve analyses kunnen bijvoorbeeld worden gebruikt om toekomstige problemen binnen de bedrijfsvoering te voorkomen of om optimaal van een bepaalde marktsituatie te profiteren.
In het eerste geval maak je gebruik van operationele bedrijfsgegevens en in het tweede geval ligt de nadruk op klantgegevens en verkooptransacties. Normatieve analyse is een belangrijk middel om de bedrijfsvoering te optimaliseren voor efficiëntie en groei.
Waardevolle data bepalen
Als je eenmaal weet welke analyse-soort nodig is om antwoord te geven op je vraag, wordt het tijd om te kijken welke gegevens je precies nodig hebt om je op te baseren. Dit is complexe materie. Bij sommige data-hamsteraars zijn die gegevens bijvoorbeeld volop beschikbaar, maar niet in de juiste vorm. Om geautomatiseerd auto’s te tellen in een parkeergarage is het bijvoorbeeld handiger om weegsensoren in de grond te bouwen dan een machine learning-algoritme te trainen om objecten te definiëren als auto en dit algoritme vervolgens loslaten op de archieven van camerabeelden van de ingang.
Dit klinkt vanzelfsprekend, maar uit recent onderzoek blijkt dat data scientists tot 45% (!) van hun tijd kwijt zijn aan schoonmaken van data, voordat het überhaupt geanalyseerd kan worden. Dat is zonde, want deze mensen wil je juist inzetten om antwoorden te vinden op complexe vragen.
Een van de oorzaken hiervan is dat data-hamsterende organisaties als onderdeel van hun digitale transformatie-trajecten op zoek gaan naar waarde in hun bonte collectie van ongestructureerde gegevens, zoals video-, audio- en beeldbestanden of de inhoud van e-mails, helpdesk interacties of social mediaberichten. Hoewel daar best relevante inzichten uit gededuceerd kunnen worden, is het vaak de vraag of dat ook inzichten zijn die aansluiten bij de digitale strategie, of überhaupt relevant zijn.
Tot slot
Maar welke data moet je nou juist wel of juist niet bewaren? Als je de waarde van data in het algemeen onderkent is het eigenlijk best vreemd als je nou juist die keuze af laat hangen van onderbuikgevoel. Als je twijfelt of bepaalde gegevens relevant (gaan) zijn is dat eerder reden om ze niet te bewaren dan wel. De tijd en middelen die je daardoor bespaard kun je namelijk beter investeren in een effectieve strategie. Daarvan is de uitkomst namelijk wel zeker, en op de lange termijn altijd van grotere meerwaarde dan het aanleggen van een groeiende kostenpost van bederfelijke waar.