Sjoerd de Vries van Symbol over werken als data scientist
Sjoerd de Vries is bij adviesbureau Symbol werkzaam als data scientist. Maar wat houdt zijn werk precies in? De redactie van Consultancy.nl ging hierover in gesprek met De Vries.
“Ik word vaak door klanten benaderd wanneer ze een product of proces hebben dat ze naar een hoger niveau willen tillen. Ik kijk dan naar twee dingen: welke verbeteringen er mogelijk zijn én hoe we ervoor kunnen zorgen dat er na loop van tijd geen dipje ontstaat”, vertelt Sjoerd de Vries, data scientist bij Symbol, een adviesbureau dat opdrachten uitvoert voor nationale en internationale organisaties uit de publieke en de private sector.
Aan de slag
Bij klanten start De Vries vervolgens niet met het analyseren van de beschikbare data: “Om een klant écht te kunnen helpen, moet ik namelijk eerst het volledige proces begrijpen. Waarom willen ze dit? Wat is het doel? Wat zijn de uitdagingen? Waar denken ze zelf dat het probleem zit? Ik stel daarom ook veel vragen. Alleen zo kan ik in een korte periode op hetzelfde niveau als de klant komen – of zelfs daarboven gaan zitten. En op die manier kan ik dus goed advies geven. Bij een klant waar ik recentelijk voor werkte stelde ik dusdanige vragen dat zelfs de engineers er geen antwoord op hadden. Eye openers, dus.”
Pas als alle antwoorden op tafel liggen, weet De Vries wat zijn klant wil bereiken: “Vervolgens ontwikkel ik samen met de klant de juiste dataset om te analyseren. Ongeveer tachtig procent van mijn tijd gaat naar ‘pre-data mining’, dat zijn voorbereidingsmaatregelen.” De overige twintig procent besteedt hij aan het daadwerkelijke analyseren van de data, ook wel ‘data mining’ genoemd.
De Vries legt uit hoe hij te werk gaat: “Ik ga altijd met een andere dataset aan de slag dan een klant van tevoren denkt. Om een voorbeeld te geven: een klant kwam bij me met de mededeling dat de analyseapparatuur van één van hun machines foutieve data uitgaf en dus niet goed werkte. Op basis van de aangeleverde dataset kreeg ik meteen het idee dat er iets heel anders gaande was. En na het opvragen en analyseren van de onderliggende data en het uitvoeren van een meetsysteemanalyse bleek dat met de analyseapparatuur niets mis was: het ging fout bij de assemblage.”
Hoe word ik een bedreven data scientist?
Een bedreven data scientist is in staat om in situaties zoals hierboven beschreven snel te schakelen. Dat kan alleen als hij of zij één wordt met een project waarbinnen hij of zij werkt, zegt De Vries: “De techniek ‘process mining’ helpt om waardevolle bedrijfskennis uit data te kunnen halen. Ik gebruik zelf altijd het CORPUS-principe. Ik stel mezelf voor als een molecuul – een klein deeltje in een groter geheel – en volg zo het gehele proces om erachter te komen welke obstakels ik moet passeren om tot het beoogde doel te komen. Er is daarbij een groot verschil tussen big data, de hype van tegenwoordig, en right data, vertelt hij: “Het vinden van de juiste data binnen een big data-set is namelijk een veel grotere uitdaging dan het alleen analyseren van een big data-set.”
De Vries geeft aan waar een data scientist verder nog op moet letten: “Bij de analyse van data is het eveneens van belang dat je niet tornt aan het uiteindelijke doel. Het mag nooit zo zijn dat je je doel aanpast aan de beschikbare middelen. Er is altijd een manier om je middelen zo aan te passen dat je je uiteindelijke doel kunt bereiken. Deze middelen kunnen software, hardware, analytische apparatuur en zelfs human zijn. Voorkomen is bovendien altijd beter dan genezen. Pas je je doel aan op je middelen, dan blijf je bezig met brandjes blussen.”
“Een goede data scientist is bovenal geen schaap met vijf poten, maar eentje met tien – of meer”
– Sjoerd de Vries
De medewerker van Symbol heeft nog meer tips om als data scientist succesvol projecten af te ronden: “Als data scientist ben ik niet alleen een probleemoplosser, maar vooral ook een continue verbeteraar. Naast ‘problem solving’ is ‘continuous improvement’ één van mijn belangrijkste doelen. Hoe mooi is het om niet van dertig procent onder baseline performance naar baseline performance te gaan, maar naar tien procent of zelfs meer boven baseline performance? Ik vind dat geweldig!”
“Een goede data scientist is bovenal geen schaap met vijf poten, maar eentje met tien – of meer, want data is soms maar een klein onderdeel van mijn werk”, vertelt De Vries, die benadrukt dat een brede basiskennis op verschillende vlakken voor iedere effectieve data scientist een must is: “Je moet niet alleen opgeleid zijn in de toegepaste wiskunde, maar ook creatief zijn, een goed analytisch vermogen hebben, innovatief zijn, een open mind hebben én de wil hebben om nog iedere dag bij te leren.”
Ten slotte moet een goede data-scientist geen enkele uitdaging uit de weg gaan, stelt De Vries: “Mijn motto is hierom ‘niets is onmogelijk’. Ik ga actief met de klant in overleg om zo de juiste data te verkrijgen. En ik werk samen met de klant, spreek zijn taal en gebruik zijn middelen. Zo maak ik mij aan het einde van de rit overbodig en kan de klant zelf aan de slag. Als data scientist ben je veelal een starter en in mindere mate een afmaker. Die verhouding ligt mij wel.”