Stappenplan voor een datawarehouse-implementatie

16 januari 2020 Consultancy.nl 6 min. leestijd
Profiel
Meer nieuws over

Met de overvloed aan data in het hedendaagse landschap is het genereren van datagedreven inzichten een essentiële stap voor organisaties die hun concurrenten voor willen blijven. Een datawarehouse is een omgeving waarin men data uit verschillende bronnen kan opslaan, combineren en analyseren, en fungeert daarmee als dé machinekamer voor big data en advanced analytics. Tony van der Prijt, adviseur bij Hot ITem, vertelt aan de hand van vijf belangrijke stappen hoe organisaties succesvol zo’n datawarehouse kunnen inrichten.

1. Informatiebehoefte bepalen

Een datawarehouse-implementatie begint voor organisaties altijd met het in kaart brengen van de informatiebehoeften, vertelt Van der Prijt. Die behoefte dient in lijn te worden gebracht met de strategische doelstellingen van de organisatie en het management, die de informatie- en datastrategie bepaalt. Van der Prijt adviseert om vanuit de strategie toe te werken naar de belangrijkste informatiebehoeften: “Welke inzichten heeft de organisatie nodig om gericht te kunnen sturen?”

De volgende stap is het uitwerken van het procesmodel. Hierbij rijzen vragen op als: ‘Met welke processen en welke gegevens werkt de organisatie?” Het functioneel modelleren van de organisatie is de volgende fase, waarbij de organisatie een bedrijfsobjectenmodel moet uitwerken. Van der Prijt legt uit: “Bedrijfsobjecten zijn alle gegevensobjecten die van belang zijn binnen een organisatie. Van deze objecten kunnen eigenschappen worden vastgelegd met behulp van data.”

2. Databronnen selecteren

Een tweede stap bij een datawarehouse-implementatie, is nagaan welke gegevensbronnen nodig zijn, om in de gestelde informatiebehoeften te kunnen voorzien. Dit vergt een onderzoek naar reeds beschikbare bronnen en het in kaart brengen of er mogelijk bronnen gecreëerd dienen te worden. Organisaties moeten hierbij ook kijken naar de aard van de data. Van der Prijt: “Zijn gegevens bijvoorbeeld makkelijk te ontsluiten, hoe ziet de kwaliteit eruit, zijn alle velden wel ingevuld en welke gegevenselementen staan erin?” 

Ook privacy speelt een belangrijke rol bij de selectie van databronnen, zeker doordat wetgevers sinds de invoering van de AVG bepaalde persoonlijke data (rondom bijvoorbeeld iemands etniciteit, gezondheid of levensovertuiging) extra beschermen. Van der Prijt licht toe: “Je mag alleen bijzondere persoonsgegevens verwerken als je je kunt beroepen op een wettelijke uitzondering.” Allemaal belangrijke zaken om rekening mee te houden, aldus de expert van Hot ITem.

Stappenplan voor een datawarehouse implementatie

3. Roadmap opstellen

Organisaties dienen vervolgens op basis van de in kaart gebrachte informatiebehoefte en de selectie van databronnen een routekaart te ontwikkelen. Daarin wordt onder meer vastgesteld welke zaken de organisatie als eerste oppakt. Van der Prijt: “Er kan bijvoorbeeld eerst gestart worden met een relatief klein deelproject, dat naar verwachting snel tot resultaat leidt, om het succes van het datawarehouse te kunnen aantonen.”

Wel moet gewaakt worden voor mogelijke valkuilen, waarschuwt Van der Prijt. Zo raadt hij organisaties af om voorafgaande aan een datawarehouse-implementatie eerst alle gegevens te verzamelen en alle data met elkaar te combineren, om zo een uniform en veelomvattend model van de gehele organisatie te ontwikkelen. “Die werkwijze kost veel tijd”, stelt hij. Bovendien kan een organisatie – en de informatiebehoefte en datahuishouding daarbinnen – in de loop der tijd snel veranderen, waarvoor te veel planning vooraf niet de juiste weg is. Bij het implementeren van een datawarehouse is wendbaarheid dus essentieel. “Houd het grotere plaatje voor ogen, maar begin klein en blijf continu herijken”, luidt het advies van Van der Prijt.

In dat kader stelt hij een zogeheten ‘snelspoor’-benadering voor, in het geval van een urgente informatiebehoefte of wanneer de transitie op weerstand binnen de organisatie stuit. Een dergelijke aanpak levert weliswaar nog geen historische data en volledige integratie van databronnen op, maar men kan wel alvast een rapportage op basis van één bronsysteem opmaken. In dat geval krijgen eindgebruikers al in de vroege fase een informatieproduct voor hun (urgente) informatiebehoefte. Van der Prijt: “Dit toont al vroeg in de praktijk de meerwaarde van het datawarehouse aan en maakt tegelijkertijd het draagvlak voor vervolgtrajecten groter.”

4. Architectuur en technologie kiezen

Vervolgens dient de organisatie voor de implementatie een datawarehouse-architectuur en bijbehorende technologie te kiezen. Organisaties kunnen daarbij kiezen uit verschillende modelleringstechnieken om het datawarehouse op te zetten. In dat kader zijn het Kumball-, Inmon- of datavault-model enkele voorbeelden die Van der Prijt oppert.

Een andere te stellen vraag luidt: ‘Welke lagen creëer je?’ Van der Prijt noemt hierbij een mogelijk drielagenmodel. “Deze sluit aan bij de drie functies van een datawarehouse (verzamelen, integreren en aanbieden).” Tot slot moeten organisaties zich ook afvragen of ze wel of niet kiezen voor een datawarehouse in de cloud, en moeten ze bijvoorbeeld ook rekening houden met de “plaats van ontwikkelingen, zoals realtime data en datavirtualisatie”.

5. Oplevering van het datawarehouse

De laatste stap draait om de daadwerkelijke implementatie van het datawarehouse, met als eindresultaat veelal een rapportage of dashboard dat beschikbaar komt voor de eindgebruiker. De verschillende lagen in het datawarehouse en tussenstappen dienen echter gedurende het traject – zodra deze klaar zijn – opgeleverd te worden. Van der Prijt benadrukt: “Wacht daar niet mee tot het eindproduct af is. Gebruik een werkwijze als DevOps om regelmatig werkende halffabricaten of producten op te leveren.”

Een laatste succesfactor bij een datawarehouse-implementatie ligt bij de uiteindelijke gebruikers binnen de organisatie, die met de nieuwe infrastructuur zullen gaan werken. Naast het opleveren van de hardware, moet de focus dus vooral ook liggen op het verankeren van een datagedreven cultuur onder de medewerkers, besluit Van der Prijt: “Het zijn uiteindelijk de mensen, die het systeem tot een succes kunnen maken”.

Voor meer informatie en de volledige checklist voor datawarehouse-implementaties, zie hier.