Een methode om de restwaarde van een auto te voorspellen

10 april 2019 Consultancy.nl

Tegenwoordig kan van alles geleased worden: zonnepanelen, een wasmachine of zelfs een matras of een scheerapparaat. Maar het meest bekende leaseproduct is toch wel de auto. Een leasemaatschappij ‘huurt’ auto’s uit aan klanten en zorgt ervoor dat de auto’s worden onderhouden en gerepareerd. Dit alles tegen een vooraf vastgestelde prijs, die voor een groot deel gebaseerd is op de restwaarde. In dit artikel kijkt Jan de Leeuw, consultant bij Quantics, naar een methode om de restwaarde van een auto te voorspellen. 

Aan het einde van de leasetermijn wordt een auto meestal verkocht aan een dealer. Deze verkoopt de auto op de consumentenmarkt aan een gebruiker. De kostprijs van een leaseauto bestaat uit meerdere componenten: de afschrijving van een auto en kosten van reparatie/onderhoud, banden en verzekeringen. Het grootste deel van de kostprijs is de afschrijving. Om de afschrijving te bepalen, wordt naar de restwaarde van de auto gekeken. Bij het bepalen van de restwaarde krijg je vragen als ‘Hoeveel is een auto na drie jaar met 90.000 kilometer op de teller nog waard?’

Restwaarde?

Het nauwkeurig voorspellen van de restwaarde kan van enorme waarde zijn voor ‘de business’. Het verdienmodel van een leasemaatschappij is vrij eenvoudig: er wordt een auto aan de klant beschikbaar gesteld tegen een vooraf bepaald bedrag, wat de totale opbrengsten zijn. De totale kosten bestaan uit afschrijving auto, reparatie, onderhoud, banden (ROB) en verzekeringen. De winst op het leasecontract is het verschil tussen de opbrengsten en de kosten. Het verkeerd inschatten van de restwaarde (de basis voor de afschrijving) kan leiden tot grote verliezen.

Voorbeeld: Een BMW 1 serie wordt ingezet voor drie jaar met een totaal aantal kilometers van 120.000. Deze BMW kost €30.000,- inclusief alle belastingen. De ROB-kosten zijn geschat op €2.000 over de gehele looptijd. Naar verwachting kan de auto over drie jaar worden verkocht tegen een restwaarde van €10.300. Voor dit contract wordt €625 per maand betaald door de leaserijder (kostprijs €603 + marge €22).

Hoe wordt de restwaarde van een BMW 1 serie berekend?Totale kosten = (fiscale waarde auto - restwaarde auto) + ROB kosten = (€30.000 - €10.300) + €2.000 = €21.700.

Totale opbrengsten = leasetermijn x termijnbedrag = 36 maanden x €625 = €22.500.

Winst = Totale opbrengsten - Totale kosten = €22.500 - €21.700 = €800.

Wanneer alles gaat zoals verwacht is de winst op dit contract €800. Echter, de restwaarde is slechts een schatting aan het begin van het contract en de uiteindelijke opbrengst is onzeker. Indien de leasemaatschappij de auto aan het einde van het contract voor een hoger bedrag kan verkopen (oftewel de ‘echte’ restwaarde is hoger dan vooraf ingeschat), leidt dit tot een hogere winst. Bij een ‘echte’ restwaarde van bijvoorbeeld €11.000 in plaats van €10.300 wordt de verwachte winst verdubbeld (€1.500 in plaats van €800). In tegenstelling tot een lagere ‘echte’ restwaarde (bijvoorbeeld €9.000 in plaats van €10.300), wat tot verliezen kan leiden (€500 verlies in plaats van €800 winst).

Restwaarde nauwkeurig bepalen is essentieel om een accurate kostprijs van een leasecontract te genereren. Accuraat restwaarde voorspellen vermijdt het inzetten van auto’s die een verlies opleveren. Daarnaast leidt het voorkomen van grote verliezen tot een lager financieel risico. Wanneer restwaardes te hoog worden geschat, zal de kostprijs voor de betreffende auto’s te hoog zijn. Wanneer de prijs lager wordt ingeschat, kan het contract ineens goedkoper zijn dan bij de concurrent. Nauwkeurig inschatten van restwaardes heeft dus de potentie meer klanten op te leveren en marktaandeel te vergroten.

Data

Een leasebedrijf heeft data van de auto’s die ze verkocht hebben, aangevuld met open datasets van bijvoorbeeld het CBS of verzamelde data van autofabrikanten. In deze data staat, naast de restwaarde, een hoop andere informatie over de auto en het gebruik. De eerste stap die gedaan wordt, is controleren of de data in de dataset consistent en compleet is. Daarna wordt de dataset aangevuld en verbeterd om vervolgens gebruikt te worden voor het maken van een model. Voorbeelden van data zijn:

Gebruik: Kilometerstand, Leeftijd, Schade, Onderhoudshistorie;

Opties: Cruise control, Navigatie, Panoramadak, Geluidssysteem;

Auto: Fiscale waarde, BPM, Merk, Kleur, Type, Bodytype, Brandstofsoort, Aantal deuren, Gewicht, Schakel/Hand, enzovoorts. 

Model

Restwaarde kan met de beschikbare data op allerlei manieren worden gemodelleerd. Auto’s hebben verschillende attributen waar de restwaarde mee samenhangt. Er zijn verschillende methoden die op deze data een goed model kunnen maken, denk aan een regressiemodel of een random forest. Omdat een regressiemodel makkelijker te interpreteren is dan een random forest, is er gekozen voor een regressiemodel. 

We zijn op zoek naar de causale verbanden in de dataset. De juiste variabele kiezen om de variantie in restwaarde te verklaren, is een belangrijk onderdeel van het regressiemodel. Een model kent geen definities en heeft geen verstand van auto’s. De logica in het model moet dus altijd worden nagelopen, idealiter in overleg met experts uit de business. 

Als voorbeeld nemen we een handgeschakelde benzineauto van drie jaar oud met 120.000 kilometer op de teller en een fiscale waarde van €30.000. Het regressiemodel wordt geschat op een dataset met variabelen zoals hierboven onder het kopje ‘Data’ beschreven. Daar zou bijvoorbeeld onderstaand model uit kunnen komen met de bijbehorende variabelen en coëfficiënten.

Bij het gebruik van een regressiemodel voor auto’s zijn ook verschillende valkuilen

Restwaarde:

= β0 + β1 x kms + β2 x leeftijd + β3 x benzine_dum + β4 x automaat_dum

= 18.000 + (-0,05) x 120.000+ (-75) x 36 + 1.000 x 1 + 400 x 0

 = 10.300 (ongeveer 34,3% van de fiscale waarde)

Constante; β0; coëfficiënt = 18.000; Constante waarde.

Kilometers; β1; coëfficiënt = -0,05; Voor elke kilometer die een auto rijdt, wordt hij 5 cent minder waard.

Leeftijd (maanden); β2; coëfficiënt = -75; Voor elke maand die een auto oud is, wordt hij 75 euro minder waard.

Benzine (benzine_dum); β3; coëfficiënt = 1.000; Een benzineauto is 1.000 euro meer waard dan een andere brandstofsoort.

Automaat (automaat_dum); β4; 400; Een auto met automaat is 400 euro meer waard dan een handgeschakelde auto. 

Deze auto wordt over drie jaar volgens het model dus verkocht met nog een waarde van €10.300. Als over drie jaar blijkt dat de auto 130.000 kilometer heeft gereden, dan is de auto volgens het model €500 minder waard (10.000*-0,05). Dit is de verwachte waarde over drie jaar. Hoeveel de auto daadwerkelijk gaat opbrengen, zal moeten blijken. 

Verder is het niet logisch dat een auto meer waard wordt met de tijd, dus we verwachten een negatief coëfficiënt voor leeftijd. Of een automaat een positief of negatief coëfficiënt heeft, is moeilijker te beredeneren; een klankbord met experts kan daarbij assisteren.

Een regressiemodel vindt alleen verbanden en trends die al in de dataset zitten. Tot voor kort bestonden elektrische auto’s nog nauwelijks. Een regressiemodel maken voor elektrische voortuigen is dan ook vrij lastig. In het regressiemodel wordt de assumptie van gelijkblijvende markt gebruikt. Echter, aangezien de markt continu in beweging is, moeten we hiervoor corrigeren. De uiteindelijke restwaarde die wordt gecommuniceerd naar de business, is de waarde die naar verwachting het meest accuraat is. 

Stel het idee is nu dat over drie jaar de eindgebruiker veel minder graag diesel wil rijden. In ons voorbeeld zijn benzineauto’s op dit moment €1.000 meer waard. Als de trend gebroken wordt en diesels nog minder waard worden, is het extra effect op diesel niet te schatten met historische data. Als door bijvoorbeeld maatregelen van de overheid diesels minder populair worden, kan dit de waarde doen verminderen. Deze maatregelen hebben we nog niet eerder gezien en kunnen we niet schatten met behulp van historische data. Het effect kan wel met andere methodes worden geschat en de restwaarde kan daarvoor worden gecorrigeerd. De gecorrigeerde restwaarde wordt gecommuniceerd naar de business en gebruikt in berekeningen voor (potentiële) klanten.

Valkuilen

Bij het gebruik van een regressiemodel zijn er ook verschillende valkuilen. Zo kruipen er in veel datasets fouten, is het van belang om aannames te blijven toetsen en moet het risico van over-fitting worden uitgesloten. Ook dient rekening te worden gehouden met veranderingen in de context/omgeving – stel de overheid verbiedt plots alle dieselauto’s in alle grote binnensteden, dan zijn alle dieselauto’s opeens veel minder waard voor de eindgebruiker.