
Verbeterde financiële planning dankzij nieuw vraagvoorspellingsmodel
Met onze financiële planning kunnen we de plausibiliteit van onze strategie controleren en realistische doelen stellen. Op basis hiervan beslissen we bijvoorbeeld wanneer er nieuwe opslagruimte nodig is, hoeveel vaste kosten we kunnen opbouwen of hoeveel liquiditeit we nodig hebben. In ons streven om onze processen voortdurend te verbeteren, hebben we de vraagprognose als belangrijkste driver van de financiële planning vanaf nul ontwikkeld, wat bijdraagt aan een verhoging van de kwaliteit en efficiëntie van onze planning.
Onze vraagvoorspelling voorspelt de dagelijkse vraag van klanten in eenheden per productgroep, klanttype, bedrijfsmodel en land van verkoop. Hieruit leidt ons financiële model statistieken af zoals omzet, contributiemarge, aantal leveringen of retouren. In de logistiek zijn de dagelijkse hoeveelheden een indicator voor de personeelsplanning. Al deze factoren zijn direct of indirect afhankelijk van de vraagvoorspelling, die bekende zwakke punten had. Zo werden zaterdagen systematisch overschat en de Black Friday Week onderschat. De langetermijntrend in de ontwikkeling van de productgroepen week af van de verwachtingen van ons categoriemanagement, in sommige gevallen met dubbele cijfers. Bovendien konden schokken in de vraag niet gemakkelijk worden herkend en uitgesloten van modeltraining. Dit leidde bijvoorbeeld tot een onzinnige groei in ontsmettingsmiddelen (na het uitbreken van de Covid-19 pandemie) en energieopslagsystemen en drones (na het uitbreken van de oorlog in Oekraïne).

Om de bekende zwakke punten te vermijden, hebben we talloze aanpassingen gedaan. Terwijl we oorspronkelijk alle tijdreeksen schatten met één en hetzelfde model, ontwikkeld door Meta genaamd Prophet, beslissen we nu in de eerste stap welk type model het meest geschikt is voor het voorspellen van de onderliggende tijdreeksen. Op basis van de verdeling van de gegevens schatten we de trend en de seizoensgebondenheid afzonderlijk of laten we dagen waarop geen enkel exemplaar is verkocht in het model opnemen. We maken momenteel onderscheid tussen 5 modeltypen en kunnen deze in de toekomst naar behoefte uitbreiden zodra we ons realiseren dat een gegevenspatroon dat ons voorheen onbekend was niet correct kan worden gemodelleerd door een van de bestaande typen. Gezien de verscheidenheid aan verschillende tijdreeksen is dit ook dringend nodig. We verkopen bijvoorbeeld geen adventskalenders in de zomer, maar wel tuinstoelen en autoaccessoires. We verkopen luiers en havermelk van Oatly in gestaag toenemende hoeveelheden. Zakelijke klanten bestellen meestal niet in het weekend, maar zondag is vaak de dag van de week met de grootste vraag van particuliere klanten.
Een groot aantal innovaties leidt tot een aanzienlijk beter vraagmodel
Bovendien rees de vraag op welke granulariteit we de vraag het beste kunnen schatten en welke het meest geschikt is voor ons financiële model. In het ene extreme geval, op productniveau, zouden we een voorspelling moeten genereren voor enkele miljoenen tijdreeksen en in het andere extreme geval, geaggregeerd over alle producten, zouden we veel productspecifieke eigenschappen verliezen. Na verschillende testen hebben we een middenweg gevonden, zodat we enerzijds voldoende granulariteit behouden om de seizoensgebonden kenmerken van de productgroepen niet te verliezen, maar anderzijds voldoende gegevens beschikbaar hebben voor een betrouwbare voorspelling. Dit heeft geleid tot een aanzienlijk kleiner aantal tijdreeksen waarvoor voorheen de vraag werd voorspeld. Dankzij deze vermindering kan onze controle ook met minder inspanning worden uitgevoerd. We kunnen nu met een redelijke inspanning individuele aanpassingen doorvoeren, zoals een kortere trainingsperiode of een modelparameterconfiguratie die afwijkt van het modeltype.
Waar het in het verleden een grote uitdaging was om een nauwkeurige voorspelling te doen voor de Black Friday Week en de week voor en na Kerstmis, kunnen we deze twee periodes nu met vergelijkbare nauwkeurigheid voorspellen als de rest van het jaar dankzij aanvullende modellen. Aan de ene kant was het effect van het samenspel van weekdag en feestdag tijdens Kerstmis moeilijk te leren voor een model (als 23 december op een zaterdag valt, worden er op 24 december geen pakketten bezorgd), omdat deze combinatie van weekdag en feestdag maar één of hooguit twee keer voorkomt in de historische gegevens. Aan de andere kant is de Black Friday Week twee jaar geleden geïntroduceerd om de piek van Black Friday beter over de week te verdelen en zo de logistiek te ontlasten. We losten het eerste probleem op door aparte modellen te trainen voor de feestdagen, die leren van gegevens uit meerdere tijdreeksen tegelijk en dus de combinatie van weekdag en feestdag meerdere keren in de trainingsgegevens zien. Het laatste konden we oplossen door nog een extra model te trainen dat een voorspelling doet voor de gehele vraag tijdens de Black Friday Week en deze vervolgens verstandig verdeelt over de afzonderlijke dagen van de week.

Heeft de inspanning vruchten afgeworpen? De grafiek hierboven geeft enig inzicht: We zien de geaggregeerde voorspellingen voor Zwitserland. Om een eerlijke vergelijking mogelijk te maken, hebben we het vorige en het nieuwe model getraind met dezelfde gegevens tot begin november 2023 en een voorspelling gegenereerd voor de volgende 12 maanden. Dit komt precies overeen met het budgetplanningsproces. Een vergelijking laat zien dat de blauwe lijn (de nieuwe voorspelling) de zwarte lijn (de werkelijke waarden) bijna congruent volgt. De wekelijkse seizoensgebondenheid, Black Friday week, Kerstmis en de algemene trend zijn allemaal verbeterd. Terwijl de zaterdagen nog steeds consequent werden overschat door het vorige voorspellingsmodel (herkenbaar aan de groene, positieve verticale balken op regelmatige tijdstippen), is er geen systematische fout meer in de blauwe, positieve verticale balken (de residuen).
De verbetering is ook terug te zien in de metrieken: De gemiddelde procentuele fout verbeterde van 16% naar 7% over de gehele evaluatieperiode van een jaar. Technisch gezien verbeterde de R-Squared metriek, die beschrijft welk deel van de variantie van de doelvariabele kan worden verklaard, van 34% naar meer dan 90%.
Betere voorspellingen voor alle producthiërarchieën en hun grenzen
De geaggregeerde voorspelling bestaat uiteindelijk uit talloze voorspellingen op lagere hiërarchieniveaus, zoals te zien is in de grafiek hierboven. De nauwkeurigheid van de voorspelling op het hoogste niveau hangt daarom direct af van de nauwkeurigheid van de voorspellingen op de laagste niveaus. De linker grafiek hieronder toont bijvoorbeeld de vraag naar de productgroep Informatica in Zwitserland. Ook hier wordt de wekelijkse seizoensgebondenheid veel nauwkeuriger gemodelleerd dan voorheen.


Het nieuwe model moet echter niet worden gezien als een orakel. Er zijn altijd dingen die een langetermijnvoorspellingsmodel een jaar van tevoren niet kan weten. Een goed voorbeeld hiervan is de voorspelling voor de productgroep watersport. Zoals te zien is in de grafiek rechtsboven, werd de werkelijke vraag naar watersportartikelen in juli en augustus behoorlijk onderschat. De reden hiervoor is het schommelende weer, dat we niet van tevoren kunnen voorspellen. Het model gaat uit van een gemiddelde waarde over de afgelopen jaren, wat duidelijk te laag is. En last but not least kunnen marketingactiviteiten zoals een actie met kortingsbonnen of kortetermijnaanpassingen van de prijzen er ook toe leiden dat de werkelijkheid anders uitpakt dan we hadden gepland. Ons vraagmodel kan deze factoren niet een jaar van tevoren weten.
Al met al kunnen we duidelijk bevestigen dat de ontwikkeling van een nieuw vraagvoorspellingsmodel voor financiële planning zijn vruchten heeft afgeworpen. We kunnen nu de ontwikkeling van de klantvraag met een hoge mate van betrouwbaarheid inschatten. Dit geeft ons vertrouwen in onze ambitieuze doelen en de moed om door te gaan met het "piraten" van kansen. We weten nog niet alles, maar we zijn zo gepositioneerd dat we snel kunnen reageren op veranderende omstandigheden.
32 mensen vinden dit artikel leuk