Datagedreven marketing: er ligt nog een groot verbeterpotentieel braak
Het beeld dat uit het DDMA-onderzoek naar voren komt, stemt vooralsnog niet vrolijk. Er ligt met andere woorden nog een groot verbeterpotentieel braak. Het goede nieuws is dat je tegenwoordig dankzij de toegenomen rekenkracht in combinatie met data science en de PDCA cyclus al heel snel klinkende resultaten kunt boeken. Opmerkelijk want de PDCA cirkel is nota bene een klassieker uit de jaren vijftig van de vorige eeuw.
Duurzame procesverbetering vereist ijzeren discipline
Er valt dus nog het een en ander te verbeteren en dat is een understatement. Duurzame procesverbetering vormt namelijk al decennialang een uitdaging voor organisaties, managers, interim consultants en medewerkers.
Hoewel er al sinds de jaren 50 een krachtige, bewezen verbetermethode is op basis van Plan-Do-Check-Act, het PDCA model, leidt deze verbetercirkel niet automatisch tot duurzame verbeteringen. De Plan- en Do-fases worden door de meeste organisaties nog wel met enthousiasme gestart, maar wanneer de Check- en Act-stappen niet met dezelfde ijzeren discipline worden uitgevoerd, zal de verbetering niet duurzaam zijn. En dit gebrek aan discipline is zoals wij constateren in de dagelijkse praktijk hetgeen organisaties dan ook uiteindelijk opbreekt.
Datagedreven marketing: enkele uitkomsten:
- Bij 27% van de in totaal 162 onderzochte Nederlandse organisaties is data laagdrempelig toegankelijk voor de belangrijkste stakeholders.
- Slechts 20% van de respondenten heeft een centraal klantbeeld, ook wel 360 graden klantbeeld genoemd.
- Technieken als datavisualisatie worden steeds meer gebruikt, maar realtime personalisatie wordt nog maar bij 40% van de organisaties toegepast en staat bij 34% nog niet eens op de planning.
- Ook met predictive modeling kunnen organisaties nog de nodige stappen zetten. 40% heeft de techniek inmiddels in gebruik, maar bij 29% is het concept nog geen onderwerp van gesprek, of zelfs volledig onbekend.
Datagedreven PDCA is de sleutel
De sleutel is een datagedreven PDCA cirkel. Hiermee krijg je doorlopend goede feedback over de resultaten van marketingacties (Check). Medewerkers kunnen voortaan zelf aan de knoppen draaien om acties aan te passen (Act) en zo raakt het procesdenken hecht verankerd in de organisatie. Verder is het belangrijk dat alle data (CRM, e-mailcampagnes, conversies, eCommerce et cetera) geïntegreerd is in een customer data platform (CDP), waardoor een integraal klantbeeld ontstaat.
In een praktijkvoorbeeld laten we zien hoe data science kan helpen de Check- en Act-stappen te vergemakkelijken. Belangrijke voorwaarden voor succes zijn:
- Database-integratie van predictive modeling en scoring. In plaats van te werken met gedownloade bestanden laat je de modellen rechtstreeks op de database draaien (lezen en schrijven).
- Metadata-management. Alle informatie over de gebruikte modellen en modelparameters staat in de database en kan worden gekoppeld aan de resultaten. Wat we precies verstaan onder metadata wordt later in dit artikel verder toegelicht.
We zullen aantonen dat als aan deze voorwaarden wordt voldaan, het relatief gemakkelijk is om nieuwe modellen toe te voegen. Hiervoor gebruiken we twee gangbare data science toepassingen: cross-selling door personalisatie en churn-preventie.
Doelstelling 1: omzet verhogen door cross-selling
We nemen als voorbeeld een organisatie die vakantiehuizen verhuurt. In deze organisatie wordt een Plan gemaakt om de omzet te verhogen met behulp van een campagne. Hierbij worden gepersonaliseerde e-mails verzonden met een aanbeveling van een vakantiehuis waar klanten met een vergelijkbaar profiel ook zijn geweest.
Er wordt een model gemaakt met het a priori (market basket analyse) algoritme. Dit statistische model gebruiken dataspecialisten om verbanden in de verkoopdata van specifieke producten en/of diensten te ontdekken. Zo weet je welke producten of diensten consumenten vaak tegelijkertijd aanschaffen. Op grond van historische transacties wordt hiermee in kaart gebracht welke affiniteiten (betekenisvolle correlaties) er zijn tussen vakantiehuizen: hoe vaak komt het voor dat iemand die in huisje 1234 is geweest ook 1235 heeft bezocht? En omgekeerd.
Door het analyseren van grote hoeveelheden transacties worden duidelijke patronen zichtbaar. Als het vaak voorkomt dat klanten na 1234 ook 1235 hebben bezocht, dan kan 1235 een zinvolle suggestie zijn voor klanten die daar nog niet, maar wél in 1234 hebben gelogeerd.
De Do-fase bevat 4 stappen:
1. Bouw rule set.
2. Bouw scoring model.
3. Selecteer klanten.
4. Voor de campagne uit.
Figuur 1: Praktijkvoorbeeld omzet verhogen met behulp van cross-selling
Eerst wordt het algoritme gekozen. Populaire tools zoals Python, R en SPSS Modeler hebben voor elke probleemstelling uitgebreide bibliotheken met algoritmes. Zo wordt voor het modelleren van voorkeuren van klanten (affiniteiten) vaak het a priori basket analysis model gebruikt (zie ook hierboven).
Vervolgens wordt een model gemaakt op basis van historische transacties. In het scoring model wordt de selectie van vakantiehuis-suggesties bepaald (huizen die altijd bezet zijn kunnen bijvoorbeeld worden uitgefilterd). Ook bij het selecteren van klanten kunnen filters worden toegepast. Alle criteria (welk model is gekozen, welke modelparameters, welke klanten zijn geselecteerd, welke huizen? et cetera) worden in de database met metadata opgeslagen, zodat de performance van het model daaraan gerelateerd kan worden.
Bovendien wordt per klant vastgelegd welke aanbeveling met welk model is gedaan, zodat de database marketeer ook hiervan kan leren.
In de Check-fase worden de resultaten van de campagne geanalyseerd, de reacties (opens, clicks en boekingen) worden per klant vastgelegd in combinatie met de informatie over de campagne, rule set, scoring model et cetera.
Omdat alle informatie centraal is opgeslagen in een CDP, kunnen in de Act-stap de volgende Plan & Do-fases worden bepaald.
Doelstelling 2: churn-reductie
In een tweede voorbeeld zoomen we in op de doelstellingen van de loyalty manager in dezelfde organisatie. Churn (klanten stappen over naar andere dienstverleners of leveranciers) is een bekend probleem, met name ook in de telecomsector. Het fenomeen zal altijd wel blijven optreden, maar het is belangrijk om in elke branche de churn zoveel mogelijk te beperken. Zoals bekend kost het werven van een nieuwe klant een veelvoud van het behouden van een bestaande klant. Om churn te beperken, moeten we per klant de kans op churn bepalen en ons met name richten op klanten met een hoog churn-risico.
In de Plan-fase wordt de doelstelling bepaald, bijvoorbeeld een reductie van 10%. Uiteraard vereist dit dat we een goede schatting hebben van de churn die zou optreden als we géén campagne zouden doen.
Figuur 2: Praktijkvoorbeeld churn-reductie
De Do-fase bevat 4 stappen:
1. Bouw een goed voorspellingsmodel (inclusief de te gebruiken predictoren).
2. Verzamel en prepareer de predictoren voor alle klanten.
3. Bereken met het model het churn-risico per klant en identificeer klanten met een hoog risico.
4. Voor de campagne uit op de geïdentificeerde klanten.
In de Check-fase worden de resultaten van de campagne geanalyseerd, de reacties (opens, clicks, boekingen) worden per klant vastgelegd, samen met de informatie over de campagne, het predictiemodel et cetera. Het resultaat van de campagne wordt vergeleken met het percentage churn in het geval dat er geen campagne zou zijn uitgevoerd.
Omdat alle informatie centraal is opgeslagen, kunnen in de Act-fase de volgende Plan & Do-fases worden bepaald.
De opleiding Kwaliteitsmanagement & PDCA Deze 3-daagse opleiding Kwaliteitsmanagement & PDCA stoomt je klaar om modern kwaliteitsmanagement in jouw organisatie op te zetten en te implementeren. Je krijgt les van Leo Kerklaan, internationaal expert kwaliteit en auteur van verschillende bestsellers. Modern kwaliteitsmanagement betekent volgens hem: een methodische aanpak, continu verbeteren met PDCA-cirkels, KPI’s, data-analyse, AI-gedreven inspecties en de ontwikkeling van hoogpresterende teams.
Data science biedt ongekende mogelijkheden
Data science biedt ongekende mogelijkheden om de Check en Act-stappen te vergemakkelijken. Zoals eerder gemeld, vereist een duurzame procesverbetering een integrale PDCA cyclus. De Check- en Act-stappen schieten er nu vaak nog bij in en dat is een gemiste kans. Wat we kunnen doen is de drempel voor de Check- en Act-stappen aanzienlijk verlagen door de benodigde informatie gemakkelijk beschikbaar te maken.
Data science biedt hiervoor de ideale uitgangspunten, mits goed toegepast. Om processen duurzaam te verbeteren, is een integrale benadering vereist: naast machine learning, diepgaande kennis van statistiek is data(base)-integratie even essentieel. Zonder integratie in de ICT-organisatie en expertise op gebieden als SQL, ETL, data cleaning, statistiek, en database programmeren kunnen data scientists niet maximaal bijdragen aan duurzame procesverbetering.
Door de specialistische kennis te concentreren in een data science team ligt het gevaar van silovorming altijd op de loer
Door de specialistische kennis te concentreren in een data science team ligt het gevaar van silovorming op de loer. In zo’n silo worden nuttige experimenten gedaan in R of Python notebooks, maar zonder hechte ICT-integratie (systemen, databases, applicaties) zal de organisatie niet ten volle kunnen profiteren. Zoals eerder opgemerkt is het wenselijk dat medewerkers buiten het data science team aan knoppen kunnen draaien en modelparameters kunnen evalueren en/of aanpassen (Check & Act). Alleen zo kan de organisatie continu verbeteren.
Metadata en database-integratie
Leren van een marketingcampagne vereist dat we de resultaten (zoals Click To Open Rates, Click Through Rates, conversieratio’s en churn rates) kunnen relateren aan het gebruikte model, scoringcriteria et cetera. En dat per klant per campagne of actie. Dat gaat niet met spreadsheets, hier is 100% database-integratie noodzakelijk.
Dit betekent dat alle informatie van een model (gekozen algoritme, regressie-coëfficiënten, test/training sets, model, Python of R script samen met de informatie van een campagne (selectiecriteria, tijdstip, e-mail subject line et cetera) door middel van een database query gerelateerd kan worden aan klantdata (klantprofiel, boekingen, opens, clicks, enzovoorts).
Idealiter vindt het scoren van een model (bepalen van churn-risico en het aanbevolen vakantiehuis) plaats binnen de database. Met het oog op AVG compliance (bescherming van persoonsgegevens) is het geen optie om met datasets heen en weer te schuiven. Veel modellen, zoals market basket analyse, (logistic) regressie en discriminantanalyse, zijn prima te implementeren in SQL-procedures, R scripts of Python notebooks die de modelparameters uit de metadata tabel kunnen lezen.
Met het oog op de AVG is het geen optie om met datasets heen en weer te schuiven.
Wanneer alle data beschikbaar is in de database-omgeving, is de informatie die nodig is voor de Check- en Plan-stappen gemakkelijk beschikbaar te maken in een dashboard. Dit kan de drempel om de PDCA-cyclus efficiënt en effectief te gebruiken aanzienlijk verlagen.
Het PDCA-handboek 'Datacratisch werken' In dit complete PDCA-boek komt het hele spectrum van datacratisch werken aan bod. Dit is een splinternieuwe, veelbelovende manier van werken. De auteur gaat uitgebreid in op de basisprincipes van PDCA, continu verbeteren en leerprocessen in organisaties.
Combinatie van twee PDCA-cycli
Nog een voordeel van de integrale data science benadering is de mogelijkheid processen te combineren.
In de cross-selling casus ging het om persoonlijke aanbevelingen met als doel de omzet te verhogen. In de churn-case ging het om klanten te identificeren die een hoog churn-risico hebben. In een geïntegreerde omgeving kunnen we nu deze cycli combineren: het selecteren van klanten voor een retentie-campagne (waarbij we bijvoorbeeld extra korting geven) kunnen we “delegeren” aan het churn-model: klanten met een hoog risico selecteren we voor een aantrekkelijke persoonlijke aanbieding.
Figuur 3: Combinatie van twee strategieën
In een geïntegreerde omgeving is deze koppeling heel goed te automatiseren. Elke dag of week kunnen de 1.000 klanten met het hoogste churn-risico geselecteerd worden voor de persoonlijke aanbieding. De modellen kunnen periodiek worden verbeterd, terwijl het geautomatiseerde proces gewoon doorloopt.
Predictive versus prescriptive
In het genoemde DDMA-onderzoek kwam naar voren dat de toepassing van prescriptive modeling achterblijft. Slechts 5% van de organisaties gebruikt het. Voor een goed begrip dien je het volgende te onthouden. “Predictive” gaat in op de vraag: wat kunnen we verwachten? En “prescriptive” gaat in op de vraag: wat moeten we doen?
Conclusie: datagedreven marketing met PDCA
Met het koppelen van goed geïmplementeerde PDCA-cycli aan de principes van data science kan elke organisatie tegenwoordig datagedreven marketing handen en voeten geven en naar een hoger plan tillen. Om niet achterop te geraken, is het wel zaak om nu de extra aandrijfkracht van deze “tandem” (data science en PDCA) optimaal te benutten. De belofte van datagedreven marketing is te groot om nog langer te dralen.
DDMA (Data Driven Marketing Association) is namens 335 organisaties de vereniging voor marketing en data. Het doel van de vereniging is de data-driven marketingsector op een hoger plan te tillen onder het motto ‘Data, maak er iets moois van’.