Twinkle | Digital Commerce

Herken de zwaktes van recommendation engines

2017-05-27
180101
  • 4:19

Recommendation engines moeten omzet, winst of verkoopcijfers van webshops laten stijgen. Ze moeten producten aanbevelen die de consument daadwerkelijk gaat bekijken en kopen, terwijl tegelijkertijd voorkomen moet worden dat down-selling gaat plaatsvinden door het aanbevelen van vervangende, goedkopere producten. Waar moet u op letten?
  
Tekst: Don Kuijer | Beeld: Twinkle/BBP Media
 
Recommendation Engines
(RE) zijn onmisbare onderdelen van webshops geworden. Er zijn verschillende soorten aanbevelingen die in verschillende gebieden van de webshop worden geplaatst. ‘Klassieke’ aanbevelingen verschijnen meestal op de productpagina's, veelal voorzien van onderschriften als ‘Klanten die dit product kochten, kochten ook …’. Dit type aanbeveling is populair gemaakt door Amazon. Een ander type aanbeveling is afgestemd op het individuele koopgedrag en wordt vaak gepresenteerd in een aparte webshopsectie (bijvoorbeeld in ‘mijn winkel’). Deze RE’s bieden de gebruiker geen algemene, maar gepersonaliseerde aanbevelingen.

Weer andere aanbevelingen verschijnen op categoriepagina's (beste aanbevelingen voor de categorie) of worden afgestemd op de resultaten van zoekopdrachten. Niet alleen producten, maar ook categorieën, banners, auteurs (in boekhandels) et cetera kunnen worden aanbevolen. Sterker nog, als ultiem doel streeft een RE naar een totale personalisatie van de webshop, met gepersonaliseerde navigatie, advertenties, prijzen en mails. De mogelijkheden op dit vlak zijn schier onuitputtelijk.

Onderzoeksgebied
Recommendation engineering is een levendig onderzoeksgebied. Honderden onderzoekers werken aan nieuwe methoden voor de ontwikkeling van verbeterde recommendation algoritmes. Waarom is dit zo?

Het genereren van intuïtief verstandige aanbevelingen is geen al te grote uitdaging. Daartoe volstaat het de topsellers aan te bevelen binnen de categorie van het op dat moment bekeken product. Het belangrijkste doel van een RE is echter een stijging van de omzet, winst of verkoopcijfers van de webshop. Dus de werkelijke uitdaging bestaat eruit producten aan te bevelen die de gebruiker daadwerkelijk gaat bekijken en kopen, terwijl je er tegelijkertijd voor moet zorgen dat er geen down-selling gaat plaatsvinden door het aanbevelen van vervangende, goedkopere producten.

De complexiteit van deze taak is groot: vele webshops bieden inmiddels honderdduizenden zo niet miljoenen verschillende producten aan. Uit deze gigantische hoeveelheid wil men de meest geschikte en relevante aanbeveling aan de klant presenteren. Bovendien kunnen door het grote aantal aanbiedingen, assortimentswijzigingen en prijzen de goede aanbevelingen al zeer snel verouderd zijn. Een goede RE moet daarom in staat zijn om te acteren in een zeer dynamische omgeving. Hiermee hebben we de belangrijkste uitdaging van RE’s in zicht: adaptief gedrag kunnen vertonen.

Zwakke punten
RE’s worden vaak nog ten onrechte gezien als behorend tot het gebied van de klassieke data mining. Veel data mining georiënteerde aanbieders richten zich bij gebrek aan een eigen RE op gebieden, zoals basket analysis en clustering technieken. Hierbij houden veel onderzoekers zich aan de volgende veronderstelling: Indien de producten die aanbevolen worden aan een gebruiker gelijk zijn aan degene die door andere gebruikers met een vergelijkbaar profiel in een vergelijkbare toestand zijn gekozen, dan zijn die producten de beste aanbevelingen.

Dit reduceert het onderwerp van recommendations tot een statistische analyse en modellering van het gedrag van gebruikers. We weten van de klassieke cross-selling technieken dat deze aanpak vaak goed werkt.

Toch verdient dit een meer kritische blik. In werkelijkheid dekt een zuivere analyse van het gedrag van de gebruiker niet alle facetten:

  1. Het effect van de aanbevelingen is niet in beschouwing genomen. Als de consument waarschijnlijk toch naar een specifiek product zou gaan kijken, wat is het nut van het aanbevelen dan? Is het niet logischer een product aan te bevelen dat het gedrag van de gebruiker verandert?
  2. Aanbevelingen zijn zelfversterkend. Als alleen eerdere ‘beste’ aanbevelingen worden weergegeven, dan bestaat het risico dat ze zichzelf versterken, zelfs als er betere alternatieven bestaan. Mogen er geen nieuwe aanbevelingen worden uitgeprobeerd?
  3. Gebruikersgedrag verandert. Zelfs als het vorige gebruikersgedrag perfect gemodelleerd is, resteert de vraag wat er zal gebeuren als het gedrag van gebruikers plotseling verandert door bijvoorbeeld aanbiedingen en assortimentswijzigingen. Zou het niet beter zijn als de RE in staat is om voortdurend te leren en zich flexibel aan te passen aan nieuw gebruikersgedrag?
  4. Optimalisatie van opeenvolgende stappen. Is het soms niet verstandiger een minder rendabel product aan te bevelen, als dat het startpunt is voor meer winstgevende vervolg verkoopacties?

Deze punten leiden tot de conclusie dat de betere RE’s het samenspel van analyse en actie moeten modelleren.

Hierbij belanden we op een specifiek gebied uit de control theory, reinforcement learning ofwel het zelfversterkend leren, het consequent leren van fouten. Een nieuw onderzoeksgebied dat nu door toenemende toepassing in robotics, complexe liftscheduling en computerschaak snel tot verdere ontwikkeling komt.

Algoritmes integreren
Maar waarom domineert de statische benadering dan nog steeds het huidige onderzoek? Adequate uitvoering van de adaptieve aanpak vereist dat de algoritmes worden geïntegreerd in realtime toepassingen. De effectiviteit van recommendation algoritmen kan namelijk niet volledig worden geanalyseerd op basis van historische gegevens, omdat het effect van de aanbevelingen grotendeels onbekend is.

Deze trend werd versterkt door de Netflix challenge. Netflix loofde een prijs uit van een miljoen dollar voor het onderzoeksteam dat de nauwkeurigheid van het voorspellende Netflix-algoritme met 10 procent zou kunnen laten toenemen. De Netflix challenge was ongetwijfeld een mijlpaal in de ontwikkeling van de recommendation systems, en het belang ervan als een benchmark kan niet worden overschat. Maar het duwde de ontwikkeling van recommendation algoritmen wel stevig in de richting van pure statistische analysemethoden.

Zo is alleen al om praktische redenen de ontwikkeling van levensvatbare recommendation algoritmes voor de meeste onderzoekers een heel moeilijke exercitie. Het aantal publicaties betreffende de adaptieve benadering zien we de laatste tijd echter toenemen. De daaraan gekoppelde ontwikkelingen resulteren in steeds krachtigere en effectievere recommendation engines.
  
Don Kuijer is regional manager Benelux van Prudsys.
 
Dit artikel verscheen eerder in Twinkle 1-2015.