Clustering

Segmentatie versus Clustering

In een eerder artikel schreven wij over ons clusteringmodel en de inzichten die dit heeft geleverd voor TaskHero.

Maar wat is clustering precies en waar past het in het marketinglandschap?

Analoog segmenteren

Segmenteren is het op basis van criteria indelen van de markt in groepen klanten die min of meer gelijke behoeften en hebben en hetzelfde koopgedrag vertonen. Dit noemen we een homogene groep.

Marktsegmentatie is een belangrijke tool voor de marketeer. Dit is het onderverdelen van bestaande en potentiële klanten in subgroepen -ook wel segmenten genoemd- gebaseerd op gedeelde kenmerken. Een goed segment kan vervolgens worden samengevat in een persona.

Voorbeeld persona’s

Segmentatie

De klassieke manier van segmentatie is om segmenten te maken op basis van marktonderzoek. Klanten wordt steekproefsgewijs gevraagd naar demografische, geografische, sociaaleconomische, psychografische en gedragsmatige kenmerken. Vervolgens wordt elke bezoeker langs deze segmenten gehouden en aan één van deze segmenten toegewezen. Hier geldt dus de volgende volgorde: 1) maak segmenten 2) kijk naar de data.

Dit proces en de resultaten hiervan zijn enorm waardevol, maar met deze manier van werken ben je -lichtelijk gechargeerd- wel afhankelijk van de juiste steekproef en een goed gestelde vraag in het marktonderzoek. Een vraag die niet gesteld wordt, zal ook niet beantwoord worden. Wat als er bij het maken van de segmenten al naar alle data gekeken kan worden? Het is immers zonde om deze bron van informatie niet optimaal te benutten.

Van segmentatie naar clustering

De meeste bedrijven en organisaties verzamelen tegenwoordig ontzettend veel data. Deze verzameling van profielen waar nog geen segment of cluster voor is bepaald, is perfecte input voor een unsupervised machine learning algoritme. In het geval van een clusteringalgoritme betekent dit dat er op basis van de aanwezige data patronen worden geleerd die resulteren in een aantal clusters. Elke klant, bezoeker of profiel uit de gebruikte dataset is één datapunt en wordt aan een cluster toegewezen.

Wanneer er clusters zijn gemaakt, worden de eigenschappen van elk cluster geïdentificeerd. Op deze manier worden de segmentatiestappen omgedraaid: 1) naar de data kijken 2) segmenten identificeren.

Clustering

Er zijn verschillende soorten algoritmen om personen aan clusters toe te wijzen, elk met hun plus- en minpunten. Welk algoritme de beste clusters maakt, kan verschillen. Dit is ook afhankelijk van de dataset. Gelukkig zijn er methoden om clusterkwaliteit te evalueren en het algoritme te identificeren die voor déze dataset het beste werkt.

Meer over algoritmen en evaluatiemethoden lees je in het achtergrond artikel Segmentatie versus Clustering; de Verdieping.

Ontdek wat clustering voor jouw organisatie kan betekenen

Marketingtoepassingen

Waar staan we nu? We hebben het gehad over het maken van clustermodellen met behulp van verschillende clusteralgoritmes, het evalueren van deze modellen en het uitkiezen van het beste model. Dit is vooral voor data scientists interessant. Maar een marketeer wil weten in welk cluster de waardevolle klanten zitten, of de klanten met potentie om heel waardevol te worden. Waar zitten deze potentiële klanten ? En hoe gaan ze deze Hoogfrequente Harry’s aanspreken met hun marketingstrategie?

Hoogfrequente Harry

Omdat clustering echt vanuit de data werkt, kan je van tevoren niet aangeven naar welke soort klanten je op zoek bent. Het algoritme vertelt op basis van de input welke klanten je hebt. Door de clusters te verdiepen, kunnen er, net als bij segmentatie, persona’s worden gemaakt. Het cluster dat klanten heeft die heel recent nog op de website zijn geweest, hier vaak komen en gemiddeld veel geld uitgeven kun je typeren als Hoogfrequente Harry. Met behulp van ouderwetse segmentatie was dit persona waarschijnlijk ook te vinden geweest. Maar wat we met hulp van het clusteralgoritme ook weten, is dat Harry bijvoorbeeld uit Haarlem komt en vaak op maandag om drie uur de website bezoekt met zijn laptop. Door op deze manier meer over Harry te leren, kunnen we deze groep efficiënter targeten en met minder budget méér bereiken.

Meer weten over hoe jouw bedrijf datagedreven kan worden met behulp van clustering? Neem contact op.

We drinken graag vrijblijvend een kop koffie met je.

Over de auteur:

Flora Boudewijnse is Data Scientist bij OnMarc. Haar achtergrond in Psychobiologie is van grote waarde bij het herkennen van patronen op het gebied van menselijk gedrag in data. Het onderzoek naar clustering binnen de doelgroepen van een bedrijf is één van de vooraanstaande projecten binnen OnMarc. De uitkomsten zullen de producten verder verrijken en meerwaarde voor klanten opleveren.

Segmentatie versus Clustering; de verdieping

Enthousiast geworden? Lees dan ook de artikelen van Persona naar cluster en Segmentatie versus Clustering; de Verdieping. In het eerste artikel gaan we dieper in op de praktische toepassing van clustering en in het volgende artikel duiken we dieper in de materie en worden verschillende clusteralgoritmes en clusterevaluatie toegelicht. Het is namelijk niet noodzakelijk om een data scientist te zijn om clusteralgoritmes te begrijpen.