Hoe factor- & clusteranalyse verborgen structuren blootleggen in je data

Ken je dat gevoel, wanneer je al op alle mogelijke manieren naar je data keek, maar je er toch verder wil induiken? Factor- en clusteranalyse kunnen je in dat soort situaties helpen om verborgen patronen in je dataset te ontdekken. In deze blogpost leggen we je uit hoe je beide technieken kan gebruiken.

Segmentatie is zowat de basis van survey onderzoek, het laat je immers toe om structuren te vinden in je data. Mannen kunnen bijvoorbeeld meer geneigd zijn een bepaald product te kopen of oudere werknemers kunnen gelukkiger zijn op hun werk.

Segmentatie kan je doen via louter descriptieve statistiek, zoals via frequenties of gemiddelden. Maar er zijn ook geavanceerdere statistische technieken die patronen kunnen detecteren in een dataset, factor-en clusteranalyse zijn twee erg populaire vormen daarvan die we uitleggen in deze blogpost.

Om te beginnen echter een korte noot over terminologie: met variabelen bedoelen we de verticale secties van je dataset (doorgaans de vragen van je enquête), met observaties (cases in de afbeelding hieronder) bedoelen we de horizontale lijnen (doorgaans de individuele respondenten).

data variables spss

Factoranalyse

Factoranalyse is een geavanceerde statistische techniek die op basis van correlatie werkt. Correlatie verklaart de covariantie van bepaalde variabelen, zoals de onderstaande foto laat zien.

correlation

Factoranalyse breidt dit principe uit en groepeert bepaalde variabelen in nieuwe variabelen, namelijk factoren, gebaseerd op hoe ze correleren. Factoren zijn als het ware de onderliggende of latente variabelen in je dataset.

Er zijn twee typen factoranalyse: exploratief en confirmatief. Exploratief betekent dat factoranalyse gebruikt wordt om patronen in de dataset te zoeken, wat vooral populair is in marktonderzoek. Confirmatieve factoranalyse probeert via een factor doorgaans hypothesen te bevestigen, wat meestal in wetenschappelijk onderzoek gebruikt wordt.

Exploratieve factoranalyse kan je in essentie helpen om onverwachte patronen in je variabelen te vinden. Bijvoorbeeld, dat een enquête naar consumptiepatronen toont hoe personen die dure voeding in de supermarkt kopen ook allerhande andere luxeproducten consumeren, van dure kleren tot de nieuwste technologie.

Clusteranalyse

Terwijl factoranalyse kijkt naar de groepering van variabelen (de verticale sectie van een dataset), kijkt clusteranalyse naar de groepering van observaties (de horizontale sectie van een dataset).

In de onderstaande foto wordt een erg simpele clusteranalyse voorgesteld, de observaties (bv. klanten) worden geplaatst op een tweezijdige grafiek (die twee variabelen voorstelt). Clusteranalyse brengt orde aan in al deze observaties en groepeert hen in twee clusters (doorgaans op basis van een soort afstandsberekening).

cluster analysis

In tegenstelling tot factoranalyse plaatst clusteranalyse individuele respondenten in groepen, wat je toelaat om hen te segmenteren en bijvoorbeeld te stellen dat 30% van je respondenten in de groep thuishoren die dure producten kopen.

Beide technieken kan je ook samen gebruiken, factoranalyse kan je hanteren om patronen te zoeken terwijl je clusteranalyse kan gebruiken om je dataset te segmenteren.

Waar vind je meer informatie?

Beide technieken kunnen erg nuttig zijn om structuren te vinden in je data die je anders niet had gevonden, maar je moet er ook mee oppassen. Beiden zijn relatief complexe statistische technieken, en kennis van de onderliggende mechanismen is de sleutel tot het maken van correcte interpretaties.

Een goed beginpunt is Multivariate Data Analysis, een bijna klassiek boek dat onder andere factor- en clusteranalyse uitlegt in taal die begrijpbaar is voor niet-experten.

Een goede kennis van statistische software, zoals SPSS, is ook een must om dit soort berekening goed uit te voeren en te interpreteren, online vind je alvast erg veel handleidingen. Hier kan je lezen hoe je factor- en clusteranalyse aanpakt in SPSS.

Om met factor- en clusteranalyse te beginnen moet je echter eerst je data verzamelen. CheckMarket geeft je alle tools om dat te doen, zodat je snel je resultaten kan segmenteren. Download je data onmiddellijk in het SPSS bestandsformaat en ga meteen aan de slag. Registreer je snel voor een gratis test account.

Geef een antwoord

Het e-mailadres wordt niet gepubliceerd.