Grip op recensies [2/3]: wat zeggen de cijfers in recensies?
Online recensies hebben enorme impact op het koopgedrag van Nederlandse consumenten: 90 procent raadpleegt ze. Maar hóé dit gemiddelde cijfer exact tot stand komt is vaak erg vaag en manipulatie ligt op de loer.
Recensies zijn belangrijk: soms bepaalt je recensiescore zelfs of je product op een platform mag blijven of je ranking in Google. Hoe krijg je grip op deze recensies? Na deel 1 over de motivaties van consumenten om ze te plaatsen, kijken we nu naar ‘de cijfers’: de statistieken en de realiteit achter recensies, en in deel 3 introduceren we het RPB-model, waarmee je recensies effectief kunt segmenteren en benutten.

Cijfers en sterren bij recensies.
Wat zeggen de cijfers eigenlijk?
Recensies worden uiteindelijk meestal uitgedrukt in één algemeen cijfer, een soort gemiddelde. Hoe hoog of laag dit exact is, is van groot belang voor je bedrijf en het heeft veel meer impact dan alleen de weergave van de klanttevredenheid.
Naast de ‘bekende’ vormen van recensies, als content, zien we ook soortgelijke informatie in reels (Instagram), Tiktok-video’s en in een unbox– of reactievideos. Dit kennen we als “n=1”: de mening van één persoon, maar wellicht wel met groot bereik en/of grote impact. Daarnaast kennen we ook EGC (Expert-Generated Content), in dit geval recensies die professioneel gemaakt zijn.

Op IMDB kun je recensies over films, series en dergelijke selecteren: van consumenten of van experts (de ‘critics’).
We kijken hier naar de grotere volumes consumentenrecensies waar het gaat om gemiddelde cijfers.
Het is geen gemiddelde!
Voor bedrijven zijn de exacte cijfers erg belangrijk. Bij Bol (pdf) en anderen, zijn de recensiescores ook de prestatienormen voor externe verkopers: “Als algemene waarderingsscore wordt minimaal een 8 verwacht. Deze score wordt berekend op basis van klantbeoordelingen en heeft invloed op de zichtbaarheid en het succes van verkopers op het platform”.
Google werkt bij de recensies met een simpel (gewogen) gemiddelde (sterren). Google neemt naast dit cijfer ook andere factoren in overweging bij het bepalen van de zichtbaarheid en rangschikking van bedrijven op SERP, zoals:
- Het aantal ontvangen recensies.
- De actualiteit van de beoordelingen.
- De algehele betrokkenheid van gebruikers.
Hoewel deze factoren de SEO-positie kunnen beïnvloeden, blijft de weergegeven gemiddelde score een eenvoudige berekening van de ontvangen beoordelingen.
Recensies beïnvloeden consumenten
Consumenten laten zich in eerste instantie leiden door het ‘eindcijfer’ en soms ook door het volume (de hoeveelheid recensies). Dit gebeurt dus in een fractie van een seconde. Consumenten verdiepen zich nooit in hoe dat cijfer tot stand komt. Een icoon, een badge, een leuk opgemaakt getal, een aantal ingekleurde sterren. Pas als er hierna interesse is, zal een consument wellicht verder kijken in de recensies.
Daarom eerst aandacht voor dit zogenaamde ‘gemiddelde’. Om als bedrijf grip te hebben op de recensies, is het belangrijk om juist een aantal zaken rond dit ‘gemiddelde’ te weten, we noemen dit verder ‘het eindcijfer’. Zonder te ver in statistiek te gaan, stippen we een paar belangrijke elementen aan.
Iedereen rekent anders met recensies
Hoe het eindcijfer tot stand komt is afhankelijk van wie de recensies bijhoudt/beheert (zie deel 1); een ‘onafhankelijk’ platform, het bedrijf zelf of bijvoorbeeld het socialemediaplatform.
Zo werkt een aantal bedrijven (Trustpilot, Algolia) met het Bayesiaanse gemiddelde, dit heeft vooral impact wanneer er weinig recensies zijn en nogal extreme scores. Vaak merken consumenten het niet, maar zo kan een product met 6 stemmen (9, 9, 10, 10,10) toch een eindscore krijgen van bijvoorbeeld 8,5. Statistisch is dat een prima methode, maar voor consumenten is het weinig inzichtelijk. Op Tweakers zie je daar bijvoorbeeld ook discussie over:
“Er zijn complexe algoritmes geschreven die de score eerlijker maken, bijvoorbeeld door een ‘vertrouwensindex’ uit te rekenen. Waarmee dan de kans dat de gegeven score daadwerkelijk klopt wordt meegenomen. Soms wordt de distributie van scores meegenomen in dergelijke berekeningen, soms zelfs door die met de verdeling van alle andere (of alleen hetzelfde type) producten te vergelijken.”
Weging van recensies
Veel platforms werken met een bijzonder gewogen gemiddelde. Zo werken bijvoorbeeld de gastbeoordelingen bij Booking:
“Elke beoordelingsscore ligt tussen 1 en 10. De eindscore is de optelling van alle beoordelingsscores van de afgelopen drie jaar, gedeeld door het aantal. Vanaf januari 2025 zijn er gewogen beoordelingen; hoe recenter de beoordeling, hoe groter de impact op de berekening van de totale beoordelingsscore.” – Booking
Het principe van een tijdsgebaseerde weging van scores wordt vaak weergegeven als recency (recentheid) of time span (periode) en heeft grote impact op het getoonde gemiddelde, de zogenaamde eindscore. Hoe groot die impact is, hangt weer af van deze exacte weging. Als alle recensies ouder dan een jaar allemaal afvallen, zoals bij Kiyoh, is de invloed heel groot.
Verder zijn er ook nog andere elementen die de weging bepalen, zoals:
- Hoe meer likes een recensies krijgt, hoe zwaarder die meetelt in de berekening.
- Hoe meer de reviewer gewaardeerd wordt, hoe zwaarder zijn/haar recensies meetellen.
- Hoe meer informatie (tekst, beeld, video), hoe zwaarder die recensie meetelt.
Recensiescores en de ‘range’?
Vaak is er een score tussen 1 en 10, of wordt en gewerkt met (vijf) sterren. Dit bepaalt ook al voor een deel de score. Soms worden de sterren dan weer ‘vertaald’ in een cijfers, of andersom, wat natuurlijk invloed heeft.

Consumenten beoordelen in sterren, maar er is een twaalfmaandenscore in een cijfer en een ‘totale’ score (8,6).
Bij TrustedShops.nl is geen exacte uitleg te vinden, maar het lijkt om een ‘gewoon’ gewogen gemiddelde te gaan. Facebook is helemaal gestopt met het sterrensysteem (maximaal 5 sterren), de recensies zijn nu heel simpel: “‘Beveel je [bedrijfsnaam] aan?’ Je kunt kiezen tussen ‘Ja’ of ‘Nee’ en hebt de mogelijkheid om een geschreven toelichting, tags en foto’s toe te voegen aan je ervaring”. Veel bedrijven hebben bieden deze recensie-optie overigens niet aan.
Facebook kent als reviews alleen nog wel-of niet aanbevelen. In dit geval beveelt 66 procent Coolblue aan.
Scores en gemiddeldes
Consumenten zijn online eerder geneigd zeer positieve of zeer negatieve ervaringen te delen dan gematigde. Dit fenomeen zien we terug in de ‘j-vormige’ (biomodale) verdeling: er is een oververtegenwoordiging van hoge en lage beoordelingen, met minder middelmatige scores. Deze ‘scheve’ verdeling wordt onder andere beïnvloed door anonimiteit online en de neiging om ‘gewone’ ervaringen niet te rapporteren. De representativiteit van de recensies is er vaak niet, ook al doordat de uitnodigingen soms niet naar iedereen gaan. Laten we als voorbeeld kijken naar de tevredenheidscores van de klanten van een hotel (in woorden, cijfers of sterren):

De typische verdeling bij recensies: meer extremen dan neutrale meningen.
Laten we zeggen dat een hotel 100 kamers heeft en een bezettingsgraad van 70 procent en een gemiddelde verblijfsduur van drie dagen. Dan zijn er in 5 jaar ongeveer 42.580 boekingen geweest.
Als er van dit hotel tweehonderd recensies online staan dan lijkt dat best een aardig aantal, maar dat vertegenwoordigt maar 0,47 procent van alle boekingen. En we weten dat recensies neigen naar extremen. Als van die tweehonderd reviews er vijftig zeer negatief zijn, is dat vijfentwintig procent van de recensies. Tegelijkertijd zijn het echter ook maar 50 van de 42.580 boekingen… Dat is nog steeds jammer en misschien van grote invloed, maar geeft een ander beeld van de waarde en representativiteit van de recensies.
Businessmodel
Bedrijven kunnen vaak mensen die recensies schrijven benaderen (Google doet dit bijvoorbeeld ook).
“Heeft een klant jou negatief beoordeeld? Daar ga je natuurlijk iets aan doen; je neemt contact op met de klant om een oplossing te vinden. Daarna kun je de klant vanuit je verkoopaccount eenmalig een nieuw beoordelingsverzoek sturen” – Bol Partner-platform(pdf)
Een aantal recensiesites, zoals Trustpilot, Tripadvisor, Trustedshops en Yelp, werken met een businessmodel dat bestaat uit (betaalde) abonnementen die bedrijven kunnen nemen om zo ‘meer te kunnen doen’ met recensies. Dit levert ook vreemde zaken op: een bedrijf kan bijvoorbeeld negatieve recensies rapporteren en ze verdwijnen dan ook (voorlopig). De klant dient bijvoorbeeld ‘extra bewijs’ te leveren (van aankoop en dergelijke), zo niet, dan verdwijnt hun recensie definitief.

Opvallend, dit bedrijf heeft heel veel negatieve recensies gerapporteerd, waardoor er nu 170 van de 223 definitief zijn verdwenen.
Het kunnen aanpassen van reviews heeft grote voor- en nadelen voor bedrijven maar ook voor consumenten. Het beïnvloedt de (algemene) scores enorm.
Welke waarde?
De waarde van recensies is op zich overduidelijk, maar wat de getallen precies zeggen en wie dat precies zegt is erg ondoorzichtig. In het laatste deel van deze serie gaan we in op het RPB-Model en andere factoren, zoals het kopen van recensies, sock puppets en synthetische media.
Geïnteresseerd in meer? De Emerce Academy biedt een Deep dive in review-strategie aan als training.
Over de auteur: Jeroen Vinkesteijn is spreker, onderzoeker en hoofddocent aan BUAS. Hij schrijft hier op persoonlijke titel.
Plaats een reactie
Uw e-mailadres wordt niet op de site getoond