Een vergelijking tussen Artificial Intelligence en de echte wereld
Vorige maand schreven we al een blog over het gebrek aan Systeem-1-data in de fundering waarop AI wordt getraind. Daardoor is het voorspellen van menselijk gedrag vaak weinig betrouwbaar. De afgelopen weken was er, met name op LinkedIn, veel aandacht voor Virtual Eye Tracking.
Met eye tracking is op zichzelf niets mis. AI-gedreven eye tracking voorspelt de uitkomsten van een echte eye tracker zelfs behoorlijk nauwkeurig, zoals wetenschappers bij Neurensics al tien jaar geleden aantoonden. Het trainen van een virtuele eye tracker is dan ook relatief eenvoudig, vooral omdat kijkgedrag zeer voorspelbaar is. Mensen kijken naar mensen. We proberen sociale situaties in te schatten nog vóór ze plaatsvinden, en dat doen we vooral door anderen in de ogen te kijken. We kijken naar tekst. En we kijken naar beweging, omdat daar kansen of bedreigingen kunnen liggen.
So far, so good.
De volgende stap is echter het voorspellen van het handelingsgedrag dat voortkomt uit dat kijkgedrag. En dát is een hachelijke onderneming. Neem bijvoorbeeld engagement. In marketingland een veelbesproken en enigszins overgewaardeerde term, zoals ik in mijn vorige blog al betoogde. Engagement zou iets zeggen over merkentrouw en zelfs koopintentie. Maar wat bedoelen we er precies mee? En vooral: hoe meet je het betrouwbaar?
Dezelfde term: verschillende oorsprong
Op internet bieden verschillende bedrijven reclameonderzoek aan waarbij op basis van Virtual Eye Tracking wordt voorspeld of een commercial, verpakking, poster of advertentie goed zal scoren. Zoals gezegd: met het voorspellen van kijkgedrag is niets mis. Maar vervolgens wordt de aanname gedaan dat de effectiviteit van een marketingstimulus kan worden afgeleid uit engagement dat uit eye-trackingdata wordt gedestilleerd.
Maar kan dat eigenlijk wel? Zegt de mate en duur van aandacht iets over de mate van betrokkenheid? En zo ja, is die betrokkenheid dan positief of negatief?
De enige manier om daarachter te komen, is door virtueel voorspelde engagement te vergelijken met daadwerkelijk gemeten engagement – en dan specifiek met engagement die kan worden bestempeld als echte engagement. Het neutrale neurale patroon dat positieve betrokkenheid in het brein vertegenwoordigt en dat uitsluitend met fMRI kan worden gemeten.
Zonder namen te noemen hebben we een van onze studies virtueel laten testen bij een van de grootste internationale aanbieders van AI-based ad testing; laten we het bedrijf X noemen. De vergelijking tussen de resultaten van deze AI-methode en onze eigen fMRI-metingen vormt een mooie aanleiding om bovenstaande vragen te verkennen. We hebben de engagement-scores van bedrijf X naast onze fMRI-engagement gelegd om te onderzoeken in hoeverre beide methoden tot vergelijkbare uitkomsten komen.
Wat is engagement eigenlijk?
Engagement dives into the magnetic draw of your content. It anticipates if viewers will feel captivated and actively involved when encountering the asset. Volgens bedrijf X
Dit is minder een definitie van het fenomeen engagement dan een beschrijving van het gedrag dat het zou oproepen. Engagement – of in goed Nederlands: positieve betrokkenheid – is de mate waarin content aandacht trekt, persoonlijk relevant aanvoelt en een betekenisvolle emotionele of cognitieve reactie oproept.
Wanneer we deze definitie ontleden, kunnen we stellen dat eye tracking hooguit kan meten in welke mate content de aandacht trekt. Maar daar houdt het ook op. Uit de mate of duur van aandacht valt niet af te leiden of iets persoonlijk relevant aanvoelt, laat staan of het een betekenisvolle emotionele of cognitieve reactie oproept. In de rapportages van bedrijf X wordt bovendien niet inzichtelijk gemaakt hoe deze vertaalslag precies tot stand komt.
Daar hebben we andere meetmethoden voor. Oogbewegingen zijn geen directe indicator van betrokkenheid. Kijkers kunnen hun aandacht richten op onderdelen van een commercial zonder daadwerkelijk betrokken of geïnteresseerd te zijn in de boodschap.
De neurale structuur van engagement
Je kunt perfect registreren waar iemand naar kijkt, zonder te weten wat dat in het brein teweegbrengt. Aandacht is niet automatisch emotie. Focus is geen waardering. Activiteit is geen betrokkenheid. Wie in het brein kan kijken, ziet dat engagement bestaat uit drie onderscheiden neurale structuren: Value, Involvement en Familiarity.
- Value (beloning / meerwaarde)
Value meet hoe sterk een reclame als belonend wordt ervaren. Denk aan het tonen van gewenst gedrag (bijvoorbeeld het openen van een flesje), gevolgd door een beloning (de verfrissende slok). Hoe sterker die beloning neuronaal wordt geregistreerd, hoe krachtiger het gedrag wordt bekrachtigd. - Involvement (zelf-relevantie)
Involvement gaat over de mate waarin de beelden persoonlijk relevant zijn voor de kijker. Belangrijk: zowel positieve als negatieve emoties kunnen leiden tot hoge involvement. Voorkeur en afkeer zijn tegenpolen, maar beide voelen nabij.
- Familiarity (vertrouwdheid)
Familiarity meet de vertrouwdheid met getoonde personen, objecten en handelingen. Niet: ken ik dit merk? maar: is dit gedrag, deze situatie of deze omgeving voor mij herkenbaar?
Dit gaat dus aanzienlijk verder dan het meten van aandacht. Deze neurale structuren zijn niet betrouwbaar te onderzoeken met EEG, en zelfs niet met fNIRS. Elk van deze drie componenten wordt afzonderlijk gemeten met fMRI, op basis van hersenactiviteit en patroonherkenning.
Wat gebeurt er als we beide methoden vergelijken?
Terug naar de vergelijking. Om het bedrijf X niet onnodig moeilijk te maken, hebben we geen TV-commercials maar zeven posters getest met predictive eye tracking. Vervolgens hebben we deze resultaten vergeleken met een fMRI-studie van dezelfde posters, die we eerder hebben uitgevoerd.
Wanneer we de engagement-scores van bedrijf X en Neurensics naast elkaar leggen, zien we een patroon dat onze wetenschappers al verwachtten.
In de grafiek staat op de X-as de voorspelde engagement van bedrijf X, en op de Y-as de engagement die met fMRI door Neurensics is gemeten. Posters A en B wekken de meeste engagement op wanneer deze direct in het brein wordt gemeten op basis van de hierboven beschreven neurale netwerken. Posters D en F scoren daarentegen het hoogst op voorspelde engagement op basis van oogbewegingen.
Opvallend is dat juist deze laatste twee varianten bij daadwerkelijke meting van hersenactiviteit in de scanner een ondergemiddelde engagement laten zien (score < 0).
Wanneer we alle zeven AI-voorspellingen vergelijken met de gemeten werkelijkheid, blijkt de overeenkomst ronduit slecht. Te slecht zelfs om in de praktijk enige voorspellende waarde te hebben.
Conclusie
Per saldo geven methodieken als Predictive Eye Tracking een inschatting van visuele aandacht. Alleen een echte neurale meting biedt inzicht in emotionele betrokkenheid. En dat verschil is fundamenteel, zeker wanneer beslissingen worden genomen over creatie, merkbouw en media-investeringen. Engagement is daartoe een waardevol concept, en het voorspellen ervan is relevant voor het beoordelen van reclame-effectiviteit. Maar alleen wanneer het op de juiste plek wordt gemeten, is die voorspelling betrouwbaar.
Want ogen kijken, maar het brein ziet.
Wil jij weten wat AI niet ziet, maar jouw doelgroep wel voelt?
Wij helpen je graag de de onbewuste indruk van jouw merk te ontdekken, te testen én te verankeren in het brein van de consument.
Meer weten?
Ontdek hoe wij met neurowetenschap de impact van jouw content kunnen voorspellen, zodat je meer kunt doen dan alleen visuele aandacht trekken: neuromarketingonderzoek bij Neurensics.
Lees verder
De AI paradox: slimme algoritmes, domme data
AI en het brein: we begrijpen genoeg van het brein, om te weten dat AI het nog niet begrijpt. ...
Martin de Munnik Leestijd 6 minuten
Herinnering, ‘sparsity’ en interferentie in neuromarketing
Herinneringen als engrammen: spaarzaam en kwetsbaar In de neurowetenschappen spreekt men van ...
Martin de Munnik Leestijd 13 minuten
Wat er écht in het brein van de kiezer gebeurt
Hoe politieke campagnes ons brein prikkelen Ons brein reageert razendsnel op beelden, gezichten en...
Neurensics Leestijd 10 minuten
Het unieke Vrouwenbrein
De wetenschap achter intuïtie, emotie en besluitvorming We leven in een tijd waarin de opmars van...
Neurensics Leestijd 8 minuten



