Primair onderwijs

Geen bewijs voor leerwinst, wel risico op ongelijkheid door AI

Groningse onderzoekers hebben geen overtuigend wetenschappelijk bewijs gevonden dat AI-systemen het leren daadwerkelijk verbeteren. Tegelijkertijd laten de onderzoekers zien dat AI discriminerende effecten kan hebben, met name voor leerlingen uit minderheidsgroepen.

Bestaande benaderingen van AI-geletterdheid bieden bovendien onvoldoende houvast, omdat ze de sociale, culturele en contextuele aspecten van leren grotendeels buiten beschouwing laten. Dat stellen Dagmar Mercedes Heeg en Lucy Avraamidou in een conceptueel artikel waarin zij pleiten voor een kritische benadering van AI in het onderwijs, uitgewerkt in wat zij aanduiden als ‘kritische AI-geletterdheid’. 

Het deze week verschenen artikel richt zich op de vraag hoe AI-systemen in het onderwijs worden ingezet en begrepen, en in hoeverre bestaande benaderingen tekortschieten wanneer leren wordt opgevat als een sociaal en cultureel proces. De auteurs signaleren dat AI in het onderwijs breed is omarmd vanwege veronderstelde voordelen, zoals gepersonaliseerd leren, het verkleinen van ongelijkheden en het verlichten van de werkdruk van leraren.

Kleinschalige studies in specifieke contexten

Die verwachtingen zijn volgens hen echter grotendeels gebaseerd op aannames, niet op stevig empirisch bewijs. Waar dat bewijs wel bestaat, betreft het kleinschalige studies in specifieke contexten, waardoor generalisatie moeilijk is. 

Volgens de auteurs blijft kritische reflectie op de beperkingen en risico’s van AI daarbij achter. In de bestaande literatuur ligt de nadruk vooral op technische toepassingen en mogelijkheden, terwijl de sociale aard van leren nauwelijks wordt meegenomen.

Wanneer AI-systemen worden ontwikkeld en toegepast

Juist dat perspectief is volgens hen essentieel, omdat leren niet alleen een cognitief proces is, maar ook wordt gevormd door interactie, identiteit, taal en context. Wanneer AI-systemen worden ontwikkeld en toegepast zonder deze dimensies mee te nemen, bestaat het risico dat ze slecht aansluiten bij hoe leren in de praktijk werkt. 

De analyse van bestaande toepassingen en studies laat zien dat drie centrale beloften van AI in het onderwijs steeds terugkeren: personalisering van het leerproces, het bevorderen van gelijke kansen en het verminderen van de werkdruk van leraren.

Niet empirisch onderbouwd

AI-systemen zouden bijvoorbeeld leerstof kunnen aanpassen aan het niveau en tempo van individuele leerlingen, of leraren ondersteunen door automatische beoordeling en feedback. Tegelijkertijd constateren de auteurs dat deze beloften vaak niet worden ondersteund door robuust onderzoek. In verschillende gevallen blijken claims over betere leerprestaties of efficiënter onderwijs niet empirisch onderbouwd. 

Daarnaast wijzen de onderzoekers op de manier waarop AI-systemen worden ontwikkeld en ingezet. Volgens hen zijn deze systemen vaak ingebed in commerciële en marktgerichte logica’s, waarin nadruk ligt op meetbare prestaties en schaalbaarheid. Daardoor verschuift de aandacht naar gestandaardiseerde, kwantificeerbare uitkomsten van leren, terwijl sociaal-emotionele ontwikkeling en contextuele factoren minder zichtbaar worden. Dit leidt tot een benadering van onderwijs die vooral gericht is op meten en optimaliseren, en minder op de bredere doelen van leren en ontwikkeling. 

Minder aansluiten bij de dominante taalnorm

Een belangrijk onderdeel van de analyse betreft discriminatie en bias in AI-systemen. Uit verschillende studies blijkt dat automatische beoordelingssystemen systematisch nadelig kunnen uitpakken voor leerlingen die geen moedertaalsprekers zijn of die varianten van taal gebruiken die afwijken van de standaard. In zulke gevallen worden antwoorden met ‘correcte’ terminologie soms hoger beoordeeld dan inhoudelijk sterkere antwoorden die minder aansluiten bij de dominante taalnorm. 

Ook systemen die gedrag, gezichtsuitdrukkingen of betrokkenheid meten, blijken niet voor alle groepen even goed te werken. Ze functioneren doorgaans nauwkeuriger voor witte, westerse en neurotypische leerlingen dan voor anderen. Hierdoor kunnen bestaande verschillen tussen groepen worden versterkt. De auteurs koppelen dit aan bredere structurele oorzaken, zoals de samenstelling van datasets en de achtergrond van ontwikkelaars. AI-systemen worden vaak ontwikkeld door relatief homogene groepen, waardoor ze beter aansluiten bij dominante culturele normen dan bij de diversiteit van gebruikers in het onderwijs. 

Naast deze empirische analyse vergelijken de auteurs zeven invloedrijke kaders voor AI-geletterdheid. Daaruit blijkt dat de meeste van deze frameworks AI benaderen als een onvermijdelijke technologie waar leerlingen mee moeten leren omgaan. Slechts enkele benaderingen bieden ruimte voor de vraag of en wanneer het gebruik van AI wenselijk is.

Zonder uitwerking van concrete sociale en culturele implicaties

Veel frameworks richten zich bovendien op technische kennis en vaardigheden, of op voorbereiding op de arbeidsmarkt. Hoewel ethische kwesties vaak worden genoemd, blijven deze meestal beperkt tot algemene principes zoals transparantie en eerlijkheid, zonder uitwerking van concrete sociale en culturele implicaties. 

De analyse laat ook zien dat de meeste frameworks niet expliciet zijn gebaseerd op kritische of socioculturele pedagogiek. Daardoor krijgt kritisch denken over AI geen centrale plaats in het curriculum, maar blijft het een aanvullend onderdeel. Daarnaast ontbreekt het in de bestaande kaders aan concrete handvatten om discriminerende of problematische toepassingen van AI daadwerkelijk te herkennen en tegen te gaan. 

AI-toepassingen bewust en doelgericht ontwerpen

Op basis van deze bevindingen pleiten Heeg en Avraamidou voor een andere benadering van AI in het onderwijs. Zij stellen voor om AI niet als vanzelfsprekend uitgangspunt te nemen, maar eerst te bepalen welke rol deze technologie daadwerkelijk zou moeten spelen in onderwijspraktijken. Voor curriculumontwikkeling betekent dit dat AI-toepassingen bewust en doelgericht moeten worden ontworpen, met expliciete aandacht voor de diversiteit van leerlingen, waaronder verschillen in taal, achtergrond en identiteit. 

Voor leraren en lerarenopleidingen benadrukken de auteurs het belang van kritische AI-geletterdheid. Leraren zouden in staat moeten zijn om AI-toepassingen te beoordelen in relatie tot hun eigen onderwijscontext en leerdoelen, en om keuzes te maken over het gebruik ervan. Dat vraagt om kennis van zowel de technische werking als de sociale en ethische implicaties van AI.

Meer aandacht voor sociale rechtvaardigheid

Ten slotte pleiten de onderzoekers voor een verschuiving in toekomstig onderzoek. In plaats van een focus op cognitieve effecten en meetbare leeropbrengsten, zou meer aandacht moeten uitgaan naar socioculturele vraagstukken, zoals gelijkwaardigheid, taal, identiteit en sociale rechtvaardigheid.

In hun conclusie roepen zij de onderwijsgemeenschap op om afstand te nemen van onkritische verwachtingen rond AI en zich te baseren op onafhankelijk en empirisch onderbouwd onderzoek. Volgens de auteurs is er op dit moment geen overtuigend bewijs dat AI-systemen het leren ondersteunen, terwijl er wel aanwijzingen zijn dat ze bestaande ongelijkheden kunnen versterken. 

Wat betekent dit in de praktijk?

Voor scholen en onderwijsinstellingen betekent dit onderzoek dat voorzichtigheid geboden is bij de inzet van AI-systemen. Er is geen stevig bewijs dat deze systemen het leren verbeteren, terwijl er wel risico’s zijn op ongelijke behandeling van leerlingen. Het is daarom van belang om kritisch te kijken naar wanneer en waarom AI wordt ingezet.

Voor leraren en lerarenopleiders onderstreept het onderzoek het belang van kritische AI-geletterdheid. Leraren moeten niet alleen weten hoe AI werkt, maar ook in staat zijn om de sociale en ethische gevolgen te beoordelen en af te wegen of het gebruik van AI past bij hun onderwijspraktijk.

Voor beleidsmakers en curriculumontwikkelaars maken de bevindingen duidelijk dat bestaande AI-geletterdheidskaders onvoldoende aandacht besteden aan sociale en culturele dimensies van leren. Nieuwe curricula zouden expliciet rekening moeten houden met diversiteit, taal en ongelijkheid, en leerlingen moeten ondersteunen om AI kritisch te beoordelen en zo nodig ook af te wijzen.

Bron: Heeg, D. M. & Avraamidou, L. (2026). Demystifying AI: The urgency of a critical stance on the use of AI systems in education, Prospects. DOI: https://doi.org/10.1007/s11125-026-09760-4