4-Check Model

Van afvinken naar waarderen in toetsing en beoordeling in het mbo

Hoe zorg je ervoor dat toetsing en beoordeling in het mbo niet alleen transparant en herleidbaar zijn, maar ook echt recht doen aan het beroep waarvoor studenten worden opgeleid? In veel praktijkexamens zijn beoordelingscriteria zorgvuldig opgebouwd vanuit kwalificatiedossiers, werkprocessen en gedragingen. Dat biedt houvast, duidelijkheid en legitimatie. Tegelijkertijd roept het ook een belangrijke vraag op: beoordelen we hiermee werkelijk het beroep, of vooral losse onderdelen daarvan?

Juist in authentieke beroepssituaties laat een student immers meer zien dan afzonderlijk gedrag. Professioneel handelen vraagt om samenhang, afstemming, keuzes maken, communiceren en onderbouwen.
Wanneer beoordelingscriteria te sterk versnipperd raken, bestaat het risico dat het examen wel controleerbaar is, maar minder goed zichtbaar maakt of een student het beroep als geheel beheerst. Dit raakt direct aan de validiteit van toetsing: wat gemeten wordt, vertegenwoordigt niet langer het geïntegreerde beroepshandelen dat centraal staat in competentiegerichte opleidingen (Gulikers, Bastiaens & Kirschner, 2004).

Vanuit dat vraagstuk is het 4-Check model ontwikkeld: een ontwerplens voor meer holistische beoordeling in het mbo, met oog voor validiteit, context, zichtbaarheid en dialoog.

4-Check model Rottier 2026 toetsing en beoordeling

Waarom holistisch beoordelen in het mbo nodig is

Binnen het mbo draait examinering uiteindelijk om de vraag of een student in staat is om het beroep uit te oefenen. Toch worden praktijkexamens nog vaak beoordeeld aan de hand van losse gedragingen of afvinkbare criteria. Dat maakt beoordeling overzichtelijk, maar niet altijd betekenisvol.

Professioneel handelen laat zich namelijk niet eenvoudig reduceren tot een reeks losse punten. Een student observeert, interpreteert, maakt afwegingen, communiceert, onderbouwt keuzes en handelt in een concrete context. Juist die samenhang maakt beroepsbekwaamheid zichtbaar. Dit sluit aan bij inzichten over authentieke toetsing, waarin wordt benadrukt dat beoordeling plaats moet vinden in realistische, betekenisvolle situaties waarin kennis, vaardigheden en houding geïntegreerd tot uiting komen (Gulikers et al., 2004).

Daarom is holistisch beoordelen in het mbo geen modetrend, maar een logische stap in het versterken van de kwaliteit van praktijkexamens.


Van analytisch beoordelen naar meer samenhangende beoordeling

De discussie over analytisch en holistisch beoordelen wordt soms te zwart-wit gevoerd. Alsof analytisch beoordelen verkeerd is en holistisch beoordelen altijd beter. In werkelijkheid hebben beide benaderingen waarde.

Analytische criteria zorgen voor duidelijkheid, transparantie en houvast, en dragen bij aan betrouwbaarheid van beoordeling (Van Berkel, Bax & Joosten-ten Brinke, 2023). Tegelijkertijd kan een sterke focus op losse criteria ertoe leiden dat het geheel van professioneel handelen uit beeld raakt.

In de literatuur wordt daarom steeds vaker gepleit voor een meer programmatische en samenhangende benadering van toetsing, waarin verschillende vormen van beoordeling gezamenlijk een rijker beeld geven van bekwaamheid (Boud & Falchikov, 2007).
Maar wanneer zij het beoordelingsniveau gaan bepalen, kunnen zij ook leiden tot versnippering. Een holistische benadering doet vaak meer recht aan de complexiteit van het beroep, maar vraagt om bewuste ontwerpkeuzes om niet te vaag te worden.

De kern ligt daarom niet in kiezen voor het één of het ander, maar in het vinden van een balans tussen houvast en samenhang. Precies daar ligt de kracht van het 4-Check model.


Het 4-Check model

Het 4-Check model helpt examenontwikkelaars en beoordelaars om beoordelingscriteria niet alleen transparant en bruikbaar te maken, maar ook beter te laten aansluiten bij integraal beroepshandelen in context.

Het model bestaat uit vier samenhangende checks:

1. Essentie

Representeert het criterium een herkenbaar en betekenisvol deel van het beroep, de kerntaak of de leeruitkomst?

2. Context

Vindt de beoordeling plaats in een passende en authentieke beroepscontext?

3. Zichtbaarheid

Wordt het handelen van de student aantoonbaar zichtbaar gemaakt, bijvoorbeeld via uitvoering, producten of onderbouwde beschrijving?

4. Dialoog

Kan de student het handelen professioneel onderbouwen en bespreken?

Samen helpen deze vier checks om beoordelingscriteria te formuleren die niet reduceren tot afvinkbare gedragingen, maar bijdragen aan valide beroepsbeoordeling in het mbo.


Waarom juist dialoog zo belangrijk is

In veel beoordelingsinstrumenten krijgt onderbouwing een plek als apart criterium, bijvoorbeeld: “de student onderbouwt met theorie” of “de student reflecteert op eigen handelen”. Het risico daarvan is dat dialoog iets losstaand wordt, terwijl het in de beroepspraktijk juist onderdeel is van professioneel handelen zelf.

Een beroepsbeoefenaar laat niet alleen zien wat hij doet, maar ook waarom hij dat doet, welke afwegingen zijn gemaakt en hoe keuzes passen binnen de context. Juist daarin wordt professionele kwaliteit zichtbaar.

Daarom krijgt dialoog in het 4-Check model een centrale plaats. Dit sluit aan bij recente ontwikkelingen rondom dialogisch valideren, waarin beoordeling wordt gezien als een proces van gezamenlijke betekenisgeving, waarbij student en beoordelaar in gesprek tot een onderbouwd oordeel komen (Duvekot et al., 2026; Brouwer & Duvekot, 2024).

Ook binnen feedbackonderzoek wordt benadrukt dat leren versterkt wordt wanneer evaluatie plaatsvindt in interactie en dialoog, in plaats van uitsluitend via statische beoordelingscriteria (Wiliam & Leahy, 2019).

Deze benadering sluit aan bij dialogisch valideren, waarin beoordeling niet alleen draait om prestaties, maar ook om betekenisgeving, professionele onderbouwing en afstemming in gesprek.

Voor praktijkexamens in het mbo is dat essentieel.


Hoe het 4-Check model in de praktijk werkt

Toepassingsmodel 4-check model Rottier 2026

Het 4-Check model is niet alleen een denkkader, maar ook een praktisch hulpmiddel voor examenontwikkeling. Je kunt het gebruiken in een logische ontwerpvolgorde:

Stap 1. Analyseer de broninformatie

Breng kwalificatiedossier, kerntaak, werkproces, leeruitkomst en beroepscontext in kaart.

Stap 2. Bepaal de essentie

Wat is hier de betekenisvolle beroepshandeling die centraal moet staan?

Stap 3. Bepaal de context

In welke authentieke beroepssituatie moet dit handelen zichtbaar worden?

Stap 4. Maak zichtbaarheid expliciet

Welk handelen, product of bewijs maakt dit aantoonbaar?

Stap 5. Voeg dialoog toe

Hoe verantwoordt de student keuzes en professioneel handelen?

Stap 6. Formuleer een integraal criterium

Niet vanuit losse gedragingen, maar vanuit beroepshandelen als betekenisvol geheel.

Stap 7. Gebruik observatierichtlijnen

Gedragingen uit het kwalificatiedossier blijven bruikbaar, maar dan als observatiehulp.

Stap 8. Check de kwaliteit

Past het criterium nog bij validiteit, transparantie, bruikbaarheid en samenhang?


Van afvinken naar waarderen

De grootste opbrengst van deze benadering is dat gedragingen en kenniscomponenten niet verdwijnen, maar een andere functie krijgen. Ze blijven bruikbaar als observatie-informatie, maar vormen niet langer het primaire beoordelingsobject.

De vraag verschuift daardoor van:

Heeft de student alle gedragingen laten zien?

naar:

Laat de student als geheel professioneel en effectief beroepshandelen zien?

Dat is de beweging van afvinken naar waarderen. Deze verschuiving past binnen een bredere beweging in het onderwijs, waarin toetsing niet alleen wordt ingezet als meetinstrument, maar ook als middel om leren te stimuleren en professioneel handelen zichtbaar te maken (Sluijsmans & Kneyber, 2016).


Ook relevant voor AI-ondersteund toetsontwerp

Generatieve AI wordt steeds vaker gebruikt bij toetsontwikkeling. Dat biedt kansen, maar ook risico’s. AI neemt gemakkelijk bestaande patronen over, waaronder versnipperde beoordelingscriteria en afvinklijsten.

Door het 4-Check model expliciet op te nemen in prompts, kan AI gestuurd worden om beoordelingscriteria te ontwerpen vanuit integraal beroepshandelen in plaats van losse gedragingen. Daarmee wordt het model ook bruikbaar als kwaliteitsfilter in AI-ondersteunde toetsontwikkeling.


Tot slot

Wie werkt aan holistisch beoordelen in het mbo, werkt in feite aan een rijker begrip van kwaliteit. Niet door structuur los te laten, maar door structuur opnieuw te verbinden aan betekenisvol beroepshandelen in context.

Het 4-Check model biedt daarvoor een bruikbare ontwerplens. Het helpt om beoordelingscriteria te formuleren die valide, transparant en hanteerbaar zijn, en tegelijkertijd beter recht doen aan de complexiteit van het beroep.

De toekomst van toetsing en beoordeling in het mbo ligt wat mij betreft niet in méér afvinken, maar in beter waarderen. En juist daarin speelt de dialoog een onmisbare rol.

Veelgestelde vragen over het 4-Check model

Wat is het 4-Check model?

Het 4-Check model is een ontwerpkader voor beoordelingscriteria in het mbo. Het model bestaat uit vier checks: Essentie, Context, Zichtbaarheid en Dialoog.

Waarom is het 4-Check model relevant voor het mbo?

Het model helpt om beoordelingscriteria niet alleen transparant en herleidbaar te maken, maar ook beter te laten aansluiten bij integraal beroepshandelen in authentieke beroepscontexten.

Wat is het verschil tussen analytisch en holistisch beoordelen?

Analytisch beoordelen richt zich op afzonderlijke criteria of gedragingen. Holistisch beoordelen kijkt meer naar de samenhang en kwaliteit van het handelen als geheel. In de praktijk is vaak een combinatie nodig.

Waarom speelt dialoog zo’n belangrijke rol in het model?

Omdat professioneel handelen niet alleen zichtbaar wordt in wat een student doet, maar ook in hoe keuzes worden onderbouwd en besproken. Dialoog maakt professionele betekenisgeving expliciet.

Hoe kan het 4-Check model worden gebruikt in examenontwikkeling?

Examenontwikkelaars kunnen het model gebruiken om van kwalificatiedossier en beroepscontext naar integraal geformuleerde beoordelingscriteria te werken, met observatierichtlijnen en kwaliteitscheck.

Literatuur

  • Biggs, J., & Tang, C. (2011). Teaching for quality learning at university. McGraw-Hill.
  • Boud, D., & Falchikov, N. (2007). Rethinking assessment in higher education. Routledge.
  • Brouwer, P., & Duvekot, R. (2024). Eindrapportage thema dialogisch valideren – MBOin2030.
  • Duvekot, R., Farla, M., Kolkman, I., & Venema, B. (2026). Werkend leren waarderen: Flexibel leren en dialogisch valideren. Concept Uitgeefgroep.
  • Gulikers, J., Bastiaens, T., & Kirschner, P. (2004). A five-dimensional framework for authentic assessment. Educational Technology Research and Development, 52(3), 67–86.
  • Gulikers, J., & Van Benthum, N. (2017). Toetsen van competenties. In H. van Berkel, A. Bax, & D. Joosten-ten Brinke (Red.), Toetsen in het hoger onderwijs (pp. 227–239). Bohn Stafleu van Loghum.
  • Sluijsmans, D., & Kneyber, R. (2016). Toetsrevolutie: Naar een feedbackcultuur in het voortgezet onderwijs. Uitgeverij Phronese.
  • Van Berkel, H., Bax, A., & Joosten-den Brinke, D. (2023). Toetsen in het hoger onderwijs. Bohn Stafleu van Loghum.
  • Wiliam, D., & Leahy, S. (2019). Formatief evalueren in de praktijk. Bazalt Educatieve Uitgaven.