Modus
De sleutel tot data-inzichtLean Six Sigma-projecten maken vaak gebruik van gegevens om problemen te meten, verbanden in datasets aan te tonen en prestaties te kwantificeren. In veel gevallen volgt men een gestandaardiseerde routine bij het verkennen van data. Eerst wordt bepaald welk type data beschikbaar is en wordt gecontroleerd of de data normaal verdeeld is. Een vervolgstap omvat vaak het identificeren van een middelpunt of centrummaat, ook wel aangeduid als ‘maat van locatie’.
Modus in Dagelijks Leven en Projecten
Dagelijks pendel ik naar kantoor en heb inmiddels een goed idee van mijn gemiddelde reistijd. Bij het bestellen van openhaardhout ken ik ook de hoeveelheid die ik gemiddeld in een winter verbruik. Of als ik uit eten ga met mijn vrouw, dan heb ik een idee hoeveel een gemiddeld etentje met haar kost. Soms is het wat meer, soms wat minder, maar het zijn allemaal voorbeelden van het toepassen van een zogenaamde ‘centrummaat’ in mijn dagelijks leven.
Een centrummaat die we wellicht niet dagelijks tegenkomen, is de modus. Tenminste, dat zou je kunnen denken. Toch wordt de modus veelvuldig gebruikt als een ‘maat van locatie’ in onze omgeving.
Zo komen we de modus tegen in gesprekken over inkomensverdeling in Nederland: het ‘modale inkomen’ is het meest voorkomende inkomen in Nederland. De term voor de ‘doorsnee Nederlander’ is er zelfs naar vernoemd: ‘Jan Modaal’.
Modaal inkomen
Het modale inkomen in Nederland bedroeg in 2023 40.000 euro bruto per jaar. Het gemiddelde inkomen bedroeg in datzelfde jaar 48.100 euro bruto per jaar. Een flink verschil dus. Dit komt doordat de verdeling van het inkomen niet voldoet aan de ‘normaalverdeling’. Een relatief kleine groep van (extreem) hoge inkomens trekt de verdeling scheef. Het modale inkomen wordt geschat op ongeveer 80% van het gemiddelde inkomen.
Voor beleidsmakers en instanties zoals het Centraal Planbureau (CPB) is het modale inkomen een betere leidraad dan het gemiddelde inkomen. Zo kan men met het modale inkomen beter beoordelen wat het effect van beleidsbeslissingen is op ‘de meeste Nederlanders’.
Soorten Data
Inkomen behoort tot de continue data: numerieke data die (theoretisch) elke waarde kan aannemen op een continue schaal. Andere vormen van continue data zijn bijvoorbeeld lengte, gewicht en temperatuur.
Vaak werken we echter met data die niet continu van aard is, maar uit categorieën bestaat. Dit noemen we discrete data. Discrete data omvat bijvoorbeeld verschillende types auto’s, haarkleuren of beoordelingen van tevredenheid.
In het geval van discrete data ligt het meer voor de hand om met de modus als centrummaat te werken. Kijk bijvoorbeeld naar onderstaande tabel:
Naam | Aantal |
Noah | 888 |
Julia | 681 |
Luca | 674 |
Lucas | 648 |
Liam | 643 |
Tabel 1: Populairste kindernamen, jongens, 2023. Bron: SVB.nl
In dit geval is een overzicht gemaakt van populaire kindernamen. De modale kindernaam voor jongens (de naam die het meest voorkomt) is in dit geval: Noah. De vraag: ‘wat is de gemiddelde naam van een jongen?’ is eigenlijk een (zin-)loze vraag. Doordat de data ‘discreet’ van aard is (elke naam is een categorie), kunnen we hier geen gemiddelde van berekenen. De aard van de data bepaalt dus wat we ermee kunnen en ook wat niet.
Veelal is bij het werken met ‘continue’ data (lengte, tijd, gewicht) geen directe modus te bepalen, omdat elke waarneming maar 1 keer voorkomt. Denk aan temperatuurwaarnemingen met twee cijfers achter de komma. In dat geval is het soms zinvol om de data eerst in ‘bins’ of ‘klassen’ in te delen. Het modale inkomen wordt ook zo bepaald. Immers er zijn echt niet heel veel mensen die precies en op de eurocent het modale inkomen verdienen maar we kunnen misschien wel zeggen dat in het bereik, of de klasse, tussen € 40.000 en € 41.000 (fictief geschat) de meeste inkomens zitten. De modale waarde is dan het middelpunt van de modale klasse. In dit voorbeeld dus € 40.500.
Het Belang van Modus in Lean Six Sigma
De modus vertegenwoordigt de waarde die het vaakst voorkomt in een dataset. Het is een centrummaat die aangeeft wat de meest voorkomende antwoordoptie of eigenschap is binnen een steekproef. Het berekenen van de modus is eenvoudig: je identificeert simpelweg welke waarde het vaakst voorkomt.
Indien meerdere waarden even vaak voorkomen, spreken we van meerdere modi:
- Bimodaal = twee modi
- Trimodaal = drie modi
- Multimodaal = meerdere modi
Hieronder zie je een histogram van de reistijd per dag van een kantoormedewerker, afgerond op 5 hele minuten. Het gemiddelde van de reistijd blijkt 68 minuten, maar de modus is 55 minuten. Oftewel, de reistijd die het vaakst voorkomt, is 55 minuten.

Relatie met Pareto
In de Six Sigma-praktijk wordt vaak gebruikgemaakt van de Pareto-analyse. Dit principe, bekend van de 80-20-regel, analyseert categorieën en hun frequentie. Door deze van hoog (modus!) naar laag te rangschikken, zien we welke categorieën het meest voorkomen. Zo blijkt vaak dat 20% van de oorzaken verantwoordelijk is voor 80% van de problemen.
Voorbeelden van Modus in Verschillende Sectoren
Zorg:
De modus kan worden gebruikt om de meest voorkomende symptomen van een ziekte te identificeren. Dit kan artsen helpen om een diagnose te stellen en de juiste behandeling voor te schrijven. Bijvoorbeeld, de modale klacht (meest voorkomende klacht) bij de ziekte ‘waterpokken’ is het hebben van jeukende bultjes en komt het meest voor bij kinderen tot 5 jaar. Deze klachten laten zien bij de (huis-)arts, samen met de leeftijd van de patiënt, geeft de arts een goede richting voor de diagnose.
Overheid:
De modus kan worden gebruikt om de meest voorkomende klachten van burgers te identificeren. Dit kan overheden helpen om gerichte beleidsmaatregelen te ontwikkelen om deze klachten aan te pakken. Bijvoorbeeld, als de modus van de klachten van burgers gerelateerd is aan verkeersopstoppingen, kan de overheid overwegen om de infrastructuur te verbeteren om de doorstroming van het verkeer te verbeteren.
Dienstverlening:
De modus kan worden gebruikt om de meest voorkomende problemen van klanten te identificeren. Dit kan bedrijven helpen om hun producten en diensten te verbeteren en klanttevredenheid te verhogen. Bijvoorbeeld, als de modus van de klachten van klanten gerelateerd is aan lange wachttijden, kan het bedrijf overwegen om projecten te prioriteren die de wachttijd verkorten.
Finance:
De modus kan worden gebruikt om de meest voorkomende transacties van klanten te identificeren. Dit kan banken helpen om hun diensten te verbeteren en klanttevredenheid te verhogen. Bijvoorbeeld, als de modus van de transacties van klanten gerelateerd is aan online betalingen, kan de bank overwegen om hun online betalingsplatform te verbeteren om het gebruiksvriendelijker te maken.
Facilitair:
Veel facilitaire afdelingen ontvangen ‘meldingen’ vanuit de organisatie of vanuit de klant. Deze meldingen worden gecategoriseerd naar hun aard. (Voorbeelden: ‘de verlichting doet het niet’ wordt een ‘elektrische storing’, ‘mijn raam sluit niet goed’ wordt een ‘bouwkundige storing’ of ‘de kraan is lek’ wordt een ‘waterleiding-melding’). De modale melding is dan de melding die het meest voorkomt en wellicht de meeste aandacht verdient.
Andere Centrummaten: Mediaan en Gemiddelde
Naast de modus gebruiken we ook andere centrummaten:
- Mediaan: de middelste waarde in een dataset.
- Gemiddelde: de som van alle waarden gedeeld door het aantal waarnemingen.
Elke centrummaat heeft zijn eigen toepassing en helpt bij het interpreteren van data.
De Kracht van Modus in Data-Analyse
Ontdek hoe de modus, als meest voorkomende waarde in een dataset, essentieel inzicht biedt in gedragspatronen en trends binnen verschillende domeinen. In de onderstaande video zal je leren hoe je modus (en andere spreidingsmaten) effectief kunt toepassen om beter geïnformeerde beslissingen te maken en de teamdynamiek en projectuitkomsten positief te beïnvloeden.