Modus

De sleutel tot data-inzicht

Vaak maken Lean Six Sigma-projecten gebruik van gegevens om problemen te meten, verbanden in datasets te bewijzen en bijvoorbeeld prestaties te kwantificeren. In veel gevallen volgt men een gestandaardiseerde routine bij het verkennen van data. Hierbij wordt eerst bepaald welk type data beschikbaar is en wordt gecontroleerd of de data normaal verdeeld is. Een vervolgstap omvat vaak het identificeren van een middelpunt of centrummaat, ook wel aangeduid als ‘maat van locatie’.

Modus in Dagelijks Leven en Projecten

Dagelijks pendel ik naar kantoor en heb inmiddels een goed idee van mijn gemiddelde reistijd. Bij het bestellen van openhaardhout ken ik ook de hoeveelheid die ik gemiddeld in een winter verbruik. Of als ik uit eten ga met mijn vrouw, dan heb ik een idee hoeveel een gemiddeld etentje met haar gaat kosten. Soms is het wat meer, soms wat minder, maar het zijn allemaal voorbeelden van het toepassen van een zogenaamde ‘centrummaat’ in mijn dagelijks leven.

Een centrummaat die we wellicht niet dagelijks tegenkomen als gewone mensen is de ‘modus’. Tenminste, dat zou je kunnen denken. Desondanks wordt de modus wel degelijk veelvuldig gebruikt als een ‘maat van locatie’ in onze omgeving. De modus is rekenkundig gezien de waarde (of bandbreedte) die het vaakst voorkomt in een dataset.

Zo komen we de modus tegen in gesprekken over inkomensverdeling in Nederland: het ‘modale inkomen’ is het ‘meest voorkomende’ inkomen in Nederland. De term voor de ‘doorsnee Nederlander’ is er zelfs naar vernoemd: ‘Jan Modaal’.

Modaal inkomen

Het modale inkomen in Nederland bedroeg in 2023 € 40.000 bruto per jaar.  Het gemiddelde inkomen bedroeg in datzelfde jaar € 48.100 bruto per jaar. Een flink verschil dus. Dit komt omdat de verdeling van het inkomen niet voldoet aan de ‘normaalverdeling’. Een relatief kleine groep van (extreem) hogere inkomens trekt hier de verdeling scheef. Het modale inkomen wordt geschat op ongeveer 80% van het gemiddelde inkomen. Voor beleidsmakers en beoordelaars, zoals het Centraal Plan Bureau (CPB) is het ‘modale inkomen’ een betere leidraad dan het ‘gemiddelde inkomen’. Zo kan men met het modale inkomen beter worden bekijken wat het effect van beleidsbeslissingen is op ‘de meeste Nederlanders’.

Inkomen is van de soort data die we ‘continu’ noemen: numerieke data die (theoretisch) elke waarde kan aannemen op een continue schaal. Andere vormen van continue data zijn bijvoorbeeld: lengte, gewicht en temperatuur. Vaak werken we echter met data die niet continu van aard is maar uit categorieën bestaat. Dit noemen we ‘discrete’ data. Discrete data is bijvoorbeeld data over verschillende types auto’s, de kleur van haar, een beoordeling van tevredenheid. In het geval van discrete data is het vaak voor de hand liggender om met de modus als centrummaat te werken. Kijk bijvoorbeeld maar eens naar onderstaande tabel:

Naam Aantal
Noah 888
Julia 681
Luca 674
Lucas 648
Liam 643

Tabel 1: Populairste kindernamen, jongens, 2023. Bron: SVB.nl

In dit geval is een overzicht gemaakt van populaire kindernamen. De modale kindernaam voor jongens (de naam die het meest voorkomt) is in dit geval: Noah. De vraag: ‘wat is de gemiddelde naam van een jongen?’ is eigenlijk een (zin-)loze vraag. Doordat de data ‘discreet’ van aard is (elke naam is een categorie), kunnen we hier geen gemiddelde van berekenen. De aard van de data bepaalt dus wat we ermee kunnen en ook wat niet.

Veelal is bij het werken met ‘continue’ data (lengte, tijd, gewicht) geen directe modus te bepalen, omdat elke waarneming maar 1 keer voorkomt. Denk aan temperatuurwaarnemingen met twee cijfers achter de komma. In dat geval is het soms zinvol om de data eerst in ‘bins’ of ‘klassen’ in te delen. Het modale inkomen wordt ook zo bepaald. Immers er zijn echt niet heel veel mensen die precies en op de eurocent het modale inkomen verdienen maar we kunnen misschien wel zeggen dat in het bereik, of de klasse, tussen € 40.000 en € 41.000 (fictief geschat) de meeste inkomens zitten. De modale waarde is dan het middelpunt van de modale klasse. In dit voorbeeld dus € 40.500.

Het Belang van Modus in Lean Six Sigma

De modus vertegenwoordigt dus de waarde die het meest frequent voorkomt in een dataset. Het is een centrummaat die aangeeft wat de meest voorkomende antwoordoptie of eigenschap is binnen een steekproef. De modus is een belangrijke statistische maat die in diverse vakgebieden, waaronder wetenschap en bedrijfsleven, wordt toegepast. Het berekenen van de modus is eenvoudig: je identificeert simpelweg welke waarde het meest voorkomt in de dataset.

Indien er meer waarden zijn die even frequent voorkomen, wordt de dataset als meer ‘modi’ beschouwd. Voor de fijnproevers kun je zelfs spreken van ‘bimodaal’ bij twee modi, ‘trimodale data’ bij drie modi en ‘multimodaal’ bij meer modi.

Hieronder zie je een ‘histogram’ van de reistijd per dag van een kantoormedewerker, afgerond op 5 hele minuten. Gemiddeld duurt de reis 68 minuten (blijkt uit de volledige dataset). De modus van de reistijd is echter 55 minuten. Oftewel, de reistijd die het vaakst voorkomt is 55 minuten.

Voorbeeld van een Histogram met de toepassing van een Modus

Relatie met Pareto

In de 6-sigma praktijk wordt ook vaak gebruik gemaakt van de Pareto Analyse. Deze analyse, ook wel bekend van de 80-20-regel, maakt ook gebruik van categorieën en hun frequentie. Bij het doen van een Pareto Analyse wordt van elke categorie vastgesteld hoe vaak deze voorkomt. De categorieën worden dan van hoog (modus!) naar laag weergegeven. Zo kunnen we zien welke categorieën het vaakst voorkomen. Hierbij wordt beweerd dat 20% van de categorieën verantwoordelijk is voor 80% van het resultaat. De Pareto Analyse kan zo helpen te identificeren met welke categorie we als eerst aan de slag moeten om bijvoorbeeld de meeste klachten te voorkomen.

Voorbeelden van Modus in Verschillende Sectoren

De modus kan ons helpen om trends te ontdekken en belangrijke informatie te verzamelen. Kijk maar eens mee naar onderstaande voorbeelden:

Zorg:

De modus kan worden gebruikt om de meest voorkomende symptomen van een ziekte te identificeren. Dit kan artsen helpen om een diagnose te stellen en de juiste behandeling voor te schrijven. Bijvoorbeeld, de modale klacht (meest voorkomende klacht) bij de ziekte ‘waterpokken’ is het hebben van jeukende bultjes en komt het meest voor bij kinderen tot 5 jaar. Deze klachten laten zien bij de (huis-)arts, samen met de leeftijd van de patiënt, geeft de arts een goede richting voor de diagnose.

Overheid:

De modus kan worden gebruikt om de meest voorkomende klachten van burgers te identificeren. Dit kan overheden helpen om gerichte beleidsmaatregelen te ontwikkelen om deze klachten aan te pakken. Bijvoorbeeld, als de modus van de klachten van burgers gerelateerd is aan verkeersopstoppingen, kan de overheid overwegen om de infrastructuur te verbeteren om de doorstroming van het verkeer te verbeteren.

Dienstverlening:

De modus kan worden gebruikt om de meest voorkomende problemen van klanten te identificeren. Dit kan bedrijven helpen om hun producten en diensten te verbeteren en klanttevredenheid te verhogen. Bijvoorbeeld, als de modus van de klachten van klanten gerelateerd is aan lange wachttijden, kan het bedrijf overwegen om projecten te prioriteren die de wachttijd verkorten.

Finance:

De modus kan worden gebruikt om de meest voorkomende transacties van klanten te identificeren. Dit kan banken helpen om hun diensten te verbeteren en klanttevredenheid te verhogen. Bijvoorbeeld, als de modus van de transacties van klanten gerelateerd is aan online betalingen, kan de bank overwegen om hun online betalingsplatform te verbeteren om het gebruiksvriendelijker te maken.

Facilitair:

Veel facilitaire afdelingen ontvangen ‘meldingen’ vanuit de organisatie of vanuit de klant. Deze meldingen worden gecategoriseerd naar hun aard. (Voorbeelden: ‘de verlichting doet het niet’ wordt een ‘elektrische storing’, ‘mijn raam sluit niet goed’ wordt een ‘bouwkundige storing’ of ‘de kraan is lek’ wordt een ‘waterleiding-melding’). De modale melding is dan de melding die het meest voorkomt en wellicht de meeste aandacht verdient.

Andere Centrummaten: Mediaan en Gemiddelde

Naast het berekenen van de modus, zijn er ook andere centrummaten die vaak worden gebruikt in de statistiek. De mediaan is de middelste waarde in een dataset en het gemiddelde is de som van alle waarden gedeeld door het aantal waarden. Elk van deze centrummaten heeft zijn eigen toepassingen en kan ons helpen om verschillende aspecten van een dataset te begrijpen.

Volg de Black Belt opleiding om meer te leren over Modus en toepassen van statistiek

De Kracht van Modus in Data-Analyse

Ontdek hoe de modus, als meest voorkomende waarde in een dataset, essentieel inzicht biedt in gedragspatronen en trends binnen verschillende domeinen. In de onderstaande video zal je leren hoe je modus (en andere spreidingsmaten) effectief kunt toepassen om beter geïnformeerde beslissingen te maken en de teamdynamiek en projectuitkomsten positief te beïnvloeden.