Continue vs. Discrete Data

Wat is het en hoe gebruik je het?

Welk type data gebruik jij?

Wanneer je in een verbeterproject data gaat verzamelen, is het essentieel om te begrijpen met welk type data je werkt. Dit bepaalt niet alleen welke analyses je kunt uitvoeren, maar ook hoe groot je eventuele steekproef moet zijn om betrouwbare conclusies te trekken. We maken onderscheid tussen continue data en discrete data. Maar wat betekenen deze begrippen precies? En hoe bepaal je de juiste steekproefgrootte? In dit artikel ontdek je de verschillen en krijg je praktische voorbeelden.

De twee hoofdtypen data

Data kunnen we in twee hoofdcategorieën verdelen:

  1. Continue data – meetbare waarden met een oneindig aantal mogelijke uitkomsten binnen een bepaald bereik.
  2. Discrete data – gegevens die bestaan uit afzonderlijke categorieën of vaste getallen.

Binnen discrete data maken we weer onderscheid tussen nominale data en ordinale data. Hieronder volgt een uitgebreide uitleg met voorbeelden.

Soorten Data

Continue data

Continue data kan elke willekeurige waarde aannemen binnen een bepaald bereik en is deelbaar. Dit betekent dat er oneindig veel mogelijke uitkomsten zijn. Een kenmerk van continue data is dat je ermee kunt rekenen, bijvoorbeeld door het gemiddelde of de spreiding te berekenen.

Voorbeelden van continue data

  • Tijd: Doorlooptijden, wachttijden, productietijden (in seconden, minuten of uren).
  • Temperatuur: De temperatuur in graden Celsius of Fahrenheit.
  • Lengte: De lengte van een product in meters, centimeters of millimeters.
  • Gewicht: Het gewicht van een patiënt, product of materiaal in kilogrammen of grammen.
  • Snelheid: De snelheid van een proces in kilometer per uur of meters per seconde.

Deze data worden meestal weergegeven met decimalen en kunnen met hoge nauwkeurigheid worden gemeten.

Discrete data

Discrete data bestaat uit afzonderlijke waarden en kan niet worden opgesplitst in kleinere eenheden. Er zijn twee soorten discrete data:

  1. Nominale data (categorische data zonder rangorde)

Nominale data bestaat uit categorieën waar geen rangorde in zit. Binnen deze categorie valt ook binaire data, oftewel gegevens met slechts twee mogelijke waarden.

Voorbeelden van nominale data

  • Kleuren: Rood, wit, blauw, groen.
  • Bloedgroepen: O-positief, A-negatief, B-positief.
  • Binaire data: Ja/Nee, Goed/Fout, Op tijd/Niet op tijd.
  1. Ordinale data (categorische data met rangorde)

Bij ordinale data is er wél een natuurlijke volgorde tussen de categorieën, maar de verschillen tussen de categorieën zijn niet exact meetbaar.

Voorbeelden van ordinale data

  • Beoordelingsschalen: Likert-schalen (1-5), Zeer slecht – Zeer goed, Onvoldoende/Voldoende/Goed.
  • Klassen: Gewichtsklassen, NPS-categorieën (Detractor/Passive/Promotor).

Deze datatypes komen veel voor in klanttevredenheidsonderzoeken en evaluaties binnen Lean Six Sigma-projecten.

Hoe groot moet mijn steekproef zijn?

Nu je weet met welk type data je werkt, kun je bepalen hoeveel data je nodig hebt. Als het praktisch niet mogelijk is om de totale populatie te meten zal je een steekproef moeten nemen. De steekproefgrootte hangt af van twee vragen:

  1. Wil je de locatie meten? (bijv. gemiddelde, modus, mediaan)
  2. Wil je de spreiding meten? (bijv. standaarddeviatie, range, kwartielen)

Hieronder een handige vuistregel voor het bepalen van de minimale steekproefgrootte:

Type data Locatie meten (gemiddelde) Spreiding meten
Discreet 100 datapunten 300 datapunten
Continue 10 datapunten 30 datapunten

Zoals je ziet, heb je voor een project met continue data (bijvoorbeeld doorlooptijden) veel minder datapunten nodig dan bij een project met discrete data. Dit maakt het vaak aantrekkelijker om processen op basis van continue data te analyseren.

De steekproefgroottes kunnen ook bepaald worden met formules. Wil je hier meer over weten, dan ken je onze Lean Six SIgma Black Belt training volgen waarin het precies bepalen van steekproefgroottes wordt uitgelegd. Klik HIER voor meer informatie over de Black Belt training.

Veelgemaakte fouten bij het verzamelen van data

  • Nominale en ordinale data verwarren– Bijvoorbeeld denken dat een beoordelingsschaal (1-5) als continue data geanalyseerd kan worden.
  • Te kleine steekproef nemen– Vooral bij discrete data is een te kleine steekproef gevaarlijk, omdat de spreiding moeilijk te meten is.
  • Geen rekening houden met de variabiliteit in data– Een proces kan fluctuerende resultaten hebben; neem daarom altijd meerdere metingen.

Conclusie

Het verschil tussen continue en discrete data is essentieel voor het correct verzamelen, analyseren en interpreteren van gegevens. Door goed te bepalen welk type data je hebt en wat je wilt meten, kun je de juiste steekproefgrootte vaststellen. Dit helpt je om betrouwbare conclusies te trekken en jouw Lean Six Sigma-project succesvol te maken.

Wil jij leren hoe je steekproefgroottes exact berekent en data-analyse toepast in Lean Six Sigma? Schrijf je in voor onze Black Belt training en word expert!