De Normale Verdeling

Over één van de belangrijkste concepten in de statistiek & toepassing ervan.

In dit artikel bespreken we één van de belangrijkste concepten in de statistiek, de normale verdeling. We zullen verkennen en ontdekken wat de normale verdeling inhoudt en hoe met Six Sigma deze verdeling gebruikt wordt om kwaliteitsverbetering te bevorderen.

De Normale Verdeling: Wat is het?

Normale Verdeling - Lean Six Sigma GroepDe Normale Verdeling, ook wel de Gausscurve of Bell curve genoemd, is een symmetrische kansverdeling die vaak voorkomt in de natuurlijke wereld. Het wordt gekenmerkt door een centrale piek en afnemende waarschijnlijkheid aan beide zijden. De verdeling wordt volledig bepaald door twee parameters: het gemiddelde (μ) en de standaardafwijking (σ). Het gemiddelde geeft het centrale punt van de verdeling aan, terwijl de standaardafwijking de mate van spreiding rond het gemiddelde aangeeft.

En wat doen we ermee binnen Six Sigma? Nou.. als je deze twee parameters hebt, en je weet dat een proces normaal verdeeld is dan kun je een voorspelling geven van hoe dit proces zich zal gedragen in de toekomst. Dus als we weten dat klanten bij een webwinkel die pennen verkoopt gemiddeld 50 pennen tegelijk bestellen met een spreiding van 10, en we weten dat hier een Normale Verdeling achter zit, dan kunnen we hiermee wat gaan zeggen over de toekomst. Dit maakt dat we minder gegevens hoeven te verzamelen om een data analyse te doen.

Een belangrijke eigenschap van de Normale Verdeling is de empirische regel (ook bekend als de 68-95-99.7 regel). Ongeveer 68% van de gegevens ligt binnen één standaardafwijking van het gemiddelde, ongeveer 95% ligt binnen twee standaardafwijkingen, en bijna 99,7% ligt binnen drie standaardafwijkingen.

Hoe ontstaat de Normale Verdeling?

Je ziet een normale verdeling veel terugkomen in natuurlijke processen. Als we bijvoorbeeld kijken naar de lengte van de blaadjes van een bepaalde boom dan zullen deze niet allemaal precies even groot zijn. Wel zal er een gemiddelde lengte zijn en daar zal een gemiddelde afwijking tot het gemiddelde van zijn. Dit laatste noemen we de spreiding. Je ziet de Normale Verdeling dus vaak ontstaan als het resultaat van een groot aantal onafhankelijke, willekeurige invloeden op een bepaalde meting. Er is dus niet eenzelfde oorzaak die zorgt dat de blaadjes soms langer worden. In dat geval zal de Normale Verdeling niet passen en zal er een andere verdeling, bijvoorbeeld een Weibull verdeling passen.

Hier komt ook de “centrale limiettheorema” naar voren. Het centrale limiettheorema stelt dat als we herhaaldelijk steekproeven uit een willekeurige populatie nemen en het gemiddelde van elke steekproef berekenen, deze gemiddelden een Normale Verdeling zullen volgen, zelfs als de oorspronkelijke populatie geen Normale Verdeling heeft. Uiteindelijk komt de Normale Verdeling dus altijd weer terug als basis. Dit maakt de Normale Verdeling een krachtig hulpmiddel bij het modelleren en begrijpen van verschillende situaties, van het meten van lengtes en gewichten tot het voorspellen van klantgedrag in bedrijven.

Toepassing van de Normale Verdeling in Six Sigma

Six Sigma is een methodologie die gericht is op het verbeteren van de kwaliteit van processen door spreiding te verminderen en defecten te minimaliseren. Deze methodologie maakt gebruik van de Normale Verdeling om gegevensanalyse te ondersteunen. Zoals gezegd gebruiken we de verdeling vaak om een model te maken van hoe een proces zich zal gedragen. Je kunt dit model maken als je uit historische gegevens kunt halen dat een proces normaal verdeeld is. Hiervoor heb je dus wel een meting nodig, maar vaak volstaan hier al 30 datapunten voor. En als je weet dat een proces normaal verdeeld is dan kan je verder gaan rekenen bijvoorbeeld in de volgende onderdelen:

  1. Standaardafwijking en Z-score:

In het Six Sigma-proces wordt de standaardafwijking als een belangrijke maatstaf gebruikt om de variabiliteit van een proces te beoordelen. Met behulp van de Z-score kan men meten hoeveel standaardafwijkingen een gegevenspunt zich van het gemiddelde bevindt. Dit helpt bij het identificeren van potentiële afwijkingen en problemen in het proces. Als een proces normaal verdeeld is kan je deze waarde makkelijker vinden en geldt dat een Z-waarde van 1 betekent dat 68% van de uitkomst van het proces tussen het gemiddelde en 1 sigma zit bijvoorbeeld.

  1. Defecten per miljoen mogelijkheden (DPMO):

Met de Normale Verdeling en Z-scores kan Six Sigma de DPMO berekend worden, wat het aantal defecten per miljoen mogelijkheden aangeeft. Dit helpt bij het kwantificeren van de prestaties van een proces en het stellen van realistische doelen voor verbetering. Dit kan trouwens ook al als het proces niet normaal verdeeld is.

  1. DMAIC-methodologie:

De DMAIC-methodologie (Define, Measure, Analyze, Improve, Control) is een integraal onderdeel van Six Sigma. In de analysefase worden gegevens verzameld en geanalyseerd om de huidige prestaties van het proces te begrijpen. De Normale Verdeling wordt vaak gebruikt om de gegevens te visualiseren en te begrijpen hoe de processen zich gedragen.

Praktisch Voorbeeld: Productieproces

Stel je een productieproces voor waarbij flessen worden gevuld met een vloeistof. Het is essentieel dat elke fles exact dezelfde hoeveelheid vloeistof bevat om aan de kwaliteitsnormen te voldoen. Het Six Sigma-team kan de normale verdeling gebruiken om de variabiliteit in het vulproces te analyseren en te verminderen.

Het team verzamelt gegevens over de vloeistofvullingen en ontdekt dat de gemiddelde vulling 500 ml is, met een standaardafwijking van 5 ml. Met behulp van de normale verdeling kunnen ze de kans berekenen dat een willekeurige fles meer of minder dan 500 ml bevat. Ze kunnen ook de DPMO berekenen om het huidige prestatieniveau te bepalen.

Door middel van DMAIC kunnen ze verbeteringen implementeren, zoals het kalibreren van de vulmachines en het trainen van het personeel. Deze aanpassingen zorgen ervoor dat het proces een veel smallere spreiding heeft (bijvoorbeeld een standaardafwijking van 1 ml), waardoor de meeste flessen zeer dicht bij de ideale 500 ml vulling liggen.

Conclusie

De Normale Verdeling speelt een belangrijke rol in Six Sigma, waarbij het helpt bij het begrijpen van het proces zodat goede beslissingen kunnen worden genomen om de kwaliteit ervan te verbeteren. Het verminderen van spreiding en van defecten leidt tot efficiëntere processen en een hogere klanttevredenheid. Six Sigma helpt organisaties die streven naar continue verbetering en het leveren van hoogwaardige producten en diensten.