Standaardafwijking
Hier volgt een iets moeilijker, real-life voorbeeld: De gemiddelde lengte voor volwassen mannen in de Verenigde Staten is 70″, met een standaardafwijking van 3″. Een standaardafwijking van 3″ betekent dat de meeste mannen (ongeveer 68%, uitgaande van een normale verdeling) 3″ langer tot 3″ korter zijn dan het gemiddelde (67″-73″) – één standaardafwijking. Bijna alle mannen (ongeveer 95%) hebben een lengte die 6″ groter tot 6″ kleiner is dan het gemiddelde (64″-76″) – twee standaardafwijkingen. Drie standaardafwijkingen omvatten alle getallen voor 99,7% van de bestudeerde steekproefpopulatie. Dit geldt als de verdeling normaal (klokvormig) is.
Als de standaardafwijking nul zou zijn, dan zouden alle mannen precies 70″ lang zijn. Als de standaardafwijking 20″ zou zijn, dan zouden sommige mannen veel langer of veel korter zijn dan het gemiddelde, met een typische range van ongeveer 50″-90″.
Een ander voorbeeld: de drie groepen {0, 0, 14, 14}, {0, 6, 8, 14} en {6, 6, 8, 8} hebben elk een gemiddelde van 7. Maar hun standaardafwijkingen zijn 7, 5 en 1. De derde groep heeft een veel kleinere standaardafwijking dan de andere twee, omdat de getallen allemaal dicht bij 7 liggen. In het algemeen zegt de standaardafwijking hoe ver de rest van de getallen van het gemiddelde afligt, en heeft deze dezelfde eenheden als de getallen zelf. Als bijvoorbeeld de groep {0, 6, 8, 14} de leeftijden van een groep van vier broers in jaren is, dan is het gemiddelde 7 jaar en de standaardafwijking 5 jaar.
Standaardafwijking kan dienen als een maat voor onzekerheid. In de wetenschap bijvoorbeeld helpt de standaardafwijking van een groep herhaalde metingen wetenschappers te weten hoe zeker zij zijn van het gemiddelde getal. Wanneer men beslist of de metingen van een experiment overeenstemmen met een voorspelling, is de standaardafwijking van die metingen zeer belangrijk. Als het gemiddelde getal uit de experimenten te ver van het voorspelde getal af ligt (met de afstand gemeten in standaardafwijkingen), dan is het mogelijk dat de geteste theorie niet klopt. Voor meer informatie, zie voorspellingsinterval.
ToepassingsvoorbeeldenEdit
Inzicht in de standaardafwijking van een reeks waarden stelt ons in staat te weten hoe groot het te verwachten verschil van het “gemiddelde” (mean) is.
WeerEdit
Als eenvoudig voorbeeld beschouwt u de gemiddelde dagelijkse hoge temperaturen voor twee steden, één in het binnenland en één bij de oceaan. Het is nuttig om te begrijpen dat het bereik van de dagelijkse hoge temperaturen voor steden in de buurt van de oceaan kleiner is dan voor steden in het binnenland. Deze twee steden kunnen elk dezelfde gemiddelde dagelijkse maximumtemperatuur hebben. De standaardafwijking van de dagelijkse maximumtemperatuur voor de stad aan de kust zal echter kleiner zijn dan die van de stad in het binnenland.
SportsEdit
Een andere manier om dit te zien is door te kijken naar sportteams. In elke sport zullen er teams zijn die goed zijn in bepaalde dingen en niet in andere. De teams die het hoogst op de ranglijst staan, vertonen niet veel verschillen in capaciteiten. Zij doen het goed in de meeste categorieën. Hoe lager de standaardafwijking van hun vaardigheid in elke categorie, hoe evenwichtiger en consistenter ze zijn. Teams met een hogere standaardafwijking zullen echter minder voorspelbaar zijn. Een ploeg die meestal slecht is in de meeste categorieën zal een lage standaardafwijking hebben. Een ploeg die meestal goed is in de meeste categorieën zal ook een lage standaardafwijking hebben. Een team met een hoge standaardafwijking kan echter het type team zijn dat veel punten scoort (sterke aanval) maar ook het andere team veel punten laat scoren (zwakke verdediging).
Als je van tevoren wilt weten welke teams zullen winnen, kun je kijken naar de standaardafwijkingen van de verschillende team-“statistieken”. Getallen die afwijken van de verwachting kunnen sterke en zwakke punten met elkaar vergelijken om te laten zien welke redenen het belangrijkst kunnen zijn om te weten welk team zal winnen.
In de racerij wordt de tijd gemeten die een coureur nodig heeft om elke ronde op het circuit af te leggen. Een coureur met een lage standaardafwijking van de rondetijden is consistenter dan een coureur met een hogere standaardafwijking. Deze informatie kan worden gebruikt om te begrijpen hoe een coureur de tijd die hij nodig heeft om een ronde af te leggen, kan verkorten.
MoneyEdit
In geld kan standaardafwijking het risico betekenen dat een prijs stijgt of daalt (aandelen, obligaties, onroerend goed, enz.). Het kan ook het risico betekenen dat een groep prijzen stijgt of daalt (actief beheerde beleggingsfondsen, indexbeleggingsfondsen, of ETF’s). Risico is een reden om beslissingen te nemen over wat te kopen. Risico is een getal dat mensen kunnen gebruiken om te weten hoeveel geld ze kunnen verdienen of verliezen. Naarmate het risico groter wordt, kan het rendement op een belegging hoger uitvallen dan verwacht (de “plus” standaarddeviatie). Een belegging kan echter ook meer geld verliezen dan verwacht (de “min”-standaarddeviatie).
Bij wijze van voorbeeld, iemand moest kiezen tussen twee aandelen. Aandeel A had over de afgelopen 20 jaar een gemiddeld rendement van 10 procent, met een standaardafwijking van 20 procentpunten (pp). Aandeel B had over de afgelopen 20 jaar een gemiddeld rendement van 12 procent, maar een hogere standaardafwijking van 30 pp. Na afweging van het risico kan de persoon besluiten dat aandeel A de veiligere keuze is. Hoewel hij misschien minder geld zal verdienen, zal hij waarschijnlijk ook niet veel geld verliezen. De persoon kan denken dat het 2 punten hogere gemiddelde van aandeel B de extra standaardafwijking van 10 pp (groter risico of onzekerheid van het verwachte rendement) niet waard is.
Regels voor normaal verdeelde getallenEdit
De meeste wiskundige vergelijkingen voor standaardafwijking gaan ervan uit dat de getallen normaal verdeeld zijn. Dit betekent dat de getallen aan weerszijden van de gemiddelde waarde op een bepaalde manier verdeeld zijn. De normale verdeling wordt ook wel de Gaussische verdeling genoemd, omdat deze is ontdekt door Carl Friedrich Gauss. Hij wordt vaak de belkromme genoemd omdat de getallen zich zo uitspreiden dat ze de vorm van een bel op een grafiek hebben.
Getallen zijn niet normaal verdeeld als ze aan de ene of aan de andere kant van de gemiddelde waarde zijn gegroepeerd. Getallen kunnen worden uitgespreid en toch normaal verdeeld zijn. De standaardafwijking geeft aan hoe sterk de getallen zijn verdeeld.