Articles

regressie naar het gemiddelde

Wat is regressie naar het gemiddelde?

definitie en uitleg

als uw favoriete team vorig jaar het kampioenschap won, wat betekent dat dan voor hun kansen om volgend seizoen te winnen? Dit is een belangrijke vraag, vaak met geld of trots op het spel (De League, iemand?). Voor zover dit te wijten is aan vaardigheid (het team is in goede conditie, top coach etc.), hun win signalen dat het meer kans dat ze zullen winnen volgend jaar. Maar hoe groter de mate waarin dit te wijten is aan geluk (andere teams verwikkeld in een drugschandaal, gunstige trekking, ontwerp picks bleek goed enz.), hoe minder waarschijnlijk het is dat ze volgend jaar zullen winnen. Dit komt door het statistische begrip regressie tot het gemiddelde.

regressie naar de gemiddelde voorbeelden

stel dat u een aantal tests uitvoert en resultaten krijgt (sommige extreem goed, sommige extreem slecht, en sommige in het midden). Want er is een kans dat als je de test opnieuw doet op degenen die zowel extreem goed als slecht waren, ze dichter bij degenen in het midden staan. Dat is regressie naar het gemiddelde.

een speelgoedvoorbeeld

stel je voor dat je een leraar bent en stel je leerlingen een true/false test in met 100 vragen, en je leerlingen, slim als ze zijn, tossen een munt om een antwoord te kiezen: heads = true; tails = false. Je zou verwachten dat het gemiddelde van de testscores 50 is. Natuurlijk, door puur geluk, sommige studenten zullen scoren aanzienlijk boven 50 en sommige aanzienlijk onder 50. Als je naïef Nam uw best presterende 10% van de studenten en geef ze een tweede test met behulp van dezelfde strategie, zou de gemiddelde score naar verwachting dicht bij 50. Dus uw best presterende studenten zouden “terugvallen” helemaal terug naar het gemiddelde van alle studenten die de oorspronkelijke test hebben genomen.

Als er aan de andere kant geen kans bestaat dat je studententestscores worden behaald, zou je verwachten dat er geen regressie is naar het gemiddelde en dat de top 10% van de studenten hetzelfde is in de eerste en tweede test. De meeste situaties bevinden zich tussen deze twee uitersten, en je verwacht dat er enige regressie naar het gemiddelde (en hoeveel hangt af van hoeveel kans er is betrokken, of hoe luidruchtig het is).

andere voorbeelden van regressie tot het gemiddelde

in de wetenschap

als een onderzoek suggereert dat gezondheidschemicaliën YK7483 beter presteren dan alle andere behandelingen voor lymfatische filariasis (dit opzoeken is niet voor mensen met een zwak hart), moet u niet al uw vertrouwen in dat resultaat stellen. Als je een tweede test van YK7483 doet, is het waarschijnlijker dat het dichter bij het gemiddelde komt de tweede keer dat je het test. Als je de waarde op het gezicht waarde, en niet projecteren voor het feit dat het waarschijnlijk zal terugvallen op de gemiddelde, Je zou je geld misplaatsen. In een systematische studie van dit effect analyseerde John Ioannidis “49 van de meest gewaardeerde onderzoeksresultaten in de geneeskunde in de afgelopen 13 jaar” en vond dat 16% van de onderzoeken tegengesproken was, 16% effecten had die in de tweede studie kleiner waren dan in de eerste, 24% bleef grotendeels onbetwist en slechts 44% werd gerepliceerd. En onthoud, dit zijn de meest gewaardeerde onderzoeksresultaten waarvan je zou verwachten dat ze betrouwbaarder zijn, niet zomaar een oud Monster.

In het leven

uw organisatie heeft een geweldig kwartaal, voldoet aan en overtreft alle gestelde doelen. Als de onderliggende redenen voor zijn prestaties ongewijzigd blijven, zal het het komende kwartaal minder goed doen.

dit alles kan een beetje deprimerend zijn, maar bedenk dat het tegenovergestelde ook Waar is. Abnormaal slechte gebeurtenissen zijn waarschijnlijk minder slecht de volgende keer dat het gebeuren! Als vorig jaar een vreselijk jaar voor je was, zou je moeten verwachten dat het beter gaat. Als uw favoriete team eindigde op de laatste plaats in het vorige seizoen, ze moeten beter doen dit jaar!