Regression til middelværdien
Hvad er regression til middelværdien?
Definition og forklaring
hvis dit yndlingshold vandt mesterskabet sidste år, hvad betyder det for deres chancer for at vinde næste sæson? Dette er et vigtigt spørgsmål, ofte med penge eller stolthed på linjen (ligaen, nogen som helst?). I det omfang dette skyldes dygtighed (holdet er i god stand, toptræner osv.), deres sejr signalerer, at det er mere sandsynligt, at de vinder næste år. Men jo større omfang dette skyldes held (andre hold involveret i en narkotikaskandale, gunstig lodtrækning, udkast til valg viste sig godt osv.), jo mindre sandsynligt er det, at de vinder næste år. Dette skyldes det statistiske begreb regression til gennemsnittet.
Regression til middeleksemplerne
Antag at du kører nogle tests og får nogle resultater (nogle ekstremt gode, nogle ekstremt dårlige og nogle i midten). Fordi der er en chance involveret i at køre dem, når du kører testen igen på dem, der var både ekstremt gode og dårlige, er de mere tilbøjelige til at være tættere på dem i midten. Det er regression til gennemsnittet.
et legetøjseksempel
Forestil dig at du er lærer og sæt dine elever en sand/falsk test med 100 spørgsmål, og dine elever, kloge som de er, flip en mønt for at vælge et svar: hoveder = sandt; haler = falsk. Du forventer, at gennemsnittet af testresultater er 50. Selvfølgelig, gennem ren og skær held, nogle studerende vil score betydeligt over 50 og nogle væsentligt under 50. Hvis du naivt tog din top udfører 10% af de studerende og give dem en anden test ved hjælp af den samme strategi, ville den gennemsnitlige score forventes at være tæt på 50. Således vil dine mest effektive studerende “regressere” helt tilbage til gennemsnittet for alle studerende, der tog den oprindelige test.
hvis der på den anden side ikke er nogen chance involveret i dine studerendes testresultater, ville du forvente, at der ikke er nogen regression til gennemsnittet, og de øverste 10% af eleverne er de samme i første og anden test. De fleste situationer er imellem disse to ekstremer, og du forventer, at der er en vis regression til gennemsnittet (og hvor meget afhænger af hvor stor chance der er involveret, eller hvor støjende det er).
andre eksempler på regression til gennemsnittet
i videnskab
hvis et forsøg antyder, at sundhedskemikalie YK7483 overgår alle andre behandlinger for lymfatisk filariasis (at se dette op er ikke for svaghjertet), bør du ikke sætte al din tro på det resultat. Når du laver en anden test af YK7483, er det mere sandsynligt, at det er tættere på gennemsnittet, anden gang du tester det. Hvis du tog værdien til pålydende værdi og ikke projicerede for det faktum, at det sandsynligvis vil regressere til gennemsnittet, ville du forlægge dine penge. I en systematisk undersøgelse af denne effekt analyserede John Ioannidis “49 af de mest ansete forskningsresultater inden for medicin i løbet af de foregående 13 år” og fandt, at 16% af undersøgelserne var modsagt, 16% havde effekter, der var mindre i den anden undersøgelse end i den første, 24% forblev stort set ubestridt, og kun 44% blev replikeret. Og husk, dette er de mest ansete forskningsresultater, som du ville forvente at være mere pålidelige, ikke bare en hvilken som helst gammel prøve.
i livet
din organisation har et godt kvartal, der opfylder og overskrider alle de fastsatte mål. Hvis de underliggende årsager til dens resultater er uændrede, vil det gøre mindre godt det næste kvartal.
alt dette kan være lidt deprimerende, men overvej at det modsatte også er sandt. Unormalt dårlige begivenheder vil sandsynligvis være mindre dårlige næste gang det sker! Hvis sidste år var et forfærdeligt år for dig, bør du forvente, at tingene bliver bedre. Hvis dit yndlingshold sluttede på sidste plads i den foregående sæson, skulle de gøre det bedre i år!
Leave a Reply