Articles

Wat zijn T-waarden en P-waarden in statistieken?

Als u geen statisticus bent, kan het kijken door statistische output u soms een beetje als Alice In Wonderland laten voelen. Plotseling stap je in een fantastische wereld waar vreemde en mysterieuze spoken uit het niets verschijnen.

neem bijvoorbeeld de T en P in uw t-testresultaten.

” Curiouser en curiouser!”je zou kunnen roepen, net als Alice, als je staren naar uw output.

One-Sample T testoutput

Wat zijn deze waarden eigenlijk? Waar komen ze vandaan? Zelfs als u de p-waarde hebt gebruikt om de statistische significantie van uw resultaten talloze keren te interpreteren, kan de werkelijke oorsprong voor u troebel blijven.

T & P: De Tweedledee en Tweedledum van een T-test

T en P zijn onlosmakelijk met elkaar verbonden. Ze gaan arm in arm, zoals Tweedledee en Tweedledum. Dit is waarom.

wanneer u een t-test uitvoert, probeert u meestal bewijs te vinden van een significant verschil tussen populatiegemiddelden (2-steekproef t) of tussen het populatiegemiddelde en een veronderstelde waarde (1-steekproef t). De t-waarde meet de grootte van het verschil ten opzichte van de variatie in uw steekproefgegevens. Anders gezegd, T is gewoon het berekende verschil vertegenwoordigd in eenheden van standaardfout. Hoe groter de grootte van T, hoe groter het bewijs tegen de nulhypothese. Dit betekent dat er meer bewijs is dat er een significant verschil is. Hoe dichter T bij 0 is, hoe waarschijnlijker het is dat er geen significant verschil is.

onthoud dat de t-waarde in uw uitvoer wordt berekend uit slechts één steekproef van de gehele populatie. Als je herhaalde willekeurige steekproeven van gegevens van dezelfde populatie nam, zou je elke keer iets verschillende t-waarden krijgen, als gevolg van een willekeurige steekproeffout (dat is echt geen fout van welke aard dan ook–het is gewoon de willekeurige variatie die verwacht wordt in de gegevens).

hoe verschillend zou u kunnen verwachten dat de t-waarden van veel willekeurige steekproeven van dezelfde populatie zijn? En hoe verhoudt de t-waarde van uw steekproefgegevens zich tot die verwachte t-waarden?

u kunt een T-distributie gebruiken om erachter te komen.

gebruik een T-verdeling om de waarschijnlijkheid te berekenen

ter illustratie, neem aan dat u een 1-steekproef t-test gebruikt om te bepalen of het populatiegemiddelde groter is dan een veronderstelde waarde, zoals 5, gebaseerd op een steekproef van 20 waarnemingen, zoals weergegeven in de bovenstaande t-test output.

  1. kies in Minitab grafiek > Kansverdelingsgrafiek.
  2. Selecteer kans weergeven en klik vervolgens op OK.
  3. uit distributie, selecteer t.
  4. In vrijheidsgraden, voer 19 in. (Voor een t-test met 1 monster is de vrijheidsgraad gelijk aan de grootte van het monster min 1).
  5. klik op gearceerd gebied. Selecteer X-Waarde. Kies De Rechterstaart.
  6. voer in X-waarde 2.8 (de t-waarde) in en klik op OK.

het hoogste deel (piek) van de distributiecurve toont u waar u kunt verwachten dat de meeste t-waarden dalen. Meestal verwacht je t-waarden dicht bij 0 te krijgen. Dat klinkt logisch, toch? Want als je willekeurig representatieve monsters uit een populatie selecteert, moet het gemiddelde van de meeste van die willekeurige monsters uit de populatie dicht bij het totale populatiegemiddelde liggen, waardoor hun verschillen (en dus de berekende t-waarden) dicht bij 0 liggen.

T-waarden, P-waarden en pokerhanden

T-waarden van Grotere magnituden (negatief of positief) zijn minder waarschijnlijk. De uiterst links en rechts “staarten” van de verdelingskromme vertegenwoordigen gevallen van het verkrijgen van extreme waarden van t, ver van 0. Bijvoorbeeld, het gearceerde gebied vertegenwoordigt de kans op het verkrijgen van een t-waarde van 2,8 of hoger. Stel je een magische dart voor die willekeurig kan worden gegooid om ergens onder de distributiecurve te landen. Wat is de kans dat het in de schaduwrijke regio zou landen? De berekende waarschijnlijkheid is 0,005712…..welke rondes naar 0.006…en dat is…de p-waarde verkregen in de T-testresultaten!

met andere woorden, de kans op het verkrijgen van een t-waarde van 2,8 of hoger bij bemonstering van dezelfde populatie (hier een populatie met een hypothetisch gemiddelde van 5), is ongeveer 0,006.

hoe waarschijnlijk is dat? Niet erg! Ter vergelijking, de kans om 3-of-a-kind gedeeld te worden in een 5-card pokerhand is meer dan drie keer zo hoog (≈ 0,021).

gegeven het feit dat de kans op het verkrijgen van een t-waarde zo hoog of hoger is wanneer de bemonstering van deze populatie zo laag is, wat is dan waarschijnlijker? Het is waarschijnlijker dat deze steekproef niet uit deze populatie komt (met het veronderstelde gemiddelde van 5). Het is veel waarschijnlijker dat dit monster afkomstig is van verschillende populaties, één met een gemiddelde groter dan 5.

wit: Omdat de p-waarde erg laag is (< alfaniveau), verwerpt u de nulhypothese en concludeert u dat er een statistisch significant verschil is.

op deze manier zijn T en P onlosmakelijk met elkaar verbonden. Beschouw ze gewoon verschillende manieren om de “extremiteit” van uw resultaten te kwantificeren onder de nulhypothese. Je kunt de waarde van de ene niet veranderen zonder de andere te veranderen.

hoe groter de absolute waarde van de t-waarde, hoe kleiner de p-waarde, en hoe groter het bewijs tegen de nulhypothese.(U kunt dit verifiëren door lagere en hogere t-waarden in te voeren voor de T-verdeling in Stap 6 hierboven).

probeer deze tweezijdige follow-up…

het bovenstaande voorbeeld van de T-verdeling is gebaseerd op een eenzijdige t-test om te bepalen of het gemiddelde van de populatie groter is dan een veronderstelde waarde. Daarom toont het voorbeeld van de T-verdeling de waarschijnlijkheid geassocieerd met de T-waarde van 2,8 slechts in één richting (de rechter staart van de verdeling).

Hoe zou u de T-verdeling gebruiken om de p-waarde te vinden die geassocieerd is met een T-waarde van 2,8 voor tweestaart t-test (in beide richtingen)?

Hint: pas in Minitab de opties in Stap 5 aan om de waarschijnlijkheid voor beide staarten te vinden. Als u geen kopie van Minitab heeft, download dan een gratis proefversie van 30 dagen.