Was sind T-Werte und P-Werte in der Statistik?
Wenn Sie kein Statistiker sind, können Sie sich beim Durchsehen der statistischen Ausgabe manchmal ein bisschen wie Alice im Wunderland fühlen. Plötzlich betrittst du eine fantastische Welt, in der seltsame und mysteriöse Phantasmen aus dem Nichts auftauchen.
Betrachten Sie beispielsweise das T und P in Ihren T-Testergebnissen.
„Neugieriger und neugieriger!“ du könntest ausrufen, wie Alice, wenn du auf deinen Ausgang blickst.
Was sind diese Werte wirklich? Woher kommen sie? Selbst wenn Sie den p-Wert verwendet haben, um die statistische Signifikanz Ihrer Ergebnisse zigmal zu interpretieren, kann sein tatsächlicher Ursprung für Sie unklar bleiben.
T & P: Die Tweedledee und Tweedledum eines T-Tests
T und P sind untrennbar miteinander verbunden. Sie gehen Arm in Arm, wie Tweedledee und Tweedledum. Hier ist der Grund.
Wenn Sie einen T-Test durchführen, versuchen Sie normalerweise, Beweise für einen signifikanten Unterschied zwischen dem Mittelwert der Grundgesamtheit (2-Stichprobe t) oder zwischen dem Mittelwert der Grundgesamtheit und einem hypothetischen Wert (1-Stichprobe t) zu finden. Der t-Wert misst die Größe der Differenz relativ zur Variation in Ihren Stichprobendaten. Anders ausgedrückt, T ist einfach die berechnete Differenz, die in Einheiten des Standardfehlers dargestellt wird. Je größer die Größe von T ist, desto größer sind die Beweise gegen die Nullhypothese. Dies bedeutet, dass es mehr Beweise dafür gibt, dass es einen signifikanten Unterschied gibt. Je näher T an 0 liegt, desto wahrscheinlicher ist kein signifikanter Unterschied.
Denken Sie daran, dass der t-Wert in Ihrer Ausgabe nur aus einer Stichprobe der gesamten Grundgesamtheit berechnet wird. Wenn Sie wiederholte Zufallsstichproben von Daten aus derselben Population nehmen, erhalten Sie jedes Mal aufgrund eines Zufallsstichprobenfehlers leicht unterschiedliche t-Werte (was wirklich kein Fehler ist – es ist nur die zufällige Variation, die in den Daten erwartet wird).
Wie unterschiedlich könnten Sie die t-Werte von vielen Zufallsstichproben aus derselben Population erwarten? Und wie vergleicht sich der t-Wert aus Ihren Beispieldaten mit den erwarteten t-Werten?
Sie können eine t-Verteilung verwenden, um dies herauszufinden.
Verwenden einer T-Verteilung zur Berechnung der Wahrscheinlichkeit
Nehmen Sie zur Veranschaulichung an, dass Sie einen T-Test mit 1 Stichprobe verwenden, um zu bestimmen, ob der Mittelwert der Grundgesamtheit größer ist als ein hypothetischer Wert, z. B. 5, basierend auf einer Stichprobe von 20 Beobachtungen, wie in der obigen t-Testausgabe gezeigt.
- Wählen Sie in Minitab Graph > Wahrscheinlichkeitsverteilungsdiagramm.
- Wählen Sie Wahrscheinlichkeit anzeigen und klicken Sie dann auf OK.
- Wählen Sie unter Verteilung die Option t.
- Geben Sie unter Freiheitsgrade 19 ein. (Bei einem t-Test mit 1 Stichprobe entsprechen die Freiheitsgrade der Stichprobengröße minus 1).
- Klicken Sie auf Schattierten Bereich. Wählen Sie X-Wert. Wählen Sie rechten Schwanz.
- Geben Sie in X-Wert 2.8 (den t-Wert) ein und klicken Sie dann auf OK.
Der höchste Teil (Peak) der Verteilungskurve zeigt Ihnen, wo Sie erwarten können, dass die meisten t-Werte fallen. Meistens würden Sie erwarten, t-Werte nahe 0 zu erhalten. Das macht Sinn, oder? Denn wenn Sie zufällig repräsentative Stichproben aus einer Grundgesamtheit auswählen, sollte der Mittelwert der meisten dieser Stichproben aus der Grundgesamtheit nahe am Gesamtmittelwert der Grundgesamtheit liegen, wodurch ihre Differenzen (und damit die berechneten t-Werte) nahe bei 0 liegen.
T-Werte, P-Werte und Pokerhände
T-Werte größerer Größen (entweder negativ oder positiv) sind weniger wahrscheinlich. Die äußersten linken und rechten „Schwänze“ der Verteilungskurve stellen Fälle dar, in denen Extremwerte von t erhalten werden, die weit von 0 entfernt sind. Beispielsweise stellt der schattierte Bereich die Wahrscheinlichkeit dar, einen t-Wert von 2,8 oder größer zu erhalten. Stellen Sie sich einen magischen Pfeil vor, der geworfen werden könnte, um zufällig irgendwo unter der Verteilungskurve zu landen. Wie groß ist die Chance, dass es in der schattigen Region landet? Die berechnete Wahrscheinlichkeit beträgt 0,005712…..was auf 0,006 rundet…welches ist…der in den t-Testergebnissen erhaltene p-Wert!
Mit anderen Worten, die Wahrscheinlichkeit, einen t-Wert von 2,8 oder höher zu erhalten, wenn aus derselben Population (hier einer Population mit einem hypothetischen Mittelwert von 5) eine Stichprobe gezogen wird, beträgt ungefähr 0,006.
Wie wahrscheinlich ist das? Nicht sehr! Zum Vergleich: Die Wahrscheinlichkeit, 3-of-a-kind in einem 5-Karten-Pokerblatt zu erhalten, ist mehr als dreimal so hoch (≈ 0,021).
Da die Wahrscheinlichkeit, einen so hohen oder höheren t-Wert zu erhalten, wenn eine Stichprobe aus dieser Population entnommen wird, so gering ist, was ist wahrscheinlicher? Es ist wahrscheinlicher, dass diese Stichprobe nicht aus dieser Population stammt (mit dem hypothetischen Mittelwert von 5). Es ist viel wahrscheinlicher, dass diese Stichprobe aus einer anderen Population stammt, eine mit einem Mittelwert von mehr als 5.
Zu Witz: Da der p-Wert sehr niedrig ist (< Alpha-Level), lehnen Sie die Nullhypothese ab und schließen daraus, dass es einen statistisch signifikanten Unterschied gibt.
Auf diese Weise sind T und P untrennbar miteinander verbunden. Betrachten Sie sie einfach als verschiedene Möglichkeiten, um die „Extremität“ Ihrer Ergebnisse unter der Nullhypothese zu quantifizieren. Sie können den Wert eines nicht ändern, ohne den anderen zu ändern.
Je größer der absolute Wert des t-Wertes ist, desto kleiner ist der p-Wert und desto größer sind die Beweise gegen die Nullhypothese.(Sie können dies überprüfen, indem Sie niedrigere und höhere t-Werte für die t-Verteilung in Schritt 6 oben eingeben).
Versuchen Sie diese Zwei-tailed Follow-up…
Das oben gezeigte t-Verteilungsbeispiel basiert auf einem einseitigen t-Test, um zu bestimmen, ob der Mittelwert der Grundgesamtheit größer als ein hypothetischer Wert ist. Daher zeigt das t-Verteilungsbeispiel die Wahrscheinlichkeit, die mit dem t-Wert von 2,8 verbunden ist, nur in einer Richtung (dem rechten Ende der Verteilung).
Wie würden Sie die t-Verteilung verwenden, um den p-Wert zu finden, der einem t-Wert von 2,8 für den zweischwänzigen T-Test (in beide Richtungen) zugeordnet ist?
Hinweis: Passen Sie in Minitab die Optionen in Schritt 5 an, um die Wahrscheinlichkeit für beide Schwänze zu ermitteln. Wenn Sie keine Kopie von Minitab haben, laden Sie eine kostenlose 30-Tage-Testversion herunter.
Leave a Reply