Jakie są wartości T i wartości P w statystykach?
Jeśli nie jesteś statystykiem, przeglądanie wyników statystycznych może czasami sprawić, że poczujesz się trochę jak Alicja w Krainie Czarów. Nagle wkraczasz w fantastyczny świat, w którym dziwne i tajemnicze fantazmaty pojawiają się znikąd.
na przykład rozważ T I P w wynikach testu T.
” kuriozalne i kuriozalne!”możesz wykrzyknąć, jak Alice, gdy patrzysz na swoje wyjście.
Jakie są te wartości? Skąd pochodzą? Nawet jeśli użyłeś wartości p do interpretacji istotności statystycznej swoich wyników kilkanaście razy, jej rzeczywiste pochodzenie może pozostać dla ciebie niejasne.
T& P: Tweedledee i Tweedledum testu T
t I P są nierozerwalnie połączone. Idą ramię w ramię, jak Tweedledee i Tweedledum. Oto dlaczego.
kiedy wykonujesz test t, Zwykle próbujesz znaleźć dowody na znaczącą różnicę między średnią populacyjną (2-próbka t) lub między średnią populacyjną a hipotezowaną wartością (1-próbka t). Wartość t mierzy wielkość różnicy w stosunku do zmian w danych próbki. Innymi słowy, T jest po prostu obliczoną różnicą reprezentowaną w jednostkach błędu standardowego. Im większa wielkość T, tym większe dowody przeciwko hipotezie zerowej. Oznacza to, że istnieją większe dowody na to, że istnieje znacząca różnica. Im bliżej T jest do 0, tym bardziej prawdopodobne jest, że nie ma znaczącej różnicy.
pamiętaj, że wartość t na Twoim wyjściu jest obliczana tylko na podstawie jednej próbki z całej populacji. Biorąc powtarzające się losowe próbki danych z tej samej populacji, za każdym razem otrzymujesz nieco inne wartości t, z powodu błędu losowego pobierania próbek (co naprawdę nie jest żadnym błędem–to tylko losowa zmienność oczekiwana w danych).
Jak różne mogą być wartości T z wielu losowych próbek z tej samej populacji? W jaki sposób wartość T z przykładowych danych porównuje się z oczekiwanymi wartościami t?
Możesz użyć rozkładu t, aby się dowiedzieć.
używając rozkładu t do obliczenia prawdopodobieństwa
dla zilustrowania, Załóżmy, że używasz testu T z 1 próbką, aby określić, czy średnia populacji jest większa niż wartość hipotetyczna, taka jak 5, na podstawie próby 20 obserwacji, jak pokazano w powyższym wyniku testu T.
- w Minitabie wybierz Wykres > Wykres rozkładu prawdopodobieństwa.
- wybierz opcję Wyświetl Prawdopodobieństwo, a następnie kliknij OK.
- z dystrybucji Wybierz t.
- w stopniach swobody wpisz 19. (W przypadku badania t z 1 próbką stopnie swobody są równe wielkości próbki minus 1).
- kliknij zacieniony obszar. Wybierz Wartość X. Wybierz Prawy Ogon.
- w wartość X wpisz 2.8 (wartość t), a następnie kliknij OK.
najwyższa część (szczyt) krzywej rozkładu pokazuje, gdzie można oczekiwać, że większość wartości t spadnie. W większości przypadków można oczekiwać, że wartości t będą zbliżone do 0. To ma sens, prawda? Ponieważ jeśli losowo wybierzesz reprezentatywne próbki z populacji, średnia większości z tych losowych próbek z populacji powinna być zbliżona do ogólnej średniej populacji, sprawiając, że ich różnice (a tym samym obliczone wartości t) są bliskie 0.
wartości T, wartości P i układy pokerowe
wartości t o większych magnitudach (ujemnych lub dodatnich) są mniej prawdopodobne. Skrajne lewe i prawe „ogony” krzywej rozkładu reprezentują przypadki uzyskania ekstremalnych wartości T, dalekich od 0. Na przykład obszar zacieniony reprezentuje prawdopodobieństwo uzyskania wartości t równej 2,8 lub wyższej. Wyobraź sobie magiczną strzałkę, która może zostać rzucona, aby wylądować losowo w dowolnym miejscu pod krzywą rozkładu. Jaka jest szansa, że wyląduje w zacienionym regionie? Obliczone prawdopodobieństwo wynosi 0,005712…..który zaokrągla do 0,006…czyli tak…wartość p uzyskana w wynikach testu t!
innymi słowy, prawdopodobieństwo uzyskania wartości t 2,8 lub wyższej, podczas pobierania próbek z tej samej populacji (tutaj populacja z hipotetyczną średnią 5), wynosi około 0,006.
Jak to możliwe? Nie bardzo! Dla porównania, prawdopodobieństwo otrzymania 3 kart w 5-kartowym układzie pokerowym jest ponad trzykrotnie wyższe (≈0,021).
biorąc pod uwagę, że prawdopodobieństwo uzyskania wartości t tak wysokiej lub wyższej podczas pobierania próbek z tej populacji jest tak niskie, co jest bardziej prawdopodobne? Jest bardziej prawdopodobne, że ta próbka nie pochodzi z tej populacji(z hipotetyczną średnią 5). Jest dużo bardziej prawdopodobne, że ta próbka pochodzi z innej populacji, jednej ze średnią większą niż 5.
To wit: Ponieważ wartość p jest bardzo niska (< poziom alfa), odrzucasz hipotezę zerową i stwierdzasz, że istnieje statystycznie istotna różnica.
w ten sposób T I P są nierozerwalnie połączone. Rozważmy je po prostu różne sposoby, aby określić ilościowo „skrajność” wyników pod hipotezą zerową. Nie można zmienić wartości jednego bez zmiany drugiego.
im większa wartość bezwzględna wartości t, tym mniejsza wartość p i tym większe dowody przeciwko hipotezie zerowej.(Można to sprawdzić, wprowadzając niższe i wyższe wartości T dla rozkładu t w kroku 6 powyżej).
wypróbuj tę dwuogniskową kontynuację…
pokazany powyżej przykład rozkładu t opiera się na jednoogniskowym teście t w celu ustalenia, czy średnia populacji jest większa niż wartość hipotetyczna. Dlatego przykład rozkładu t pokazuje prawdopodobieństwo związane z wartością t 2,8 tylko w jednym kierunku (prawy ogon rozkładu).
W Jaki Sposób użyłbyś rozkładu t, aby znaleźć wartość p związaną z wartością t równą 2,8 dla dwubiegunowego testu t (w obu kierunkach)?
Wskazówka: W Minitab, Dostosuj opcje w kroku 5, aby znaleźć Prawdopodobieństwo dla obu reszek. Jeśli nie masz kopii Minitab, pobierz bezpłatną 30-dniową wersję próbną.
Leave a Reply