Jaké jsou hodnoty T a hodnoty P ve statistikách?
Pokud nejste statistik, při pohledu na statistický výstup se někdy budete cítit trochu jako Alenka v říši divů. Najednou vstoupíte do fantastického světa, kde se z ničeho nic objevují podivné a tajemné fantasmy.
zvažte například T A P ve výsledcích t-testu.
“ zvědavější a zvědavější!“můžete vykřiknout, jako Alice, když se díváte na svůj výstup.
jaké jsou tyto hodnoty, opravdu? Odkud pocházejí? I když jste použili hodnotu p k interpretaci statistické významnosti vašich výsledků mnohokrát, jeho skutečný původ vám může zůstat nejasný.
T & P: Tweedledee a Tweedledum T-test
T a P jsou neoddělitelně spojeny. Jdou ruku v ruce, jako Tweedledee a Tweedledum. Tady je důvod.
Když provádíte t-test, obvykle se snažíte najít důkaz významného rozdílu mezi populačními prostředky (2-vzorek t) nebo mezi populačním průměrem a hypotetickou hodnotou(1-vzorek t). Hodnota t měří velikost rozdílu vzhledem k odchylkám ve vašich vzorových datech. Jinak řečeno, T je jednoduše vypočtený rozdíl reprezentovaný v jednotkách standardní chyby. Čím větší je velikost T, tím větší je důkaz proti nulové hypotéze. To znamená, že existuje větší důkaz, že existuje významný rozdíl. Čím blíže T je 0, tím větší je pravděpodobnost, že není významný rozdíl.
nezapomeňte, že hodnota t ve vašem výstupu se vypočítá pouze z jednoho vzorku z celé populace. To jsi vzal opakované náhodné vzorky dat ze stejné populace, by se mírně liší t-hodnoty každé době, v důsledku náhodné výběrové chyby (což opravdu není nějakou chybu–je to jen náhodná odchylka očekává, že v datech).
jak odlišné byste mohli očekávat, že hodnoty t z mnoha náhodných vzorků ze stejné populace budou? A jak se hodnota t z vašich vzorových dat porovná s očekávanými hodnotami t?
můžete použít t-rozdělení zjistit.
Pomocí t-rozdělení pro výpočet pravděpodobnosti
Kvůli ilustraci, předpokládejme, že používáte 1-sample t-test k určení, zda je populační průměr je větší, než předpokládali hodnotu, například 5, na základě vzorku 20 pozorování, jak je znázorněno ve výše uvedeném t-test výstupní.
- v Minitabu zvolte Graf > Graf rozdělení pravděpodobnosti.
- Vyberte Pravděpodobnost Zobrazení a klepněte na tlačítko OK.
- z distribuce vyberte t.
- ve stupních volnosti zadejte 19. (U testu 1-vzorku t se stupně volnosti rovnají velikosti vzorku minus 1).
- klikněte na stínovanou oblast. Vyberte Hodnotu X. Vyberte Pravý Ocas.
- do hodnoty X zadejte 2.8 (hodnota t) a klepněte na tlačítko OK.
nejvyšší část (vrchol) distribuční křivky ukazuje, kde můžete očekávat pokles většiny hodnot t. Většinu času byste očekávali, že se t-hodnoty blíží 0. To dává smysl, ne? Protože pokud si náhodně vybrat reprezentativní vzorky z populace, většina z těchto náhodných vzorků z populace by měla být blízko na celkový průměr populace, takže jejich rozdíly (a tedy vypočtená t-hodnoty) se blíží 0.
hodnoty T, hodnoty P a pokerové kombinace
hodnoty t větších veličin (záporných nebo kladných) jsou méně pravděpodobné. Krajně levý a pravý „ocas“ distribuční křivky představují případy získání extrémních hodnot t, daleko od 0. Například stínovaná oblast představuje pravděpodobnost získání hodnoty t 2,8 nebo vyšší. Představte si magickou šipku, která by mohla být hozena náhodně přistát kdekoli pod distribuční křivkou. Jaká je šance, že přistane ve stinné oblasti? Vypočtená pravděpodobnost je 0,005712…..což zaokrouhlí na 0,006…což je…p-hodnota získaná ve výsledcích t-testu!
jinými slovy, pravděpodobnost získání t-hodnoty 2.8 nebo vyšší, když odběr vzorků ze stejné populace (populace s předpokládal, průměr 5), je přibližně 0.006.
Jak je to pravděpodobné? Moc ne! Pro srovnání, pravděpodobnost, že budou rozdány 3-of-a-druhu v 5 karet pokeru je více než třikrát vyšší (≈0.021).
Vzhledem k tomu, že pravděpodobnost získání t-hodnoty této vysoké nebo vyšší při odběru vzorků z této populace je tak nízká, co je více pravděpodobné? Je pravděpodobnější, že tento vzorek nepochází z této populace (s předpokládaným průměrem 5). Je mnohem pravděpodobnější, že tento vzorek pochází z jiné populace, jedna s průměrem větším než 5.
To wit: Protože p-hodnota je velmi nízká (< hladina alfa), nulovou hypotézu zamítnout a konstatovat, že existuje statisticky významný rozdíl.
tímto způsobem jsou T A P neoddělitelně spojeny. Zvažte je jednoduše různými způsoby, jak kvantifikovat „extrémnost“ vašich výsledků podle nulové hypotézy. Nemůžete změnit hodnotu jednoho, aniž byste změnili druhou.
čím větší je absolutní hodnota hodnoty t, tím menší je hodnota p a tím větší je důkaz proti nulové hypotéze.(Můžete to ověřit zadáním nižších a vyšších hodnot t pro rozdělení t v kroku 6 výše).
zkuste toto dvouocasé sledování…
výše uvedený příklad t-distribuce je založen na jednoocasém t-testu, aby se zjistilo, zda je průměr populace větší než předpokládaná hodnota. Příklad t-distribuce proto ukazuje pravděpodobnost spojenou s hodnotou t 2,8 pouze v jednom směru (pravý ocas distribuce).
Jak byste Pomocí t-distribuce našli hodnotu p spojenou s hodnotou t 2,8 pro dvouocasý t-test (v obou směrech)?
Tip: V Minitabu upravte možnosti v kroku 5 a zjistěte pravděpodobnost obou ocasů. Pokud nemáte kopii Minitabu, stáhněte si zdarma 30denní zkušební verzi.
Leave a Reply