Melyek a T értékek és a p értékek a statisztikában?
ha nem vagy Statisztikus, a statisztikai kimeneten keresztül nézve néha kissé úgy érzi magát, mint az Alice Csodaországban. Hirtelen egy fantasztikus világba lépsz, ahol furcsa és titokzatos fantomok jelennek meg a semmiből.
például vegye figyelembe A t és P értéket a T-teszt eredményeiben.
” Curiouser and curiouser!”lehet, hogy felkiált, mint Alice, ahogy tekintete a kimenet.
Mik ezek az értékek, tényleg? Honnan származnak? Még akkor is, ha a P-értéket használta az eredmények statisztikai jelentőségének értelmezésére, tényleges eredete homályos lehet számodra.
t & P: a T-teszt Tweedledje és Tweedledumja
t és P elválaszthatatlanul kapcsolódik egymáshoz. Kéz a kézben járnak, mint a Tweedledee és a Tweedledum. Elmondom, miért.
t-teszt elvégzésekor általában a populációs eszközök (2-minta t) vagy a populációs átlag és a feltételezett érték (1-minta t) közötti jelentős különbségre próbál bizonyítékot találni. A T-érték méri a különbség méretét a mintaadatok változásához viszonyítva. Másképpen fogalmazva, T egyszerűen a kiszámított különbség a standard hibaegységekben. Minél nagyobb a T nagysága, annál nagyobb a bizonyíték a null hipotézis ellen. Ez azt jelenti, hogy nagyobb bizonyíték van arra, hogy jelentős különbség van. Minél közelebb van a t a 0-hoz, annál valószínűbb, hogy nincs jelentős különbség.
ne feledje, hogy a kimenet t-értékét csak egy mintából számítják ki a teljes népességből. Ugyanabból a populációból vett ismételt véletlenszerű mintákat, minden alkalommal kissé eltérő t-értékeket kap, véletlenszerű mintavételi hiba miatt (ami valójában nem bármilyen hiba–ez csak az adatokban várható véletlenszerű változás).
mennyire lehet elvárni, hogy a T-értékek sok véletlenszerű mintából származzanak ugyanabból a populációból? És hogyan viszonyul a t-érték a mintaadatokból a várt t-értékekhez?
A t-eloszlás segítségével megtudhatja.
a t-eloszlás, hogy kiszámítja a valószínűsége
kedvéért illusztráció, feltételezem, hogy segítségével egy 1-mintás t-teszt annak megállapítására, hogy a lakosság jelent nagyobb, mint azt feltételezték, érték, mint 5, minta alapján 20 megfigyelések, amint az a fenti t-teszt kimenet.
- a Minitab, válassza Graph > valószínűségi eloszlási telek.
- válassza a valószínűség megtekintése lehetőséget, majd kattintson az OK gombra.
- a disztribúcióból válassza a T.
- lehetőséget a Szabadság fokában, írja be a 19. (1-minta T teszt esetén a szabadság foka megegyezik a minta méretével mínusz 1).
- kattintson az árnyékolt területre. Válassza Az X Értéket. Válassza Ki A Jobb Farkát.
- X értékbe írja be a 2.8-at (a t-értéket), majd kattintson az OK gombra.
az eloszlási görbe legmagasabb része (csúcsa) azt mutatja, hogy a T-értékek többsége hol eshet. Az idő nagy részében, akkor számíthat arra, hogy a t-értékek közel 0. Ennek van értelme, igaz? Mert, ha véletlenszerűen válasszuk a reprezentatív minták a lakosság, úgy a legtöbb ilyen véletlenszerű mintát a lakosság közel kell lennie a teljes népesség jelenti, hogy a különbségek (így a számított t-értékek) közel 0-ra.
t értékek, p értékek és póker kezek
t nagyobb (negatív vagy pozitív) nagyságok értékei kevésbé valószínűek. Az eloszlási görbe bal és jobb “farka” a T szélső értékeinek előfordulását jelenti, távol a 0-tól. Például az árnyékolt régió a 2,8 vagy annál nagyobb t-érték megszerzésének valószínűségét jelenti. Képzeljünk el egy mágikus dart, hogy lehet dobni a földre véletlenszerűen bárhol az elosztási görbe. Mi az esélye, hogy leszáll az árnyékos régióban? A számított valószínűség 0,005712…..melyik fordulóban 0.006…ami az…a T-teszt eredményeiben kapott p-érték!
más szóval, a valószínűsége, hogy a T-érték 2,8 vagy magasabb, ha a mintavétel ugyanabból a populációból (itt, a populáció egy feltételezett átlag 5), körülbelül 0,006.
mennyire valószínű ez? Nem nagyon! Összehasonlításképpen, a valószínűsége, hogy 3-of-a-fajta egy 5-kártya póker kéz több mint háromszor olyan magas (≈0.021).
tekintettel arra, hogy a T-érték megszerzésének valószínűsége ilyen magas vagy magasabb, ha ebből a populációból történő mintavétel olyan alacsony, mi valószínűbb? Valószínűbb, hogy ez a minta nem ebből a populációból származik (a feltételezett átlag 5). Sokkal valószínűbb, hogy ez a minta különböző népességből származik, az egyik átlag nagyobb, mint 5.
to wit: Mivel a p-érték nagyon alacsony (< alpha szint), elutasítja a null hipotézist, és arra a következtetésre jut, hogy statisztikailag szignifikáns különbség van.
ily módon a T és a P elválaszthatatlanul kapcsolódik egymáshoz. Tekintsük őket egyszerűen különböző módon számszerűsíteni a” extremeness ” az eredményeket a null hipotézis. Az egyik értékét nem lehet megváltoztatni a másik megváltoztatása nélkül.
minél nagyobb a T-érték abszolút értéke, annál kisebb a p-érték, annál nagyobb a bizonyíték a null hipotézis ellen.(Ezt úgy ellenőrizheti, hogy a fenti 6. lépésben alacsonyabb és magasabb t értékeket ad meg a t-eloszláshoz).
próbálja ki ezt a Kétfarkú nyomon követést…
a fenti t-eloszlás példa egy egyfarkú t-teszten alapul annak meghatározására, hogy a populáció átlaga nagyobb-e, mint egy feltételezett érték. Ezért a T-eloszlási példa csak egy irányban mutatja a 2,8 t-értékhez társított valószínűséget (az eloszlás jobb farka).
hogyan használná a t-eloszlást a Kétfarkú T-teszt 2,8 t-értékéhez társított p-érték megtalálásához (mindkét irányban)?
tipp: a Minitab-ban állítsa be az opciókat az 5.lépésben, hogy megtalálja mindkét farok valószínűségét. Ha nincs Minitab példánya, töltsön le egy ingyenes 30 napos próbaverziót.
Leave a Reply