Mitkä ovat tilastoissa t-ja P-arvot?
Jos ei ole tilastotieteilijä, tilastotuotosta katsomalla voi joskus tuntua vähän Liisalta Ihmemaassa. Yhtäkkiä astut mielikuvitusmaailmaan, jossa oudot ja salaperäiset aaveet ilmestyvät tyhjästä.
harkitse esimerkiksi T-ja P-arvoja t-testituloksissasi.
” Curiouser and curiouser!”saatat huudahtaa, kuten Alice, kun katselet tuotosta.
Mitä nämä arvot oikeastaan ovat? Mistä ne tulevat? Vaikka olet käyttänyt P-arvoa tulosten tilastollisen merkityksen tulkitsemiseen lukemattomia kertoja, sen todellinen alkuperä voi jäädä hämäräksi.
T & P: t-testin Tweedledee ja Tweedledum
T ja P liittyvät erottamattomasti toisiinsa. He kulkevat käsi kädessä, niinkuin Tittelityy ja Tittelityy. Tässä syy.
kun suoritat t-testiä, yrität yleensä löytää todisteita merkittävästä erosta populaation keskiarvon (2-näyte t) tai populaation keskiarvon ja hypoteettisen arvon (1-näyte t) välillä. T-arvo mittaa erotuksen kokoa suhteessa näyteaineistosi vaihteluun. Toisin sanoen T on yksinkertaisesti keskivirheen yksikköinä esitetty laskettu ero. Mitä suurempi T: n suuruus on, sitä suurempi on näyttö nollahypoteesia vastaan. Tämä tarkoittaa, että on enemmän näyttöä siitä, että on olemassa merkittävä ero. Mitä lähempänä t on arvoa 0, sitä todennäköisemmin ei ole merkittävää eroa.
muista, että tuotoksesi t-arvo lasketaan vain yhdestä otoksesta koko populaatiosta. Se otit toistuvia satunnaisnäytteitä samasta väestöstä, saat hieman eri t-arvot joka kerta, koska satunnaisotanta virhe (joka ei todellakaan ole virhe minkäänlaista-se on vain satunnaisvaihtelu odotettavissa tiedot).
kuinka erilaisia voisi olettaa monien satunnaisotosten t-arvojen samasta populaatiosta olevan? Ja miten t-arvo näyteaineistosi verrattuna odotettuihin t-arvoihin?
sen voi selvittää t-jakauman avulla.
käyttämällä T-jakaumaa todennäköisyyden laskemiseen
kuvan vuoksi oletetaan, että käytät 1 otoksen t-testiä selvittääksesi, onko populaation keskiarvo suurempi kuin hypoteettinen arvo, kuten 5, joka perustuu 20 havainnon otokseen, kuten yllä olevasta t-testin tulosteesta käy ilmi.
- Minitabissa valitaan kuvaaja > todennäköisyysjakauman kuvaaja.
- valitse Näkymätodennäköisyys ja valitse sitten OK.
- jakaumasta valitaan t.
- Vapausasteissa merkitään 19. (1 näytteen t testissä vapausasteet vastaavat näytteen kokoa miinus 1).
- valitse varjostettu alue. Valitse X-Arvo. Valitse Oikea Häntä.
- X-arvossa Kirjoita 2.8 (t-arvo) ja valitse sitten OK.
jakaumakäyrän korkein osa (huippu) näyttää, mihin voi odottaa suurimman osan t-arvoista laskevan. Useimmiten t-arvojen luulisi olevan lähellä nollaa. Siinä on järkeä. Koska jos satunnaisesti valitaan edustavia otoksia populaatiosta, useimpien satunnaisotosten keskiarvon populaatiosta pitäisi olla lähellä koko populaation keskiarvoa, jolloin niiden erot (ja siten lasketut t-arvot) ovat lähellä 0: ta.
t-arvot, P-arvot ja pokerikädet
t suurempien magnitudien arvot (joko negatiiviset tai positiiviset) ovat epätodennäköisempiä. Jakaumakäyrän äärivasemmisto ja oikea ”hännät” edustavat tapauksia, joissa saadaan ääriarvot t, kaukana nollasta. Esimerkiksi varjostettu alue kuvaa todennäköisyyttä saada t-arvo 2,8 tai suurempi. Kuvittele maaginen tikka, joka voitaisiin heittää maahan satunnaisesti missä tahansa jakelukäyrän alla. Miten se voisi laskeutua varjoiselle alueelle? Laskettu todennäköisyys on 0,005712…..kierrokset 0,006: een…joka on…t-testituloksissa saatu p-arvo!
toisin sanoen todennäköisyys saada t-arvo 2,8 tai suurempi, kun otetaan näytteitä samasta populaatiosta (tässä populaatiossa, jonka oletettu keskiarvo on 5), on noin 0,006.
kuinka todennäköistä se on? Ei kovin! Vertailun vuoksi, todennäköisyys tulla jaetuksi 3-of-a-kind 5-kortin pokerikädessä on yli kolme kertaa suurempi (≈ 0,021).
ottaen huomioon, että todennäköisyys saada t-arvo näin suuri tai suurempi, kun otanta tästä populaatiosta on niin pieni, mikä on todennäköisempää? On todennäköisempää, että tämä näyte ei tule tästä populaatiosta (oletetulla keskiarvolla 5). On paljon todennäköisempää, että tämä näyte tulee eri populaatiosta, yhden keskiarvo on suurempi kuin 5.
to wit: Koska p-arvo on hyvin pieni (< alfataso), hylätään nollahypoteesi ja päädytään siihen, että ero on tilastollisesti merkittävä.
Näin T ja P liittyvät erottamattomasti toisiinsa. Harkitse niitä yksinkertaisesti eri tapoja kvantifioida” ekstremeness ” teidän tuloksia alle nollahypoteesi. Yhden arvoa ei voi muuttaa muuttamatta toista.
mitä suurempi on t-arvon itseisarvo, sitä pienempi on p-arvo ja sitä suurempi on näyttö nollahypoteesia vastaan.(Voit tarkistaa tämän syöttämällä t-jakaumalle pienemmät ja korkeammat t-arvot kohdassa 6 edellä).
kokeile tätä kaksihäntäistä seurantaa…
yllä esitetty t-jakaumaesimerkki perustuu yksihäntäiseen t-testiin, jossa selvitetään, onko populaation keskiarvo suurempi kuin oletettu arvo. Siksi t-jakauman esimerkki näyttää t-arvoon 2,8 liittyvän todennäköisyyden vain yhteen suuntaan (jakauman oikea pyrstö).
miten löytäisit t-jakauman avulla p-arvon, joka liittyy t-arvoon 2,8 kaksihäntäisessä t-testissä (molempiin suuntiin)?
Vihje: säädä minitabissa vaiheessa 5 olevia vaihtoehtoja löytääksesi todennäköisyyden molemmille hännille. Jos sinulla ei ole kopiota minitabista, lataa ilmainen 30 päivän kokeiluversio.
Leave a Reply