Articles

Hva Er T-Verdier Og P-Verdier I Statistikk?

hvis Du ikke er en statistiker, kan du se gjennom statistisk utgang noen ganger få Deg Til Å føle Deg Litt Som Alice In Wonderland. Plutselig går du inn i en fantastisk verden hvor merkelige og mystiske phantasms vises ut av ingensteds.

vurder For Eksempel T og P i t-testresultatene dine.

» Nysgjerrig og nysgjerrig!»du kan utbryte, Som Alice, mens du ser på produksjonen din .

En-Prøve T test utgang

Hva er disse verdiene, egentlig? Hvor kommer de fra? Selv om du har brukt p-verdien til å tolke den statistiske signifikansen av resultatene dine, kan den faktiske opprinnelsen forbli skummel for deg.

T & P: Tweedledee og Tweedledum av En T-test

T Og P er uløselig forbundet. De går arm i arm, Som Tweedledee og Tweedledum. Her er hvorfor.

når du utfører en t-test, prøver du vanligvis å finne bevis på en signifikant forskjell mellom populasjonsmiddel (2-prøve t) eller mellom populasjonsmiddel og en hypotetisk verdi (1-prøve t). T-verdien måler størrelsen på forskjellen i forhold til variasjonen i eksempeldataene. Sagt på en annen måte, T er bare den beregnede forskjellen representert i enheter av standardfeil. Jo større størrelsen På T, desto større bevis mot nullhypotesen. Dette betyr at det er større bevis på at det er en betydelig forskjell. Jo nærmere T er til 0, jo mer sannsynlig er det ikke en signifikant forskjell.

Husk at t-verdien i produksjonen din beregnes ut fra bare ett utvalg fra hele populasjonen. Det du tok gjentatte tilfeldige prøver av data fra samme populasjon, ville du få litt forskjellige t-verdier hver gang, på grunn av tilfeldig utvalgsfeil (som egentlig ikke er en feil av noe slag–det er bare den tilfeldige variasjonen som forventes i dataene).

Hvor forskjellig kan du forvente at t-verdiene fra mange tilfeldige prøver fra samme populasjon skal være? Og hvordan sammenligner t-verdien fra utvalgsdataene dine med de forventede t-verdiene?

du kan bruke en t-distribusjon for å finne ut.

bruk en t-fordeling til å beregne sannsynlighet

for illustrasjonens skyld, anta at du bruker en 1-prøve t-test for å avgjøre om populasjonsgjennomsnittet er større enn en hypotetisk verdi, for eksempel 5, basert på et utvalg på 20 observasjoner, som vist i t-testutgangen ovenfor.

  1. i Minitab velger Du Graf > Sannsynlighetsfordelingsplott.
  2. Velg Vis Sannsynlighet, og klikk DERETTER PÅ OK.
  3. fra Distribusjon velger du t.
  4. skriv inn 19 I Frihetsgrader. (For en 1-prøve t-test er frihetsgraden lik prøvestørrelsen minus 1).
  5. Klikk Skyggelagt Område. Velg X-Verdi. Velg Høyre Hale.
  6. i X-Verdi skriver du inn 2.8( t-verdien) og klikker PÅ OK.

den høyeste delen av fordelingskurven viser deg hvor du kan forvente at de fleste t-verdiene faller. Mesteparten av tiden, du forventer å få t-verdier nær 0. Det er fornuftig, ikke sant? Fordi hvis du tilfeldig velger representative prøver fra en populasjon, bør gjennomsnittet for de fleste av disse tilfeldige prøvene fra populasjonen være nær det totale populasjonsgjennomsnittet, noe som gjør forskjellene (og dermed de beregnede t-verdiene) nær 0.

T-verdier, p-verdier og pokerhender

t-verdier med større størrelser (enten negative eller positive) er mindre sannsynlige. Langt til venstre og høyre «haler» av fordelingskurven representerer forekomster av å oppnå ekstreme verdier av t, langt fra 0. For eksempel representerer det skyggelagte området sannsynligheten for å oppnå en t-verdi på 2,8 eller høyere. Tenk deg en magisk dart som kan kastes for å lande tilfeldig hvor som helst under distribusjonskurven. Hva er sjansen for at det vil lande i det skyggefulle området? Den beregnede sannsynligheten er 0,005712…..som runder til 0.006…som er…p-verdien oppnådd i t-testresultatene!

med andre ord er sannsynligheten for å oppnå en t-verdi på 2,8 eller høyere ved prøvetaking fra samme populasjon (her en populasjon med et hypotetisk gjennomsnitt på 5), omtrent 0,006.

Hvor sannsynlig er det? Ikke veldig! Til sammenligning er sannsynligheten for å få utdelt 3 like i en 5-korts pokerhånd over tre ganger så høy (≈0,021).Gitt at sannsynligheten for å oppnå en t-verdi så høy eller høyere når prøvetaking fra denne populasjonen er så lav, hva er mer sannsynlig? Det er mer sannsynlig at denne prøven ikke kommer fra denne befolkningen (med det hypotetiske gjennomsnittet av 5). Det er mye mer sannsynlig at denne prøven kommer fra annen populasjon, en med en gjennomsnittlig større enn 5.

til wit: Fordi p-verdien er svært lav (< alfa nivå), avviser du nullhypotesen og konkluderer med at det er en statistisk signifikant forskjell.

På Denne måten Er T Og P uløselig forbundet. Vurder dem bare forskjellige måter å kvantifisere» ekstremiteten » av resultatene dine under nullhypotesen. Du kan ikke endre verdien av en uten å endre den andre.

jo større absoluttverdien av t-verdien er, desto mindre er p-verdien, og jo større bevis mot nullhypotesen.(Du kan bekrefte dette ved å angi lavere og høyere t-verdier for t-fordelingen i trinn 6 ovenfor).

Prøv denne to-tailed oppfølgingen…

t-fordelingseksemplet vist ovenfor er basert på en en-tailed t-test for å avgjøre om gjennomsnittet av befolkningen er større enn en hypotetisk verdi. Derfor viser t-fordelingseksemplet sannsynligheten knyttet til t-verdien på 2,8 bare i en retning (høyre hale av fordelingen).

Hvordan vil du bruke t-fordelingen til å finne p-verdien knyttet til en t-verdi på 2,8 for to-tailed t-test (i begge retninger)?

Hint: i Minitab justerer du alternativene i trinn 5 for å finne sannsynligheten for begge haler. Hvis Du ikke har en kopi Av Minitab, laste ned en gratis 30-dagers prøveversjon.