Articles

Ce sunt valorile T și valorile P în statistici?

dacă nu sunteți statistician, căutarea prin rezultatele statistice vă poate face uneori să vă simțiți un pic ca Alice în țara Minunilor. Dintr-o dată, pășești într-o lume fantastică în care fantasme ciudate și misterioase apar de nicăieri.

de exemplu, luați în considerare T și P în rezultatele testului T.

„curios și curios!”s-ar putea exclama, ca Alice, în timp ce privirea la ieșire dumneavoastră.

o probă de ieșire t test

care sunt aceste valori, într-adevăr? De unde vin? Chiar dacă ați folosit valoarea p pentru a interpreta semnificația statistică a rezultatelor dvs. de nenumărate ori, originea sa reală poate rămâne neclară pentru dvs.

T& P: Tweedledee și Tweedledum ale unui test T

T și P sunt indisolubil legate. Merg braț la braț, ca Tweedledee și Tweedledum. Uite de ce.

când efectuați un test t, încercați de obicei să găsiți dovezi ale unei diferențe semnificative între mijloacele populației (2-proba t) sau între media populației și o valoare ipotezată (1-proba t). Valoarea t măsoară dimensiunea diferenței în raport cu variația datelor dvs. eșantion. Altfel spus, T este pur și simplu diferența calculată reprezentată în unități de eroare standard. Cu cât magnitudinea T este mai mare, cu atât sunt mai mari dovezile împotriva ipotezei nule. Aceasta înseamnă că există dovezi mai mari că există o diferență semnificativă. Cu cât T este mai aproape de 0, cu atât este mai probabil să nu existe o diferență semnificativă.

amintiți-vă, valoarea t din producția dvs. este calculată dintr-un singur eșantion din întreaga populație. Dacă ați luat eșantioane aleatorii repetate de date din aceeași populație, veți obține valori t ușor diferite de fiecare dată, din cauza erorii de eșantionare aleatoare (ceea ce nu este într-adevăr o greșeală de orice fel–este doar variația aleatorie așteptată în date).

cât de diferite v-ați putea aștepta ca valorile t din mai multe eșantioane aleatorii din aceeași populație să fie? Și cum se compară valoarea t din datele eșantionului dvs. cu valorile t așteptate?

puteți utiliza o distribuție t pentru a afla.

folosind o distribuție t pentru a calcula probabilitatea

de dragul ilustrării, presupunem că utilizați un test t cu 1 eșantion pentru a determina dacă media populației este mai mare decât o valoare ipotezată, cum ar fi 5, pe baza unui eșantion de 20 de observații, așa cum se arată în rezultatul testului t de mai sus.

  1. În Minitab, alegeți Grafic> Plot de distribuție a probabilității.
  2. Selectați Vizualizare probabilitate, apoi faceți clic pe OK.
  3. din distribuție, selectați t.
  4. în grade de libertate, introduceți 19. (Pentru un test t cu 1 eșantion, gradele de libertate sunt egale cu dimensiunea eșantionului minus 1).
  5. Faceți clic pe zona umbrită. Selectați Valoarea X. Selectați Coada Dreaptă.
  6. în valoarea X, introduceți 2.8 (valoarea t), apoi faceți clic pe OK.

cea mai mare parte (vârf) a curbei de distribuție vă arată unde vă puteți aștepta ca majoritatea valorilor t să scadă. De cele mai multe ori, te-ai aștepta să obții valori t apropiate de 0. Are sens, nu? Deoarece dacă selectați aleatoriu eșantioane reprezentative dintr-o populație, media majorității eșantioanelor aleatorii din populație ar trebui să fie apropiată de media totală a populației, făcând diferențele lor (și astfel valorile t calculate) apropiate de 0.

valorile T, valorile P și mâinile de poker

Valorile t cu magnitudini mai mari (fie negative, fie pozitive) sunt mai puțin probabile. „Cozile” din stânga și din dreapta ale curbei de distribuție reprezintă cazuri de obținere a valorilor extreme ale lui t, departe de 0. De exemplu, regiunea umbrită reprezintă probabilitatea obținerii unei valori t de 2,8 sau mai mare. Imaginați-vă o săgeată magică care ar putea fi aruncată pentru a ateriza aleatoriu oriunde sub curba de distribuție. Care este șansa să aterizeze în regiunea umbrită? Probabilitatea calculată este de 0,005712…..care se rotunjește la 0.006…care este…valoarea p obținută în rezultatele testului t!

cu alte cuvinte, probabilitatea de a obține o valoare t de 2,8 sau mai mare, la eșantionarea din aceeași populație (aici, o populație cu o medie ipotezată de 5), este de aproximativ 0,006.

cât de probabil este asta? Nu foarte! Pentru comparație, probabilitatea de a primi 3 cărți de joc într-o mână de poker cu 5 cărți este de peste trei ori mai mare (0,021).având în vedere că probabilitatea de a obține o valoare t atât de mare sau mai mare atunci când eșantionarea din această populație este atât de mică, ce este mai probabil? Este mai probabil ca acest eșantion să nu provină din această populație (cu media ipotezată de 5). Este mult mai probabil ca acest eșantion să provină din populație diferită, una cu o medie mai mare de 5.

la spirit: Deoarece valoarea p este foarte scăzută (< nivel alfa), respingeți ipoteza nulă și concluzionați că există o diferență semnificativă statistic.

în acest fel, T și P sunt indisolubil legate. Luați în considerare pur și simplu moduri diferite de a cuantifica „extremitatea” rezultatelor dvs. sub ipoteza nulă. Nu poți schimba valoarea unuia fără a-l schimba pe celălalt.

cu cât este mai mare valoarea absolută a valorii t, cu atât este mai mică valoarea p și cu atât sunt mai mari dovezile împotriva ipotezei nule.(Puteți verifica acest lucru introducând valori t mai mici și mai mari pentru distribuția t în pasul 6 de mai sus).

încercați această urmărire cu două cozi…

exemplul de distribuție t prezentat mai sus se bazează pe un test T cu o singură coadă pentru a determina dacă media populației este mai mare decât o valoare ipotezată. Prin urmare, exemplul de distribuție t arată probabilitatea asociată cu valoarea t de 2,8 numai într-o singură direcție (coada dreaptă a distribuției).

cum ați folosi distribuția t pentru a găsi valoarea p asociată cu o valoare t de 2,8 pentru testul t cu două cozi (în ambele direcții)?

Sugestie: În Minitab, ajustați opțiunile din pasul 5 pentru a găsi probabilitatea pentru ambele cozi. Dacă nu aveți o copie a Minitab, descărcați o versiune de încercare gratuită de 30 de zile.