Regresie Liniară: Pași Simpli, Video. Găsiți ecuație, coeficient, pantă
cuprins:
Ce este regresia liniară simplă?
Cum de a găsi o ecuație de regresie liniară:
- Cum de a găsi o ecuație de regresie liniară de mână.
- găsiți o ecuație de regresie liniară în Excel.
- Ti83 regresie liniară.
- TI 89 regresie liniară
găsirea elemente conexe:
- Cum de a găsi coeficientul de regresie.
- găsiți panta de regresie liniară.
- găsiți o valoare a testului de regresie liniară.
pârghie:
- pârghie în regresie liniară.
Înapoi sus
ce este regresia liniară simplă?
dacă abia începeți să aflați despre analiza de regresie, un liniar simplu este primul tip de regresie pe care îl veți întâlni într-o clasă de statistici.
regresia liniară este cea mai utilizată tehnică statistică; este o modalitate de a modela o relație între două seturi de variabile. Rezultatul este o ecuație de regresie liniară care poate fi utilizată pentru a face predicții despre date.
majoritatea pachetelor software și calculatoarelor pot calcula regresia liniară. De exemplu:
- TI-83.
- Excel.
puteți găsi, de asemenea, o regresie liniară de mână.
înainte de a încerca calculele, ar trebui să faceți întotdeauna un grafic scatter pentru a vedea dacă datele dvs. se potrivesc aproximativ unei linii. De ce? Deoarece regresia vă va oferi întotdeauna o ecuație și este posibil să nu aibă sens dacă datele dvs. urmează un model exponențial. Dacă știți că relația este neliniară, dar nu știți exact care este acea relație, o soluție este utilizarea modelelor de funcții de bază liniare— care sunt populare în învățarea automată.
etimologie
„liniar” înseamnă linie. Cuvântul regresie a venit de la un om de știință din secolul al 19-lea, Sir Francis Galton, care a inventat termenul „regresie spre mediocritate” (în limba modernă, care este regresie la medie. El a folosit termenul pentru a descrie fenomenul modului în care Natura tinde să atenueze excesul de trăsături fizice din generație în generație (cum ar fi înălțimea extremă).
De ce să folosim relațiile liniare?
relațiile liniare, adică liniile, sunt mai ușor de lucrat și majoritatea fenomenelor sunt în mod natural legate liniar. Dacă variabilele nu sunt legate liniar, atunci unele matematici pot transforma acea relație într-una liniară, astfel încât să fie mai ușor pentru cercetător (adică tu) să înțeleagă.
ce este regresia liniară simplă?
probabil că sunteți familiarizați cu trasarea graficelor de linie cu o axă X și o axă Y. Variabila X este uneori numită variabilă independentă, iar variabila Y este numită variabilă dependentă. Regresia liniară simplă trasează o variabilă independentă X împotriva unei variabile dependente Y. din punct de vedere tehnic, în analiza regresiei, variabila independentă se numește de obicei variabila predictor, iar variabila dependentă se numește variabila criteriu. Cu toate acestea, mulți oameni le numesc doar variabilele independente și dependente. Tehnicile de regresie mai avansate (cum ar fi regresia multiplă) utilizează mai multe variabile independente.
analiza de regresie poate duce la grafice liniare sau neliniare. O regresie liniară este locul în care relațiile dintre variabilele dvs. pot fi descrise cu o linie dreaptă. Regresiile neliniare produc linii curbe.(**)
regresie liniară simplă pentru cantitatea de precipitații pe an.
analiza de regresie este aproape întotdeauna efectuată de un program de calculator, deoarece ecuațiile consumă extrem de mult timp pentru a fi efectuate manual.
**deoarece acesta este un articol introductiv, l-am păstrat simplu. Dar există de fapt o diferență tehnică importantă între liniar și neliniar, care va deveni mai importantă dacă veți continua să studiați regresia. Pentru detalii, consultați articolul despre regresia neliniară.
Înapoi la început
cum se găsește o ecuație de regresie liniară: Prezentare generală
analiza de regresie este utilizată pentru a găsi ecuații care se potrivesc datelor. Odată ce avem ecuația de regresie, putem folosi modelul pentru a face predicții. Un tip de analiză de regresie este analiza liniară. Când un coeficient de corelație arată că datele sunt susceptibile de a putea prezice rezultatele viitoare și un grafic de împrăștiere a datelor pare să formeze o linie dreaptă, puteți utiliza regresia liniară simplă pentru a găsi o funcție predictivă. Dacă vă amintiți din algebra elementară, ecuația pentru o linie este y = mx + b. acest articol vă arată cum să luați date, să calculați regresia liniară și să găsiți ecuația y’ = a + bx. Notă: Dacă luați statistici AP, este posibil să vedeți ecuația scrisă ca b0 + b1x, care este același lucru (utilizați doar variabilele b0 + b1 în loc de a + b.
Urmăriți videoclipul sau citiți pașii de mai jos pentru a găsi manual o ecuație de regresie liniară. Încă confuz? Verificați tutorii la Chegg.com. primele 30 de minute sunt gratuite!
ecuația de regresie liniară
regresia liniară este o modalitate de a modela relația dintre două variabile. S-ar putea recunoaște, de asemenea, ecuația ca formula pantă. Ecuația are forma Y = a + bX, unde Y este variabila dependentă (aceasta este variabila care merge pe axa Y), X este variabila independentă (adică. este reprezentat grafic pe axa X), b este panta liniei și a este y-interceptarea.
primul pas în găsirea unei ecuații de regresie liniară este de a determina dacă există o relație între cele două variabile. Acesta este adesea un apel de judecată pentru cercetător. De asemenea, veți avea nevoie de o listă a datelor dvs. în format x-y (adică două coloane de variabile independente de date și dependente).
avertismente:
- doar pentru că două variabile sunt legate, nu înseamnă că una o provoacă pe cealaltă. De exemplu, deși există o relație între scoruri mari GRE și performanțe mai bune în școală grad, aceasta nu înseamnă că scoruri mari GRE provoca performanțe bune școală grad.
- dacă încercați să încercați să găsiți o ecuație de regresie liniară pentru un set de date (în special printr-un program automat, cum ar fi Excel sau un TI-83), veți găsi unul, dar nu înseamnă neapărat că ecuația este potrivită pentru datele dvs. O tehnică este să faceți mai întâi un complot de împrăștiere, pentru a vedea dacă datele se potrivesc aproximativ unei linii înainte de a încerca să găsiți o ecuație de regresie liniară.
cum să găsiți o ecuație de regresie liniară: pași
Pasul 1: Faceți o diagramă a datelor dvs., completând coloanele în același mod în care ați completa graficul dacă ați găsi coeficientul de corelație al lui Pearson.
Subject | Age x | Glucose Level y | xy | x2 | y2 | 1 | 43 | 99 | 4257 | 1849 | 9801 |
---|---|---|---|---|---|
2 | 21 | 65 | 1365 | 441 | 4225 | 3 | 25 | 79 | 1975 | 625 | 6241 |
4 | 42 | 75 | 3150 | 1764 | 5625 | 5 | 57 | 87 | 4959 | 3249 | 7569 |
6 | 59 | 81 | 4779 | 3481 | 6561 |
Σ | 247 | 486 | 20485 | 11409 | 40022 |
Din tabelul de mai sus, Σx = 247, Σy = 486, Σxy = 20485, Σx2 = 11409, Σy2 = 40022. n este dimensiunea eșantionului (6, în cazul nostru).
Pasul 2: folosiți următoarele ecuații pentru a găsi a și b.
a = 65.1416
b=.385225
Faceți clic aici dacă doriți instrucțiuni simple, pas cu pas pentru rezolvarea acestei formule.
găsiți un:
- ((486 × 11,409) – ((247 × 20,485)) / 6 (11,409) – 2472)
- 484979 / 7445
- =65.14
găsi b:
- (6(20,485) – (247 × 486)) / (6 (11409) – 2472)
- (122,910 – 120,042) / 68,454 – 2472
- 2868 / 7445
- = .385225
Pasul 3: Introduceți valorile în ecuație.
y’ = a + bx
y ‘ = 65.14+.385225x
acesta este modul de a găsi o ecuație de regresie liniară de mână!
ca explicația? Consultați manualul de statistici practic înșelător, care are alte sute de soluții pas cu pas, la fel ca acesta!
* rețineți că acest exemplu are un coeficient de corelație scăzut și, prin urmare, nu ar fi prea bun la prezicerea nimic.
Înapoi la început
găsiți o ecuație de regresie liniară în Excel
vizionați videoclipul sau citiți pașii de mai jos:
ecuația de regresie liniară Microsoft Excel: pași
Pasul 1: Instalați instrumentul de analiză a datelor, dacă nu este deja instalat. Pentru instrucțiuni despre cum să încărcați Toolpak-ul de analiză a datelor, Faceți clic aici.
Pasul 2: tastați datele în două coloane în Excel. De exemplu, tastați datele „x” în coloana a și datele „y” în coloana b. nu lăsați celule goale între intrări.
Pasul 3: Faceți clic pe fila „analiza datelor” din bara de instrumente Excel.
Pasul 4: Faceți clic pe” regresie „în fereastra pop-up și apoi faceți clic pe” OK.”
fereastra pop-up de analiză a datelor are multe opțiuni, inclusiv regresia liniară.
Pasul 5: Selectați intervalul y de intrare. Puteți face acest lucru în două moduri: fie selectați datele din foaia de lucru, fie tastați locația datelor dvs. în „intrare y interval cutie.”De exemplu, dacă datele dvs. Y sunt în A2 până la A10, tastați” A2:A10 ” în caseta de intrare y Range.
Pasul 6: Selectați intervalul de intrare X selectând datele din foaia de lucru sau tastând locația datelor dvs. în „caseta de intrare X Range.”
Pasul 7: Selectați locația în care doriți să meargă intervalul de ieșire selectând o zonă goală din foaia de lucru sau tastând locația unde doriți să meargă datele dvs. în caseta „interval de ieșire”.
Pasul 8: Faceți clic pe”OK”. Excel va calcula regresia liniară și va popula foaia de lucru cu rezultatele.
sfat: informația ecuației de regresie liniară este dată în ultimul set de ieșire (coloana coeficienților). Prima intrare în rândul ” Intercept „este” a „(y-intercept) și prima intrare în coloana” X „este” B ” (panta).
înapoi la început
Ti83 regresie liniară
Urmăriți videoclipul sau citiți pașii de mai jos:
două linii de regresie liniară.
TI 83 regresie liniară: Prezentare generală
regresia liniară este obositoare și predispusă la erori atunci când este făcută manual, dar puteți efectua regresie liniară în timpul necesar pentru a introduce câteva variabile într-o listă. Regresia liniară vă va oferi un rezultat rezonabil numai dacă datele dvs. arată ca o linie pe un grafic scatter, deci înainte de a găsi ecuația pentru o linie de regresie liniară, poate doriți să vizualizați mai întâi datele dintr-un grafic scatter. A se vedea acest articol pentru modul de a face un complot scatter pe TI 83.
TI 83 regresie liniară: pași
problema eșantionului: găsiți o ecuație de regresie liniară (de forma y = ax + b) Pentru x-valori de 1, 2, 3, 4, 5 și Y-valori de 3, 9, 27, 64 și 102.
Pasul 1: Apăsați STAT, apoi apăsați ENTER pentru a intra în ecranul liste. Dacă aveți deja date în L1 sau L2, ștergeți datele: mutați cursorul pe L1, apăsați CLEAR și apoi ENTER. Repetați pentru L2.
Pasul 2: Introduceți variabilele x, una câte una. Urmați fiecare număr apăsând tasta ENTER. Pentru lista noastră, ar trebui să introduceți:
1 ENTER
2 ENTER
3 ENTER
4 ENTER
5 ENTER
Pasul 3: Utilizați tastele săgeată pentru a defila peste la următoarea coloană, L2.
Pasul 4: Introduceți variabilele y, una câte una. Urmați fiecare număr apăsând tasta enter. Pentru lista noastră, ați introduce:
3 Introduceți
9 introduceți
27 introduceți
64 introduceți
102 introduceți
Pasul 5: Apăsați butonul STAT, apoi utilizați tasta de parcurgere pentru a evidenția ” CALC.”
Pasul 6: Apăsați 4 pentru a alege”LinReg(ax+b)”. Apăsați ENTER și apoi introduceți din nou. TI 83 va returna variabilele necesare pentru ecuație. Doar introduceți variabilele date (a, b) în ecuația pentru regresie liniară (y=ax+b). Pentru datele de mai sus, acesta este y = 25,3 x – 34,9.
așa se efectuează regresia liniară TI 83!
Înapoi sus
cum se găsește o pantă de regresie liniară: Prezentare generală
amintiți-vă din algebră, că panta este ” m „în formula y = mx + b.
în formula de regresie liniară, panta este a în ecuația y’ = b + ax.
ele sunt în esență același lucru. Deci, dacă vi se cere să găsiți panta de regresie liniară, tot ce trebuie să faceți este să găsiți b în același mod în care ați găsi m.
calcularea regresiei liniare de mână este dificilă, cel puțin. Există o mulțime de însumare (care este simbolul de la 7CT, ceea ce înseamnă a adăuga în sus). Pașii de bază sunt mai jos sau puteți viziona videoclipul la începutul acestui articol. Videoclipul intră în mult mai multe detalii despre cum se face însumarea. Găsirea ecuației vă va oferi și panta. Dacă nu doriți să găsiți panta manual (sau dacă doriți să vă verificați munca), puteți utiliza și Excel.
cum se găsește panta de regresie liniară: pași
Pasul 1: Găsiți următoarele date din informațiile furnizate: Dacă nu vă amintiți cum să obțineți aceste variabile din date, consultați acest articol despre cum să găsiți un coeficient de corelație al lui Pearson. Urmați pașii de acolo pentru a crea un tabel și pentru a găsi un X, X, X, X, X2 și X2.
Pasul 2: Introduceți datele în formula b (nu este nevoie să găsiți a).
dacă formulele vă sperie, puteți găsi instrucțiuni mai cuprinzătoare despre cum să lucrați formula aici: cum să găsiți o ecuație de regresie liniară: Prezentare generală.
cum să găsiți panta de regresie în Excel 2013
Abonați-vă la canalul nostru Youtube pentru mai multe sfaturi și trucuri despre statistici.
Înapoi sus
cum se găsește coeficientul de regresie
un coeficient de regresie este același lucru cu panta liniei ecuației de regresie. Ecuația pentru coeficientul de regresie pe care o veți găsi la testul de Statistică AP este: B1 = B1 = ecuația pentru coeficientul de regresie pe care îl veți găsi la testul de Statistică AP este: B1 = B1 = sec / sec . „y „în această ecuație este media lui y și” x”este media lui x.
puteți găsi coeficientul de regresie manual (așa cum este subliniat în secțiunea din partea de sus a acestei pagini).
cu toate acestea, nu va trebui să calculați coeficientul de regresie manual în testul AP — veți folosi calculatorul TI-83. De ce? Calculul regresiei liniare de mână consumă foarte mult timp (permiteți-vă aproximativ 30 de minute pentru a face calculele și a le verifica) și din cauza numărului mare de calcule pe care trebuie să le faceți, este foarte probabil să faceți erori matematice. Când găsiți o ecuație de regresie liniară pe TI83, obțineți coeficientul de regresie ca parte a răspunsului.
problema eșantionului: găsiți coeficientul de regresie pentru următorul set de Date:
x: 1, 2, 3, 4, 5.
y: 3, 9, 27, 64, 102.
Pasul 1: Apăsați STAT, apoi apăsați ENTER pentru a introduce liste. Poate fi necesar să ștergeți datele dacă aveți deja numere în L1 sau L2. Pentru a șterge datele: mutați cursorul pe L1, apăsați CLEAR și apoi ENTER. Repetați pentru L2 dacă aveți nevoie.
Pasul 2: Introduceți datele x într-o listă. Apăsați tasta ENTER după fiecare intrare.
1 ENTER
2 ENTER
3 ENTER
4 ENTER
5 ENTER
Pasul 3: parcurgeți până la următoarea coloană, L2 folosind tastele săgeată din partea dreaptă sus a tastaturii.
Pasul 4: Introduceți datele y:
3 ENTER
9 ENTER
27 ENTER
64 ENTER
102 ENTER
Pasul 5: Apăsați butonul STAT, apoi derulați pentru a evidenția „CALC.”Apăsați ENTER
Pasul 6: Apăsați 4 pentru a alege „LinReg(ax+b)”. Apăsați ENTER. TI 83 va returna variabilele necesare pentru ecuația de regresie liniară. Valoarea pe care o căutați >coeficientul de regresie > este b, care este 25.3 pentru acest set de date.
asta e!
Înapoi sus
valoarea testului de regresie liniară
două linii de regresie liniară.
valorile testului de regresie liniară sunt utilizate în regresia liniară simplă exact în același mod în care valorile testului (cum ar fi scorul z sau statistica T) sunt utilizate în testarea ipotezelor. În loc să lucrați cu tabelul z, veți lucra cu un tabel de distribuție T. Valoarea testului de regresie liniară este comparată cu statistica testului pentru a vă ajuta să susțineți sau să respingeți o ipoteză nulă.
valoarea testului de regresie liniară: pași
întrebare eșantion: Având în vedere un set de date cu dimensiunea eșantionului 8 și r = 0,454, găsiți valoarea testului de regresie liniară.
notă: r este coeficientul de corelație.
Pasul 1: Găsiți r, coeficientul de corelație, cu excepția cazului în care v-a fost deja dat în întrebare. În acest caz, r este dat (r = .0454). Nu sunteți sigur cum să găsiți r? A se vedea: coeficientul de corelație pentru pași pe cum să găsiți R.
Pasul 2: Utilizați următoarea formulă pentru a calcula valoarea testului (n este dimensiunea eșantionului):
cum de a rezolva formula:
valoarea testului de regresie liniară, T = 1.24811026
asta e!
găsirea statisticii testului
valoarea testului de regresie liniară nu este prea utilă decât dacă aveți ceva cu care să o comparați. Comparați valoarea dvs. cu statistica testului. Statistica testului este, de asemenea, un scor t (t) definit de următoarea ecuație:
t = panta liniei de regresie a eșantionului / eroarea standard a pantei.
vezi: cum de a găsi o pantă de regresie liniară / cum de a găsi eroarea standard a pantei (TI-83).
puteți găsi un exemplu lucrat de calcul al valorii testului de regresie liniară (cu un nivel alfa) aici: coeficienții de corelație.
Înapoi sus
efectul de levier în regresia liniară
punctele de date care au efectul de levier au potențialul de a muta o linie de regresie liniară. Ele tind să fie aberante. Un outlier este un punct care este fie o valoare extrem de mare, fie extrem de scăzută.
puncte influente
Dacă parametrul estimează (deviația standard a eșantionului, varianța etc.) schimbați semnificativ atunci când un outlier este eliminat, acel punct de date se numește observație influentă.
cu cât un punct de date diferă mai mult de media celorlalte valori x, cu atât are mai multă pârghie. Cu cât un punct este mai puternic, cu atât este mai mare probabilitatea ca acel punct să influențeze (adică ar putea modifica estimările parametrilor).
efectul de levier în regresia liniară: cum afectează graficele
în regresia liniară, punctul influent (outlier) va încerca să tragă linia de regresie liniară spre sine. Graficul de mai jos arată ce se întâmplă cu o linie de regresie liniară atunci când outlier A este inclus:
două linii de regresie liniară. Punctul influent A este inclus în linia superioară, dar nu în linia inferioară.
Valorile aberante cu valori X extreme (valori care nu se încadrează în intervalul celorlalte puncte de date) au o pârghie mai mare în regresia liniară decât punctele cu valori x extreme mai mici. Cu alte cuvinte, valorile extreme x-value vor muta linia mai mult decât valorile extreme mai puțin.
graficul următor arată un punct de date în afara intervalului celorlalte valori. Valorile variază de la 0 la aproximativ 70.000. Acest punct are o valoare x de aproximativ 80.000, care este în afara intervalului. Aceasta afectează linia de regresie mult mai mult decât punctul din prima imagine de mai sus, care se afla în intervalul celorlalte valori.
un outlier cu levier ridicat. Punctul a mutat graficul mai mult, deoarece este în afara intervalului celorlalte valori.
în general, valorile aberante care au valori apropiate de media lui x vor avea o pârghie mai mică decât valorile aberante către marginile intervalului. Valorile aberante cu valori de x în afara intervalului vor avea mai mult efect de levier. Valorile care sunt extreme pe axa y (în comparație cu celelalte valori) vor avea o influență mai mare decât valorile mai apropiate de celelalte valori Y.
cum ar fi videoclipurile? Abonați-vă la canalul nostru Youtube.
conexiunea la transformarea afină
regresia liniară este infinit conectată la transformarea afină. Formula y ‘ = b + ax nu este cu adevărat linear…it este o funcție afină, care este definită ca o funcție liniară plus o transformare. Deci ar trebui să se numească regresie afină, nu liniară!
——————————————————————————
aveți nevoie de ajutor cu o temă sau o întrebare de testare? Cu studiul Chegg, puteți obține soluții pas cu pas la întrebările dvs. de la un expert în domeniu. Primele 30 de minute cu un tutore Chegg sunt gratuite!
Leave a Reply