Linjär Regression: Enkla Steg, Video. Hitta ekvation, koefficient, lutning
innehåll:
vad är enkel linjär Regression?
hur man hittar en linjär regressionsekvation:
- hur man hittar en linjär regressionsekvation för Hand.
- hitta en linjär regressionsekvation i Excel.
- Ti83 linjär Regression.
- TI 89 linjär Regression
hitta relaterade objekt:
- hur man hittar regressionskoefficienten.
- hitta den linjära Regressionslutningen.
- hitta ett linjärt Regressionstestvärde.
hävstång:
- hävstång i linjär Regression.
tillbaka till toppen
Vad är enkel linjär Regression?
Om du bara börjar lära dig om regressionsanalys är en enkel linjär den första typen av regression du kommer att stöta på i en statistikklass.
linjär regression är den mest använda statistiska tekniken; det är ett sätt att modellera ett förhållande mellan två uppsättningar variabler. Resultatet är en linjär regressionsekvation som kan användas för att göra förutsägelser om data.
de flesta programvarupaket och miniräknare kan beräkna linjär regression. Till exempel:
- TI-83.
- Excel.
Du kan också hitta en linjär regression för hand.
innan du försöker dina beräkningar bör du alltid göra en scatter-plot för att se om dina data ungefär passar en rad. Varför? Eftersom regression alltid ger dig en ekvation, och det kanske inte är meningsfullt om dina data följer en exponentiell modell. Om du vet att förhållandet är icke-linjärt, men inte vet exakt vad det förhållandet är, är en lösning att använda linjära basfunktionsmodeller— som är populära inom maskininlärning.
etymologi
”linjär” betyder linje. Ordet Regression kom från en 19-Talsforskare, Sir Francis Galton, som myntade termen ”regression mot medelmåttighet” (på modernt språk, det är regression till medelvärdet. Han använde termen för att beskriva fenomenet hur naturen tenderar att dämpa överflödiga fysiska egenskaper från generation till generation (som extrem höjd).
Varför använda linjära relationer?
linjära relationer, dvs linjer, är lättare att arbeta med och de flesta fenomen är naturligt linjärt relaterade. Om variabler inte är linjärt relaterade kan viss matematik omvandla det förhållandet till en linjär, så att det är lättare för forskaren (dvs. du) att förstå.
Vad är enkel linjär Regression?
du är förmodligen bekant med att rita linjediagram med en X-axel och en Y-axel. X-variabeln kallas ibland den oberoende variabeln och Y-variabeln kallas den beroende variabeln. Enkel linjär regression plottar en oberoende variabel X mot en beroende variabel Y. Tekniskt, i regressionsanalys, kallas den oberoende variabeln vanligtvis prediktorvariabeln och den beroende variabeln kallas kriteriumvariabeln. Men många kallar dem bara de oberoende och beroende variablerna. Mer avancerade regressionstekniker (som multipel regression) använder flera oberoende variabler.
regressionsanalys kan resultera i linjära eller olinjära grafer. En linjär regression är där relationerna mellan dina variabler kan beskrivas med en rak linje. Icke-linjära regressioner producerar böjda linjer.(**)
enkel linjär regression för mängden nederbörd per år.
regressionsanalys utförs nästan alltid av ett datorprogram, eftersom ekvationerna är extremt tidskrävande att utföra för hand.
**eftersom detta är en inledande artikel, Jag höll det enkelt. Men det finns faktiskt en viktig teknisk skillnad mellan linjär och olinjär, det blir viktigare om du fortsätter att studera regression. För detaljer, se artikeln om icke-linjär regression.
tillbaka till toppen
hur man hittar en linjär regressionsekvation: översikt
regressionsanalys används för att hitta ekvationer som passar data. När vi har regressionsekvationen kan vi använda modellen för att göra förutsägelser. En typ av regressionsanalys är linjär analys. När en korrelationskoefficient visar att data sannolikt kommer att kunna förutsäga framtida resultat och en spridningsdiagram av data verkar bilda en rak linje, kan du använda enkel linjär regression för att hitta en prediktiv funktion. Om du kommer ihåg från elementär algebra är ekvationen för en rad y = mx + b. den här artikeln visar hur du tar data, beräknar linjär regression och hittar ekvationen y’ = a + bx. Obs: Om du tar AP-statistik kan du se ekvationen skriven som b0 + b1x, vilket är samma sak (du använder bara variablerna b0 + b1 istället för a + b.
titta på videon eller läs stegen nedan för att hitta en linjär regressionsekvation för hand. Fortfarande förvirrad? Kolla in handledarna på Chegg.com. dina första 30 minuter är gratis!
den linjära regressionsekvationen
linjär regression är ett sätt att modellera förhållandet mellan två variabler. Du kanske också känner igen ekvationen som lutningsformeln. Ekvationen har formen Y= a + bX, där Y är den beroende variabeln (det är variabeln som går på Y-axeln), X är den oberoende variabeln (dvs. den är ritad på X-axeln), b är linjens lutning och A är y-avlyssningen.
det första steget i att hitta en linjär regressionsekvation är att bestämma om det finns ett samband mellan de två variablerna. Detta är ofta en dom kräver forskaren. Du behöver också en lista över dina data i XY-format (dvs. två kolumner med dataoberoende och beroende variabler).
varningar:
- bara för att två variabler är relaterade betyder det inte att den ena orsakar den andra. Till exempel, även om det finns ett samband mellan höga GRE-poäng och bättre prestanda i grundskolan, betyder det inte att höga GRE-poäng orsakar bra gradskolans prestanda.
- Om du försöker försöka hitta en linjär regressionsekvation för en uppsättning data (särskilt genom ett automatiserat program som Excel eller en TI-83) hittar du en, men det betyder inte nödvändigtvis att ekvationen passar bra för dina data. En teknik är att göra en scatter plot först, för att se om data ungefär passar en linje innan du försöker hitta en linjär regressionsekvation.
så här hittar du en linjär regressionsekvation: steg
Steg 1: Gör ett diagram över dina data och fyll i kolumnerna på samma sätt som du skulle fylla i diagrammet om du hittade Pearsons korrelationskoefficient.
Subject | Age x | Glucose Level y | xy | x2 | y2 | 1 | 43 | 99 | 4257 | 1849 | 9801 |
---|---|---|---|---|---|
2 | 21 | 65 | 1365 | 441 | 4225 | 3 | 25 | 79 | 1975 | 625 | 6241 |
4 | 42 | 75 | 3150 | 1764 | 5625 | 5 | 57 | 87 | 4959 | 3249 | 7569 |
6 | 59 | 81 | 4779 | 3481 | 6561 |
Σ | 247 | 486 | 20485 | 11409 | 40022 |
Från tabellen ovan, Σx = 247, Σy = 486, Σxy = 20485, Σx2 = 11409, Σy2 = 40022. n är provstorleken (6, i vårt fall).steg 2: Använd följande ekvationer för att hitta a och b.
a = 65.1416
b = .385225
Klicka här om du vill ha enkla steg-för-steg-instruktioner för att lösa denna formel.
hitta en:
- ((486 × 11,409) – ((247 × 20,485)) / 6 (11,409) – 2472)
- 484979 / 7445
- =65.14
hitta b:
- (6(20,485) – (247 × 486)) / (6 (11409) – 2472)
- (122,910 – 120,042) / 68,454 – 2472
- 2,868 / 7,445
- = .385225
steg 3: Sätt in värdena i ekvationen.
y’ = a + bx
y’ = 65,14 + .385225x
Så här hittar du en linjär regressionsekvation för hand!
som förklaringen? Kolla in handboken praktiskt taget fusk statistik, som har hundratals fler steg-för-steg-lösningar, precis som den här!
* Observera att detta exempel har en låg korrelationskoefficient och därför inte skulle vara för bra för att förutsäga någonting.
tillbaka till toppen
hitta en linjär regressionsekvation i Excel
titta på videon eller läs stegen nedan:
linjär regressionsekvation Microsoft Excel: steg
Steg 1: Installera Data Analysis Toolpak, om det inte redan är installerat. För instruktioner om hur du laddar Data Analysis Toolpak, klicka här.
steg 2: Skriv in dina data i två kolumner i Excel. Skriv till exempel dina” x ”- data i kolumn A och dina” y ” – data i kolumn b. lämna inga tomma celler mellan dina poster.
steg 3: Klicka på fliken ”dataanalys” i Excel-verktygsfältet.
steg 4: Klicka på ”regression” i popup-fönstret och klicka sedan på ”OK.”
popupfönstret för dataanalys har många alternativ, inklusive linjär regression.
Steg 5: Välj ditt inmatade y-intervall. Du kan göra detta på två sätt: välj antingen data i kalkylbladet eller skriv in platsen för dina data i rutan ”Input Y Range.”Om dina y-data till exempel finns i A2 till A10 skriver du” A2:A10 ” i rutan Input Y Range.
steg 6: Välj ditt input X-intervall genom att välja data i kalkylbladet eller skriva platsen för dina data i rutan ”Input X Range.”
Steg 7: Välj den plats där du vill att ditt utgångsområde ska gå genom att välja ett tomt område i kalkylbladet eller skriva platsen där du vill att dina data ska gå i rutan ”Utgångsområde”.
steg 8: Klicka på ”OK”. Excel beräknar den linjära regressionen och fyller ditt kalkylblad med resultaten.
tips: informationen om linjär regressionsekvation ges i den sista utdatauppsättningen (kolumnen koefficienter). Den första posten i raden” Intercept ”är” a ”(y-intercept) och den första posten i kolumnen” X ”är” b ” (lutningen).
tillbaka till toppen
Ti83 linjär Regression
titta på videon eller läs stegen nedan:
två linjära regressionslinjer.
TI 83 linjär Regression: översikt
linjär regression är tråkig och benägen för fel när den görs för hand, men du kan utföra linjär regression under den tid det tar dig att mata in några variabler i en lista. Linjär regression ger dig bara ett rimligt resultat om dina data ser ut som en rad på en scatter-plot, så innan du hittar ekvationen för en linjär regressionslinje kanske du vill se data på en scatter-plot först. Se den här artikeln för hur man gör en scatter plot på TI 83.
TI 83 linjär Regression: steg
provproblem: hitta en linjär regressionsekvation( av formen y = ax + b) för x-värden på 1, 2, 3, 4, 5 och y-värden på 3, 9, 27, 64 och 102.
Steg 1: Tryck på STAT och tryck sedan på ENTER för att komma in på skärmen listor. Om du redan har data i L1 eller L2, Rensa data: flytta markören till L1, tryck på CLEAR och sedan ENTER. Upprepa för L2.
steg 2: Ange dina x-variabler, en i taget. Följ varje nummer genom att trycka på ENTER-tangenten. För vår lista anger du:
1 ENTER
2 ENTER
3 ENTER
4 ENTER
5 ENTER
steg 3: Använd piltangenterna för att bläddra över till nästa kolumn, L2.
steg 4: Ange dina y-variabler, en i taget. Följ varje nummer genom att trycka på enter-tangenten. För vår lista skulle du ange:
3 Ange
9 ange
27 ange
64 ange
102 ange
Steg 5: Tryck på STAT-knappen och använd sedan bläddringsknappen för att markera ”CALC.”
steg 6: Tryck 4 för att välja”LinReg(ax+b)”. Tryck på ENTER och sedan på ENTER igen. TI 83 returnerar de variabler som behövs för ekvationen. Sätt bara in de givna variablerna (a, b) i ekvationen för linjär regression (y=ax+b). För ovanstående data är detta y = 25,3 x – 34,9.
det är så man utför TI 83 linjär Regression!
tillbaka till toppen
hur man hittar en linjär Regression lutning: Översikt
Kom ihåg från algebra att lutningen är ”m” i formeln y = mx + b.
i den linjära regressionsformeln är lutningen a i ekvationen y’ = b + ax.
de är i princip samma sak. Så om du blir ombedd att hitta linjär regression lutning, allt du behöver göra är att hitta b på samma sätt som du skulle hitta m.
beräkna linjär regression för hand är knepigt, minst sagt. Det finns en hel del summering (det är en symbol för att lägga till den, vilket innebär att lägga till). De grundläggande stegen är nedan, eller du kan titta på videon i början av den här artikeln. Videon går in mycket mer i detalj om hur man gör summering. Att hitta ekvationen ger dig också lutningen. Om du inte vill hitta lutningen för hand (eller om du vill kontrollera ditt arbete) kan du också använda Excel.
så här hittar du linjär Regressionslutning: steg
Steg 1: Hitta följande data från informationen som ges: Ubix, Ubigy, Ubixy, Ubix2, Ubigy2. Om du inte kommer ihåg hur du får dessa variabler från data, se den här artikeln om hur du hittar en Pearsons korrelationskoefficient. Följ stegen där för att skapa ett bord och hitta Ubix, Ubigy, Ubixy, Ubix2 och Ubisy2.
steg 2: Sätt in data i b-formeln (det finns inget behov av att hitta A).
om formler skrämmer dig kan du hitta mer omfattande instruktioner om hur du arbetar med formeln här: Hur man hittar en linjär regressionsekvation: översikt.
hur man hittar Regression lutning i Excel 2013
prenumerera på vår Youtube-kanal för mycket mer statistik tips och tricks.
tillbaka till toppen
hur man hittar regressionskoefficienten
en regressionskoefficient är samma sak som lutningen på regressionsekvationens linje. Ekvationen för regressionskoefficienten som du hittar på AP-Statistiktestet är: B1 = B1 = ml / kg . ”y” i denna ekvation är medelvärdet för y och ”x”är medelvärdet för x.
du kan hitta regressionskoefficienten för hand (som beskrivs i avsnittet högst upp på denna sida).
du behöver dock inte beräkna regressionskoefficienten för hand i AP-testet-du använder din TI-83-kalkylator. Varför? Att beräkna linjär regression för hand är mycket tidskrävande (Tillåt dig själv cirka 30 minuter att göra beräkningarna och kontrollera dem) och på grund av det stora antalet beräkningar du måste göra är det mycket troligt att du gör matematiska fel. När du hittar en linjär regressionsekvation på TI83 får du regressionskoefficienten som en del av svaret.
provproblem: hitta regressionskoefficienten för följande uppsättning data:
x: 1, 2, 3, 4, 5.
y: 3, 9, 27, 64, 102.
Steg 1: Tryck på STAT och tryck sedan på ENTER för att ange listor. Du kan behöva rensa data om du redan har nummer i L1 eller L2. Rensa data: flytta markören till L1, tryck på Rensa och sedan på ENTER. Upprepa för L2 om du behöver.
steg 2: Ange din x-data i en lista. Tryck på ENTER-tangenten efter varje post.
1 ENTER
2 ENTER
3 ENTER
4 ENTER
5 ENTER
steg 3: Bläddra över till nästa kolumn, L2 med piltangenterna längst upp till höger på knappsatsen.
steg 4: ange y-data:
3 ENTER
9 ENTER
27 ENTER
64 ENTER
102 ENTER
Steg 5: Tryck på STAT-knappen och bläddra sedan för att markera ”CALC.”Tryck på ENTER
steg 6: Tryck 4 för att välja ”LinReg(ax+b)”. Tryck på ENTER. TI 83 returnerar de variabler som behövs för den linjära regressionsekvationen. Värdet du letar efter >regressionskoefficienten > är b, vilket är 25,3 för denna uppsättning data.
det är det!
tillbaka till toppen
linjärt Regressionstestvärde
två linjära regressionslinjer.
linjära regressionstestvärden används i enkel linjär regression exakt på samma sätt som testvärden (som z-score eller T-statistik) används vid hypotesprovning. Istället för att arbeta med Z-tabellen kommer du att arbeta med en T-distributionstabell. Det linjära regressionstestvärdet jämförs med teststatistiken för att hjälpa dig att stödja eller avvisa en nollhypotes.
linjärt Regressionstestvärde: steg
provfråga: Med tanke på en uppsättning data med provstorlek 8 och r = 0,454, hitta det linjära regressionstestvärdet.
Obs: r är korrelationskoefficienten.
Steg 1: Hitta r, korrelationskoefficienten, såvida den inte redan har givits dig i frågan. I detta fall ges r (r = .0454). Inte säker på hur man hittar r? Se: korrelationskoefficient för steg om hur man hittar r.
steg 2: Använd följande formel för att beräkna testvärdet (n är provstorleken):
hur man löser formeln:
det linjära Regressionstestvärdet, T = 1.24811026
det är det!
hitta teststatistiken
det linjära regressionstestvärdet är inte mycket användbart om du inte har något att jämföra det med. Jämför ditt värde med teststatistiken. Teststatistiken är också en T-poäng (t) definierad av följande ekvation:
t = lutning av provregressionslinjen / standardfel i lutningen.
se: hur man hittar en linjär regression lutning / hur man hittar standardfelet i lutningen (TI-83).
Du kan hitta ett arbetat exempel på beräkning av det linjära regressionstestvärdet (med en alfa-nivå) här: korrelationskoefficienter.
tillbaka till toppen
hävstång i linjär Regression
datapunkter som har hävstång har potential att flytta en linjär regressionslinje. De tenderar att vara outliers. En outlier är en punkt som antingen är ett extremt högt eller extremt lågt värde.
inflytelserika punkter
om parametern uppskattar (prov standardavvikelse, varians etc.) ändra signifikant när en outlier tas bort, den datapunkten kallas en inflytelserik observation.
ju mer en datapunkt skiljer sig från medelvärdet för de andra x-värdena, desto mer hävstång har den. Ju mer hävstång en punkt är, desto högre är sannolikheten för att punkten kommer att vara inflytelserik (dvs. det kan ändra parameteruppskattningarna).
hävstång i linjär Regression: hur det påverkar grafer
i linjär regression kommer den inflytelserika punkten (outlier) att försöka dra den linjära regressionslinjen mot sig själv. Diagrammet nedan visar vad som händer med en linjär regressionslinje när outlier a ingår:
två linjära regressionslinjer. Den inflytelserika punkten A ingår i den övre raden men inte i den nedre raden.
Outliers med extrema X-värden (värden som inte ligger inom intervallet för de andra datapunkterna) har mer hävstång i linjär regression än punkter med mindre extrema x-värden. Med andra ord kommer extreme X-value outliers att flytta linjen mer än mindre extrema värden.
Följande diagram visar en datapunkt utanför intervallet för de andra värdena. Värdena sträcker sig från 0 till cirka 70 000. Den här punkten har ett x-värde på cirka 80 000 som ligger utanför intervallet. Det påverkar regressionslinjen mycket mer än punkten i den första bilden ovan, som låg inom intervallet för de andra värdena.
en outlier med hög hävstångseffekt. Punkten har flyttat grafen mer eftersom den ligger utanför intervallet för de andra värdena.
i allmänhet kommer avvikare som har värden nära medelvärdet av x att ha mindre hävstång som avviker mot kanterna på intervallet. Outliers med värden på x utanför intervallet kommer att ha mer hävstångseffekt. Värden som är extrema på y-axeln (jämfört med de andra värdena) kommer att ha mer inflytande än värden närmare de andra y-värdena.
gilla videon? Prenumerera på vår Youtube-kanal.
anslutning till Affin Transformation
linjär regression är oändligt kopplad till Affin transformation. Formeln y ’ = b + ax är inte riktigt linear…it är en affinfunktion, som definieras som en linjär funktion plus en transformation. Så det borde verkligen kallas affine regression, inte linjär!
——————————————————————————
behöver du hjälp med en läxa eller testfråga? Med Chegg Study kan du få steg-för-steg-lösningar på dina frågor från en expert på området. Din första 30 minuter med en Chegg handledare är gratis!
Leave a Reply