Articles

Lineaire Regressie: Eenvoudige Stappen, Video. Find Equation, Coefficient, Slope

Share on

inhoud:

Wat is eenvoudige lineaire regressie?

hoe een lineaire regressievergelijking te vinden:

  1. Hoe een lineaire regressievergelijking met de Hand te vinden.
  2. zoek een lineaire regressievergelijking in Excel.
  3. TI83 lineaire regressie.
  4. TI 89 lineaire regressie

gerelateerde items vinden:

  1. Hoe de regressiecoëfficiënt te vinden.
  2. Zoek de lineaire Regressiehelling.
  3. zoek een lineaire Regressietestwaarde.

hefboom:

  1. hefboom in lineaire regressie.

terug naar boven

Wat is eenvoudige lineaire regressie?

als je net begint te leren over regressieanalyse, is een eenvoudige lineaire het eerste type regressie dat je tegenkomt in een stats-klasse.

lineaire regressie is de meest gebruikte statistische techniek; het is een manier om een relatie tussen twee reeksen variabelen te modelleren. Het resultaat is een lineaire regressievergelijking die kan worden gebruikt om voorspellingen over gegevens te maken.

De meeste softwarepakketten en rekenmachines kunnen lineaire regressie berekenen. Bijvoorbeeld:

  • TI-83.
  • Excel.

u kunt ook een lineaire regressie met de hand vinden.

voordat u uw berekeningen uitvoert, moet u altijd een scatterplot maken om te zien of uw gegevens ruwweg passen bij een lijn. Waarom? Omdat regressie je altijd een vergelijking zal geven, en het kan geen zin hebben als je gegevens een exponentieel model volgen. Als je weet dat de relatie niet-lineair is, maar niet precies weet wat die relatie is, is een oplossing om lineaire basisfunctiemodellen te gebruiken— die populair zijn in machine learning.

etymologie

“lineair” betekent lijn. Het woord regressie kwam van een 19e-eeuwse wetenschapper, Sir Francis Galton, die de term “regressie naar middelmatigheid” (in moderne taal, dat is regressie naar het gemiddelde. Hij gebruikte de term om het fenomeen te beschrijven van hoe de natuur de neiging heeft om overtollige fysieke eigenschappen van generatie op generatie te dempen (zoals extreme hoogte).

waarom lineaire relaties gebruiken?

lineaire relaties, d.w.z. lijnen, zijn gemakkelijker om mee te werken en de meeste verschijnselen zijn van nature lineair gerelateerd. Als variabelen niet lineair gerelateerd zijn, dan kan wat wiskunde die relatie omzetten in een lineaire, zodat het makkelijker is voor de onderzoeker (dat wil zeggen Jij) om te begrijpen.

Wat is eenvoudige lineaire regressie?

u bent waarschijnlijk bekend met het plotten van lijngrafieken met één X-as en één Y-as. De x-variabele wordt soms de onafhankelijke variabele genoemd en de Y-variabele wordt de afhankelijke variabele genoemd. Eenvoudige lineaire regressie plaatst een onafhankelijke variabele X tegen een afhankelijke variabele Y. technisch gezien wordt de onafhankelijke variabele in de regressieanalyse meestal de voorspellende variabele genoemd en wordt de afhankelijke variabele de criteriumvariabele genoemd. Echter, veel mensen noemen ze gewoon de onafhankelijke en afhankelijke variabelen. Meer geavanceerde regressietechnieken (zoals meervoudige regressie) gebruiken meerdere onafhankelijke variabelen.

regressieanalyse kan resulteren in lineaire of niet-lineaire grafieken. Een lineaire regressie is waar de relaties tussen uw variabelen kunnen worden beschreven met een rechte lijn. Niet-lineaire regressies produceren gebogen lijnen.(**)

eenvoudige lineaire regressie voor de hoeveelheid neerslag per jaar.

regressieanalyse wordt bijna altijd uitgevoerd door een computerprogramma, omdat de vergelijkingen zeer tijdrovend zijn om met de hand uit te voeren.

* * omdat dit een inleiding is, hield ik het simpel. Maar er is eigenlijk een belangrijk technisch verschil tussen lineair en niet-lineair, dat belangrijker wordt als je regressie blijft bestuderen. Voor details, zie het artikel over niet-lineaire regressie.
Back to top

hoe een lineaire regressievergelijking te vinden: overzicht

regressieanalyse wordt gebruikt om vergelijkingen te vinden die bij de gegevens passen. Zodra we de regressievergelijking hebben, kunnen we het model gebruiken om voorspellingen te doen. Een type regressieanalyse is lineaire analyse. Wanneer een correlatiecoëfficiënt laat zien dat gegevens waarschijnlijk in staat zijn om toekomstige resultaten te voorspellen en een scatterplot van de gegevens een rechte lijn lijkt te vormen, kunt u eenvoudige lineaire regressie gebruiken om een voorspellende functie te vinden. Als u zich herinnert uit de elementaire algebra, is de vergelijking voor een lijn y = mx + b. Dit artikel laat u zien hoe u gegevens neemt, lineaire regressie berekent en de vergelijking y’ = a + bx vindt. Opmerking: als je AP statistieken neemt, zie je de vergelijking geschreven als b0 + b1x, wat hetzelfde is (je gebruikt gewoon de variabelen b0 + b1 in plaats van a + b.

bekijk de video of lees de onderstaande stappen om een lineaire regressievergelijking met de hand te vinden. Nog steeds verward? Bekijk de tutors op Chegg.com. je eerste 30 minuten is gratis!

accepteer statistieken, marketingcookies om deze video te bekijken.

de lineaire regressievergelijking

lineaire regressie is een manier om de relatie tussen twee variabelen te modelleren. Je zou de vergelijking ook kunnen herkennen als de hellingsformule. De vergelijking heeft de vorm Y = a + bX, waarbij Y de afhankelijke variabele is (dat is de variabele die op de Y-as gaat), X is de onafhankelijke variabele (d.w.z. het is uitgezet op de x-as), b is de helling van de lijn en a is de Y-as.

de eerste stap in het vinden van een lineaire regressievergelijking is om te bepalen of er een verband is tussen de twee variabelen. Dit is vaak een oordeel oproep voor de onderzoeker. U hebt ook een lijst van uw gegevens in X-y formaat nodig (dat wil zeggen twee kolommen van data—onafhankelijke en afhankelijke variabelen).

waarschuwingen:

  1. alleen omdat twee variabelen gerelateerd zijn, betekent dit niet dat de ene de andere veroorzaakt. Bijvoorbeeld, hoewel er een relatie tussen hoge GRE scores en betere prestaties in grad school, het betekent niet dat hoge GRE scores leiden tot goede grad schoolprestaties.
  2. Als u probeert een lineaire regressievergelijking voor een verzameling gegevens te vinden (vooral via een geautomatiseerd programma zoals Excel of een TI-83), zult u er een vinden, maar dat betekent niet noodzakelijk dat de vergelijking goed past bij uw gegevens. Een techniek is om eerst een scatterplot te maken, om te zien of de gegevens ruwweg passen bij een lijn voordat je probeert een lineaire regressievergelijking te vinden.

hoe een lineaire regressievergelijking te vinden: stappen

Stap 1: Maak een grafiek van uw gegevens en vul de kolommen in op dezelfde manier als u de grafiek zou invullen als u de correlatiecoëfficiënt van Pearson zou vinden.

Subject Age x Glucose Level y xy x2 y2
1 43 99 4257 1849 9801
2 21 65 1365 441 4225
3 25 79 1975 625 6241
4 42 75 3150 1764 5625
5 57 87 4959 3249 7569
6 59 81 4779 3481 6561
Σ 247 486 20485 11409 40022

Uit de bovenstaande tabel, Σx = 247, Σy = 486, Σxy = 20485, Σx2 = 11409, Σy2 = 40022. n is de steekproefgrootte (6, in ons geval).

Stap 2: Gebruik de volgende vergelijkingen om a en b te vinden.

a = 65.1416
b = .385225

Klik hier als u eenvoudige, stapsgewijze instructies wilt voor het oplossen van deze formule.

zoek een:

  • ((486 × 11,409) – ((247 × 20,485)) / 6 (11,409) – 2472)
  • 484979 / 7445
  • =65.14

b:

  • (6(20,485) – (247 × 486)) / (6 (11409) – 2472)
  • (122,910 – 120,042) / 68,454 – 2472
  • 2,868 / 7,445
  • = .385225

Stap 3: Voeg de waarden in de vergelijking in.
y ‘= a + bx
y ‘ = 65.14 + .385225x

zo vind je een lineaire regressievergelijking met de hand!

zoals de uitleg? Check out de Practically Cheating Statistics Handbook, die honderden meer stap-voor-stap oplossingen heeft, net als deze!

* merk op dat dit voorbeeld een lage correlatiecoëfficiënt heeft, en daarom niet al te goed zou zijn in het voorspellen van iets.
Terug naar boven

zoek een lineaire regressievergelijking in Excel

bekijk de video of lees de onderstaande stappen:

accepteer statistieken, marketingcookies om deze video te bekijken.

Lineaire regressievergelijking Microsoft Excel: stappen

Stap 1: Installeer de Data Analysis Toolpak, als deze nog niet is geïnstalleerd. Voor instructies over het laden van de Data Analysis Toolpak, Klik hier.

Stap 2: Typ uw gegevens in twee kolommen in Excel. Typ bijvoorbeeld Uw” x “- gegevens in kolom A en uw” y ” – gegevens in kolom b. laat geen lege cellen achter tussen uw gegevens.

Stap 3: Klik op het tabblad” Data Analysis ” op de Excel-werkbalk.

Stap 4: Klik op “regressie” in het pop-upvenster en klik vervolgens op ” OK.”

het pop-upvenster voor gegevensanalyse heeft vele opties, waaronder lineaire regressie.

Stap 5: Selecteer uw invoerbereik y. U kunt dit op twee manieren doen: selecteer de gegevens in het werkblad of typ de locatie van uw gegevens in de “Input Y Range doos.”Als uw Y-gegevens bijvoorbeeld in A2 tot en met A10 zijn, typ dan “A2:A10” in de invoer Y bereik doos.

Stap 6: Selecteer uw invoer X bereik door de gegevens in het werkblad te selecteren of de locatie van uw gegevens te typen in de “invoer X bereik doos.”

Stap 7: Selecteer de locatie waar u uw uitvoerbereik naar toe wilt door een leeg gebied in het werkblad te selecteren of de locatie te typen van waar u uw gegevens naar toe wilt in het vak “Uitvoerbereik”.

Stap 8: Klik op “OK”. Excel berekent de lineaire regressie en vult uw werkblad met de resultaten.

Tip: de informatie over de lineaire regressievergelijking wordt gegeven in de laatste uitvoerset (kolom coëfficiënten). Het eerste item in de” Intercept “rij is” a “(de y-intercept) en het eerste item in de” x “kolom is” b ” (De Helling).

terug naar boven

TI83 lineaire regressie

bekijk de video of lees de onderstaande stappen:

accepteer statistieken, marketingcookies om deze video te bekijken.

twee lineaire regressielijnen.

TI 83 lineaire regressie: overzicht

lineaire regressie is vervelend en vatbaar voor fouten wanneer dit met de hand wordt gedaan, maar u kunt lineaire regressie uitvoeren in de tijd die nodig is om een paar variabelen in een lijst in te voeren. Lineaire regressie geeft u alleen een redelijk resultaat als uw gegevens eruit zien als een lijn op een scatterplot, dus voordat u de vergelijking voor een lineaire regressielijn vindt, wilt u misschien eerst de gegevens op een scatterplot bekijken. Zie dit artikel voor het maken van een scatter plot op de TI 83.

TI 83 lineaire regressie: stappen

Monsterprobleem: zoek een lineaire regressievergelijking (van de vorm y = ax + b) Voor x-waarden van 1, 2, 3, 4, 5 en y-waarden van 3, 9, 27, 64 en 102.

Stap 1: Druk op STAT, druk vervolgens op ENTER om het scherm lijsten in te voeren. Als u al gegevens in L1 of L2 hebt, wis de gegevens: verplaats de cursor naar L1, druk op Wissen en voer vervolgens in. Herhaal voor L2.

Stap 2: Voer uw X-variabelen één voor één in. Volg elk nummer door op de ENTER-toets te drukken. Voor onze lijst zou u het volgende invoeren:
1 ENTER
2 ENTER
3 ENTER
4 ENTER
5 ENTER

Stap 3: Gebruik de pijltjestoetsen om door te bladeren naar de volgende kolom, L2.

Stap 4: Voer uw Y-variabelen één voor één in. Volg elk nummer door op de enter-toets te drukken. Voor onze lijst zou u het volgende invoeren:
3 ENTER
9 ENTER
27 ENTER
64 ENTER
102 ENTER

Stap 5: Druk op de knop STAT en gebruik vervolgens de scroll-toets om “CALC te markeren.”


Stap 6: Druk op 4 om”LinReg(ax+b)” te kiezen. Druk op ENTER en voer opnieuw in. De TI 83 geeft de variabelen terug die nodig zijn voor de vergelijking. Voeg gewoon de gegeven variabelen (A, b) in de vergelijking voor lineaire regressie (y=ax+b). Voor de bovenstaande gegevens is dit y = 25.3 x-34.9.

zo voer je TI 83 lineaire regressie uit!

terug naar boven

een lineaire Regressiehelling vinden: Overzicht

onthoud uit de algebra dat de helling de “m” is in de formule y = mx + b.
in de lineaire regressieformule is de helling de A in de vergelijking y’ = b + ax.
ze zijn in principe hetzelfde. Dus als je gevraagd wordt om lineaire regressiehelling te vinden, hoef je alleen maar b te vinden op dezelfde manier als m.lineaire regressie met de hand berekenen is op zijn zachtst gezegd lastig. Er is veel sommatie (dat is het Σ symbool, wat optellen betekent). De basisstappen staan hieronder, of u kunt de video aan het begin van dit artikel bekijken. De video gaat in veel meer detail over hoe sommatie te doen. Het vinden van de vergelijking geeft je ook de helling. Als u de helling niet met de hand wilt vinden (of als u uw werk wilt controleren), kunt u ook Excel gebruiken.

hoe Lineaire Regressiehelling te vinden: stappen

Stap 1: Zoek de volgende gegevens uit de gegeven informatie: Σx, Σy, Σxy, Σx2, Σy2. Als je niet meer weet hoe je die variabelen uit gegevens kunt halen, zie dan dit artikel over hoe je de correlatiecoëfficiënt van Pearson kunt vinden. Volg de stappen daar om een lijst te creëren en Σx, Σy, Σxy, Σx2, en Σy2 te vinden.

Stap 2: Voeg de gegevens in de formule b in (het is niet nodig om a te vinden).

als formules u bang maken, kunt u meer uitgebreide instructies vinden over hoe de formule werkt: hoe vindt u een lineaire regressievergelijking: overzicht.

Regressiehelling vinden in Excel 2013

accepteer statistieken, marketingcookies om deze video te bekijken.

Abonneer je op ons Youtube-kanaal voor nog veel meer statistieken tips en trucs.


Back to top

hoe de regressiecoëfficiënt te vinden

een regressiecoëfficiënt is hetzelfde als de helling van de lijn van de regressievergelijking. De vergelijking voor de regressiecoëfficiënt die u vindt op de AP Statistics test is: B1 = B1 = Σ / Σ . “y “in deze vergelijking is het gemiddelde van y en” x”is het gemiddelde van x.

U kunt de regressiecoëfficiënt met de hand vinden (zoals beschreven in de sectie bovenaan deze pagina).
U hoeft de regressiecoëfficiënt echter niet met de hand te berekenen in de AP — test-u gebruikt uw TI-83 calculator. Waarom? Lineaire regressie met de hand berekenen is erg tijdrovend (laat jezelf ongeveer 30 minuten om de berekeningen te doen en te controleren) en vanwege het enorme aantal berekeningen die je moet maken ben je zeer waarschijnlijk wiskundige fouten te maken. Als je een lineaire regressievergelijking op de TI83 vindt, krijg je de regressiecoëfficiënt als deel van het antwoord.

Monsterprobleem: Zoek de regressiecoëfficiënt voor de volgende reeks gegevens:
x: 1, 2, 3, 4, 5.
y: 3, 9, 27, 64, 102.

Stap 1: Druk op STAT, druk vervolgens op ENTER om lijsten in te voeren. Mogelijk moet u Gegevens wissen Als u al getallen in L1 of L2 hebt. Gegevens wissen: verplaats de cursor naar L1, druk op Wissen en voer vervolgens in. Herhaal dit voor L2 als het nodig is.

Stap 2: Voer uw x-gegevens in een lijst in. Druk na elke invoer op de ENTER-toets.
1 ENTER
2 ENTER
3 ENTER
4 ENTER
5 ENTER

Stap 3: Scroll naar de volgende kolom, L2 met de pijltjestoetsen rechtsboven op het toetsenbord.

Stap 4: Voer de y-gegevens in:
3 ENTER
9 ENTER
27 ENTER
64 ENTER
102 ENTER

Stap 5: Druk op de knop STAT, scroll dan om “CALC te markeren.”Druk op ENTER

Stap 6: Druk op 4 om “LinReg(ax+b)”te kiezen. Druk op ENTER. De TI 83 geeft de variabelen terug die nodig zijn voor de lineaire regressievergelijking. De waarde die u zoekt >de regressiecoëfficiënt > is b, wat 25.3 is voor deze verzameling gegevens.

dat is het!
Back to top

Lineaire Regressietestwaarde

twee lineaire regressielijnen.

Lineaire regressietestwaarden worden bij eenvoudige lineaire regressie op precies dezelfde manier gebruikt als testwaarden (zoals de Z-score of T-statistiek) bij het testen van hypothesen. In plaats van te werken met de Z-tafel zal je werken met een T-distributie tabel. De lineaire regressietestwaarde wordt vergeleken met de teststatistiek om u te helpen een nulhypothese te ondersteunen of af te wijzen.

Lineaire Regressietestwaarde: stappen

steekproefvraag: Gegeven een reeks gegevens met steekproefgrootte 8 en r = 0,454, vind de lineaire regressietestwaarde.

opmerking: r is de correlatiecoëfficiënt.

Stap 1: Zoek r, de correlatiecoëfficiënt, tenzij deze al aan u is gegeven in de vraag. In dit geval wordt r gegeven (r = .0454). Weet je niet zeker hoe je r kunt vinden? Zie: correlatiecoëfficiënt voor stappen om r te vinden.

Stap 2: Gebruik de volgende formule om de testwaarde te berekenen (n is de steekproefgrootte):

hoe de formule op te lossen:

De lineaire Regressietestwaarde, T = 1.24811026

dat is het!

het vinden van de teststatistiek

De lineaire regressietestwaarde heeft niet veel zin, tenzij u iets hebt om het mee te vergelijken. Vergelijk uw waarde met de teststatistiek. De teststatistiek is ook een T-score (t) die wordt gedefinieerd met de volgende vergelijking:
t = helling van de regressielijn van de steekproef / standaardfout van de helling.
zie: hoe een lineaire regressiehelling te vinden / hoe de standaardfout van de helling te vinden (TI-83).

Hier vindt u een gewerkt voorbeeld van het berekenen van de lineaire regressietestwaarde (met een alfaniveau): correlatiecoëfficiënten.

Back to top

hefboomwerking in lineaire regressie

gegevenspunten die hefboomwerking hebben, hebben het potentieel om een lineaire regressielijn te verplaatsen. Ze zijn meestal uitschieters. Een uitschieter is een punt dat ofwel een extreem hoge of extreem lage waarde.

invloedrijke punten

indien de parameter schat (standaarddeviatie van het monster, variantie enz.) significant veranderen wanneer een uitschieter wordt verwijderd, wordt dat gegevenspunt een invloedrijke observatie genoemd.

hoe meer een gegevenspunt verschilt van het gemiddelde van de andere x-waarden, hoe meer hefboomwerking het heeft. Hoe meer hefboomwerking een punt is, hoe hoger de kans dat punt invloedrijk zal zijn (dat wil zeggen dat het de parameterschattingen zou kunnen veranderen).

hefboomwerking in lineaire regressie: hoe het grafieken beïnvloedt

in lineaire regressie zal het invloedrijke punt (uitschieter) proberen de lineaire regressielijn naar zichzelf toe te trekken. De onderstaande grafiek laat zien wat er gebeurt met een lineaire regressielijn wanneer uitschieter A wordt opgenomen:

twee lineaire regressielijnen. Het invloedrijke punt A is opgenomen in de bovenste lijn, maar niet in de onderste lijn.

uitschieters met extreme X-waarden (waarden die niet binnen het bereik van de andere gegevenspunten liggen) hebben meer hefboomwerking in lineaire regressie dan punten met minder extreme x-waarden. Met andere woorden, extreme x-waarde uitschieters zullen de lijn meer dan minder extreme waarden verplaatsen.

de volgende grafiek toont een gegevenspunt buiten het bereik van de andere waarden. De waarden variëren van 0 tot ongeveer 70.000. Dit punt heeft een x-waarde van ongeveer 80.000 wat buiten het bereik ligt. Het beïnvloedt de regressielijn veel meer dan het punt in de eerste afbeelding hierboven, dat binnen het bereik van de andere waarden lag.

A high-leverage outlier. Het punt heeft de grafiek meer verplaatst omdat het buiten het bereik van de andere waarden ligt.

in het algemeen hebben uitschieters die waarden hebben die dicht bij het gemiddelde van x liggen minder hefboomwerking dan uitschieters naar de randen van het bereik. Uitschieters met waarden van x buiten het bereik hebben meer hefboomwerking. Waarden die extreem zijn op de y-as (vergeleken met de andere waarden) zullen meer invloed hebben dan waarden dichter bij de andere y-waarden.

zoals de video ‘ s? Abonneer u op ons Youtube-kanaal.

verbinding met affiene transformatie

lineaire regressie is oneindig verbonden met affiene transformatie. De formule y ‘= b + ax is niet echt linear…it ‘ s een affiene functie, die wordt gedefinieerd als een lineaire functie plus een transformatie. Dus het moet echt affiene regressie worden genoemd, niet lineair!

——————————————————————————eeft u hulp nodig met een huiswerk-of testvraag? Met Chegg Study krijgt u stap-voor-stap oplossingen voor uw vragen van een expert in het veld. Je eerste 30 minuten met een Chegg tutor is gratis!