Articles

Lineær Regression: Enkle Trin, Video. Find ligning, koefficient, hældning

Del på

indhold:

Hvad er simpel lineær Regression?

Sådan finder du en lineær regressionsligning:

  1. Sådan finder du en lineær regressionsligning for hånd.
  2. Find en lineær regressionsligning.
  3. Ti83 lineær Regression.
  4. TI 89 lineær Regression

Find relaterede emner:

  1. Sådan finder du regressionskoefficienten.
  2. Find den lineære Regressionshældning.
  3. Find en lineær Regressionstestværdi.

gearing:

  1. gearing i lineær Regression.

Tilbage til toppen

Hvad er simpel lineær Regression?

Hvis du lige er begyndt at lære om regressionsanalyse, er en simpel lineær den første type regression, du kommer på tværs i en statistikklasse.

lineær regression er den mest anvendte statistiske teknik; det er en måde at modellere et forhold mellem to sæt variabler. Resultatet er en lineær regressionsligning, der kan bruges til at forudsige data.

de fleste programpakker og regnemaskiner kan beregne lineær regression. For eksempel:

  • TI-83.
  • udmærke sig.

Du kan også finde en lineær regression for hånd.

før du prøver dine beregninger, skal du altid lave et scatter-plot for at se, om dine data stort set passer til en linje. Hvorfor? Fordi regression altid vil give dig en ligning, og det giver muligvis ikke mening, hvis dine data følger en eksponentiel model. Hvis du ved, at forholdet er ikke— lineært, men ikke ved præcis, hvad det forhold er, er en løsning at bruge lineære basisfunktionsmodeller-som er populære i maskinindlæring.

etymologi

“lineær” betyder linje. Ordet Regression kom fra en videnskabsmand fra det 19.århundrede, Sir Francis Galton, der opfandt udtrykket “regression mod middelmådighed” (på moderne sprog er det regression til middelværdien. Han brugte udtrykket til at beskrive fænomenet, hvordan naturen har tendens til at dæmpe overskydende fysiske træk fra generation til generation (som ekstrem højde).

Hvorfor bruge lineære relationer?

lineære relationer, dvs. linjer, er lettere at arbejde med, og de fleste fænomener er naturligt lineært relaterede. Hvis variabler ikke er lineært relaterede, kan nogle matematik omdanne dette forhold til en lineær, så det er lettere for forskeren (dvs.Dig) at forstå.

Hvad er simpel lineær Regression?

du er sikkert bekendt med at plotte linjegrafer med en H-akse og en Y-akse. Variablen kaldes undertiden den uafhængige variabel, og Y-variablen kaldes den afhængige variabel. Teknisk set kaldes den uafhængige variabel i regressionsanalyse normalt forudsigelsesvariablen, og den afhængige variabel kaldes kriterievariablen. Men mange mennesker kalder dem bare de uafhængige og afhængige variabler. Mere avancerede regressionsteknikker (som multipel regression) bruger flere uafhængige variabler.

regressionsanalyse kan resultere i lineære eller ikke-lineære grafer. En lineær regression er, hvor forholdet mellem dine variabler kan beskrives med en lige linje. Ikke-lineære regressioner producerer buede linjer.(**)

enkel lineær regression for mængden af nedbør pr.

regressionsanalyse udføres næsten altid af et computerprogram, da ligningerne er ekstremt tidskrævende at udføre manuelt.

* * da dette er en indledende artikel, holdt jeg det simpelt. Men der er faktisk en vigtig teknisk forskel mellem lineær og ikke-lineær, det bliver vigtigere, hvis du fortsætter med at studere regression. For detaljer, se artiklen om ikke-lineær regression.
Tilbage til toppen

Sådan finder du en lineær regressionsligning: oversigt

regressionsanalyse bruges til at finde ligninger, der passer til data. Når vi har regressionsligningen, kan vi bruge modellen til at lave forudsigelser. En type regressionsanalyse er lineær analyse. Når en korrelationskoefficient viser, at data sandsynligvis vil være i stand til at forudsige fremtidige resultater, og et scatter-plot af dataene ser ud til at danne en lige linje, kan du bruge simpel lineær regression til at finde en forudsigende funktion. Hvis du husker fra elementær algebra, er ligningen for en linje y = MKS + b.Denne artikel viser dig, hvordan du tager data, beregner lineær regression og finder ligningen y’ = a + BKS. Bemærk: Hvis du tager AP-statistik, kan du se ligningen skrevet som b0 + B1H, hvilket er det samme (du bruger bare variablerne b0 + b1 i stedet for a + b.

se videoen, eller læs nedenstående trin for at finde en lineær regressionsligning manuelt. Stadig forvirret? Tjek vejlederne på Chegg.com. dine første 30 minutter er gratis!

accepter venligst statistik, marketing cookies for at se denne video.

den lineære regressionsligning

lineær regression er en måde at modellere forholdet mellem to variabler. Du kan også genkende ligningen som hældningsformlen. Ligningen har formen Y= a + BKS, hvor Y er den afhængige variabel (det er variablen, der går på Y-aksen), er den uafhængige variabel (dvs. det er tegnet på aksen), b er linjens hældning og A er y-skæringspunktet.

det første trin i at finde en lineær regressionsligning er at bestemme, om der er et forhold mellem de to variabler. Dette er ofte en dom opfordring til forskeren. Du har også brug for en liste over dine data i Y-format (dvs.to kolonner med datauafhængige og afhængige variabler).

advarsler:

  1. bare fordi to variabler er relaterede, betyder det ikke, at den ene forårsager den anden. For eksempel, selvom der er et forhold mellem høje GRE-scoringer og bedre præstationer i grundskolen, betyder det ikke, at høje GRE-scoringer medfører god gradskolepræstation.
  2. hvis du forsøger at finde en lineær regressionsligning for et datasæt (især gennem et automatiseret program som f.eks. En teknik er først at lave et scatter-plot for at se, om dataene groft passer til en linje, før du prøver at finde en lineær regressionsligning.

Sådan finder du en lineær regressionsligning: trin

Trin 1: Lav et diagram over dine data, udfyld kolonnerne på samme måde som du ville udfylde diagrammet, hvis du fandt Pearsons korrelationskoefficient.

Subject Age x Glucose Level y xy x2 y2
1 43 99 4257 1849 9801
2 21 65 1365 441 4225
3 25 79 1975 625 6241
4 42 75 3150 1764 5625
5 57 87 4959 3249 7569
6 59 81 4779 3481 6561
Σ 247 486 20485 11409 40022

Fra den ovenstående tabel, Σx = 247, Σy = 486, Σxy = 20485, Σx2 = 11409, Σy2 = 40022. n er prøvestørrelsen (6, i vores tilfælde).

Trin 2: Brug følgende ligninger til at finde a og b.

a = 65.1416
b = .385225

Klik her, hvis du vil have nemme, trinvise instruktioner til løsning af denne formel.

Find en:

  • ((486 × 11,409) – ((247 × 20,485)) / 6 (11,409) – 2472)
  • 484979 / 7445
  • =65.14

Find b:

  • (6(20,485) – (247 × 486)) / (6 (11409) – 2472)
  • (122,910 – 120,042) / 68,454 – 2472
  • 2.868/7.445
  • = .385225

Trin 3: Indsæt værdierne i ligningen.
y’ = a + b
y’ = 65.14 + .385225h

Sådan finder du en lineær regressionsligning for hånd!

ligesom forklaringen? Tjek praktisk talt Snyd statistik håndbog, som har hundredvis flere trin-for-trin løsninger, ligesom denne ene!

* Bemærk, at dette eksempel har en lav korrelationskoefficient og derfor ikke ville være for god til at forudsige noget.
Tilbage til toppen

Find en lineær regressionsligning i

se videoen eller læs nedenstående trin:

accepter venligst statistik, marketing cookies for at se denne video.

lineær regressionsligning Microsoft udmærker sig: trin

Trin 1: Installer Dataanalyseværktøjetpak, hvis det ikke allerede er installeret. For instruktioner om, hvordan du indlæser Dataanalyseværktøjetpak, Klik her.Trin 2: Indtast dine data i to kolonner. Skriv f. eks.dine” H “- data i kolonne A og dine” y ” – data i kolonne b. Efterlad ikke tomme celler mellem dine indtastninger.

Trin 3: Klik på fanen “dataanalyse” på værktøjslinjen.

Trin 4: Klik på “regression” i pop op-vinduet, og klik derefter på “OK.”

pop op-vinduet dataanalyse har mange muligheder, herunder lineær regression.

Trin 5: Vælg dit input Y-interval. Du kan gøre dette på to måder: vælg enten dataene i regnearket, eller skriv placeringen af dine data i feltet “Input Y rækkevidde.”Hvis dine Y-data f.eks. er i A2 til A10, skal du skrive” A2:A10 ” i feltet Input Y-område.

Trin 6: Vælg dit input-område ved at vælge dataene i regnearket eller skrive placeringen af dine data i feltet “Input-område.”

Trin 7: Vælg den placering, hvor dit outputområde skal gå, ved at vælge et tomt område i regnearket eller skrive placeringen af, hvor du vil have dine data til at gå i feltet “outputområde”.

Trin 8: Klik på”OK”. Beregne den lineære regression og udfylde dit regneark med resultaterne.

Tip: den lineære regressionsligningsinformation er angivet i det sidste outputsæt (kolonnen koefficienter). Den første post i rækken “Intercept” er “a” (y-intercept), og den første post i kolonnen “H” er “b” (hældningen).

Tilbage til toppen

TI83 lineær Regression

se videoen eller læs nedenstående trin:

accepter venligst statistik, marketing cookies for at se denne video.

to lineære regressionslinjer.

TI 83 lineær Regression: oversigt

lineær regression er kedelig og tilbøjelig til fejl, når den udføres manuelt, men du kan udføre lineær regression i den tid, det tager dig at indtaste et par variabler på en liste. Lineær regression vil kun give dig et rimeligt resultat, hvis dine data ligner en linje på et scatter-plot, så før du finder ligningen for en lineær regressionslinje, vil du måske først se dataene på et scatter-plot. Se denne artikel for, hvordan man laver et scatter plot på TI 83.

TI 83 lineær Regression: trin

Prøveproblem: Find en lineær regressionsligning (af formen y = økse + b) for H-værdier på 1, 2, 3, 4, 5 og y-værdier på 3, 9, 27, 64 og 102.

Trin 1: Tryk på STAT, og tryk derefter på ENTER for at åbne skærmbilledet lister. Hvis du allerede har data i L1 eller L2, skal du rydde dataene: flyt markøren til L1, tryk på Ryd og derefter ENTER. Gentag for L2.

Trin 2: Indtast dine variabler, en ad gangen. Følg hvert nummer ved at trykke på ENTER-tasten. For vores liste skal du indtaste:
1 ENTER
2 ENTER
3 ENTER
4 ENTER
5 ENTER

Trin 3: Brug piletasterne til at rulle over til den næste kolonne, L2.

Trin 4: Indtast dine y-variabler, en ad gangen. Følg hvert nummer ved at trykke på enter-tasten. For vores liste skal du indtaste:
3 Indtast
9 Indtast
27 indtast
64 indtast
102 indtast

Trin 5: Tryk på STAT-knappen, og brug derefter rulletasten til at fremhæve “CALC.”


Trin 6: Tryk på 4 for at vælge”LinReg(økse+b)”. Tryk på ENTER og derefter på ENTER igen. TI 83 returnerer de variabler, der er nødvendige for ligningen. Indsæt bare de givne variabler (a, b) i ligningen for lineær regression (y=økse+b). For ovenstående data er dette y = 25,3 gange – 34,9.

Sådan udføres TI 83 lineær Regression!

Tilbage til toppen

Sådan finder du en lineær Regressionshældning: Oversigt

Husk fra algebra, at hældningen er ” m “i formlen y = MH + b.
i den lineære regressionsformel er hældningen A i ligningen y’ = b + økse.
det er stort set det samme. Så hvis du bliver bedt om at finde lineær regressionshældning, er alt hvad du skal gøre at finde b på samme måde som du ville finde m.
beregning af lineær regression for hånd er mildest talt vanskelig. Der er en masse summation (det er det røde symbol, hvilket betyder at tilføje op). De grundlæggende trin er nedenfor, eller du kan se videoen i begyndelsen af denne artikel. Videoen går meget mere i detaljer om, hvordan man opsummerer. At finde ligningen vil også give dig hældningen. Hvis du ikke vil finde hældningen manuelt (eller hvis du vil kontrollere dit arbejde), kan du også bruge.

Sådan finder du lineær Regressionshældning: trin

Trin 1: Find følgende data fra de givne oplysninger:. Hvis du ikke kan huske, hvordan du får disse variabler fra data, kan du se denne artikel om, hvordan du finder en Pearsons korrelationskoefficient. Følg trinnene der for at oprette en tabel og finde en tabel.

Trin 2: Indsæt dataene i B-formlen (der er ingen grund til at finde a).

hvis formler skræmmer dig, kan du finde mere omfattende instruktioner om, hvordan du arbejder formlen her: Sådan finder du en lineær regressionsligning: oversigt.

Sådan finder du Regressionshældning i 2013

accepter venligst statistik, marketing cookies for at se denne video.

Abonner på vores Youtube-kanal for meget mere statistik tips og tricks.


Tilbage til toppen

Sådan finder du regressionskoefficienten

en regressionskoefficient er den samme som hældningen af linjen i regressionsligningen. Ligningen for regressionskoefficienten, som du finder på Ap-Statistiktesten, er: B1 = B1 = Kr / Kr .

du kan finde regressionskoefficienten manuelt (som beskrevet i afsnittet øverst på denne side).
du behøver dog ikke at beregne regressionskoefficienten manuelt i AP — testen-du bruger din TI-83-lommeregner. Hvorfor? Beregning lineær regression i hånden er meget tidskrævende (Tillad dig selv omkring 30 minutter til at gøre beregningerne og kontrollere dem) og på grund af det enorme antal beregninger, du er nødt til at gøre du er meget tilbøjelige til at gøre matematiske fejl. Når du finder en lineær regressionsligning på TI83, får du regressionskoefficienten som en del af svaret.

Prøveproblem: find regressionskoefficienten for følgende datasæt:
: 1, 2, 3, 4, 5.
y: 3, 9, 27, 64, 102.

Trin 1: Tryk på STAT, og tryk derefter på ENTER for at indtaste lister. Det kan være nødvendigt at rydde data, hvis du allerede har tal i L1 eller L2. Sådan rydder du dataene: flyt markøren til L1, tryk på Ryd og derefter ENTER. Gentag for L2, hvis du har brug for det.

Trin 2: Indtast dine data på en liste. Tryk på ENTER-tasten efter hver post.
1 ENTER
2 ENTER
3 ENTER
4 ENTER
5 ENTER

Trin 3: Rul over til næste kolonne, L2 ved hjælp af piletasterne øverst til højre på tastaturet.

Trin 4: Indtast y-data:
3 ENTER
9 ENTER
27 ENTER
64 ENTER
102 ENTER

Trin 5: Tryk på STAT-knappen, og rul derefter for at fremhæve “CALC.”Tryk på ENTER

Trin 6: Tryk på 4 for at vælge “LinReg(økse+b)”. Tryk på ENTER. TI 83 returnerer de variabler, der er nødvendige for den lineære regressionsligning. Den værdi, du leder efter >regressionskoefficienten > er b, hvilket er 25.3 for dette datasæt.

det er det!
Tilbage til toppen

lineær Regressionstestværdi

to lineære regressionslinjer.

lineære regressionstestværdier anvendes i simpel lineær regression nøjagtigt på samme måde som testværdier (som f.eks. I stedet for at arbejde med T-tabellen arbejder du med en T-distributionstabel. Den lineære regressionstestværdi sammenlignes med teststatistikken for at hjælpe dig med at understøtte eller afvise en nulhypotese.

lineær Regressionstestværdi: trin

Prøvespørgsmål: Givet et sæt data med prøvestørrelse 8 og r = 0,454, find den lineære regressionstestværdi.

Bemærk: r er korrelationskoefficienten.

Trin 1: Find r, korrelationskoefficienten, medmindre den allerede er givet til dig i spørgsmålet. I dette tilfælde gives r (r = .0454). Ikke sikker på, hvordan man finder r? Se: korrelationskoefficient for trin til, hvordan man finder r.

Trin 2: Brug følgende formel til at beregne testværdien (n er prøvestørrelsen):

Sådan løses formlen:

den lineære Regressionstestværdi, T = 1.24811026

det er det!

find teststatistikken

den lineære regressionstestværdi er ikke meget brug, medmindre du har noget at sammenligne det med. Sammenlign din værdi med teststatistikken. Teststatistikken er også en t-score (t) defineret af følgende ligning:
t = hældning af prøveregressionslinjen / standardfejl i hældningen.
se: Sådan finder du en lineær regressionshældning / Sådan finder du standardfejl i hældningen (TI-83).

Du kan finde et bearbejdet eksempel på beregning af den lineære regressionstestværdi (med et alfa-niveau) her: korrelationskoefficienter.

Tilbage til toppen

gearing i lineær Regression

datapunkter, der har gearing, har potentialet til at flytte en lineær regressionslinje. De har tendens til at være outliers. En outlier er et punkt, der enten er en ekstremt høj eller ekstremt lav værdi.

indflydelsesrige punkter

hvis parameteren estimerer (prøvestandardafvigelse, varians osv.) ændre sig markant når en outlier fjernes, kaldes dette datapunkt en indflydelsesrig observation.

jo mere et datapunkt adskiller sig fra gennemsnittet af de andre værdier, jo mere gearing har det. Jo mere gearing et punkt er, jo højere er sandsynligheden for, at punktet vil være indflydelsesrig (dvs.det kan ændre parameterestimaterne).

gearing i lineær Regression: hvordan det påvirker grafer

i lineær regression vil det indflydelsesrige punkt (outlier) forsøge at trække den lineære regressionslinje mod sig selv. Grafen nedenfor viser, hvad der sker med en lineær regressionslinje, når outlier A er inkluderet:

to lineære regressionslinjer. Det indflydelsesrige punkt A er inkluderet i den øverste linje, men ikke i den nederste linje.

Outliers med ekstreme værdier (værdier, der ikke er inden for området for de andre datapunkter) har mere gearing i lineær regression end punkter med mindre ekstreme værdier. Med andre ord vil ekstreme outliers flytte linjen mere end mindre ekstreme værdier.

følgende graf viser et datapunkt uden for området for de andre værdier. Værdierne spænder fra 0 til omkring 70.000. 80.000, som ligger uden for området. Det påvirker regressionslinjen meget mere end punktet i det første billede ovenfor, som var inden for området for de andre værdier.

en høj gearing outlier. Punktet har flyttet grafen mere, fordi den ligger uden for rækkevidden af de andre værdier.

generelt vil outliers, der har værdier tæt på gennemsnittet af H, have mindre gearing, der outliers mod kanterne af området. Outliers med værdier uden for området vil have mere gearing. Værdier, der er ekstreme på y-aksen (sammenlignet med de andre værdier) vil have mere indflydelse end værdier tættere på de andre y-værdier.

ligesom videoerne? Abonner på vores Youtube-kanal.

forbindelse til Affin Transformation

lineær regression er uendeligt forbundet med Affin transformation. Formlen y ‘= b + økse er ikke rigtig linear…it ‘ s en affine funktion, som er defineret som en lineær funktion plus en transformation. Så det skal virkelig kaldes affine regression, ikke lineær!

——————————————————————————

brug for hjælp til et hjemmearbejde eller test spørgsmål? Med Chegg Study kan du få trinvise løsninger på dine spørgsmål fra en ekspert på området. Dine første 30 minutter med en Chegg tutor er gratis!