Regressione lineare: Semplici passi, Video. Trova Equazione, Coefficiente, Pendenza
Condividi su
Contenuto:
Cos’è la regressione lineare semplice?
Come trovare un’equazione di regressione lineare:
- Come trovare un’equazione di regressione lineare a mano.
- Trova un’equazione di regressione lineare in Excel.
- TI83 Regressione lineare.
- TI 89 Regressione lineare
Trovare elementi correlati:
- Come trovare il coefficiente di regressione.
- Trova la pendenza di regressione lineare.
- Trova un valore di test di regressione lineare.
Leva:
- Leva in regressione lineare.
Torna all’inizio
Cos’è la regressione lineare semplice?
Se stai appena iniziando a conoscere l’analisi di regressione, un semplice lineare è il primo tipo di regressione che incontrerai in una classe stats.
La regressione lineare è la tecnica statistica più utilizzata; è un modo per modellare una relazione tra due insiemi di variabili. Il risultato è un’equazione di regressione lineare che può essere utilizzata per fare previsioni sui dati.
La maggior parte dei pacchetti software e calcolatrici in grado di calcolare la regressione lineare. Ad esempio:
- TI-83.
- Eccellere.
È anche possibile trovare una regressione lineare a mano.
Prima di provare i tuoi calcoli, dovresti sempre creare un grafico a dispersione per vedere se i tuoi dati si adattano approssimativamente a una linea. Perché? Perché la regressione ti darà sempre un’equazione e potrebbe non avere alcun senso se i tuoi dati seguono un modello esponenziale. Se sai che la relazione non è lineare, ma non sai esattamente quale sia quella relazione, una soluzione è usare modelli di funzioni di base lineari, che sono popolari nell’apprendimento automatico.
Etimologia
“Lineare” significa linea. La parola regressione è venuto da uno scienziato del 19 ° secolo, Sir Francis Galton, che ha coniato il termine “regressione verso la mediocrità” (nel linguaggio moderno, che è la regressione alla media. Ha usato il termine per descrivere il fenomeno di come la natura tende a smorzare i tratti fisici in eccesso di generazione in generazione (come l’altezza estrema).
Perché usare le relazioni lineari?
Le relazioni lineari, cioè le linee, sono più facili da lavorare e la maggior parte dei fenomeni sono naturalmente correlati linearmente. Se le variabili non sono linearmente correlate, allora un po ‘ di matematica può trasformare quella relazione in una lineare, in modo che sia più facile per il ricercatore (cioè tu) capire.
Cos’è la regressione lineare semplice?
Probabilmente hai familiarità con la stampa di grafici a linee con un asse X e un asse Y. La variabile X è talvolta chiamata variabile indipendente e la variabile Y è chiamata variabile dipendente. La regressione lineare semplice traccia una variabile indipendente X contro una variabile dipendente Y. Tecnicamente, nell’analisi di regressione, la variabile indipendente viene solitamente chiamata variabile predittiva e la variabile dipendente viene chiamata variabile di criterio. Tuttavia, molte persone li chiamano semplicemente le variabili indipendenti e dipendenti. Le tecniche di regressione più avanzate (come la regressione multipla) utilizzano più variabili indipendenti.
L’analisi di regressione può portare a grafici lineari o non lineari. Una regressione lineare è dove le relazioni tra le variabili possono essere descritte con una linea retta. Regressioni non lineari producono linee curve.( * * )
Regressione lineare semplice per la quantità di precipitazioni all’anno.
L’analisi di regressione è quasi sempre eseguita da un programma per computer, poiché le equazioni richiedono molto tempo per essere eseguite a mano.
**Poiché questo è un articolo introduttivo, l’ho mantenuto semplice. Ma c’è in realtà un’importante differenza tecnica tra lineare e non lineare, che diventerà più importante se si continua a studiare la regressione. Per i dettagli, vedere l’articolo sulla regressione non lineare.
Torna all’inizio
Come trovare un’equazione di regressione lineare: Panoramica
L’analisi di regressione viene utilizzata per trovare equazioni che si adattano ai dati. Una volta che abbiamo l’equazione di regressione, possiamo usare il modello per fare previsioni. Un tipo di analisi di regressione è l’analisi lineare. Quando un coefficiente di correlazione mostra che è probabile che i dati siano in grado di prevedere i risultati futuri e un grafico a dispersione dei dati sembra formare una linea retta, è possibile utilizzare la regressione lineare semplice per trovare una funzione predittiva. Se ricordi dall’algebra elementare, l’equazione per una linea è y = mx + b. Questo articolo ti mostra come prendere i dati, calcolare la regressione lineare e trovare l’equazione y’ = a + bx. Nota: se stai prendendo statistiche AP, potresti vedere l’equazione scritta come b0 + b1x, che è la stessa cosa (stai solo usando le variabili b0 + b1 invece di a + b.
Guarda il video o leggi i passaggi qui sotto per trovare un’equazione di regressione lineare a mano. Ancora confuso? Scopri i tutor a Chegg.com. I tuoi primi 30 minuti è gratis!
L’equazione di regressione lineare
La regressione lineare è un modo per modellare la relazione tra due variabili. Potresti anche riconoscere l’equazione come formula di pendenza. L’equazione ha la forma Y= a + bX, dove Y è la variabile dipendente( cioè la variabile che va sull’asse Y), X è la variabile indipendente (cioè è tracciato sull’asse X), b è la pendenza della linea e a è l’intercetta y.
Il primo passo per trovare un’equazione di regressione lineare è determinare se esiste una relazione tra le due variabili. Questo è spesso un giudizio per il ricercatore. Avrai anche bisogno di un elenco dei tuoi dati in formato XY (cioè due colonne di variabili indipendenti dai dati e dipendenti).
Avvertenze:
- Solo perché due variabili sono correlate, non significa che una causa l’altra. Ad esempio, anche se c’è una relazione tra alti punteggi GRE e migliori prestazioni nella scuola grad, ciò non significa che alti punteggi GRE causano buone prestazioni scolastiche grad.
- Se si tenta di cercare di trovare un’equazione di regressione lineare per un insieme di dati (in particolare attraverso un programma automatizzato come Excel o un TI-83), si trova uno, ma non significa necessariamente l’equazione è una buona misura per i vostri dati. Una tecnica consiste nel creare prima un grafico a dispersione, per vedere se i dati si adattano approssimativamente a una linea prima di provare a trovare un’equazione di regressione lineare.
Come trovare un’equazione di regressione lineare: Passi
Passo 1: Crea un grafico dei tuoi dati, riempiendo le colonne nello stesso modo in cui riempiresti il grafico se trovassi il coefficiente di correlazione di Pearson.
Subject | Age x | Glucose Level y | xy | x2 | y2 | 1 | 43 | 99 | 4257 | 1849 | 9801 |
---|---|---|---|---|---|
2 | 21 | 65 | 1365 | 441 | 4225 | 3 | 25 | 79 | 1975 | 625 | 6241 |
4 | 42 | 75 | 3150 | 1764 | 5625 | 5 | 57 | 87 | 4959 | 3249 | 7569 |
6 | 59 | 81 | 4779 | 3481 | 6561 |
S | 247 | 486 | 20485 | 11409 | 40022 |
Dalla tabella sopra, Σx = 247, Σy = 486, Σxy = 20485, Σx2 = 11409, Σy2 = 40022. n è la dimensione del campione (6, nel nostro caso).
Passaggio 2: Utilizzare le seguenti equazioni per trovare a e b.
a = 65.1416
b = .385225
Clicca qui se vuoi istruzioni semplici e dettagliate per risolvere questa formula.
Trova un:
- ((486 × 11,409) – ((247 × 20,485)) / 6 (11,409) – 2472)
- 484979 / 7445
- =65.14
b:
- (6(20,485) – (247 × 486)) / (6 (11409) – 2472)
- (122,910 – 120,042) / 68,454 – 2472
- 2,868 / 7,445
- = .385225
Fase 3: Inserire i valori nell’equazione.
y ‘ = a + bx
y’ = 65,14 + .385225x
Ecco come trovare un’equazione di regressione lineare a mano!
Come la spiegazione? Dai un’occhiata al Practically Cheating Statistics Handbook, che ha centinaia di più soluzioni passo-passo, proprio come questo!
* Si noti che questo esempio ha un basso coefficiente di correlazione e quindi non sarebbe troppo bravo a prevedere nulla.
Torna su
Trova un’equazione di regressione lineare in Excel
Guarda il video o leggi i passaggi seguenti:
Equazione di regressione lineare Microsoft Excel: Passi
Passo 1: Installare il Toolpak per l’analisi dei dati, se non è già installato. Per istruzioni su come caricare l’analisi dei dati Toolpak, fare clic qui.
Passo 2: Digitare i dati in due colonne in Excel. Ad esempio, digitare i dati “x” nella colonna A e i dati “y” nella colonna b. Non lasciare celle vuote tra le voci.
Passo 3: Fare clic sulla scheda “Analisi dei dati” sulla barra degli strumenti di Excel.
Passo 4: Fare clic su “regressione” nella finestra pop-up e quindi fare clic su ” OK.”
La finestra pop-up Analisi dei dati ha molte opzioni, tra cui la regressione lineare.
Passo 5: Selezionare l’intervallo Y di input. Puoi farlo in due modi: seleziona i dati nel foglio di lavoro o digita la posizione dei tuoi dati nella casella “Inserisci intervallo Y”.” Ad esempio, se i tuoi dati Y sono da A2 a A10, digita “A2:A10” nella casella Intervallo Y di input.
Passo 6: Selezionare l’intervallo X di input selezionando i dati nel foglio di lavoro o digitando la posizione dei dati nella casella ” Intervallo X di input.”
Passo 7: Seleziona la posizione in cui vuoi che il tuo intervallo di output vada selezionando un’area vuota nel foglio di lavoro o digitando la posizione in cui vuoi che i tuoi dati vadano nella casella “Intervallo di output”.
Passo 8: fare clic su “OK”. Excel calcolerà la regressione lineare e popolerà il foglio di lavoro con i risultati.
Suggerimento: Le informazioni sull’equazione di regressione lineare sono fornite nell’ultimo set di output (la colonna dei coefficienti). La prima voce nella riga “Intercetta “è” a “(l’intercetta y) e la prima voce nella colonna” X “è” b” (la pendenza).
Torna all’inizio
Regressione lineare TI83
Guarda il video o leggi i passaggi qui sotto:
Due linee di regressione lineare.
TI 83 Regressione lineare: Panoramica
La regressione lineare è noiosa e soggetta a errori quando viene eseguita a mano, ma è possibile eseguire la regressione lineare nel tempo necessario per inserire alcune variabili in un elenco. La regressione lineare ti darà un risultato ragionevole solo se i tuoi dati sembrano una linea su un grafico a dispersione, quindi prima di trovare l’equazione per una linea di regressione lineare potresti voler prima visualizzare i dati su un grafico a dispersione. Vedere questo articolo per come fare un grafico a dispersione sul TI 83.
TI 83 Regressione lineare: Passi
Problema di esempio: Trova un’equazione di regressione lineare (della forma y = ax + b) per i valori x di 1, 2, 3, 4, 5 e i valori y di 3, 9, 27, 64 e 102.
Passo 1: Premere STAT, quindi premere INVIO per accedere alla schermata elenchi. Se si dispone già di dati in L1 o L2, deselezionare i dati: spostare il cursore su L1, premere CANCELLA e quindi INVIO. Ripetere per L2.
Passo 2: Inserisci le tue variabili x, una alla volta. Seguire ogni numero premendo il tasto INVIO. Per la nostra lista, dovresti inserire:
1 ENTER
2 ENTER
3 ENTER
4 ENTER
5 ENTER
Passo 3: Usa i tasti freccia per scorrere fino alla colonna successiva, L2.
Passo 4: Inserisci le tue variabili y, una alla volta. Seguire ogni numero premendo il tasto invio. Per la nostra lista, dovresti inserire:
3 INSERISCI
9 INSERISCI
27 INSERISCI
64 INSERISCI
102 INSERISCI
Passo 5: Premere il pulsante STAT, quindi utilizzare il tasto di scorrimento per evidenziare ” CALC.”
Passo 6: Premere 4 per scegliere”LinReg(ax+b)”. Premere INVIO e quindi IMMETTERE di nuovo. Il TI 83 restituirà le variabili necessarie per l’equazione. Basta inserire le variabili date (a, b) nell’equazione per la regressione lineare (y=ax+b). Per i dati di cui sopra, questo è y = 25.3 x-34.9.
Ecco come eseguire la regressione lineare TI 83!
Torna all’inizio
Come trovare una pendenza di regressione lineare: Panoramica
Ricorda dall’algebra che la pendenza è la “m” nella formula y = mx + b.
Nella formula di regressione lineare, la pendenza è la a nell’equazione y’ = b + ax.
Sono fondamentalmente la stessa cosa. Quindi, se ti viene chiesto di trovare la pendenza di regressione lineare, tutto ciò che devi fare è trovare b nello stesso modo in cui troveresti m.
Calcolare la regressione lineare a mano è difficile, per non dire altro. C’è un sacco di sommatoria (questo è il simbolo Σ, che significa sommare). I passaggi di base sono di seguito, oppure è possibile guardare il video all’inizio di questo articolo. Il video entra molto più in dettaglio su come fare la sommatoria. Trovare l’equazione ti darà anche la pendenza. Se non vuoi trovare la pendenza a mano (o se vuoi controllare il tuo lavoro), puoi anche usare Excel.
Come trovare pendenza regressione lineare: Passi
Passo 1: Trovare i seguenti dati dalle informazioni fornite: Σx, Σy, Σxy, Σx2, Σy2. Se non ricordi come ottenere quelle variabili dai dati, vedi questo articolo su come trovare il coefficiente di correlazione di Pearson. Seguire i passaggi per creare una tabella e trovare Σx, Σy, Σxy, Σx2 e Σy2.
Passaggio 2: Inserire i dati nella formula b (non è necessario trovare a).
Se le formule ti spaventano, puoi trovare istruzioni più complete su come lavorare la formula qui: Come trovare un’equazione di regressione lineare: Panoramica.
Come trovare Regressione pendenza in Excel 2013
Iscriviti al nostro canale Youtube per un sacco di più statistiche suggerimenti e trucchi.
Torna all’inizio
Come Trovare il Coefficiente di Regressione
Un coefficiente di regressione è la stessa cosa come la pendenza della retta di equazione di regressione. L’equazione per il coefficiente di regressione che troverai nel test delle statistiche AP è: B1 = b1 = Σ / Σ . “y” in questa equazione è la media di y e “x”è la media di x.
È possibile trovare il coefficiente di regressione a mano (come descritto nella sezione in cima a questa pagina).
Tuttavia, non dovrai calcolare il coefficiente di regressione a mano nel test AP — userai la tua calcolatrice TI-83. Perché? Calcolare la regressione lineare a mano richiede molto tempo (concediti circa 30 minuti per fare i calcoli e controllarli) e, a causa dell’enorme numero di calcoli che devi fare, è molto probabile che tu faccia errori matematici. Quando si trova un’equazione di regressione lineare sul TI83, si ottiene il coefficiente di regressione come parte della risposta.
Problema di esempio: trova il coefficiente di regressione per il seguente set di dati:
x: 1, 2, 3, 4, 5.
y: 3, 9, 27, 64, 102.
Passo 1: Premere STAT, quindi premere INVIO per inserire gli elenchi. Potrebbe essere necessario cancellare i dati se si dispone già di numeri in L1 o L2. Per cancellare i dati: spostare il cursore su L1, premere CANCELLA e quindi INVIO. Ripetere per L2 se è necessario.
Passo 2: Inserisci i tuoi x-data in un elenco. Premere il tasto INVIO dopo ogni voce.
1 ENTER
2 ENTER
3 ENTER
4 ENTER
5 ENTER
Passo 3: Scorrere fino alla colonna successiva, L2 utilizzando i tasti freccia in alto a destra della tastiera.
Passo 4: Inserire i dati y:
3 ENTER
9 ENTER
27 ENTER
64 ENTER
102 ENTER
Passo 5: Premere il pulsante STAT, quindi scorrere fino a evidenziare “CALC.”Premere INVIO
Passo 6: Premere 4 per scegliere” LinReg (ax+b)”. Premere INVIO. Il TI 83 restituirà le variabili necessarie per l’equazione di regressione lineare. Il valore che stai cercando >il coefficiente di regressione> è b, che è 25.3 per questo insieme di dati.
Questo è tutto!
Torna all’inizio
Valore del test di regressione lineare
Due linee di regressione lineare.
I valori dei test di regressione lineare vengono utilizzati nella regressione lineare semplice esattamente allo stesso modo in cui i valori dei test (come la statistica z-score o T) vengono utilizzati nei test di ipotesi. Invece di lavorare con la tabella z, lavorerai con una tabella di distribuzione T. Il valore del test di regressione lineare viene confrontato con la statistica del test per supportare o rifiutare un’ipotesi nulla.
Valore di prova di regressione lineare: passi
Domanda di esempio: Dato un insieme di dati con dimensione del campione 8 e r = 0,454, trovare il valore del test di regressione lineare.
Nota: r è il coefficiente di correlazione.
Passo 1: Trova r, il coefficiente di correlazione, a meno che non ti sia già stato dato nella domanda. In questo caso, viene dato r (r = .0454). Non sai come trovare r? Vedere: Coefficiente di correlazione per i passaggi su come trovare r.
Passaggio 2: Utilizzare la seguente formula per calcolare il valore del test (n è la dimensione del campione):
Come risolvere la formula:
Il valore del test di regressione lineare, T = 1.24811026
Questo è tutto!
Trovare la statistica del test
Il valore del test di regressione lineare non è molto utile a meno che tu non abbia qualcosa con cui confrontarlo. Confronta il tuo valore con la statistica del test. La statistica del test è anche un t-score (t) definito dalla seguente equazione:
t = pendenza della linea di regressione del campione / errore standard della pendenza.
Vedi: Come trovare una pendenza regressione lineare / Come trovare l’errore standard della pendenza (TI-83).
Puoi trovare un esempio di calcolo del valore del test di regressione lineare (con un livello alfa) qui: Coefficienti di correlazione.
Torna all’inizio
Leva nella regressione lineare
I punti dati che hanno leva hanno il potenziale per spostare una linea di regressione lineare. Tendono ad essere valori anomali. Un outlier è un punto che è un valore estremamente alto o estremamente basso.
Punti influenti
Se il parametro stima (deviazione standard del campione, varianza ecc.) cambia in modo significativo quando viene rimosso un outlier, quel punto dati viene chiamato osservazione influente.
Più un punto dati differisce dalla media degli altri valori x, più leva ha. Maggiore è la leva di un punto, maggiore è la probabilità che il punto sia influente (cioè potrebbe modificare le stime dei parametri).
Leva nella regressione lineare: come influisce sui grafici
Nella regressione lineare, il punto influente (outlier) cercherà di tirare la linea di regressione lineare verso se stesso. Il grafico seguente mostra cosa succede a una linea di regressione lineare quando è incluso l’outlier A:
Due linee di regressione lineare. Il punto influente A è incluso nella linea superiore ma non nella linea inferiore.
I valori anomali con valori X estremi (valori che non rientrano nell’intervallo degli altri punti dati) hanno più leva nella regressione lineare rispetto ai punti con valori x meno estremi. In altre parole, valori anomali x estremi sposteranno la linea più di valori meno estremi.
Il grafico seguente mostra un punto dati al di fuori dell’intervallo degli altri valori. I valori vanno da 0 a circa 70.000. Questo punto ha un valore x di circa 80.000 che è al di fuori dell’intervallo. Colpisce la linea di regressione molto più del punto nella prima immagine sopra, che era all’interno dell’intervallo degli altri valori.
Un outlier ad alta leva. Il punto ha spostato di più il grafico perché è al di fuori dell’intervallo degli altri valori.
In generale, valori anomali che hanno valori vicini alla media di x avranno meno leva che valori anomali verso i bordi dell’intervallo. I valori anomali con valori di x al di fuori dell’intervallo avranno più leva. I valori che sono estremi sull’asse y (rispetto agli altri valori) avranno più influenza dei valori più vicini agli altri valori y.
Ti piacciono i video? Iscriviti al nostro canale Youtube.
Connessione alla trasformazione Affine
La regressione lineare è infinitamente connessa alla trasformazione affine. La formula y ‘= b + ax non è davvero linear…it ‘ s una funzione affine, che è definita come una funzione lineare più una trasformazione. Quindi dovrebbe davvero essere chiamata regressione affine, non lineare!
——————————————————————————
Hai bisogno di aiuto con un compito a casa o una domanda di prova? Con Chegg Studio, è possibile ottenere soluzioni passo-passo alle vostre domande da un esperto del settore. I tuoi primi 30 minuti con un tutor Chegg sono gratuiti!
Leave a Reply