Lineární Regrese: Jednoduché Kroky, Video. Najít Rovnice, Koeficient, Sklon
Obsah:
Co je Jednoduché Lineární Regrese?
Jak najít lineární regresní rovnici:
- jak najít lineární regresní rovnici ručně.
- Najděte lineární regresní rovnici v aplikaci Excel.
- TI83 lineární regrese.
- TI 89 lineární regrese
hledání souvisejících položek:
- jak najít regresní koeficient.
- Najděte lineární regresní sklon.
- najděte hodnotu lineárního regresního testu.
pákový efekt:
- pákový efekt v lineární regresi.
zpět na začátek
co je jednoduchá lineární regrese?
Pokud se teprve začínáte učit o regresní analýze, jednoduchý lineární je první typ regrese, na který narazíte ve třídě statistik.
lineární regrese je nejpoužívanější statistickou technikou; je to způsob, jak modelovat vztah mezi dvěma sadami proměnných. Výsledkem je lineární regresní rovnice, kterou lze použít k předpovídání dat.
většina softwarových balíčků a kalkulaček dokáže vypočítat lineární regresi. Například:
- TI-83.
- Excel.
lineární regresi najdete také ručně.
než vyzkoušíte výpočty, měli byste vždy vytvořit bodový graf, abyste zjistili, zda vaše data zhruba odpovídají řádku. Proč? Protože regrese vám vždy dá rovnici a nemusí mít smysl, pokud vaše data sledují exponenciální model. Pokud víte, že vztah je nelineární, ale nevím přesně, co to vztah je, jedním z řešení je použití lineární bázová funkce modely, které jsou populární v strojového učení.
etymologie
„Lineární“ znamená přímku. Slovo Regrese pochází z 19. Století, Vědec, Sir Francis Galton, který razil termín „regrese k průměrnosti“ (v moderním jazyce, to je to, regrese k průměru. Použil tento termín k popisu fenoménu toho, jak příroda má tendenci tlumit přebytečné fyzické vlastnosti z generace na generaci (jako extrémní výška).
Proč používat lineární vztahy?
lineární vztahy, tj. čáry, se snáze pracují a většina jevů je přirozeně lineárně příbuzná. Pokud proměnné nejsou lineárně příbuzné, pak nějaká matematika může tento vztah přeměnit na lineární, takže je pro výzkumníka (tj.
co je jednoduchá lineární regrese?
pravděpodobně Jste obeznámeni s vynesením line grafy s jedním osy X a Y osy. Proměnná X se někdy nazývá nezávislá proměnná a proměnná Y se nazývá závislá proměnná. Jednoduchá lineární regrese pozemcích jedné nezávislé proměnné X proti jedné závislé proměnné Y. Technicky, v regresní analýze, nezávislé proměnné se obvykle nazývá prediktor proměnnou a závislou proměnnou, se nazývá kritérium proměnné. Mnoho lidí je však nazývá nezávislými a závislými proměnnými. Pokročilejší regresní techniky (jako vícenásobná regrese) používají více nezávislých proměnných.
regresní analýza může vést k lineárním nebo nelineárním grafům. Lineární regrese je místo, kde vztahy mezi proměnnými lze popsat přímkou. Nelineární regrese vytvářejí zakřivené čáry.(**)
jednoduchá lineární regrese pro množství srážek za rok.
regresní analýza je téměř vždy prováděna počítačovým programem, protože rovnice jsou extrémně časově náročné na ruční provedení.
* * protože se jedná o úvodní článek, držel jsem to jednoduché. Ale ve skutečnosti existuje důležitý technický rozdíl mezi lineárním a nelineárním, který bude důležitější, pokud budete pokračovat ve studiu regrese. Podrobnosti naleznete v článku o nelineární regresi.
Zpět na začátek
Jak Najít Lineární Regresní Rovnice: Přehled
Regresní analýza se používá k nalezení rovnic, které se vešly data. Jakmile máme regresní rovnici, můžeme použít model k předpovídání. Jedním typem regresní analýzy je lineární analýza. Když korelační koeficient ukazuje, že data budou pravděpodobně schopna předvídat budoucí výsledky a zdá se, že rozptylový graf dat tvoří přímku, můžete použít jednoduchou lineární regresi k nalezení prediktivní funkce. Pokud si vzpomenete, od základní algebry, rovnice přímky je y = mx + b. Tento článek ukazuje, jak, aby se data, výpočet lineární regrese, a najít rovnici y‘ = a + bx. Poznámka: Pokud používáte statistiky AP, můžete vidět rovnici napsanou jako b0 + b1x, což je totéž (pouze používáte proměnné b0 + b1 místo a + b.
podívejte se na video nebo si přečtěte níže uvedené kroky, abyste ručně našli lineární regresní rovnici. Stále zmatený? Podívejte se na lektory na Chegg.com, prvních 30 minut je zdarma!
Lineární Regresní Rovnice
Lineární regrese je způsob, jak modelovat vztah mezi dvěma proměnnými. Můžete také rozpoznat rovnici jako vzorec sklonu. Rovnice má tvar Y= a + bX, kde Y je závislá proměnná (to je proměnná, která bude na ose Y), X je nezávislá proměnná (tj. je vynesen na ose X), b je sklon čáry a a je y-intercept.
prvním krokem při hledání lineární regresní rovnice je zjistit, zda existuje vztah mezi oběma proměnnými. Toto je často úsudek pro výzkumného pracovníka. Budete také potřebovat seznam vašich dat ve formátu XY (tj. dva sloupce dat-nezávislé a závislé proměnné).
varování:
- jen proto, že dvě proměnné jsou příbuzné, neznamená to, že jedna způsobuje druhou. Například, i když existuje vztah mezi vysokou GRE skóre a lepší výkon ve škole, to neznamená, že vysoké GRE skóre, protože dobré grad školní výkon.
- Pokud se pokusíte, aby se pokusila najít lineární regresní rovnice pro sadu dat (zejména prostřednictvím automatizovaného programu, jako je Excel nebo TI-83), najdete jeden, ale to nemusí nutně znamenat, rovnice je dobrou volbou pro vaše data. Jednou z technik je nejprve vytvořit rozptylový graf, abyste zjistili, zda data zhruba odpovídají linii, než se pokusíte najít lineární regresní rovnici.
Jak Najít Lineární Regresní Rovnice: Kroky
Krok 1: Vytvořit graf z dat, vyplňování sloupce stejným způsobem, jako byste vyplnit v grafu pokud jste byli nalezení Pearsonův Korelační Koeficient.
Subject | Age x | Glucose Level y | xy | x2 | y2 | 1 | 43 | 99 | 4257 | 1849 | 9801 |
---|---|---|---|---|---|
2 | 21 | 65 | 1365 | 441 | 4225 | 3 | 25 | 79 | 1975 | 625 | 6241 |
4 | 42 | 75 | 3150 | 1764 | 5625 | 5 | 57 | 87 | 4959 | 3249 | 7569 |
6 | 59 | 81 | 4779 | 3481 | 6561 |
Σ | 247 | 486 | 20485 | 11409 | 40022 |
Z výše uvedené tabulky, Σx = 247, Σy = 486, Σxy = 20485, Σx2 = 11409, Σy2 = 40022. n je velikost vzorku (6, v našem případě).
Krok 2: Použijte následující rovnice najít a a b.
a = 65.1416
b = .385225
Klikněte zde, pokud chcete snadné, podrobné pokyny pro řešení tohoto vzorce.
najít:
- ,
- ((486 × 11,409) – ((247 × 20,485)) / 6 (11,409) – 2472)
- 484979 / 7445
- =65.14
b:
- ,
- (6(20,485) – (247 × 486)) / (6 (11409) – 2472)
- (122,910 – 120,042) / 68,454 – 2472
- 2,868 / 7,445
- = .385225
Krok 3: Vložte hodnoty do rovnice.
y ‚= a + bx
y ‚ = 65.14 + .385225x
to je, jak najít lineární regresní rovnici ručně!
jako vysvětlení? Podívejte se na prakticky podvádění statistiky příručka, který má stovky dalších krok za krokem řešení, stejně jako tento!
* Všimněte si, že tento příklad má nízký korelační koeficient, a proto by neměl být příliš dobrý v předpovídání nic.
Zpět na začátek
Najděte Lineární Regresní Rovnice v aplikaci Excel
podívejte se na video nebo si přečtěte níže uvedené kroky:
lineární regresní rovnice Microsoft Excel: kroky
Krok 1: Nainstalujte nástroj pro analýzu Datpak, pokud již není nainstalován. Pokyny, jak načíst Nástroj pro analýzu Datpak, klikněte zde.
Krok 2: Zadejte data do dvou sloupců v aplikaci Excel. Například zadejte data “ x „do sloupce A a data“ y “ do sloupce b. nenechávejte mezi položkami žádné prázdné buňky.
Krok 3: Klikněte na kartu „Analýza dat“ na panelu nástrojů aplikace Excel.
Krok 4: v rozbalovacím okně klikněte na „regrese“ a poté na “ OK.“
vyskakovací okno pro analýzu dat má mnoho možností, včetně lineární regrese.
Krok 5: Vyberte rozsah vstupu Y. Můžete to udělat dvěma způsoby: buď vyberte data v listu, nebo zadejte umístění svých dat do pole “ vstup y rozsah.“Pokud jsou například vaše data Y v A2 až A10, zadejte do pole vstup y rozsah „A2:A10“.
Krok 6: Vyberte rozsah vstupu X výběrem dat v listu nebo zadáním umístění dat do pole “ vstup X rozsah.“
Krok 7: Vyberte umístění, kam chcete, aby vaše výstupní rozsah jít výběrem do prázdné oblasti v listu, nebo zadáním umístění, kde chcete, aby vaše data v „Output Range“ box.
Krok 8: Klikněte na „OK“. Excel vypočítá lineární regresi a naplní váš list výsledky.
Tip: informace o lineární regresní rovnici jsou uvedeny v poslední výstupní sadě (sloupec koeficientů). První položka v řádku „Intercept“ je “ a „(y-intercept) a první položka ve sloupci “ X “ je “ b „(sklon).
Zpět na začátek
TI83 Lineární Regrese
podívejte se na video nebo si přečtěte níže uvedené kroky:
dvě lineární regresní linie.
TI 83 Lineární Regrese: Přehled
Lineární regrese je únavné a náchylné k chybám, když se provádí ručně, ale můžete provádět lineární regrese v čas potřebný k zadání několika proměnných do seznamu. Lineární regrese bude jen vám rozumný výsledek, pokud vaše data vypadá jako čára na bodový graf, takže než si najít rovnice pro lineární regresní přímku, možná budete chtít zobrazit data na první bodový graf. V tomto článku naleznete, jak vytvořit bodový graf na TI 83.
TI 83 Lineární Regrese: Kroky
příklad: Najděte lineární regresní rovnice (ve tvaru y = ax + b) pro x-hodnoty 1, 2, 3, 4, 5 a y hodnoty z 3, 9, 27, 64, 102.
Krok 1: Stiskněte STAT a stiskněte klávesu ENTER pro vstup na obrazovku seznamy. Pokud již máte data v L1 nebo L2, vymažte data: přesuňte kurzor na L1, stiskněte vymazat a poté zadejte. Opakujte pro L2.
Krok 2: Zadejte x-proměnné, jeden po druhém. Sledujte každé číslo stisknutím klávesy ENTER. Pro našeho seznamu, zadejte:
1 ZADEJTE
2 ZADEJTE
3 ZADEJTE
4 ZADEJTE
5 ENTER
Krok 3: Pomocí kláves se šipkami přejděte přes na další sloupec, L2.
Krok 4: Zadejte y-proměnné, jeden po druhém. Sledujte každé číslo stisknutím klávesy enter. Pro náš seznam zadejte:
3 Zadejte
9 Zadejte
27 zadejte
64 zadejte
102 zadejte
Krok 5: Stiskněte tlačítko STAT, poté pomocí posuvníku zvýrazněte “ CALC.“
Krok 6: Stiskněte 4 zvolte „LinReg(ax+b)“. Stiskněte klávesu ENTER a poté znovu zadejte. TI 83 vrátí proměnné potřebné pro rovnici. Stačí vložit dané proměnné (a, b) do rovnice pro lineární regresi (y=ax+b). Pro výše uvedené údaje je to y = 25,3 x-34,9.
takto se provádí lineární regrese TI 83!
zpět na začátek
jak najít lineární regresní sklon: Přehled
Vzpomenout z algebry, že sklon je „m“ ve vzorci y = mx + b.
V lineární regrese vzorce, sklon je v rovnici y‘ = b + ax.
jsou v podstatě totéž. Takže pokud budete požádáni, abyste našli lineární regresní sklon, vše, co musíte udělat, je najít b stejným způsobem, jako byste našli m.
výpočet lineární regrese ručně je přinejmenším ošidný. Je tu hodně součtu (to je symbol Σ, což znamená sečíst). Základní kroky jsou uvedeny níže, nebo si můžete prohlédnout video na začátku tohoto článku. Video jde do mnohem více podrobností o tom, jak to udělat součet. Nalezení rovnice vám také poskytne sklon. Pokud nechcete najít svah ručně (nebo pokud chcete zkontrolovat svou práci), můžete také použít Excel.
jak najít lineární regresní sklon: kroky
Krok 1: Najděte následující údaje z uvedených informací: Σx, Σy, Σxy, Σx2, Σy2. Pokud si nepamatujete, jak tyto proměnné získat z dat, přečtěte si tento článek o tom, jak najít Pearsonův korelační koeficient. Podle těchto kroků vytvořte tabulku a najděte Σx, Σy, Σxy, Σx2 a Σy2.
Krok 2: vložte data do vzorce b (není třeba najít a).
Pokud vás vzorce vyděsí, najdete podrobnější pokyny, jak pracovat se vzorcem zde: Jak najít lineární regresní rovnici: přehled.
jak najít regresní sklon v aplikaci Excel 2013
přihlaste se k odběru našeho kanálu Youtube a získejte mnoho dalších tipů a triků pro statistiky.
Zpět na začátek
Jak Najít Regresní Koeficient
regresní koeficient je stejný jako sklon přímky regresní rovnice. Rovnice pro regresní koeficient, kterou najdete v testu statistiky AP, je: B1 = b1 = Σ / Σ . „y“ v této rovnici je průměr “ y “ a „x“ je průměr x.
můžete najít regresní koeficient ručně (jak je uvedeno v sekci v horní části této stránky).
v testu AP však nebudete muset ručně vypočítat regresní koeficient-použijete kalkulačku TI-83. Proč? Ruční výpočet lineární regrese je velmi časově náročný (nechte si asi 30 minut na výpočty a zkontrolujte je) a kvůli obrovskému počtu výpočtů musíte udělat, že budete pravděpodobně dělat matematické chyby. Když najdete lineární regresní rovnici na TI83, dostanete regresní koeficient jako součást odpovědi.
ukázkový problém: najděte regresní koeficient pro následující sadu dat:
x: 1, 2, 3, 4, 5.
y: 3, 9, 27, 64, 102.
Krok 1: Stiskněte STAT a poté stiskněte ENTER pro zadání seznamů. Možná budete muset vymazat data, pokud již máte čísla v L1 nebo L2. Vymazání dat: přesuňte kurzor na L1, stiskněte vymazat a poté zadejte. Opakujte pro L2, pokud potřebujete.
Krok 2: Zadejte x-data do seznamu. Po každém zadání stiskněte klávesu ENTER.
1 Zadejte
2 Zadejte
3 Zadejte
4 Zadejte
5 Zadejte
Krok 3: Přejděte na další sloupec, L2 pomocí kláves se šipkami v pravém horním rohu klávesnice.
Krok 4: Zadejte y-data:
3 Zadejte
9 Zadejte
27 zadejte
64 zadejte
102 zadejte
Krok 5: Stiskněte tlačítko STAT a poté přejděte na zvýraznění “ CALC.“Stiskněte klávesu ENTER
Krok 6: stisknutím tlačítka 4 Zvolte“ LinReg (ax+b)“. Stiskněte klávesu ENTER. TI 83 vrátí proměnné potřebné pro lineární regresní rovnici. Hodnota, kterou hledáte pro >regresní koeficient > je b, což je 25,3 pro tuto sadu dat.
to je ono!
Zpět na začátek
Lineární Regrese Test Hodnota
Dvě lineární regresní přímky.
hodnoty lineárního regresního testu se používají v jednoduché lineární regresi přesně stejným způsobem jako testovací hodnoty (jako je Z-skóre nebo statistika T) se používají při testování hypotéz. Místo práce se z-tabulkou budete pracovat s t-distribuční tabulkou. Hodnota lineárního regresního testu je porovnána se statistikou testu, která vám pomůže podpořit nebo odmítnout nulovou hypotézu.
hodnota lineárního regresního testu: kroky
Ukázková otázka: Vzhledem k sadě dat s velikostí vzorku 8 A r = 0,454 najděte hodnotu lineární regresní zkoušky.
Poznámka: r je korelační koeficient.
Krok 1: Najděte R, korelační koeficient, pokud vám již nebyl v otázce dán. V tomto případě je dáno r (r = .0454). Nejste si jisti, jak najít r? Viz: Korelační Koeficient pro kroky, o tom, jak najít, r‘.
Krok 2: Použijte následující vzorec pro výpočet testu hodnota (n je velikost vzorku):
Jak vyřešit tento vzorec:
Lineární Regrese Test hodnota, T = 1.24811026
to je ono!
nalezení statistiky testu
hodnota lineárního regresního testu není příliš užitečná, pokud ji nemáte s čím porovnat. Porovnejte svou hodnotu se statistikou testu. Statistikou testu je také T-skóre (t) definované následující rovnicí:
t = sklon regresní přímky vzorku / standardní chyba sklonu.
Viz: Jak najít lineární regresní sklon / jak najít standardní chybu svahu (TI-83).
zpracovaný příklad výpočtu hodnoty lineárního regresního testu (s úrovní alfa) najdete zde: korelační koeficienty.
Zpět na začátek
Pákový efekt v Lineární Regresi
Datové body, které mají vliv mají potenciál k pohybu lineární regresní přímky. Bývají to odlehlé hodnoty. Odlehlá hodnota je bod, který má buď extrémně vysokou nebo extrémně nízkou hodnotu.
vlivné body
Pokud parametr odhaduje (vzorová směrodatná odchylka, rozptyl atd.) výrazně změnit, když je odstraněn odlehlé hodnoty, že datový bod se nazývá vlivné pozorování.
čím více se datový bod liší od průměru ostatních hodnot x, tím větší pákový efekt má. Čím větší pákový efekt je bod, tím vyšší je pravděpodobnost, že bod bude mít vliv (tj. mohl by změnit odhady parametrů).
pákový efekt v lineární regresi: jak ovlivňuje grafy
v lineární regresi se vlivný bod (outlier) pokusí vytáhnout lineární regresní linii směrem k sobě. Níže uvedený graf ukazuje, co se stane lineární regresní přímky, když odlehlých hodnot je zahrnuto:
Dvě lineární regresní přímky. Vlivný bod A je zahrnut v horní linii, ale ne v dolní linii.
odlehlé hodnoty extrémní hodnoty X (hodnoty, které nejsou v dosahu jiných datových bodů) mají větší vliv v lineární regresi než body s méně extrémní hodnoty x. Jinými slovy, extrémní hodnoty X budou pohybovat čárou více než méně extrémními hodnotami.
následující graf ukazuje datový bod mimo rozsah ostatních hodnot. Hodnoty se pohybují od 0 do asi 70 000. Tento jeden bod má hodnotu x asi 80 000, což je mimo rozsah. Ovlivňuje regresní přímku mnohem více než bod na prvním obrázku výše, který byl uvnitř rozsahu ostatních hodnot.
a high-leverage outlier. Bod posunul graf více, protože je mimo rozsah ostatních hodnot.
obecně platí, že odlehlé hodnoty, které mají hodnoty blízké průměru x, budou mít menší páku, která se odchyluje směrem k okrajům rozsahu. Odlehlé hodnoty s hodnotami x mimo rozsah budou mít větší páku. Hodnoty, které jsou extrémní na ose y (ve srovnání s ostatními hodnotami), budou mít větší vliv než hodnoty blíže k ostatním hodnotám y.
Líbí se vám videa? Přihlaste se k odběru našeho kanálu Youtube.
spojení s afinní transformací
lineární regrese je nekonečně spojena s afinní transformací. Vzorec y ‚ = b + ax není ve skutečnosti linear…it je afinní funkce, která je definována jako lineární funkce plus transformace. Takže by se to mělo opravdu nazývat afinní regrese, ne lineární!
——————————————————————————
potřebujete pomoc s domácími úkoly nebo testovací otázkou? S Chegg Study, můžete získat krok za krokem řešení vašich otázek od odborníka v oboru. Váš první 30 minut s Chegg tutorem je zdarma!
Leave a Reply