Articles

[ML basics] [Regression] hur vet jag om en dataset är linjär eller inte?

Tja, frågan är ganska enkel på den här.

hur skulle du berätta om en given dataset är linjär eller icke-linjär i naturen? Naturligtvis kommer valet av modeller som ska användas att bero på det.

ja då, låt oss komma igång.

först skillnaden mellan linjära och icke-linjära funktioner:

(vänster)linjär funktioner (höger)icke-linjära funktioner

linjär funktion: kan enkelt definieras som en funktion som alltid följer principen om:

input / output = konstant.

en linjär ekvation är alltid ett polynom av grad 1 (till exempel x+2y+3=0). I de tvådimensionella Fallen bildar de alltid linjer; i andra dimensioner kan de också bilda plan, punkter eller hyperplaner. Deras ”form” är alltid helt rak, utan kurvor av något slag. Det är därför vi kallar dem linjära ekvationer.

Icke-linjär funktion: varje funktion som inte är linjär är enkelt uttryckt, icke-linjär. Högre grad polynom är olinjära. Trigonometriska funktioner (som sin eller cos) är olinjära. Kvadratrots är olinjära.

det är allt bra och dandy men hur hittar vi om en dataset är linjär eller inte. Grafer är enkla om vi har en enda dimension (inte alltid som vi kommer att se här)men hur man hanterar flera dimensionella dataset?