Articles

[ML basics] [regressie] hoe te zien of een dataset lineair is of niet?

Nou, de vraag is vrij eenvoudig op deze.

Hoe zou u weten of een gegeven dataset lineair of niet-lineair van aard is? Natuurlijk zal de selectie van de modellen die moeten worden gebruikt ervan afhangen.

goed dan, laten we beginnen.

ten eerste, het verschil tussen lineaire en niet-lineaire functies:

(Links)Lineaire functies (rechts)Niet-lineaire functies

Lineaire functie: Kan eenvoudig worden gedefinieerd als een functie die altijd volgens het principe van :

input/output = constant.

een lineaire vergelijking is altijd een veelterm van graad 1 (bijvoorbeeld x+2y+3=0). In de tweedimensionale gevallen vormen ze altijd lijnen; in andere dimensies kunnen ze ook vlakken, punten of hypervlakken vormen. Hun “vorm” is altijd perfect recht, zonder enige vorm van rondingen. Daarom noemen we ze lineaire vergelijkingen.

niet-lineaire functie: elke functie die niet lineair is, is simpel gezegd niet-lineair. Hogere graadpolynomen zijn niet-lineair. Trigonometrische functies (zoals sin of cos) zijn niet-lineair. Vierkantswortels zijn niet-lineair.

dat is allemaal prima en dandy, maar hoe zullen we vinden of een dataset lineair is of niet. Grafieken zijn eenvoudig als we een enkele dimensie hebben (niet altijd zoals we hier zullen zien), maar hoe om te gaan met meerdere dimensionale datasets?