Articles

[ML basics][Regression] Wie kann man feststellen, ob ein Datensatz linear ist oder nicht?

Nun, die Frage ist ziemlich einfach.

Wie würden Sie feststellen, ob ein gegebener Datensatz linearer oder nichtlinearer Natur ist? Natürlich hängt die Auswahl der zu verwendenden Modelle davon ab.

Nun, dann lasst uns anfangen.

Zunächst der Unterschied zwischen linearen und nichtlinearen Funktionen:

(Links)Lineare Funktionen (rechts)Nichtlineare Funktionen

Lineare Funktion: Kann einfach als eine Funktion definiert werden, die immer dem Prinzip folgt:

input/output = constant.

Eine lineare Gleichung ist immer ein Polynom vom Grad 1 (zum Beispiel x+2y+3=0). In den zweidimensionalen Fällen bilden sie immer Linien; in anderen Dimensionen können sie auch Ebenen, Punkte oder Hyperebenen bilden. Ihre „Form“ ist immer perfekt gerade, ohne Kurven jeglicher Art. Deshalb nennen wir sie lineare Gleichungen.

Nichtlineare Funktion: Jede Funktion, die nicht linear ist, ist einfach nichtlinear. Polynome höheren Grades sind nichtlinear. Trigonometrische Funktionen (wie sin oder cos) sind nichtlinear. Quadratwurzeln sind nichtlinear.

Das ist alles in Ordnung, aber wie werden wir feststellen, ob ein Datensatz linear ist oder nicht. Diagramme sind einfach, wenn wir eine einzige Dimension haben (nicht immer, wie wir hier sehen werden), aber wie können mehrdimensionale Datensätze angegangen werden?