Régression Linéaire: Étapes simples, Vidéo. Trouver l’équation, le Coefficient, la Pente
Contenu:
Qu’est-ce qu’une régression linéaire simple?
Comment Trouver une Équation de Régression Linéaire:
- Comment Trouver une Équation de Régression Linéaire à la Main.
- Trouvez une équation de régression linéaire dans Excel.
- Régression linéaire TI83.
- TI 89 Régression linéaire
Trouver des éléments connexes:
- Comment trouver le Coefficient de régression.
- Trouvez la pente de régression linéaire.
- Trouvez une Valeur de Test de Régression Linéaire.
Effet de levier :
- Effet de levier en régression linéaire.
Haut de page
Qu’est-ce qu’une régression linéaire simple ?
Si vous commencez tout juste à en apprendre davantage sur l’analyse de régression, un linéaire simple est le premier type de régression que vous rencontrerez dans une classe de statistiques.
La régression linéaire est la technique statistique la plus utilisée ; c’est un moyen de modéliser une relation entre deux ensembles de variables. Le résultat est une équation de régression linéaire qui peut être utilisée pour faire des prédictions sur les données.
La plupart des logiciels et des calculatrices peuvent calculer la régression linéaire. Par exemple :
- TI-83.
- Excel.
Vous pouvez également Trouver une régression linéaire à la main.
Avant d’essayer vos calculs, vous devez toujours créer un nuage de points pour voir si vos données correspondent à peu près à une ligne. Pourquoi? Parce que la régression vous donnera toujours une équation, et cela peut ne pas avoir de sens si vos données suivent un modèle exponentiel. Si vous savez que la relation est non linéaire, mais que vous ne savez pas exactement ce qu’est cette relation, une solution consiste à utiliser des modèles de fonctions de base linéaires — qui sont populaires dans l’apprentissage automatique.
Étymologie
« Linéaire » signifie ligne. Le mot Régression vient d’un scientifique du XIXe siècle, Sir Francis Galton, qui a inventé le terme « régression vers la médiocrité” (en langage moderne, c’est une régression vers la moyenne. Il a utilisé le terme pour décrire le phénomène de la façon dont la nature a tendance à atténuer les traits physiques excessifs de génération en génération (comme la hauteur extrême).
Pourquoi utiliser des Relations linéaires ?
Les relations linéaires, c’est-à-dire les lignes, sont plus faciles à travailler et la plupart des phénomènes sont naturellement liés linéairement. Si les variables ne sont pas liées linéairement, alors certaines mathématiques peuvent transformer cette relation en une relation linéaire, de sorte qu’il est plus facile pour le chercheur (c’est-à-dire vous) de comprendre.
Qu’est-ce qu’une régression linéaire simple ?
Vous êtes probablement familier avec le tracé de graphiques linéaires avec un axe X et un axe Y. La variable X est parfois appelée la variable indépendante et la variable Y est appelée la variable dépendante. La régression linéaire simple trace une variable indépendante X contre une variable dépendante Y. Techniquement, dans l’analyse de régression, la variable indépendante est généralement appelée variable prédictive et la variable dépendante est appelée variable critère. Cependant, beaucoup de gens les appellent simplement les variables indépendantes et dépendantes. Des techniques de régression plus avancées (comme la régression multiple) utilisent plusieurs variables indépendantes.
L’analyse de régression peut aboutir à des graphiques linéaires ou non linéaires. Une régression linéaire est l’endroit où les relations entre vos variables peuvent être décrites avec une ligne droite. Les régressions non linéaires produisent des lignes courbes.(**)
Régression linéaire simple pour la quantité de précipitations par an.
L’analyse de régression est presque toujours effectuée par un programme informatique, car les équations prennent énormément de temps à effectuer à la main.
**Comme il s’agit d’un article d’introduction, je suis resté simple. Mais il y a en fait une différence technique importante entre linéaire et non linéaire, qui deviendra plus importante si vous continuez à étudier la régression. Pour plus de détails, voir l’article sur la régression non linéaire.
Haut de page
Comment trouver une équation de régression linéaire: Aperçu
L’analyse de régression est utilisée pour trouver des équations qui correspondent aux données. Une fois que nous avons l’équation de régression, nous pouvons utiliser le modèle pour faire des prédictions. Un type d’analyse de régression est l’analyse linéaire. Lorsqu’un coefficient de corrélation montre que les données sont susceptibles de prédire les résultats futurs et qu’un nuage de points des données semble former une ligne droite, vous pouvez utiliser une régression linéaire simple pour trouver une fonction prédictive. Si vous vous souvenez de l’algèbre élémentaire, l’équation d’une droite est y = mx + b. Cet article vous montre comment prendre des données, calculer la régression linéaire et trouver l’équation y ’ = a + bx. Remarque: Si vous prenez des statistiques AP, vous pouvez voir l’équation écrite comme b0 + b1x, ce qui est la même chose (vous utilisez simplement les variables b0 + b1 au lieu de a + b.
Regardez la vidéo ou lisez les étapes ci-dessous pour trouver une équation de régression linéaire à la main. Toujours confus? Découvrez les tuteurs à Chegg.com . Vos 30 premières minutes sont gratuites!
L’équation de régression linéaire
La régression linéaire est un moyen de modéliser la relation entre deux variables. Vous pouvez également reconnaître l’équation comme la formule de pente. L’équation a la forme Y = a + bX, où Y est la variable dépendante (c’est la variable qui va sur l’axe Y), X est la variable indépendante (i.e. il est tracé sur l’axe des abscisses), b est la pente de la droite et a est l’ordonnée à l’origine.
La première étape pour trouver une équation de régression linéaire consiste à déterminer s’il existe une relation entre les deux variables. C’est souvent un appel au jugement pour le chercheur. Vous aurez également besoin d’une liste de vos données au format xy (c’est-à—dire deux colonnes de variables indépendantes des données et dépendantes).
Avertissements :
- Ce n’est pas parce que deux variables sont liées que l’une provoque l’autre. Par exemple, bien qu’il existe une relation entre des scores élevés au GRE et une meilleure performance à l’école supérieure, cela ne signifie pas que des scores élevés au GRE entraînent de bons résultats à l’école supérieure.
- Si vous essayez de trouver une équation de régression linéaire pour un ensemble de données (en particulier via un programme automatisé comme Excel ou un TI-83), vous en trouverez une, mais cela ne signifie pas nécessairement que l’équation convient à vos données. Une technique consiste à créer un nuage de points en premier, pour voir si les données correspondent à peu près à une ligne avant d’essayer de trouver une équation de régression linéaire.
Comment trouver une équation de régression linéaire: Étapes
Étape 1: Créez un graphique de vos données, en remplissant les colonnes de la même manière que vous rempliriez le graphique si vous trouviez le Coefficient de corrélation de Pearson.
Subject | Age x | Glucose Level y | xy | x2 | y2 | 1 | 43 | 99 | 4257 | 1849 | 9801 |
---|---|---|---|---|---|
2 | 21 | 65 | 1365 | 441 | 4225 | 3 | 25 | 79 | 1975 | 625 | 6241 |
4 | 42 | 75 | 3150 | 1764 | 5625 | 5 | 57 | 87 | 4959 | 3249 | 7569 |
6 | 59 | 81 | 4779 | 3481 | 6561 |
Σ | 247 | 486 | 20485 | 11409 | 40022 |
D’après le tableau ci-dessus, Σx=247, Σy=486, Σxy=20485, Σx2=11409, Σy2=40022. n est la taille de l’échantillon (6, dans notre cas).
Étape 2: Utilisez les équations suivantes pour trouver a et b.
a=65.1416
b=.385225
Cliquez ici si vous voulez des instructions faciles et étape par étape pour résoudre cette formule.
Trouver un:
- ((486 × 11,409) – ((247 × 20,485)) / 6 (11,409) – 2472)
- 484979 / 7445
- =65.14
Trouver b:
- (6(20,485) – (247 × 486)) / (6 (11409) – 2472)
- (122,910 – 120,042) / 68,454 – 2472
- 2,868 / 7,445
- =.385225
Étape 3: Insérez les valeurs dans l’équation.
y ‘ =a +bx
y’ =65.14+.385225x
Voici comment trouver une équation de régression linéaire à la main!
Comme l’explication? Consultez le Manuel de statistiques Pratiquement triche, qui contient des centaines d’autres solutions étape par étape, tout comme celle-ci!
* Notez que cet exemple a un faible coefficient de corrélation, et ne serait donc pas trop bon pour prédire quoi que ce soit.
Haut de page
Trouvez une équation de régression linéaire dans Excel
Regardez la vidéo ou lisez les étapes ci-dessous:
Équation de régression linéaire Microsoft Excel: Étapes
Étape 1: Installez l’outil d’analyse de données, s’il n’est pas déjà installé. Pour obtenir des instructions sur la façon de charger l’outil d’analyse de Donnéespak, cliquez ici.
Étape 2: Tapez vos données dans deux colonnes dans Excel. Par exemple, tapez vos données « x” dans la colonne A et vos données « y” dans la colonne b. Ne laissez aucune cellule vide entre vos entrées.
Étape 3: Cliquez sur l’onglet « Analyse de données » de la barre d’outils Excel.
Étape 4: Cliquez sur « régression » dans la fenêtre contextuelle, puis cliquez sur « OK.”
La fenêtre contextuelle d’analyse des données comporte de nombreuses options, y compris la régression linéaire.
Étape 5: Sélectionnez votre plage Y d’entrée. Vous pouvez le faire de deux manières: sélectionnez les données dans la feuille de calcul ou tapez l’emplacement de vos données dans la zone « Entrée Y Range ».”Par exemple, si vos données Y sont comprises entre A2 et A10, tapez « A2: A10 » dans la zone de plage Y d’entrée.
Étape 6: Sélectionnez votre plage X d’entrée en sélectionnant les données dans la feuille de calcul ou en tapant l’emplacement de vos données dans la zone « Plage X d’entrée. »
Étape 7: Sélectionnez l’emplacement où vous souhaitez que votre plage de sortie se déplace en sélectionnant une zone vide dans la feuille de calcul ou en tapant l’emplacement où vous souhaitez que vos données se déplacent dans la zone « Plage de sortie”.Étape 8 : Cliquez sur « OK ». Excel calculera la régression linéaire et remplira votre feuille de calcul avec les résultats.
Astuce: Les informations de l’équation de régression linéaire sont données dans le dernier ensemble de sortie (colonne des coefficients). La première entrée de la ligne « Interception » est ”a » (l’interception y) et la première entrée de la colonne ”X » est ”b » (la pente).
Haut de page
Régression linéaire TI83
Regardez la vidéo ou lisez les étapes ci-dessous:
Deux lignes de régression linéaire.
TI 83 Régression linéaire: Aperçu
La régression linéaire est fastidieuse et sujette aux erreurs lorsqu’elle est effectuée à la main, mais vous pouvez effectuer une régression linéaire dans le temps nécessaire pour entrer quelques variables dans une liste. La régression linéaire ne vous donnera un résultat raisonnable que si vos données ressemblent à une ligne sur un nuage de points, donc avant de trouver l’équation pour une ligne de régression linéaire, vous pouvez d’abord afficher les données sur un nuage de points. Voir cet article pour savoir comment créer un nuage de points sur le TI 83.
TI 83 Régression linéaire: Étapes
Exemple de problème: Trouvez une équation de régression linéaire (de la forme y = ax +b) pour les valeurs x de 1, 2, 3, 4, 5 et les valeurs y de 3, 9, 27, 64 et 102.
Étape 1: Appuyez sur STAT, puis appuyez sur ENTRÉE pour accéder à l’écran des listes. Si vous avez déjà des données dans L1 ou L2, effacez les données: déplacez le curseur sur L1, appuyez sur EFFACER, puis sur ENTRÉE. Répétez l’opération pour L2.
Étape 2: Entrez vos variables x, une à la fois. Suivez chaque numéro en appuyant sur la touche ENTRÉE. Pour notre liste, vous devez entrer:
1 ENTRÉE
2 ENTRÉE
3 ENTRÉE
4 ENTRÉE
5 ENTRÉE
Étape 3: Utilisez les touches fléchées pour faire défiler jusqu’à la colonne suivante, L2.
Étape 4: Entrez vos variables y, une à la fois. Suivez chaque numéro en appuyant sur la touche entrée. Pour notre liste, vous devez entrer:
3 ENTREZ
9 ENTREZ
27 ENTREZ
64 ENTREZ
102 ENTREZ
Étape 5: Appuyez sur le bouton STAT, puis utilisez la touche de défilement pour mettre en surbrillance « CALC. »
Étape 6: Appuyez sur 4 pour choisir ”LinReg(ax + b) ». Appuyez sur ENTRÉE, puis ENTREZ à nouveau. Le TI 83 renverra les variables nécessaires à l’équation. Il suffit d’insérer les variables données (a, b) dans l’équation de régression linéaire (y = ax + b). Pour les données ci–dessus, c’est y = 25,3x -34,9.
Voici comment effectuer une régression linéaire TI 83!
Haut de page
Comment trouver une pente de régression linéaire: Aperçu
Rappelez-vous de l’algèbre, que la pente est le « m » dans la formule y = mx +b.
Dans la formule de régression linéaire, la pente est le a dans l’équation y ’ = b + ax.
Ils sont fondamentalement la même chose. Donc, si on vous demande de trouver une pente de régression linéaire, il vous suffit de trouver b de la même manière que vous trouveriez m.
Le calcul de la régression linéaire à la main est pour le moins délicat. Il y a beaucoup de sommation (c’est le symbole Σ, ce qui signifie additionner). Les étapes de base sont ci-dessous, ou vous pouvez regarder la vidéo au début de cet article. La vidéo va beaucoup plus en détail sur la façon de faire la sommation. Trouver l’équation vous donnera également la pente. Si vous ne voulez pas trouver la pente à la main (ou si vous voulez vérifier votre travail), vous pouvez également utiliser Excel.
Comment trouver la Pente de régression linéaire: Étapes
Étape 1: Trouvez les données suivantes à partir des informations données: Σx, Σy, Σxy, Σx2, Σy2. Si vous ne vous souvenez pas comment obtenir ces variables à partir de données, consultez cet article sur la façon de trouver un coefficient de corrélation de Pearson. Suivez les étapes pour créer une table et trouver Σx, Σy, Σxy, Σx2 et Σy2.
Étape 2: Insérez les données dans la formule b (il n’est pas nécessaire de trouver a).
Si les formules vous font peur, vous pouvez trouver des instructions plus complètes sur la façon de travailler la formule ici: Comment trouver une équation de régression linéaire: Aperçu.
Comment trouver la pente de régression dans Excel 2013
Abonnez-vous à notre chaîne Youtube pour plus de trucs et astuces sur les statistiques.
Haut de page
Comment trouver le coefficient de régression
Un coefficient de régression est la même chose que la pente de la droite de l’équation de régression. L’équation pour le coefficient de régression que vous trouverez sur le test de statistiques AP est: B1 = b1 = Σ / Σ. « y » dans cette équation est la moyenne de y et « x » est la moyenne de x.
Vous pouvez trouver le coefficient de régression à la main (comme indiqué dans la section en haut de cette page).
Cependant, vous n’aurez pas à calculer le coefficient de régression à la main dans le test AP — vous utiliserez votre calculatrice TI-83. Pourquoi? Calculer la régression linéaire à la main prend beaucoup de temps (accordez-vous environ 30 minutes pour faire les calculs et les vérifier) et en raison du grand nombre de calculs que vous devez faire, vous êtes très susceptible de faire des erreurs mathématiques. Lorsque vous trouvez une équation de régression linéaire sur le TI83, vous obtenez le coefficient de régression dans le cadre de la réponse.
Exemple de problème : Trouvez le coefficient de régression pour l’ensemble de données suivant :
x: 1, 2, 3, 4, 5.
y: 3, 9, 27, 64, 102.
Étape 1: Appuyez sur STAT, puis appuyez sur ENTRÉE pour entrer dans les LISTES. Vous devrez peut-être effacer les données si vous avez déjà des numéros en L1 ou L2. Pour effacer les données: déplacez le curseur sur L1, appuyez sur EFFACER puis sur ENTRÉE. Répétez l’opération pour L2 si nécessaire.
Étape 2: Entrez vos données x dans une liste. Appuyez sur la touche ENTRÉE après chaque entrée.
1 ENTRÉE
2 ENTRÉE
3 ENTRÉE
4 ENTRÉE
5 ENTRÉE
Étape 3: Faites défiler jusqu’à la colonne suivante, L2 à l’aide des touches fléchées en haut à droite du clavier.
Étape 4: Entrez les données y:
3 ENTREZ
9 ENTREZ
27 ENTREZ
64 ENTREZ
102 ENTREZ
Étape 5: Appuyez sur le bouton STAT, puis faites défiler pour mettre en surbrillance « CALC. »Appuyez sur ENTRÉE
Étape 6: Appuyez sur 4 pour choisir « LinReg (ax + b) ». Appuyez sur ENTRÉE. Le TI 83 renverra les variables nécessaires à l’équation de régression linéaire. La valeur que vous recherchez > le coefficient de régression > est b, ce qui vaut 25,3 pour cet ensemble de données.
C’est tout!
Haut de page
Valeur du test de régression linéaire
Deux lignes de régression linéaire.
Les valeurs de test de régression linéaire sont utilisées dans la régression linéaire simple exactement de la même manière que les valeurs de test (comme le score z ou la statistique T) sont utilisées dans les tests d’hypothèse. Au lieu de travailler avec la table z, vous travaillerez avec une table de distribution en t. La valeur du test de régression linéaire est comparée à la statistique de test pour vous aider à soutenir ou à rejeter une hypothèse nulle.
Valeur du test de régression linéaire: Étapes
Exemple de question: Étant donné un ensemble de données avec une taille d’échantillon 8 et r = 0,454, trouvez la valeur du test de régression linéaire.
Remarque : r est le coefficient de corrélation.
Étape 1: Trouvez r, le coefficient de corrélation, à moins qu’il ne vous ait déjà été donné dans la question. Dans ce cas, r est donné (r =.0454). Vous ne savez pas comment trouver r? Voir: Coefficient de corrélation pour les étapes sur la façon de trouver r.
Étape 2: Utilisez la formule suivante pour calculer la valeur de test (n est la taille de l’échantillon):
Comment résoudre la formule:
La valeur du test de régression linéaire, T = 1.24811026
C’est tout!
Trouver la statistique de test
La valeur du test de régression linéaire n’est pas très utile à moins d’avoir quelque chose à comparer. Comparez votre valeur à la statistique de test. La statistique de test est également un score t (t) défini par l’équation suivante :
t = pente de la droite de régression de l’échantillon / erreur type de la pente.
Voir: Comment trouver une pente de régression linéaire / Comment trouver l’erreur type de la pente (TI-83).
Vous pouvez trouver un exemple travaillé de calcul de la valeur du test de régression linéaire (avec un niveau alpha) ici: Coefficients de corrélation.
Haut de page
Effet de levier dans la régression linéaire
Les points de données qui ont un effet de levier ont le potentiel de déplacer une ligne de régression linéaire. Ils ont tendance à être des valeurs aberrantes. Une valeur aberrante est un point qui est une valeur extrêmement élevée ou extrêmement faible.
Points d’influence
Si le paramètre estime (écart type de l’échantillon, variance, etc.) changer de manière significative lorsqu’une valeur aberrante est supprimée, ce point de données est appelé une observation influente.
Plus un point de données diffère de la moyenne des autres valeurs x, plus il a d’effet de levier. Plus un point a un effet de levier, plus la probabilité que ce point ait une influence est élevée (c’est-à-dire qu’il pourrait modifier les estimations des paramètres).
Effet de levier dans la régression linéaire: Comment cela affecte les graphiques
Dans la régression linéaire, le point influent (valeur aberrante) essaiera de tirer la ligne de régression linéaire vers elle-même. Le graphique ci-dessous montre ce qui arrive à une ligne de régression linéaire lorsque la valeur aberrante A est incluse :
Deux lignes de régression linéaire. Le point d’influence A est inclus dans la ligne supérieure mais pas dans la ligne inférieure.
Les valeurs aberrantes avec des valeurs X extrêmes (valeurs qui ne sont pas dans la plage des autres points de données) ont plus d’effet de levier dans la régression linéaire que les points avec des valeurs x moins extrêmes. En d’autres termes, les valeurs aberrantes extrêmes de valeur X déplaceront la ligne plus que des valeurs moins extrêmes.
Le graphique suivant montre un point de données en dehors de la plage des autres valeurs. Les valeurs vont de 0 à environ 70 000. Ce point a une valeur x d’environ 80 000, ce qui est en dehors de la plage. Cela affecte beaucoup plus la ligne de régression que le point de la première image ci-dessus, qui se trouvait dans la plage des autres valeurs.
Une valeur aberrante à effet de levier élevé. Le point a plus déplacé le graphique car il est en dehors de la plage des autres valeurs.
En général, les valeurs aberrantes qui ont des valeurs proches de la moyenne de x auront moins de levier que les valeurs aberrantes vers les bords de la plage. Les valeurs aberrantes avec des valeurs de x en dehors de la plage auront plus d’effet de levier. Les valeurs extrêmes sur l’axe y (par rapport aux autres valeurs) auront plus d’influence que les valeurs plus proches des autres valeurs y.
Vous aimez les vidéos ? Abonnez-vous à notre chaîne Youtube.
Connexion à la transformation affine
La régression linéaire est infiniment connectée à la transformation affine. La formule y’ = b+ ax n’est pas vraiment linear…it ‘ est une fonction affine, qui est définie comme une fonction linéaire plus une transformation. Cela devrait donc vraiment s’appeler régression affine, pas linéaire!
——————————————————————————
Besoin d’aide pour une question de devoirs ou de test? Avec Chegg Study, vous pouvez obtenir des solutions étape par étape à vos questions d’un expert dans le domaine. Vos 30 premières minutes avec un tuteur Chegg sont gratuites!
Leave a Reply