Articles

선형 회귀분석에서 Excel

튜토리얼을 위한 기본 사항에 대해 설명합니다회귀분석 및 보여줍니다 몇 가지 다른 방법을 선형 회귀분석에서 Excel.다른 데이터를 많이 제공하고 회사의 내년의 판매 수를 예측하도록 요청받습니다. 당신은 아마도 숫자에 영향을 줄 수있는 수십 가지,아마도 수백 가지 요인을 발견했습니다. 그러나 어떤 것들이 정말로 중요한지 어떻게 알 수 있습니까? Excel 에서 회귀 분석을 실행하십시오. 그것은 당신에게 이것과 더 많은 질문에 대한 답을 줄 것입니다: 어떤 요소가 중요하며 어떤 요소가 무시 될 수 있습니까? 이러한 요소들이 서로 얼마나 밀접하게 관련되어 있습니까? 그리고 예측에 대해 얼마나 확신 할 수 있습니까?

  • 회귀분석에서 Excel
  • 선형 회귀분석에서 Excel 으로 분석 도구
  • 그리기 선형 회귀 분석 그래프
  • 회귀분석에서 Excel 공식과 함께

회귀분석에서 Excel-기본

에서 통계 모델링,회귀 분석을 사용하여 예측 사이의 관계 두 개 이상의변수:

종속 변수(일명 기준 변수)는 이해하고 예측하려고하는 주요 요소입니다.

독립 변수(일명 설명 변수 또는 예측 변수)는 종속 변수에 영향을 줄 수있는 요소입니다.

회귀 분석을 이해하는 데 도움이 어떻게 종속 변수를 변경할 때 하나의 독립적인 변수까지 다양하고 있습을 수학적으로 결정하는 사람들의 변수를 정말 영향을 미친다.

기술적으로 회귀 분석 모델은 데이터 포인트의 분산을 찾는 수학적 방법 인 제곱의 합을 기반으로합니다. 의 목표는 모델은 가장 작은 가능한 제곱고 선을 그리는 가장 가까운 오는 데이터입니다.

통계에서는 단순 회귀와 다중 선형 회귀를 구분합니다. 단순 선형 회귀는 선형 함수를 사용하여 종속 변수와 하나의 독립 변수 간의 관계를 모델링합니다. 종속 변수를 예측하기 위해 두 개 이상의 설명 변수를 사용하는 경우 다중 선형 회귀를 처리합니다. 는 경우 종속변수 모델링으로 비선형 기능 때문에 데이터의 관계를 따르지 않는 직선으로 사용,비선형 회귀 대신 합니다. 이 튜토리얼의 초점은 간단한 선형 회귀에있을 것입니다.

예를 들어,의 판매 숫자를 위한 파라솔 마지막을 위해 24 개월을 찾을 수 있 월 평균 강우량을 동일한 기능을 가지고 있습니다. 줄거리는 이 정보에는 차트,그리고 회귀 라인 사이의 관계를 보여 독립변수(레인폴)및 종속변수(우산 판매)

선형 회귀방정식

수학적으로,선형 회귀분석에 의해 정의 이 방정식:

y=bx+a+ε

어디:

  • x 는 독립 변수입니다.
  • y 는 종속 변수입니다.
  • a 는 모든 x 변수가 0 과 같을 때 y 의 예상 평균값 인 Y-절편입니다. 회귀 그래프에서 선이 Y 축을 가로 지르는 지점입니다.
  • b 는 회귀선의 기울기이며,x 가 변함에 따라 y 에 대한 변화율입니다.
  • ε 는 종속 변수의 실제 값과 예측 값의 차이 인 임의 오류 항입니다.

선형 회귀방정식상 오류가 있기 때문에,실제로는 예측은 절대 완벽하게 정확합니다. 그러나 Excel 을 포함한 일부 프로그램은 뒤에서 오류 용어 계산을 수행합니다. 그래서,엑셀에서,당신의 선형 회귀분석을 사용하여 적어도 사각형 방법을 추구하고 계수를 a 와 b 하는 등

y=bx+a

우리의 예를 들어,선형 회귀방정식은 다음과 같은 모양

Umbrellas sold = b * rainfall + a

가 존재하는 다양한 방법의 소수를 찾을 a 와 b. 세 가지 주요 방법을 수행하는 선형회귀분석에서 Excel:

  • 회귀 분석 도구가 포함되어 있으로 분석 도구
  • 차트 분산으로지선
  • 선형 회귀 분석 공식

아래를 찾을 것입니다에 대한 자세한 지침을 각각 사용하는 방법입니다.

을 어떻게 선형 회귀분석에서 Excel 으로 분석 도구

이 예제를 실행하는 방법 회귀분석에서는 엑셀을 사용하여 특정 도구와 함께 포함되는 분석 도구를 추가합니다.

사용하는 분석 도구가 추가

는 분석 도구에서 사용할 수 있는 모든 버전의 Excel2019 년 2003 년 그러나 기본적으로 사용되지 않습니다. 그래서 수동으로 켜야합니다. 여기 방법:

  1. Excel 에서 파일>옵션을 클릭하십시오.
  2. Excel 옵션 대화 상자를 선택,추가 기능에 왼쪽 사이드바는지 확인,Excel 추가 기능에서 선택 관리자,그리고 이동을 클릭합니다.
  3. 에서 추가 기능을 대화 상자에,체크 분석,도구하고 확인을 클릭합니다:

이것은 추가 데이터 분석 도구를 데이터 탭의 엑셀 리본입니다.

회귀 분석 실행

이 예에서는 Excel 에서 간단한 선형 회귀를 수행하려고합니다. 우리는 무엇이 있는 목록의 평균 강우량을 위한 마지막 24 개월에서 열 B,는 우리의 독립적인 변수(예측)및 파라솔에서 판매되는 열 C 는 종속 변수입니다. 물론,다른 많은 영향을 미칠 수 있는 요인 판매는,하지만 지금 우리는 초점에서만 이러한 두 개의 변수를

으로 분석 도구가 사용할을 수행,이러한 단계를 수행하는 회귀분석에서 Excel:

  1. 데이터 탭에서,분석 그룹,클릭 데이터 분석 버튼입니다.
  2. 회귀를 선택하고 확인을 클릭하십시오.
  3. 회귀 대화 상자에,다음과 같은 설정을 구성
    • 입력을 선택합 Y 범위의 종속 변수입니다. 우리의 경우 우산 판매(C1:C25)입니다.
    • 입력 X 범위,즉 독립 변수를 선택하십시오. 이 예에서는 평균 월간 강우량(B1:B25)입니다.

    다중 회귀 모델을 작성하는 경우 독립 변수가 다른 두 개 이상의 인접한 열을 선택하십시오.

    • X 및 Y 범위의 맨 위에 헤더가 있으면 레이블 상자를 선택하십시오.
    • 선호하는 출력 옵션,우리의 경우 새 워크 시트를 선택하십시오.
    • 필요에 따라 잔차 확인란을 선택하여 예측 값과 실제 값의 차이를 가져옵니다.
  4. 확인을 클릭하고 Excel 에서 만든 회귀 분석 출력을 관찰하십시오.

해석한 회귀 분석을 출력

으로 너무 많은,실행하는 회귀분석에서 Excel 기 쉽기 때문에 모든 계산을 미리 형성되는 자동으로 합니다. 각 숫자 뒤에 무엇이 있는지 알아야하기 때문에 결과의 해석은 조금 까다 롭습니다. 아래에서 회귀 분석 출력의 4 가지 주요 부분의 고장을 찾을 수 있습니다.

회귀 분석을 출력 요약:출력

이 부분는 방법을 알려줍니다 잘 계산선형 회귀방정식에 맞는 원본 데이터입니다.

여기에 각각의 정보를 의미합니다:

여러 R. 그것은 상관관계 계수를 측정하는 강도의 선형 사이의 관계 두 변수입니다. 상관 계수는-1 과 1 사이의 임의의 값이 될 수 있으며 절대 값은 관계 강도를 나타냅니다. 큰 절대값,강력한 관계가:

  • 1 의미 강한 긍정적인 관계를
  • -1 을 의미 강한 부정적인 관계
  • 0 이 아무 관계에서 모든

R 광장입니다. 그것은 적합성의 선량을 나타내는 지표로 사용되는 결정 계수입니다. 회귀선에 얼마나 많은 점이 떨어지는 지 보여줍니다. R2 값은 제곱의 총합으로부터 계산되며,보다 정확하게는 평균에서 원래 데이터의 제곱 편차의 합입니다.

우리의 예에서,R2 는 0.91(2 자리로 반올림)이며,이는 요정 좋다. 이는 우리 값의 91%가 회귀 분석 모델에 적합하다는 것을 의미합니다. 즉,종속 변수(y-값)의 91%는 독립 변수(x-값)에 의해 설명됩니다. 일반적으로 95%이상의 R 제곱은 좋은 적합으로 간주됩니다.

조정 R 광장. 모델의 독립 변수 수에 맞게 조정 된 R 제곱입니다. 다중 회귀 분석을 위해 R 제곱 대신이 값을 사용하고 싶을 것입니다.

표준 오류. 그것은 또 다른 goodness-of-fit 측정을 표시하는 정밀도의 회귀 분석-작은 수,더 확신할 수 있습에 대한 회귀분 방정식이다. 동 R2 나타내는 비율을 종속변수의 차이에 의해 설명되는 모형,표준 오류가 절대 측정 평균을 보여 주는 거리하는 데이터 포인트에서 떨어진 회귀 라인입니다.

관찰. 그것은 단순히 모델의 관측치 수입니다.

회귀 분석을 출력:ANOVA

의 두 번째 부분은 출력이 Analysis of Variance(ANOVA):

기본적으로,그것은 분할의 합계를 사각형으로 개별 구성 요소에 대한 정보를 제공하는 수준의 다양성에 당신의 회귀분석 모형:

  • df 은 수준의 자유와 관련된 원본의 변동합니다.
  • SS 는 제곱의 합입니다. 전체 SS 와 비교하여 잔여 SS 가 작을수록 모델이 데이터에 더 잘 맞습니다.
  • MS 는 평균 제곱입니다.
  • F 는 귀무 가설에 대한 f 통계 또는 F-test 입니다. 모델의 전반적인 중요성을 테스트하는 데 사용됩니다.
  • 의미 F P-value 의 F.

ANOVA 부분은 거의 사용에 대한 간단한 선형회귀분석에서 Excel,하지만 당신은 확실히 해야 가까운 모습에서 마지막 구성 요소입니다. 중요성 F 값은 결과가 얼마나 신뢰할 수 있는지(통계적으로 유의미한)아이디어를 제공합니다. 유의 F 가 0.05(5%)미만이면 모델은 괜찮습니다. 0.05 보다 크면 다른 독립 변수를 선택하는 것이 좋습니다.

회귀 분석을 출력:계수

이 섹션이 특정 정보를 제공합의 구성 요소에 대한 분석:

가장 유용한 구성요소에서 이 섹션에서는 계수. 그것을 구축 할 수 있습 선형 회귀방정식에서 Excel:

y=bx+a

에 대한 우리의 데이터를 설정하는 방법은 무엇입니까?의 수산 판매하고 x 는 월 평균 강우량,우리의 선형 회귀 분석 수식은 다음과 같습니다:

Y = Rainfall Coefficient * x + Intercept

갖추고 b 값을 반올림하여 세 소수 자릿수 로:

Y=0.45*x-19.074

예를 들어,평균 강우량과 같 82mm,우산 판매 것을 약 17.8:

0.45*82-19.074=17.8

에 비슷한 방법으로 찾을 수 있습니다,얼마나 많은 우산이 될 것으로 판매되는 모든 다른 매달 강우(x 변수) 하도록 명령할 수 있습니다.

회귀 분석을 출력:오차

을 비교하는 경우 예상과 실제 번호 의 판매되는 파라솔에 해당하는 월간 강우량 82mm,당신은 이러한 숫자는 약간 다르다:

  • 예상:17 입니다.8(위의 계산)
  • 실제:15(소스 데이터의 행 2)

왜 차이가 있습니까? 독립 변수는 결코 종속 변수의 완벽한 예측 변수가 아니기 때문입니다. 잔류 수 있는 방법을 이해하는 데 도움을 멀리하는 실제 값은 예측 값:

하는 방법을 확인 선형 회귀 분석 그래프에서 Excel

필요한 경우 빠르게 시각화하는 둘 사이의 관계는 변수 그릴,선형 회귀분석의 차트입니다. 그건 매우 쉽습니다! 방법은 다음과 같습니다.

  1. 헤더를 포함하여 데이터가있는 두 개의 열을 선택하십시오.
  2. 에 삽입 탭에서 채팅 그룹을 클릭합 차트 분산 및 분산 축소판(첫번째)

    이를 삽입하 scatter plot 워크시트에서는 다음과 같습니다 one:

  3. 지금 우리는 그려야하는 최소 제곱법을 이용하여 분석한 라인입니다. 을 오른쪽 클릭하여 어떤 지점을 선택 추가하지선에서의 컨텍스트 메뉴입니다.
  4. 오른쪽 창에서 선택 선형지선 모양 선택적으로 체크 표시에 대한 방정식 차트를 당신의 회귀 공식:

    으로 나타날 수 있습니다,회귀방정식 Excel 은 우리를 위해 만든과 같은 선형 회귀 분석 공식을 기반으로 구축 계수를 출력합니다.

  5. 채우기&줄 탭으로 전환하고 원하는대로 줄을 사용자 정의하십시오. 예를 들어,당신이 선택할 수 있습니다 다른 라인의 색상과 사용선 대신에 점선(선택 솔리드 라인에 대한 유형자)

이 시점에서,당신의 이미 차트처럼 보이는 괜찮은 회귀분석 그래프

전 할 수 있습을 개선:

  • 끌어 방정식이 어디 있습니다.
  • 축 제목 추가(차트 요소 버튼>축 제목).
  • 경우의 데이터 포인트를 시작 중에 수평 및/또는 수직 축에서 같은 이 예제할 수 있습 제거하는 과도한 흰색 공간입니다. 다음 팁에서는이를 수행하는 방법을 설명합니다:공백을 줄이기 위해 차트 축의 크기를 조정하십시오.

    이것은 어떻게 향한 우리의 회귀 분석 그래프처럼 보인

    중요한 참고! 회귀 그래프에서 독립 변수는 항상 X 축에 있고 종속 변수는 Y 축에 있어야합니다. 그래프가 역순으로 플롯 된 경우 워크 시트의 열을 교환 한 다음 차트를 새롭게 그립니다. 원본 데이터를 다시 정렬할 수 없는 경우 차트에서 X 및 Y 축을 직접 전환할 수 있습니다.

수행하는 방법 회귀분석에서는 엑셀을 사용하여 수식

Microsoft Excel 은 통계 기능을 할 수 있도록 도울 수 있습니선형 회귀분석 등 LINEST,기울기,INTERCPET 및 CORREL.

LINEST 기능을 사용하여 적어도 사각형 회귀분석 방법을 계산하는 직선 최고의 관계를 설명하는 변수와 배열을 반환합을 설명하는 라인입니다. 이 자습서에서는 함수의 구문에 대한 자세한 설명을 찾을 수 있습니다. 지금은,하자 단식에 대한 우리의 견본 데이터 집합:

=LINEST(C2:C25, B2:B25)

기 때문에 LINEST 기능의 배열을 반환하는 값을 입력해야 합니다 그것은 배열로 공식입니다. 같은 행에서 두 개의 인접한 셀 선택,E2:F2 이 경우 수식을 입력하고 Ctrl+Shift+Enter 키를 눌러 완료하십시오.

반환합 b 계수(E1)및 일정한(F1)를 이미 친숙한 선형 회귀방정식:

y = bx + a

을 사용하지 않는 경우에는 배열에 수식의 워크시트를 계산할 수 있습니다 그리고 b 개별적으로 일반 공식:

Get Y(a):

=INTERCEPT(C2:C25, B2:B25)

Get 기울기(b):

=SLOPE(C2:C25, B2:B25)

또한,당신은 당신을 찾을 수 있습니다 상관관계 계수(다수 R 에 회귀 분석 요약을 출력)나타내는 방법을 강하게 두 변수와 관련된 각 기타:

=CORREL(B2:B25,C2:C25)

다음과 같은 스크린샷 이러한 모든 Excel 회귀 공식 행동:

팁이 있습니다. 회귀 분석에 대한 추가 통계를 얻으려는 경우이 예제와 같이 통계 매개 변수가 TRUE 로 설정된 LINEST 함수를 사용하십시오.Excel 에서 선형 회귀를 수행하는 방법입니다. 즉,마이크로 소프트 엑셀은 통계 프로그램이 아니라는 것을 명심하시기 바랍니다 말했다. 전문가 수준에서 회귀 분석을 수행해야하는 경우 XLSTAT,RegressIt 등과 같은 대상 소프트웨어를 사용하는 것이 좋습니다.

사용할 수 있 다운로드:

을 직접 체험할 수 있습니다 우리의 선형회귀식과 다른 기술에서의 튜토리얼에서,당신은 다운로드에 오신 것을 환영합니다 우리의 샘플을 회귀 분석에서 Excel 통합 문서입니다.

  • 사용하는 방법을 찾기 엑셀에서 예제와 함께
  • 을 계산하는 방법에 복리 Excel
  • 을 계산하는 방법 CAGR(합성 연간 성장율)에서 Excel