Articles

표준 편차의 편견없는 추정

위의 자료는 점을 다시 강조하기 위해 독립적 인 데이터에만 적용됩니다. 그러나 실제 데이터는 종종이 요구 사항을 충족시키지 못하며 자동 상관 관계(직렬 상관 관계라고도 함)입니다. 한 예로,연속적인 독서의 측정 기기는 일부를 포함한 형태의”다듬기”(더 올바르게 낮은 패스 필터링)프로세스 autocorrelated 때문에,어떤 특정한 값을 계산한의 어떤 조합은 이전과 이후 판독.

자기 상관 데이터의 분산 및 표준 편차의 추정치는 편향됩니다. 예상되는 가치의 표본 분산입니다.

E=2σ{\displaystyle{\rm{E}}\left=\sigma^{2}\left}

{\displaystyle{\rm{E}}\left=\sigma^{2}\left}

는 샘플 크기(측정) 고 ρ k{\displaystyle\rho_{k}}

\rho_{k}

은 자기상관 함수(ACF)데이터. (괄호 안의 표현식은 판독 값에 대한 평균 예상 자기 상관을 뺀 것일뿐입니다.)ACF 가 양의 값으로 구성되면 분산(및 제곱근,표준 편차)의 추정치가 낮게 편향됩니다. 즉,데이터의 실제 변동성은 수정되지 않은 분산 또는 표준 편차 계산으로 표시된 것보다 클 것입니다. 그것은 필수적을 인정하는 경우 이 표현을 사용하여 올바른지에 대한 편견을 분할하여 예측 s2{\displaystyle s^{2}}

s^{2}

에 의해 수량 괄호 안에 위,다음 ACF 알아야 해석,지 않을 통해 추정에서 데이터입니다. 이는 추정 된 ACF 자체가 편향 될 것이기 때문입니다.

예의 바이어스에서 표준 deviationEdit

을 설명하는 크기의 바이어스에서는 표준 편차,고려한 데이터 집합으로 구성되는 순차 측정 계측기에서 사용하는 특정 디지털 필터의 ACF 은 것으로 알려진에 의해 주어진

ρ k=(1−α)k{\displaystyle\rho_{k}=(1-\alpha)^{k}}

{\displaystyle\rho_{k}=(1-\alpha)^{k}}

α 은 매개변수의 필터링하고,그 값에서 제 unity. 따라서 ACF 는 긍정적이고 기하학적으로 감소합니다.

바이어스에서는 표준 편차에 대한 autocorrelated 데이터입니다.

그림이 차지하는 비중을 나타내는 표를 알려진 값(계산할 수 있는 원통 이를 위해 디지털 필터),에 대한 몇 가지 설정의 α 기능으로 샘플 크기의 n. 변 α 변경하는 분산을 감소 비율의 필터링하는 것으로 알려져 있

V R R=α2−α{\displaystyle{\rm{VRR}}={\frac{\alpha}{2-\alpha}}}

{\displaystyle{\rm{VRR}}={\frac{\alpha}{2-\alpha}}}

도록 작은 값의 α 결과에서 더 많은 분산 축소,또는”다듬기.”편견입니다 표시된 값에 수직 축에서 다른 unity 는 경우에 없었다는 편견의 비율 추정을 알려진 표준 편차가 될 것이다. 분명히,겸손한 표본 크기의 경우 상당한 편향(두 가지 또는 그 이상의 요인)이있을 수 있습니다.

의 분산을 meanEdit

그것은 종종의 관심 분산을 추정하는 표준 편차의 추정된 의미보다는 차의 인구입니다. 데이터가 자기 상관 될 때,이것은

V a r=σ2n 인 샘플 평균의 이론적 분산에 직접적인 영향을 미친다. {\displaystyle{\rm{Var}}\left={\frac{\sigma^{2}}{n}}\left.}

{\displaystyle{\rm{Var}}\left={\frac{\sigma^{2}}{n}}\left.}

샘플 평균의 분산은 σ2 의 추정치를 대체하여 추정 할 수 있습니다. 그러한 추정치 중 하나는 위에 주어진 E 에 대한 방정식으로부터 얻어 질 수있다. 먼저 알려진 ACF 를 가정하여 다음 상수를 정의하십시오:

γ1≡1−2n−1∑k=1n−1(1−k n)ρ k{\displaystyle\gamma_{1}\equiv1-{\frac{2}{n-1}}\sum_{k=1}^{n-1}{\left(1-{\frac{k}{n}}\right)}\rho_{k}}

{\displaystyle\gamma_{1}\equiv1-{\frac{2}{n-1}}\sum_{k=1}^{n-1}{\left(1-{\frac{k}{n}}\right)}\rho_{k}}

γ2≡1+2∑k=1n−1(1−k n)ρ k{\displaystyle\gamma_{2}\equiv1+2\sum_{k=1}^{n-1}{\left(1-{\frac{k}{n}}\right)}\rho_{k}}

{\displaystyle\gamma_{2}\equiv1+2\sum_{k=1}^{n-1}{\left(1-{\frac{k}{n}}\right)}\rho _{k}}

E=2σ γ1⇒E=2σ{\displaystyle{\rm{E}}\left=\sigma^{2}\gamma_{1}\Rightarrow{\rm{E}}\left=\sigma^{2}}

{\displaystyle{\rm{E}}\left=\sigma^{2}\gamma_{1}\Rightarrow{\rm{E}}\left=\sigma^{2}}

이 말하는 예상의 가치 양 분할하여 얻어진 관찰된 샘플을 분산에 의하여 수정 요소 γ1{\displaystyle\gamma_{1}}

\gamma_{1}

에게 공정한 추정치의 차이는 없습니다. 마찬가지로,다시 쓰는 표현에 대해 위의 분산을 의미,V r=2σ n γ2{\displaystyle{\rm{Var}}\left={\frac{\sigma^{2}}{n}}\gamma_{2}}

{\displaystyle{\rm{Var}}\left={\frac{\sigma^{2}}{n}}\gamma_{2}}

와 대체에 대한 견적 σ2{\displaystyle\sigma^{2}}

\sigma^{2}

제 V r=E=전자{\displaystyle{\rm{Var}}\left={\rm{E}}\left={\rm{E}}\left}

{\displaystyle{\rm{Var}}\left={\rm{E}}\left={\rm{E}}\left}

는 관찰 된 샘플 분산 및 알려진 양의 관점에서 평균의 분산의 편향되지 않은 추정기. 면 자기상관 ρ k{\displaystyle\rho_{k}}

\rho_{k}

은 동일하게 제로,이 표현을 감소를 잘 알려진 결과에 대한 분산의 평균을 위한 독립적 데이터입니다. 이러한 표현식에서 기대 연산자의 효과는 평등이 평균(즉,평균)으로 유지된다는 것입니다.

추정하는 표준 편차의 populationEdit

을 가지는 표현상과 관련된 분산을 인구의의 추정의의 의미는 인구,그것은 것 같다는 논리를 단순히 제곱근의 이러한 표현을 얻을 수 없는 추정치를 각각의 표준 편차를 계산하는 것이 좋습니다. 그러나 그것은 경우에는,이후의 기대는 integrals,

E≠E≠σ γ1{\displaystyle{\rm{E}}\neq{\sqrt{{\rm{E}}\left}}\neq\sigma{\sqrt{\gamma_{1}}}}

{\displaystyle{\rm{E}}\neq{\sqrt{{\rm{E}}\left}}\neq\sigma{\sqrt{\gamma_{1}}}}

대신에,추측은 기능 θ 존재하는 공평한 평가의 표준편차 작성할 수 있습

E=σ θ γ1⇒σ^=s θ γ1{\displaystyle{\rm{E}}=\sigma\타{\sqrt{\gamma_{1}}}\Rightarrow{\hat{\sigma}}={\frac{s}{\타{\sqrt{\gamma_{1}}}}}}

iv 나는 이것이 내가 할 수있는 일이 아니라는 것을 알고 있지만,내가 할 수있는 일이 없다는 것을 알고 있습니다._{1}}}}}}

및 θ 는 샘플 크기 n 과 ACF 에 따라 다릅니다. NID(정상적으로 그리고 독립적으로 분산 된)데이터의 경우 radicand 는 unity 이고 γ 는 위의 첫 번째 섹션에서 주어진 c4 함수 일뿐입니다. C4 와 마찬가지로 θ 는 샘플 크기가 증가함에 따라 unity 에 접근합니다(γ1 과 마찬가지로).

을 증명할 수 있다 시뮬레이션을 통해 모델링되는 무시 θ(즉,그것은 단결)고 사용하는

E≈σ γ1⇒σ^≈s γ1{\displaystyle{\rm{E}}\약\sigma{\sqrt{\gamma_{1}}}\Rightarrow{\hat{\sigma}}\약{\frac{s}{\sqrt{\gamma_{1}}}}}

{\displaystyle{\rm{E}}\약\sigma{\sqrt{\gamma_{1}}}\Rightarrow{\hat{\sigma}}\약{\frac{s}{\sqrt{\gamma_{1}}}}}

모두 제거합니다 하지만 몇 퍼센트의 바이어스에 의한 자동 이 감소-바이어스 견적이 아닌,공평 estimator. 실용적인 측정 상황에서 바이어스의 이러한 감소는 일부 비교적 작은 바이어스가 남아 있더라도 중요 할 수 있으며 유용 할 수 있습니다. 위의 그림을 보여주는 예의 바이어스 표준 편차에 대한 샘플 크기,이를 기반으로 근사;실제 바이어스 될 것이 보다 다소 큰에 표시된 그래프후 변환 bias θ 포함되어 있지 않다.

표준 편차를 추정하는 샘플 meanEdit

공평의 분산을 의미한 관점에서 인구의 분산과 ACF 의해 주어집

V r=2σ n γ2{\displaystyle{\rm{Var}}\left={\frac{\sigma^{2}}{n}}\gamma_{2}}

{\displaystyle{\rm{Var}}\left={\frac{\sigma^{2}}{n}}\gamma_{2}}

과가 없기 때문에 예상한 값을 여기에,이 경우에는 제곱근,촬영 할 수 있습니다 그래서 그

σ x=σ n γ2{\displaystyle\sigma_{\overline{x}}={\frac{\sigma}{\sqrt{n}}}{\sqrt{\gamma_{2}}}}

{\displaystyle\sigma_{\overline{x}}={\frac{\sigma}{\sqrt{n}}}{\sqrt{\gamma_{2}}}}

를 사용하여 공평 추정치현상에 대한 σ, 예상의 표준편차의 의미는 그때

σ^x=s θ n γ2γ1{\displaystyle{\hat{\sigma}}_{\overline{x}}={\frac{s}{\타{\sqrt{n}}}}{\frac{\sqrt{\gamma_{2}}}{\sqrt{\gamma_{1}}}}}

{\displaystyle{\hat{\sigma}}_{\overline{x}}={\frac{s}{\타{\sqrt{n}}}}{\frac{\sqrt{\gamma_{2}}}{\sqrt{\gamma_{1}}}}}

경우에는 데이터는 NID,그래서 는 ACF 라이 줄어듭니다.

σ^x=s4n{\displaystyle{\hat{\sigma}}_{\overline{x}}={\frac{s}{c{4}{\sqrt{n}}}}}

{\displaystyle{\hat{\sigma}}_{\overline{x}}={\frac{s}{c{4}{\sqrt{n}}}}}