Articles

Objektiv uppskattning av standardavvikelse

materialet ovan, för att betona punkten igen, gäller endast oberoende data. Verkliga data uppfyller emellertid ofta inte detta krav; det är autokorrelaterat (även känt som seriell korrelation). Som ett exempel kommer de successiva avläsningarna av ett mätinstrument som innehåller någon form av ”utjämning” (mer korrekt, lågpassfiltrering) process att autokorreleras, eftersom ett visst värde beräknas från någon kombination av tidigare och senare avläsningar.

uppskattningar av variansen och standardavvikelsen för autokorrelerade data kommer att vara partiska. Det förväntade värdet av provvariansen är

E = C/2 {\displaystyle {\rm {e}}\left=\sigma ^{2}\left}

{\displaystyle {\rm {e}}\left=\sigma ^{2}\left}

där n är provstorleken (antal mätningar) och c/k {\displaystyle \Rho _{k}}

\Rho _{k}

är autokorrelationsfunktionen (ACF) för data. (Observera att uttrycket i parenteserna helt enkelt är ett minus den genomsnittliga förväntade autokorrelationen för avläsningarna.) Om ACF består av positiva värden kommer uppskattningen av variansen (och dess kvadratrot, standardavvikelsen) att vara förspänd låg. Det vill säga den faktiska variationen av data kommer att vara större än den som indikeras av en okorrigerad varians eller standardavvikelseberäkning. Det är viktigt att inse att om detta uttryck ska användas för att korrigera för bias, genom att dividera uppskattningen s 2 {\displaystyle s^{2}}

s^{2}

med kvantiteten inom parentes ovan, måste ACF vara känt analytiskt, inte via uppskattning från data. Detta beror på att den uppskattade ACF själv kommer att vara partisk.

exempel på förspänning i standard deviationEdit

för att illustrera storleken på förspänningen i standardavvikelsen, överväga en dataset som består av sekventiella avläsningar från ett instrument som använder ett specifikt digitalt filter vars ACF är känt för att ges av

Jacobsen K = ( 1 − crunch ) k {\displaystyle \rho _{K}=(1-\alpha )^{k}}

{\displaystyle \rho _{K}=(1-\alpha )^{k}}{\displaystyle \ rho _ {K} = (1 - \ alpha) ^ {k}}{\displaystyle \ Rho _ {K} = (1 - \ alpha) ^ {k}}

där kub är parametern för filtret, och det tar värden från noll till enhet. Således är ACF positiv och geometriskt minskande.

Bias i standardavvikelse för autokorrelerade data.

figuren visar förhållandet mellan den uppskattade standardavvikelsen och dess kända värde (som kan beräknas analytiskt för detta digitala filter), för flera inställningar av XML som en funktion av provstorlek n. Om du ändrar det ändrar du filterets variansreduktionsförhållande, vilket är känt för att vara

vr r = 2 − c/c {\displaystyle {\rm {VRR}}={\frac {\alpha }{2-\alpha }}}

{\displaystyle {\rm {VRR}}={\frac {\alpha }{2-\alpha}}}

så att mindre värden på Kubi resulterar i mer variansreduktion eller ”utjämning.”Förspänningen indikeras av värden på den vertikala axeln som skiljer sig från enhet; det vill säga om det inte fanns någon förspänning skulle förhållandet mellan den uppskattade till kända standardavvikelsen vara enhet. Det är uppenbart att för blygsamma provstorlekar kan det finnas betydande bias (en faktor på två eller flera).

varians av medelvärdet

det är ofta av intresse att uppskatta variansen eller standardavvikelsen för ett uppskattat medelvärde snarare än variansen för en population. När data är autokorrelerade har detta en direkt effekt på den teoretiska variansen för provmedelvärdet, vilket är

V a r = 2 n. {\displaystyle {\rm {var}} \ left={\frac {\sigma ^{2}}{n}} \ left.}

{\displaystyle {\rm {var}} \ vänster = {\frac {\sigma ^{2}}{n}}\vänster.}

variansen för medelvärdet för provet kan sedan beräknas genom att ersätta en uppskattning av kub2. En sådan uppskattning kan erhållas från ekvationen för E som anges ovan. Definiera först följande konstanter, antar, igen, en känd ACF:

γ-1 ≡ 1 − 2 n − 1 ∑ k = 1 n − 1 ( 1 − k n ) ρ k {\displaystyle \gamma _{1}\equiv 1-{\frac {2}{n-1}}\summan _{n=1}^{n-1}{\left(1-{\frac {n}{n}}\höger)}\rho _{k}}

{\displaystyle \gamma _{1}\equiv 1-{\frac {2}{n-1}}\summan _{n=1}^{n-1}{\left(1-{\frac {n}{n}}\höger)}\rho _{k}}

γ 2 ≡ 1 + 2 ∑ k = 1 n − 1 ( 1 − k n ) ρ k {\displaystyle \gamma _{2}\equiv 1+2\summan _{n=1}^{n-1}{\left(1-{\frac {n}{n}}\höger)}\rho _{k}}

{\displaystyle \gamma _{2}\equiv 1+2\summan _{n=1}^{n-1}{\left(1-{\frac {n}{n}}\höger)}\rho _{k}}

så att

E = 2 2 8 fdc1cf173″>{\displaystyle {\rm {e}}\left = \sigma ^{2}\gamma _{1}\Rightarrow {\rm {e}}\left=\Sigma ^{2}}

{\displaystyle {\rm {e}}\left=\sigma ^{2}\gamma _{1}\rightarrow {\rm {e}}\left=\sigma ^{2}}

detta säger att det förväntade värdet av den mängd som erhållits genom att dividera den observerade provvariansen med korrigeringsfaktorn jacob1 {\displaystyle \gamma _{1}}

\gamma _{1}

ger en objektiv uppskattning av variansen. På samma sätt skriver du om uttrycket ovan för variansen av medelvärdet, V A r = 2 cr n 2 {\displaystyle {\rm {var}}\left={\frac {\sigma ^{2}}{n}}\gamma _{2}}

{\displaystyle {\rm {var}}\left={\frac {\sigma ^{2}}{n}}\gamma _{2}}

och ersätter uppskattningen för 2 {\displaystyle \Sigma ^{2}}

\Sigma ^{2}

ger v a r = e = e {\displaystyle {\rm {var}}\left={\rm {e}}\left={\rm {e}}\left={\rm {e}} \left={\rm {e}}\left={\rm {e}}}

{\displaystyle {\rm {var}} \ left = {\rm {e}} \ Left = {\rm {e}} \ left}

vilket är en objektiv uppskattning av variansen av medelvärdet i termer av den observerade provvariansen och kända kvantiteter. Om autokorrelationerna är identiskt noll, reduceras detta uttryck till det välkända resultatet för variansen av medelvärdet för oberoende data. Effekten av förväntningsoperatören i dessa uttryck är att jämlikheten håller i medelvärdet (dvs. i genomsnitt).

uppskatta standardavvikelsen för populationEdit

med uttrycken ovan som involverar populationens varians och en uppskattning av medelvärdet för den befolkningen, verkar det logiskt att helt enkelt ta kvadratroten av dessa uttryck för att få objektiva uppskattningar av respektive standardavvikelser. Men det är så att, eftersom förväntningarna är integraler,

E ≠ E ≠ σ γ-1 {\displaystyle {\rm {E}}\neq {\sqrt {{\rm {E}}\left}}\neq \sigma {\sqrt {\gamma _{1}}}}

{\displaystyle {\rm {E}}\neq {\sqrt {{\rm {E}}\left}}\neq \sigma {\sqrt {\gamma _{1}}}}

i Stället anta en funktion θ finns sådana som antevă ardesriktig skattning av standardavvikelsen kan skrivas

E = σ θ γ 1 ⇒ σ ^ = s θ γ-1 {\displaystyle {\rm {E}}=\sigma \theta {\sqrt {\gamma _{1}}}\Rightarrow {\hat {\sigma }}={\frac {s}{\theta {\sqrt {\gamma _{1}}}}}}

{\displaystyle {\rm {E}}=\Sigma \ theta {\sqrt {\gamma _ {1}}}\Rightarrow {\hat {\sigma }} = {\frac {s} {\theta {\sqrt {\gamma _{1}}}}}}

och kub beror på provstorleken n och ACF. När det gäller nid (normalt och oberoende distribuerad) data är radicand unity och kub är bara C4-funktionen som ges i det första avsnittet ovan. Precis som med c4 närmar sig ozi enhet när provstorleken ökar (liksom även S1).

det kan demonstreras via simuleringsmodellering som ignorerar xib (det vill säga tar det till enhet) och använder

E-1 1 {\displaystyle {\rm {e}}\ca \Sigma {\sqrt {\gamma _{1}}}\rightarrow {\Hat {\Sigma }}\ca {\frac {s}{\sqrt {\gamma _{1}}}}}

{\displaystyle {\rm {e}}\ca \Sigma {\sqrt {\gamma _{1}}}\rightarrow {\hat {\Sigma }}\ca {\frac {s}{\sqrt {\gamma _{1}}}}}

tar bort alla utom några procent av bias orsakad av autokorrelation, vilket gör detta till en reducerad bias estimator, snarare än en objektiv estimator. I praktiska mätsituationer kan denna minskning av bias vara betydande och användbar, även om någon relativt liten bias kvarstår. Figuren ovan, som visar ett exempel på bias i standardavvikelsen vs. provstorlek, är baserad på denna approximation; den faktiska bias skulle vara något större än vad som anges i dessa grafer eftersom transformationsförskjutningen Bisexuell inte ingår där.

uppskattning av standardavvikelsen för provet meanEdit

den objektiva variansen för medelvärdet i termer av populationsvariansen och ACF ges av

V a r = 2 N 2 {\displaystyle {\rm {var}}\left={\frac {\sigma ^{2}}{n}}\gamma _{2}}

{\displaystyle {\rm {var}}\Left={\frac {\sigma ^{2}}{n}}\gamma _{2}}

och eftersom det inte finns några förväntade värden här, kan kvadratroten i detta fall tas, så att

sqrt {\gamma _{2}}}}

{\displaystyle \sigma _{\overline {x}}={\frac {\sigma }{\sqrt {\n}}} {\sqrt {\gamma _{2}}}}

med hjälp av det objektiva uppskattningsuttrycket ovan för KB kommer en uppskattning av standardavvikelsen för medelvärdet då att vara

{\Sigma}} _{\overline {x}} = {\frac {s} {\Theta {\sqrt {n}}}} {\frac {\sqrt {\gamma _{2}}} {\sqrt {\gamma _{1}}}}

{\displaystyle {\hat {\Sigma}} _{\overline {x}}={\frac {s} {\theta {\sqrt {n}}} {\frac {\sqrt {\gamma _{2}}} {\sqrt {\gamma _{1}}}}}

om data är NID, så att ACF försvinner, minskar detta till

{{\displaystyle {\hat {\sigma}} _{\overline {x}} = {\frac{s} {c_ {4} {\sqrt {n}}}}

{\displaystyle {\hat {\sigma}} _{\overline {x}}={\frac{s} {C_ {4} {\sqrt {n}}}}}