Articles

Upartisk estimering av standardavvik

materialet ovenfor, for å understreke punktet igjen, gjelder bare for uavhengige data. Sanntidsdata oppfyller imidlertid ofte ikke dette kravet; det er autokorrelert (også kjent som seriell korrelasjon). Som et eksempel vil de suksessive avlesningene av et måleinstrument som inkorporerer en form for» utjevning » (mer korrekt, lavpassfiltrering) prosess bli autokorrelert, siden en bestemt verdi beregnes ut fra en kombinasjon av tidligere og senere avlesninger.

Estimater av variansen og standardavviket for autokorrelerte data vil være partisk. Den forventede verdien av utvalgsvariansen er

e = σ 2 {\displaystyle {\rm {E}}\left=\sigma ^{2}\left}

{\displaystyle {\rm {E}}\left=\sigma ^{2}\left}

hvor n er utvalgsstørrelsen (antall mål) og ρ k {\displaystyle \rho _{k}}

\rho _{k}

er autokorrelasjonsfunksjonen (acf) til dataene. (Merk at uttrykket i parentesene bare er en minus gjennomsnittlig forventet autokorrelasjon for avlesningene.) Hvis ACF består av positive verdier, vil estimatet av variansen (og kvadratroten, standardavviket) være partisk lav. Det vil si at den faktiske variabiliteten av dataene vil være større enn den som er angitt av en ukorrigert varians eller standardavviksberegning. Det er viktig å erkjenne at hvis dette uttrykket skal brukes til å korrigere for bias, ved å dividere estimatet s 2 {\displaystyle s^{2}}

s^{2}

MED mengden i parentes ovenfor, må ACF være kjent analytisk, ikke via estimering fra dataene. Dette skyldes at den estimerte ACF selv vil være partisk.

Eksempel på bias i standardavvikrediger

for å illustrere størrelsen på bias i standardavviket, bør du vurdere et datasett som består av sekvensielle avlesninger fra et instrument som bruker et spesifikt digitalt filter HVIS acf er kjent for å være gitt ved

ρ k = ( 1 − α ) k {\displaystyle \rho _{k}=(1-\alpha )^{k}}

{\displaystyle \rho _{K}=(1-\alpha )^{k}}

hvor α er parameteren til filteret, og det tar verdier fra null til enhet. DERMED ER ACF positiv og geometrisk avtagende.

Bias i standardavvik for autokorrelerte data.

figuren viser forholdet mellom det estimerte standardavviket og dets kjente verdi( som kan beregnes analytisk for dette digitale filteret), for flere innstillinger av α som en funksjon av utvalgsstørrelse n. Endring av α endrer variansreduksjonsforholdet til filteret, som er kjent som

v R r = α 2 − α {\displaystyle {\rm {VRR}}={\frac {\alpha }{2-\alpha}}

{\displaystyle {\rm {VRR}}={\frac {\alpha} {2-\alpha}}

slik at mindre verdier av α resulterer i mer variansreduksjon, eller «utjevning.»Bias er indikert av verdier på den vertikale aksen forskjellig fra enhet; det vil si at hvis det ikke var noen bias, ville forholdet mellom estimert til kjent standardavvik være enhet. Det er klart at for beskjedne utvalgsstørrelser kan det være betydelig bias (en faktor på to eller flere).

varians av meanEdit

det er ofte av interesse å estimere variansen eller standardavviket til et estimert gjennomsnitt i stedet for variansen til en populasjon. Når dataene er autokorrelert, har dette en direkte effekt på den teoretiske variansen av utvalgsgjennomsnittet, som er

V a r = σ 2 n . {\displaystyle {\rm {Var}} \ venstre={\frac {\sigma ^{2}} {n}} \ venstre.

{\displaystyle {\rm {Var}} \ left={\frac {\sigma ^{2}} {n}} \ left.}

variansen i utvalgsgjennomsnittet kan da estimeres ved å erstatte et estimat på σ 2. Et slikt estimat kan fås fra ligningen For E gitt ovenfor. Definer først følgende konstanter, antar igjen en kjent ACF:

γ-1 ≡ 1 − 2 n − 1 ∑ k = 1 n − 1 ( 1 − k n ) ρ k {\displaystyle \gamma _{1}\ekv 1-{\frac {2}{n-1}}\sum _{k=1}^{n-1}{\left(1-{\frac {k}{n}}\right)}\rho _{k}}

{\displaystyle \gamma _{1}\ekv 1-{\frac {2}{n-1}}\sum _{k=1}^{n-1}{\left(1-{\frac {k}{n}}\right)}\rho _{k}}

γ 2 ≡ 1 + 2 ∑ k = 1 n − 1 ( 1 − k n ) ρ k {\displaystyle \gamma _{2}\ekv 1+2\sum _{k=1}^{n-1}{\left(1-{\frac {k}{n}}\right)}\rho _{k}}

{\displaystyle \gamma _{2}\ekv 1+2\sum _{k=1}^{n-1}{\left(1-{\frac {k}{n}}\right)}\rho _{k}}

Slik at

e = σ 2 σ 2 {\displaystyle {\rm {E}}\venstre = \sigma ^{2}\gamma _{1}\Rightarrow {\rm {E}}\venstre=\sigma ^{2}}

{\displaystyle {\rm {E}}\venstre=\sigma ^{2}\gamma _{1}\rightarrow {\rm {e}}\left=\sigma ^{2}}

dette sier at den forventede verdien av mengden oppnådd ved å dividere den observerte prøvevariansen Med Korreksjonsfaktoren γ 1 {\Displaystyle \gamma _{1}}

\gamma _{1}

gir en upartisk estimat av variansen. På samme måte, omskriving av uttrykket ovenfor for variansen av gjennomsnittet, v a r = σ 2 n γ 2 {\displaystyle {\rm {Var}}\left={\frac {\sigma ^{2}}{n}}\gamma _{2}}

{\displaystyle {\rm {Var}}\left={\frac {\sigma ^{2}}{n}}\gamma _{2}}

og erstatte estimatet for σ 2 {\displaystyle \sigma ^{2}}

\sigma ^{2}

gir v en r = e = e {\displaystyle {\rm {var}}\left={\rm {e}}\left={\rm {e}}\left={\rm {e}} \left={\rm {e}}\left={\rm {e}}

{\displaystyle {\rm {var}} \ left = {\rm {e}} \ left = {\rm {e}} \ left}

som er en upartisk estimator av variansen av gjennomsnittet i form av den observerte prøvevariansen og kjente mengder. Hvis autokorrelasjonene ρ k {\displaystyle \ rho _{k}}

\rho _{k}

er identisk null, reduseres dette uttrykket til det velkjente resultatet for variansen av gjennomsnittet for uavhengige data. Effekten av forventningsoperatøren i disse uttrykkene er at likestillingen holder i gjennomsnittet (dvs.i gjennomsnitt).

Estimering av standardavviket i befolkningenrediger

å ha uttrykkene ovenfor som involverer variansen i befolkningen, og av et estimat av gjennomsnittet av den befolkningen, synes det logisk å bare ta kvadratroten av disse uttrykkene for å oppnå objektive estimater av de respektive standardavvikene. Imidlertid er det slik at, fordi forventningene er integraler,

E ≠ E ≠ γ σ 1 {\displaystyle {\rm {E}}\neq {\sqrt {{\rm {E}}\left}}\neq \sigma {\sqrt {\gamma _{1}}}}

{\displaystyle {\rm {E}}\neq {\sqrt {{\rm {E}}\left}}\neq \sigma {\sqrt {\gamma _{1}}}}

i Stedet, anta en funksjon θ finnes, slik at en objektiv estimator for standardavviket kan være skriftlig

E = σ θ γ-1 ⇒ σ ^ = s θ γ 1 {\displaystyle {\rm {E}}=\sigma \theta {\sqrt {\gamma _{1}}}\Rightarrow {\hat {\sigma }}={\frac {s}{\theta {\sqrt {\gamma _{1}}}}}}

{\displaystyle {\rm {e}}= \ sigma \ theta {\sqrt {\gamma _{1}}} \ Rightarrow {\hat {\sigma }} ={\frac {s}{\theta {\sqrt {\gamma _{1}}}}}}

og θ avhenger av utvalgsstørrelsen n og ACF. Når det gjelder nid (normalt og uavhengig distribuert) data, er radicand enhet og θ er bare c4-funksjonen gitt i første avsnitt ovenfor. Som med c4 nærmer θ enhet etter hvert som prøvestørrelsen øker (det samme gjør γ 1).

Det kan demonstreres ved hjelp av simuleringsmodellering at man ignorerer θ (det vil si at man tar det til å være enhet) og bruker

E ≈ σ γ 1 ⇒ σ ^ ≈ 1 {\displaystyle {\rm {e}}\ca \sigma {\sqrt {\gamma _{1}}}\rightarrow {\Hat {\sigma }}\ca {\frac {s}{\sqrt {\gamma _{1}}}}

{\displaystyle {\rm {e}}\ca \sigma {\sqrt {\gamma _{1}}}\rightarrow {\hat {\sigma}} \ca {\frac {s} {\sqrt {\gamma _{1}}}}}

fjerner alle, men noen få prosent av bias forårsaket av autokorrelasjon, noe som gjør dette til en redusert bias estimator, snarere enn en objektiv estimator. I praktiske målesituasjoner kan denne reduksjonen i bias være betydelig og nyttig, selv om noen relativt små bias forblir. Figuren over, som viser et eksempel på bias i standardavviket vs. utvalgsstørrelse, er basert på denne tilnærmingen; den faktiske bias ville være noe større enn angitt i disse grafene, siden transformasjonsbias ikke er inkludert der.

Estimering av standardavviket for utvalgsgjennomsnittetrediger

den objektive variansen av gjennomsnittet i form av populasjonsvariansen og ACF er gitt ved

v a r = σ 2 n γ 2 {\displaystyle {\rm {Var}}\left={\frac {\sigma ^{2}}{n}}\gamma _{2}}

{\displaystyle {\rm {Var}}\left={\frac {\sigma ^{2}}{n}}\gamma _{2}}

og siden det ikke er noen forventede verdier her, kan kvadratroten i dette tilfellet tas slik At

σ x = σ n γ 2 {\displaystyle \sigma _{\overline {x}}={\frac {\sigma }{\sqrt {n}}}{\sqrt {n}} {\sqrt {\gamma _{2}}}}

{\displaystyle \sigma _{\overline {x}}={\frac {\sigma }{\sqrt {n}}}{\sqrt {\gamma _{2}}}

ved å bruke det objektive estimatet uttrykket ovenfor for σ, vil et estimat av standardavviket i gjennomsnitt da være

σ ^ x = s θ n γ 2 γ 1 {\displaystyle {\hat {\sigma}} _{\overline {x}}={\frac {s} {\theta {\sqrt {\gamma _{2}}} {\sqrt {\gamma _{1}}}}

{\displaystyle {\hat {\sigma}} _{\overline {x}}={\frac {s} {\theta{\sqrt {n}}} {\frac {\sqrt {\gamma _{2}}} {\sqrt {\gamma _{1}}}}}

hvis dataene ER NID, så NÅR ACF forsvinner, reduseres DETTE til

σ ^ x = s c 4 n {\displaystyle {\hat {\sigma }}_{\overline {x}}={\frac {s}{c_{4}{\sqrt {n}}}}

{\displaystyle {\hat {\sigma}} _{\overline {x}}={\frac {s} {c_{4} {\sqrt {n}}}}}