Articles

Upartisk estimering af standardafvigelse

materialet ovenfor, for at understrege punktet igen, gælder kun for uafhængige data. Imidlertid opfylder data i den virkelige verden ofte ikke dette krav; det er autokorreleret (også kendt som seriel korrelation). Som et eksempel vil de successive aflæsninger af et måleinstrument, der inkorporerer en eller anden form for “udjævning” (mere korrekt, lavpasfiltrering) proces være autokorreleret, da en bestemt værdi beregnes ud fra en kombination af de tidligere og senere aflæsninger.

estimater af variansen og standardafvigelsen af autokorrelerede data vil være forudindtaget. Den forventede værdi af prøvevariansen er

E = left 2 {\displaystyle {\rm {E}}\left=\sigma ^{2}\left}

{\displaystyle {\rm {E}}\left=\sigma ^{2}\left}

hvor n er prøvestørrelsen (antal målinger) og Left k {\displaystyle \Rho _{k}}

\Rho _{k}

er autokorrelationsfunktionen (ACF) af dataene. (Bemærk, at udtrykket i parenteserne simpelthen er en minus den gennemsnitlige forventede autokorrelation for aflæsningerne.) Hvis ACF består af positive værdier, vil estimatet af variansen (og dens kvadratrod, standardafvigelsen) være forudindtaget lav. Det vil sige, at den faktiske variabilitet af dataene vil være større end den, der er angivet ved en ukorrigeret varians eller standardafvigelsesberegning. Det er vigtigt at erkende, at hvis dette udtryk skal bruges til at korrigere for bias ved at dividere estimatet s 2 {\displaystyle S^{2}}

s^{2}

med mængden i parentes ovenfor, skal ACF være kendt analytisk, ikke via estimering fra dataene. Dette skyldes, at den estimerede ACF selv vil være partisk.

eksempel på bias i standardafvigelsedit

for at illustrere størrelsen af bias i standardafvigelsen skal du overveje et datasæt, der består af sekventielle aflæsninger fra et instrument, der bruger et specifikt digitalt filter, hvis ACF vides at være givet af

Karr k = ( 1 − Karr ) k {\displaystyle \rho _{k}=(1-\alpha )^{k}}{\displaystyle \Rho _{k}=(1-\Alpha )^{k}}

hvor prisT er filterets parameter, og det tager værdier fra nul til enhed. ACF er således positiv og geometrisk faldende.

Bias i standardafvigelse for autokorrelerede data.

figuren viser forholdet mellem den estimerede standardafvigelse og dens kendte værdi (som kan beregnes analytisk for dette digitale filter), for flere indstillinger af Chr som en funktion af prøvestørrelse n. Ændring af karret ændrer filterets variansreduktionsforhold, som vides at være

V R r = Kart 2 − kart {\displaystyle {\rm {VRR}}={\frac {\alpha }{2-\alpha }}}

{\displaystyle {\rm {VRR}}={\frac {\alpha }{2-\alpha }}}

så at mindre værdier af krup resulterer i mere variansreduktion eller “udjævning.”Bias er angivet med værdier på den lodrette akse, der er forskellig fra enhed; det vil sige, hvis der ikke var nogen bias, ville forholdet mellem den estimerede og kendte standardafvigelse være enhed. Det er klart, at for beskedne prøvestørrelser kan der være betydelig bias (en faktor på to eller mere).

varians af gennemsnittetredit

det er ofte af interesse at estimere variansen eller standardafvigelsen for et estimeret gennemsnit snarere end variansen for en population. Når dataene er autokorrelerede, har dette en direkte effekt på den teoretiske varians af stikprøvegennemsnittet, som er

V a R = liter 2 n . {\displaystyle {\rm {Var}} \ left={\frac {\sigma ^{2}}{n}} \ left.}

{\displaystyle {\rm {Var}}\left={\frac {\sigma ^{2}}{n}}\left.}

variansen af prøvegennemsnittet kan derefter estimeres ved at erstatte et estimat på lurit2. Et sådant skøn kan opnås ud fra ligningen for E givet ovenfor. Definer først følgende konstanter, idet du igen antager en kendt ACF:

γ-1 ≡ 1 − 2 n − 1 ∑ k = 1 n − 1 ( 1 − k n ) ρ k {\displaystyle \gamma _{1}\equiv 1-{\frac {2}{n-1}}\sum _{k=1}^{n-1}{\left(1-{\frac {k}{n}}\right)}\rho _{k}}

{\displaystyle \gamma _{1}\equiv 1-{\frac {2}{n-1}}\sum _{k=1}^{n-1}{\left(1-{\frac {k}{n}}\right)}\rho _{k}}

γ 2 ≡ 1 + 2 ∑ k = 1 n − 1 ( 1 − k n ) ρ k {\displaystyle \gamma _{2}\equiv 1+2\sum _{k=1}^{n-1}{\left(1-{\frac {k}{n}}\right)}\rho _{k}}

{\displaystyle \gamma _{2}\equiv 1+2\sum _{k=1}^{n-1}{\left(1-{\frac {k}{n}}\right)}\rho _{k}}

E = lir 2 lir 1 lir E = lir 2 {\displaystyle {\rm {E}}\left=\sigma ^{2}\gamma _{1}\Højrepil {\rm {E}}\left=\sigma ^{2}}

{\displaystyle {\rm {E}}\left=\Sigma ^{2}\gamma _{1}\rightar {\rm {e}}\left=\Sigma ^{2}}

dette siger, at den forventede værdi af den mængde, der opnås ved at dividere den observerede prøvevarians med korrektionsfaktoren prisT 1 {\displaystyle \gamma _{1}}

\gamma _{1}

giver et upartisk skøn over variansen. Tilsvarende omskrivning af udtrykket ovenfor for variansen af middelværdien, V A R = list 2 n list 2 {\displaystyle {\rm {Var}}\left={\frac {\sigma ^{2}}{n}}\gamma _{2}}

{\displaystyle {\rm {Var}}\left={\frac {\sigma ^{2}}{n}}\gamma _{2}} {n}} \gamma _ {n}}{\displaystyle {\rm {Var}} \left = {\frac {\sigma ^{2}} {n}}\gamma _ {2}}

og erstatning af estimatet for Lot 2 {\displaystyle\Sigma ^{2}}

\Sigma ^ {2}

giver V A R=E=E {\displaystyle {\rm {Var}}\left={\rm {e}}\left={\rm {e}}\left={\rm {e}} \ left = {\rm {e}} \ left = {\rm {e}} \ left = {\rm {e}} \ left = {\rm {e}} \ left = {\rm {e}} \ left = {\rm {e}} \ left = {\rm {e}} \ left = {\rm {e}} \ left}

{\displaystyle {\rm {var}} \ left = {\rm {e}} \ Left = {\rm {e}} \ Left}

hvilket er en upartisk estimator af variansen af gennemsnittet med hensyn til den observerede prøvevarians og kendte mængder. Hvis autokorrelationerne L. k {\displaystyle \ rho _{k}}

\rho _{k}

er identisk nul, reduceres dette udtryk til det velkendte resultat for variansen af gennemsnittet for uafhængige data. Effekten af forventningsoperatøren i disse udtryk er, at ligheden holder i gennemsnittet (dvs.i gennemsnit).

estimering af standardafvigelsen for populationEdit

med ovenstående udtryk, der involverer befolkningens varians og et skøn over gennemsnittet af denne befolkning, synes det logisk at blot tage kvadratroden af disse udtryk for at opnå upartiske skøn over de respektive standardafvigelser. Men det er sådan, at, da forventningerne er integraler,

E ≠ E ≠ σ γ-1 {\displaystyle {\rm {E}}\neq {\sqrt {{\rm {E}}\left}}\neq \sigma {\sqrt {\gamma _{1}}}}

{\displaystyle {\rm {E}}\neq {\sqrt {{\rm {E}}\left}}\neq \sigma {\sqrt {\gamma _{1}}}}

i Stedet for at påtage sig en funktion θ eksisterer en sådan, at en unbiased estimator af standardafvigelsen kan være skrevet

E = σ γ θ 1 ⇒ σ ^ = s θ γ-1 {\displaystyle {\rm {E}}=\sigma \theta {\sqrt {\gamma _{1}}}\Rightarrow {\hat {\sigma }}={\frac {s}{\theta {\sqrt {\gamma _{1}}}}}}

{\displaystyle {\rm {E}}=\sigma \ theta {\gamma _{1}}}\Højre pil {\hat {\sigma }} = {\frac {s} {\theta {\kvm {\gamma _{1}}}}}}

og div afhænger af stikprøvestørrelsen n og ACF. I tilfælde af NID (normalt og uafhængigt distribuerede) data er radicand enhed, og Krar er bare C4-funktionen givet i det første afsnit ovenfor. Som med c4 nærmer sig kursen enhed, når stikprøvestørrelsen stiger (ligesom kursen 1).

det kan demonstreres via simuleringsmodellering, at ignorering af prisT (det vil sige at tage det til at være enhed) og ved hjælp af

e list 1 List ^ List s list 1 {\displaystyle {\rm {e}}\ca \Sigma {\gamma _{1}}} \højre pil {\Hat {\Sigma}} \ca {\frac {s} {\list{\gamma _{1}}}}

{\displaystyle{\rm {e}} \CA\Sigma {\kvm {\gamma _{1}}} \højre {\hat {\Sigma}} \ca {\frac {s} {\kvm{\gamma _{1}}}}}

fjerner alle undtagen et par procent af bias forårsaget af autokorrelation, hvilket gør dette til en estimator med reduceret bias snarere end en upartisk estimator. I praktiske målesituationer kan denne reduktion i bias være betydelig og nyttig, selvom der stadig er en relativt lille bias. Figuren ovenfor, der viser et eksempel på bias i standardafvigelsen vs. stikprøvestørrelse, er baseret på denne tilnærmelse; den faktiske bias ville være noget større end angivet i disse grafer, da transformationsforstyrrelsen kurr ikke er inkluderet der.

estimering af standardafvigelsen for prøven gennemsnitredit

den upartiske varians af gennemsnittet med hensyn til populationsvariansen og ACF er givet af

V a R = lot 2 n lot 2 {\displaystyle {\rm {Var}}\left={\frac {\sigma ^{2}}{n}}\gamma _{2}}

{\displaystyle {\rm {var}}\left={\frac {\Sigma ^{2}}{N}}\Gamma _{2}}

og da der ikke er nogen forventede værdier her, kan kvadratroden i dette tilfælde tages, så

{\gamma _{2}}}}

{\displaystyle \sigma _{\overline {}}={\frac {\sigma }{\frac {\gamma _{2}}} {\frac {\gamma _{2}}}

Ved hjælp af det upartiske estimatudtryk ovenfor for kr, vil et skøn over standardafvigelsen af gennemsnittet derefter være

kr ^ ^ = s kr n kr 2 kr 1 {\displaystyle {\hat{\Sigma}} _{\overline {}}={\frac {s} {\theta {\theta {\theta {\gamma _{2}}} {\frac {\gamma _{1}}}}

{\displaystyle {\hat {\Sigma}} _{\overline {}}={\\frac {s} {\Theta {\theta {n}}}} {\frac {\gamma _ {2}}} {\frat {\gamma _{1}}}}}

hvis dataene er NID, så at ACF ‘ en forsvinder, reduceres dette til

LIT ^ s = s c 4 n {\displaystyle {\hat {\sigma }}_{\overline {s}}={\frac {s}{c_{4}{\KVRT {n}}}}

{\displaystyle {\hat {\sigma}} _{\overline {s}}={\frac {s}}{\displaystyle {\hat {\sigma}} _ {\overline {s}} = {\frac {s} {C_ {4} {\SV {n}}}}