Upartisk estimering af standardafvigelse
materialet ovenfor, for at understrege punktet igen, gælder kun for uafhængige data. Imidlertid opfylder data i den virkelige verden ofte ikke dette krav; det er autokorreleret (også kendt som seriel korrelation). Som et eksempel vil de successive aflæsninger af et måleinstrument, der inkorporerer en eller anden form for “udjævning” (mere korrekt, lavpasfiltrering) proces være autokorreleret, da en bestemt værdi beregnes ud fra en kombination af de tidligere og senere aflæsninger.
estimater af variansen og standardafvigelsen af autokorrelerede data vil være forudindtaget. Den forventede værdi af prøvevariansen er
E = left 2 {\displaystyle {\rm {E}}\left=\sigma ^{2}\left}
hvor n er prøvestørrelsen (antal målinger) og Left k {\displaystyle \Rho _{k}}
er autokorrelationsfunktionen (ACF) af dataene. (Bemærk, at udtrykket i parenteserne simpelthen er en minus den gennemsnitlige forventede autokorrelation for aflæsningerne.) Hvis ACF består af positive værdier, vil estimatet af variansen (og dens kvadratrod, standardafvigelsen) være forudindtaget lav. Det vil sige, at den faktiske variabilitet af dataene vil være større end den, der er angivet ved en ukorrigeret varians eller standardafvigelsesberegning. Det er vigtigt at erkende, at hvis dette udtryk skal bruges til at korrigere for bias ved at dividere estimatet s 2 {\displaystyle S^{2}}
med mængden i parentes ovenfor, skal ACF være kendt analytisk, ikke via estimering fra dataene. Dette skyldes, at den estimerede ACF selv vil være partisk.
eksempel på bias i standardafvigelsedit
for at illustrere størrelsen af bias i standardafvigelsen skal du overveje et datasæt, der består af sekventielle aflæsninger fra et instrument, der bruger et specifikt digitalt filter, hvis ACF vides at være givet af
Karr k = ( 1 − Karr ) k {\displaystyle \rho _{k}=(1-\alpha )^{k}}
hvor prisT er filterets parameter, og det tager værdier fra nul til enhed. ACF er således positiv og geometrisk faldende.
figuren viser forholdet mellem den estimerede standardafvigelse og dens kendte værdi (som kan beregnes analytisk for dette digitale filter), for flere indstillinger af Chr som en funktion af prøvestørrelse n. Ændring af karret ændrer filterets variansreduktionsforhold, som vides at være
V R r = Kart 2 − kart {\displaystyle {\rm {VRR}}={\frac {\alpha }{2-\alpha }}}
så at mindre værdier af krup resulterer i mere variansreduktion eller “udjævning.”Bias er angivet med værdier på den lodrette akse, der er forskellig fra enhed; det vil sige, hvis der ikke var nogen bias, ville forholdet mellem den estimerede og kendte standardafvigelse være enhed. Det er klart, at for beskedne prøvestørrelser kan der være betydelig bias (en faktor på to eller mere).
varians af gennemsnittetredit
det er ofte af interesse at estimere variansen eller standardafvigelsen for et estimeret gennemsnit snarere end variansen for en population. Når dataene er autokorrelerede, har dette en direkte effekt på den teoretiske varians af stikprøvegennemsnittet, som er
V a R = liter 2 n . {\displaystyle {\rm {Var}} \ left={\frac {\sigma ^{2}}{n}} \ left.}
variansen af prøvegennemsnittet kan derefter estimeres ved at erstatte et estimat på lurit2. Et sådant skøn kan opnås ud fra ligningen for E givet ovenfor. Definer først følgende konstanter, idet du igen antager en kendt ACF:
γ-1 ≡ 1 − 2 n − 1 ∑ k = 1 n − 1 ( 1 − k n ) ρ k {\displaystyle \gamma _{1}\equiv 1-{\frac {2}{n-1}}\sum _{k=1}^{n-1}{\left(1-{\frac {k}{n}}\right)}\rho _{k}}
γ 2 ≡ 1 + 2 ∑ k = 1 n − 1 ( 1 − k n ) ρ k {\displaystyle \gamma _{2}\equiv 1+2\sum _{k=1}^{n-1}{\left(1-{\frac {k}{n}}\right)}\rho _{k}}
så
E = lir 2 lir 1 lir E = lir 2 {\displaystyle {\rm {E}}\left=\sigma ^{2}\gamma _{1}\Højrepil {\rm {E}}\left=\sigma ^{2}}
dette siger, at den forventede værdi af den mængde, der opnås ved at dividere den observerede prøvevarians med korrektionsfaktoren prisT 1 {\displaystyle \gamma _{1}}
giver et upartisk skøn over variansen. Tilsvarende omskrivning af udtrykket ovenfor for variansen af middelværdien, V A R = list 2 n list 2 {\displaystyle {\rm {Var}}\left={\frac {\sigma ^{2}}{n}}\gamma _{2}}
og erstatning af estimatet for Lot 2 {\displaystyle\Sigma ^{2}}
giver V A R=E=E {\displaystyle {\rm {Var}}\left={\rm {e}}\left={\rm {e}}\left={\rm {e}} \ left = {\rm {e}} \ left = {\rm {e}} \ left = {\rm {e}} \ left = {\rm {e}} \ left = {\rm {e}} \ left = {\rm {e}} \ left = {\rm {e}} \ left = {\rm {e}} \ left}
hvilket er en upartisk estimator af variansen af gennemsnittet med hensyn til den observerede prøvevarians og kendte mængder. Hvis autokorrelationerne L. k {\displaystyle \ rho _{k}}
er identisk nul, reduceres dette udtryk til det velkendte resultat for variansen af gennemsnittet for uafhængige data. Effekten af forventningsoperatøren i disse udtryk er, at ligheden holder i gennemsnittet (dvs.i gennemsnit).
estimering af standardafvigelsen for populationEdit
med ovenstående udtryk, der involverer befolkningens varians og et skøn over gennemsnittet af denne befolkning, synes det logisk at blot tage kvadratroden af disse udtryk for at opnå upartiske skøn over de respektive standardafvigelser. Men det er sådan, at, da forventningerne er integraler,
E ≠ E ≠ σ γ-1 {\displaystyle {\rm {E}}\neq {\sqrt {{\rm {E}}\left}}\neq \sigma {\sqrt {\gamma _{1}}}}
i Stedet for at påtage sig en funktion θ eksisterer en sådan, at en unbiased estimator af standardafvigelsen kan være skrevet
E = σ γ θ 1 ⇒ σ ^ = s θ γ-1 {\displaystyle {\rm {E}}=\sigma \theta {\sqrt {\gamma _{1}}}\Rightarrow {\hat {\sigma }}={\frac {s}{\theta {\sqrt {\gamma _{1}}}}}}
og div afhænger af stikprøvestørrelsen n og ACF. I tilfælde af NID (normalt og uafhængigt distribuerede) data er radicand enhed, og Krar er bare C4-funktionen givet i det første afsnit ovenfor. Som med c4 nærmer sig kursen enhed, når stikprøvestørrelsen stiger (ligesom kursen 1).
det kan demonstreres via simuleringsmodellering, at ignorering af prisT (det vil sige at tage det til at være enhed) og ved hjælp af
e list 1 List ^ List s list 1 {\displaystyle {\rm {e}}\ca \Sigma {\gamma _{1}}} \højre pil {\Hat {\Sigma}} \ca {\frac {s} {\list{\gamma _{1}}}}
fjerner alle undtagen et par procent af bias forårsaget af autokorrelation, hvilket gør dette til en estimator med reduceret bias snarere end en upartisk estimator. I praktiske målesituationer kan denne reduktion i bias være betydelig og nyttig, selvom der stadig er en relativt lille bias. Figuren ovenfor, der viser et eksempel på bias i standardafvigelsen vs. stikprøvestørrelse, er baseret på denne tilnærmelse; den faktiske bias ville være noget større end angivet i disse grafer, da transformationsforstyrrelsen kurr ikke er inkluderet der.
estimering af standardafvigelsen for prøven gennemsnitredit
den upartiske varians af gennemsnittet med hensyn til populationsvariansen og ACF er givet af
V a R = lot 2 n lot 2 {\displaystyle {\rm {Var}}\left={\frac {\sigma ^{2}}{n}}\gamma _{2}}
og da der ikke er nogen forventede værdier her, kan kvadratroden i dette tilfælde tages, så
{\gamma _{2}}}}
Ved hjælp af det upartiske estimatudtryk ovenfor for kr, vil et skøn over standardafvigelsen af gennemsnittet derefter være
kr ^ ^ = s kr n kr 2 kr 1 {\displaystyle {\hat{\Sigma}} _{\overline {}}={\frac {s} {\theta {\theta {\theta {\gamma _{2}}} {\frac {\gamma _{1}}}}
hvis dataene er NID, så at ACF ‘ en forsvinder, reduceres dette til
LIT ^ s = s c 4 n {\displaystyle {\hat {\sigma }}_{\overline {s}}={\frac {s}{c_{4}{\KVRT {n}}}}
Leave a Reply