Articles

A standard deviáció elfogulatlan becslése

a fenti anyag, a pont újbóli hangsúlyozására, csak független adatokra vonatkozik. A valós adatok azonban gyakran nem felelnek meg ennek a követelménynek; autokorrelált (soros korrelációnak is nevezik). Például egy olyan mérőműszer egymást követő leolvasása, amely magában foglalja a “simítás” (pontosabban az alacsony áteresztésű szűrés) valamilyen formáját, autokorrelálódik, mivel az adott értéket a korábbi és későbbi leolvasások valamilyen kombinációjából számítják ki.

az autokorrelált adatok varianciájára és szórására vonatkozó becslések elfogultak lesznek. A várható érték a minta eltérés E = σ 2 {\displaystyle {\rm {E}}\balra=\sigma ^{2}\maradt}

{\displaystyle {\rm {E}}\balra=\sigma ^{2}\maradt}

, ahol az n a minta mérete (mérések száma) pedig ρ k {\displaystyle \rho _{k}}

\rho _{k}

a autocorrelation function (ACF) az adatok. (Vegye figyelembe,hogy a zárójelben szereplő kifejezés egyszerűen egy mínusz a leolvasások átlagos várható autokorrelációja.) Ha az ACF pozitív értékekből áll, akkor a variancia (és annak négyzetgyöke, a szórás) becslése alacsony lesz. Vagyis az adatok tényleges változékonysága nagyobb lesz, mint amit egy korrigálatlan variancia vagy szórásszámítás jelez. Lényeges felismerni, hogy, ha ezt a kifejezést használni, hogy helyes az az elfogultság, elosztjuk a becslés s 2 {\displaystyle s^{2}}

s^{2}

a mennyiség zárójelben felett, akkor az ACF ismerni kell analitikusan, nem via becslési az adatokat. Ennek oka az, hogy a becsült ACF maga is elfogult lesz.

Példa elfogultság standard deviationEdit

az, Hogy bemutassa a nagysága, az elfogultság a szórás, fontolja meg egy adatkészlet áll, hogy az egymást követő mérések egy eszköz, amely egy adott digitális szűrő, akinek az ACF ismert, hogy adott

ρ k = ( 1 − α ) k {\displaystyle \rho _{k}=(1-\alfa )^{k}}

{\displaystyle \rho _{k}=(1-\alfa )^{k}}

ahol α a paraméter a szűrő tart értékek nulláról egység. Így az ACF pozitív és geometriailag csökken.

torzítás az autokorrelált adatok szórásában.

az ábra a becsült szórás arányát mutatja az ismert értékhez (amely analitikusan kiszámítható ehhez a digitális szűrőhöz), az α több beállításához, mint az n minta méretének függvényében. Változó α megváltoztatja a variancia-csökkentési arány a szűrő, amely arról ismert, hogy

V R R = α 2 − α {\displaystyle {\rm {VRR}}={\frac {\alfa }{2-\alfa }}}

{\displaystyle {\rm {VRR}}={\frac {\alfa }{2-\alfa }}}

tehát, hogy a kisebb értékek az α eredményeképpen több eltérés csökkentése, vagy “simítás.”Az elfogultságot az egységtől eltérő függőleges tengelyen lévő értékek jelzik; vagyis ha nem lenne torzítás, a becsült és az ismert szórás aránya egység lenne. Nyilvánvaló, hogy a szerény mintaméretek esetében jelentős torzítás lehet (kettő vagy több tényező).

az átlag varianciája

gyakran érdekes megbecsülni egy becsült átlag varianciáját vagy szórását, nem pedig egy populáció varianciáját. Ha az adatok autokorreláltak, ez közvetlen hatással van a minta átlagának elméleti varianciájára, ami

v a r = σ 2 n . {\displaystyle {\rm {Var}}} \ left = {\FRAC {\sigma ^{2}}} {n}}}\left.}

{\displaystyle {\rm {Var}}}\left={\FRAC {\sigma ^{2}} {n}}\left.}

a minta átlagának varianciája ezután becsülhető meg σ2 becslés helyettesítésével. Az egyik ilyen becslés a fent megadott E egyenletből nyerhető. Először határozza meg a következő állandókat, feltételezve, ismét ismert ACF: γ 1 ≡ 1 − 2 n − 1 ∑ k = 1 n − 1 ( 1 − k, n ) ρ k {\displaystyle \gamma _{1}\equiv 1-{\frac {2}{n-1}}\összeg _{k=1}^{n-1}{\left(1-{\frac {k}{n}}\right)}\rho _{k}}

{\displaystyle \gamma _{1}\equiv 1-{\frac {2}{n-1}}\összeg _{k=1}^{n-1}{\left(1-{\frac {k}{n}}\right)}\rho _{k}}

γ 2 ≡ 1 + 2 ∑ k = 1 n − 1 ( 1 − k, n ) ρ k {\displaystyle \gamma _{2}\equiv 1+2\összeg _{k=1}^{n-1}{\left(1-{\frac {k}{n}}\right)}\rho _{k}}

{\displaystyle \gamma _{2}\equiv 1+2\összeg _{k=1}^{n-1}{\left(1-{\frac {k}{n}}\right)}\rho _{k}}

így E = σ 2 γ 1 ⇒ E = σ 2 {\displaystyle {\rm {E}}\balra=\sigma ^{2}\gamma _{1}\működik a legjobban, {\rm {E}}\balra=\sigma ^{2}}

{\displaystyle {\rm {E}}\balra=\sigma ^{2}\gamma _{1}\működik a legjobban, {\rm {E}}\balra=\sigma ^{2}}

Ez azt mondja, hogy a várható értéke a mennyiség osztásával kapott a megfigyelt minta varianciája a korrekciós tényező γ 1 {\displaystyle \gamma _{1}}

\gamma _{1}

ad torzítatlan becslést a variancia. Hasonlóképpen, újra írni a fenti kifejezés a variancia az átlagos, V a r = σ 2 n γ 2 {\displaystyle {\rm {Var}}\balra={\frac {\sigma ^{2}}{n}}\gamma _{2}}

{\displaystyle {\rm {Var}}\balra={\frac {\sigma ^{2}}{n}}\gamma _{2}}

pedig helyettesítik az előzetes becslés σ 2 {\displaystyle \sigma ^{2}}

\sigma ^{2}

ad V a r = E = E {\displaystyle {\rm {Var}}\balra={\rm {E}}\balra={\rm {E}}\maradt}

{\displaystyle {\rm {Var}}\balra={\rm {E}}\balra={\rm {E}}\maradt}

amely egy az átlag varianciájának elfogulatlan becslése a megfigyelt minta varianciája és az ismert mennyiségek tekintetében. Ha az autokorrelációk ρ k {\displaystyle \ rho _{k}}

\rho _{k}

azonos nulla, ez a kifejezés a független adatok átlagának változására vonatkozó jól ismert eredményre csökken. Az elvárás operátor hatása ezekben a kifejezésekben az, hogy az egyenlőség az átlagban (azaz átlagosan) tart.

Becslése a szórás a populationEdit

Miután a fenti kifejezések bevonásával a variancia a lakosság, valamint becslését jelenti, hogy a lakosság, az lenne logikus, hogy egyszerűen csak a négyzetgyök ezek a kifejezések, hogy szerezzen elfogulatlan becslések a megfelelő szórás. Azonban az a helyzet, hogy, mivel a várakozások integrálok,

E ≠ E ≠ ∑ γ 1 {\displaystyle {\rm {E}}\neq {\sqrt {{\rm {E}}\maradt}}\neq \sigma {\sqrt {\gamma _{1}}}}

{\displaystyle {\rm {E}}\neq {\sqrt {{\rm {E}}\maradt}}\neq \sigma {\sqrt {\gamma _{1}}}}

Ehelyett tegyük fel, hogy egy funkció θ létezik olyan, hogy egy elfogulatlan becslő, a szórás lehet írni E = σ θ, γ 1 ⇒ σ ^ = s θ, γ 1 {\displaystyle {\rm {E}}=\sigma \theta {\sqrt {\gamma _{1}}}\Működik a legjobban, {\kalap {\sigma }}={\frac {s}{\theta {\sqrt {\gamma _{1}}}}}}

{\displaystyle {\rm {e}}} = \ sigma \theta {\sqrt {\gamma _ {1}}} \ rightarrow {\hat {\sigma}}} ={\FRAC {s} {\theta {\sqrt {\gamma _{1}}}}}}

és θ az N mintamérettől és az ACF-től függ. A NID (általában és egymástól függetlenül elosztott) adatok esetében a radicand egység, a θ pedig csak a fenti első szakaszban megadott c4 függvény. A C4-hez hasonlóan a θ megközelíti az egységet, ahogy a minta mérete növekszik (mint a γ1).

bizonyítható keresztül szimulációs modellezés, hogy figyelmen kívül θ (ez, figyelembe véve azt, hogy az egység) használata E ≈ ∑ γ 1 ⇒ σ ^ ≈ s γ 1 {\displaystyle {\rm {E}}\kb \sigma {\sqrt {\gamma _{1}}}\működik a legjobban, {\kalap {\sigma }}\körülbelül {\frac {s}{\sqrt {\gamma _{1}}}}}

{\displaystyle {\rm {E}}\kb \sigma {\sqrt {\gamma _{1}}}\működik a legjobban, {\kalap {\sigma }}\körülbelül {\frac {s}{\sqrt {\gamma _{1}}}}}

eltávolítja minden, de néhány százaléka az elfogultság által okozott autocorrelation, hogy ez egy csökkentett-elfogultság becslő, ahelyett, hogy egy elfogulatlan becslő. Gyakorlati mérési helyzetekben ez az elfogultság-csökkenés jelentős, hasznos lehet, még akkor is, ha viszonylag kis torzítás marad. A fenti ábra, amely egy példát mutat a szórás torzítására a minta méretével szemben, ezen a közelítésen alapul; a tényleges torzítás valamivel nagyobb lenne, mint az ezekben a grafikonokban feltüntetett, mivel a θ transzformációs torzítás nem szerepel ott.

Becslése a szórás a minta meanEdit

Az elfogulatlan variancia az átlagos szempontjából a lakosság variancia a ACF által megadott

V a r = σ 2 n γ 2 {\displaystyle {\rm {Var}}\balra={\frac {\sigma ^{2}}{n}}\gamma _{2}}

{\displaystyle {\rm {Var}}\balra={\frac {\sigma ^{2}}{n}}\gamma _{2}}

mivel nem várt értékek itt, ebben az esetben a négyzetgyök lehet venni, szóval, hogy

σ x = σ n γ 2 {\displaystyle \sigma _{\overline {x}}={\frac {\sigma }{\sqrt {n}}}{\sqrt {\gamma _{2}}}}

{\displaystyle \sigma _{\overline {x}}={\frac {\sigma }{\sqrt {n}}}{\sqrt {\gamma _{2}}}}

az elfogulatlan becslés kifejezés a fenti σ, becsült szórás, az azt jelenti, majd

σ ^ x = s θ n γ 2 γ 1 {\displaystyle {\kalap {\sigma }}_{\overline {x}}={\frac {s}{\theta {\sqrt {n}}}}{\frac {\sqrt {\gamma _{2}}}{\sqrt {\gamma _{1}}}}}

{\displaystyle {\kalap {\sigma }}_{\overline {x}}={\frac {s}{\theta {\sqrt {n}}}}{\frac {\sqrt {\gamma _{2}}}{\sqrt {\gamma _{1}}}}}

Ha az adatok NID, szóval az ACF eltűnik, ez csökkenti

σ ^ x = s c 4 n {\displaystyle {\kalap {\sigma }}_{\overline {x}}={\frac {s}{c_{4}{\sqrt {n}}}}}

{\displaystyle {\kalap {\sigma }}_{\overline {x}}={\frac {s}{c_{4}{\sqrt {n}}}}}