Articles

Bezstronne oszacowanie odchylenia standardowego

powyższy materiał, aby ponownie podkreślić punkt, dotyczy tylko niezależnych danych. Jednak dane ze świata rzeczywistego często nie spełniają tego wymogu; są autokorelowane (znane również jako korelacja szeregowa). Jako przykład, kolejne odczyty przyrządu pomiarowego, który zawiera pewną formę procesu „wygładzania” (bardziej poprawnie, filtrowanie dolnoprzepustowe) będą autokorelowane, ponieważ każda konkretna wartość jest obliczana z pewnej kombinacji wcześniejszych i późniejszych odczytów.

szacunki wariancji i odchylenia standardowego danych autokorelowanych będą stronnicze. Wartość oczekiwana wariancji próbki wynosi

e = σ 2 {\displaystyle {\RM {e}}\left=\sigma ^{2}\left}

{\displaystyle {\RM {e}}\left=\sigma ^{2}\left}

gdzie n to Rozmiar próbki (liczba pomiarów) i ρ Rho _{k}}

\Rho _{k}

jest funkcją autokorelacji (ACF) danych. (Zauważ, że wyrażenie w nawiasach jest po prostu jeden minus średnia oczekiwana autokorelacja dla odczytów.) Jeśli ACF składa się z wartości dodatnich, oszacowanie wariancji (i jej pierwiastka kwadratowego, odchylenia standardowego) będzie stronnicze niskie. Oznacza to, że rzeczywista zmienność danych będzie większa niż wskazywana przez nieskorygowaną wariancję lub obliczenie odchylenia standardowego. Ważne jest, aby uznać, że jeśli to wyrażenie ma być użyte do skorygowania błędu, dzieląc estymat S 2 {\displaystyle S^{2}}

s^{2}

przez ilość w nawiasach powyżej, to ACF musi być znany analitycznie, a nie poprzez estymację z danych. Wynika to z faktu, że szacowany ACF będzie sam w sobie stronniczy.

przykład odchylenia standardowegoedit

aby zilustrować wielkość odchylenia standardowego, rozważ zbiór danych, który składa się z sekwencyjnych odczytów z instrumentu, który używa określonego filtra cyfrowego, o którym wiadomo, że ACF jest podawany przez

ρ K = ( 1 − α ) k {\displaystyle \Rho _{K}=(1-\alpha )^{k}}

{\displaystyle displaystyle \Rho _{K}=(1-\Alpha )^{K}}

gdzie α jest parametrem filtra i przyjmuje wartości od zera do jedności. Tak więc ACF jest dodatni i geometrycznie maleje.

odchylenie standardowe dla danych autokorelowanych.

rysunek przedstawia stosunek szacowanego odchylenia standardowego do jego znanej wartości (którą można obliczyć analitycznie dla tego filtra cyfrowego), dla kilku ustawień α w funkcji wielkości próbki N. Zmiana α zmienia współczynnik redukcji wariancji filtra, który jest znany jako

V R R = α 2 − α {\displaystyle {\rm {VRR}}={\frac {\alpha }{2-\alpha }}}

{\displaystyle {\RM {VRR}}={\frac {\alpha }{2-\alpha }}}

tak, że mniejsze wartości α powodują większą redukcję wariancji, czyli „wygładzanie.”Odchylenie jest wskazywane przez wartości na osi pionowej różniące się od jedności; to znaczy, jeśli nie było odchylenia, stosunek oszacowanego do znanego odchylenia standardowego byłby jednością. Oczywiście, dla skromnych rozmiarów próbek może być znaczące odchylenie (współczynnik dwa lub więcej).

Wariancjaedytuj

często interesujące jest oszacowanie wariancji lub odchylenia standardowego szacowanej średniej, a nie wariancji populacji. Gdy dane są autokorelowane, ma to bezpośredni wpływ na teoretyczną wariancję średniej próby, która wynosi

V A R = σ 2 n. {\displaystyle {\RM {Var}} \ left={\frac {\sigma ^{2}} {n}} \ left.}

{\displaystyle {\RM {Var}} \ left = {\frac {\sigma ^{2}}{n}}\left.}

wariancję średniej próby można następnie oszacować przez zastąpienie oszacowania σ2. Jedno takie oszacowanie można uzyskać z równania dla e podanego powyżej. Najpierw zdefiniuj następujące stałe, zakładając ponownie znany ACF:

γ 1 ≡ 1 − 2 n − 1 ∑ k = 1 n − 1 ( 1 − k n ) ρ k {\displaystyle \gamma _{1}\equiv 1-{\frac {2}{n-1}}\sum _{k=1}^{n-1}{\left(1-{\frac {k}{N}}\right)}\rho _{k}}

{\displaystyle \gamma _{1}\equiv 1-{\frac {2}{N-1}}\Sum _{K=1}^{N-1}{\left(1-{\frac {K}{N}}\right)}\Rho _{K}}

γ 2 ≡ 1 + 2 ∑ K = 1 N − 1 ( 1 − k n ) ρ k {\displaystyle \gamma _{2}\equiv 1+2\Sum _{K=1}^{N-1}{\left(1-{\frac {k}{n}}\right)}\Rho _{k}}

{\displaystyle \gamma _{2}\equiv 1+2\Sum _{K=1}^{N-1}{\left(1-{\frac {K}{N}}\right)}\Rho _{k}}

tak, że

e = σ 2 γ 1 ⇒ e = σ 2 {\displaystyle {\RM {e}}\left=\sigma ^{2}\gamma _{1}\Rightarrow {\rm {e}}\left=\sigma ^{2}}

{\displaystyle {\rm {e}}\left=\Sigma ^{2}\gamma _{1}\rightarrow {\RM {e}}\Left=\Sigma ^{2}}

to mówi, że oczekiwana wartość ilości otrzymana przez podzielenie obserwowanej wariancji próbki przez współczynnik korekcji γ 1 {\displaystyle \gamma _{1}}

\gamma _{1}

daje wynik bezstronne oszacowanie wariancji. Podobnie, przepisując powyższe wyrażenie dla wariancji średniej, V A R = σ 2 n γ 2 {\displaystyle {\RM {Var}}\left={\frac {\sigma ^{2}}{n}}\gamma _{2}}

{\displaystyle {\RM {Var}}\left={\frac {\sigma ^{2}}{n}}\gamma _{2}

i zastąpienie oszacowania σ 2 {\displaystyle \Sigma ^{2}}

\Sigma ^{2}

daje V A R = E = E {\displaystyle {\rm {var}}\left={\RM {e}}\Left={\RM {e}}\Left={\RM {e}} \Left}

{\displaystyle{\RM {var}}\Left={\RM {e}}\Left = {\RM {e}} \ left}

która jest bezstronny Estymator wariancji średniej pod względem obserwowanej wariancji próbki i znanych ilości. Jeśli autokorelacje ρ k {\displaystyle \rho _{k}}

\Rho _{k}

są identyczne zeru, to wyrażenie redukuje się do dobrze znanego wyniku wariancji średniej dla niezależnych danych. Efekt operatora oczekiwania w tych wyrażeniach polega na tym, że równość utrzymuje się w średniej (tj. w średniej).

Szacowanie odchylenia standardowego populacjiedit

mając powyższe wyrażenia obejmujące wariancję populacji i oszacowanie średniej tej populacji, logiczne wydaje się po prostu wziąć pierwiastek kwadratowy z tych wyrażeń, aby uzyskać bezstronne szacunki odpowiednich odchyleń standardowych. Jednakże, ponieważ oczekiwania są całkami,

E ≠ e ≠ σ γ 1 {\displaystyle {\rm {e}}\neq {\sqrt {{\rm {e}}\left}}\neq \sigma {\sqrt {\gamma _{1}}}}

{\displaystyle {\rm {e}}\neq {\sqrt {{\RM {e}}\Left}}\neq \Sigma {\sqrt {\Gamma _{1}}}}

zamiast tego załóżmy, że istnieje funkcja θ tak, że można zapisać bezstronny estymator odchylenia standardowego

e = σ θ γ 1 ⇒ σ ^ = s θ γ 1 {\displaystyle {\RM {e}}=\Sigma \Theta {\sqrt {\gamma _{1}}}\rightarrow {\Hat {\Sigma }}={\frac {s}{\Theta {\sqrt {\gamma _{1}}}}}}

{\displaystyle {\RM {E}}= \ sigma \ Theta {\sqrt {\gamma _{1}}}\Rightarrow {\hat {\sigma }} ={\frac {s} {\theta {\sqrt {\gamma _{1}}}}}}

i θ zależy od wielkości próbki n i ACF. W przypadku danych NID (normalnie i niezależnie rozproszonych) radikand jest jednością, a θ jest tylko funkcją c4 podaną w pierwszej sekcji powyżej. Podobnie jak w przypadku c4, θ zbliża się do jedności wraz ze wzrostem wielkości próbki(podobnie jak γ1).

za pomocą modelowania symulacyjnego można wykazać, że ignorując θ (to znaczy przyjmując ją za jedność) i używając

e ≈ σ γ 1 ⇒ σ ^ ≈ s γ 1 {\displaystyle {\RM {e}}\approx \sigma {\sqrt {\gamma _{1}}}\Rightarrow {\hat {\sigma }}\approx {\frac {s}{\sqrt {\gamma _{1}}}}

{\displaystyle {\RM {e}}\approx \Sigma {\sqrt {\gamma _{1}}}\rightarrow {\Hat {\Sigma}} \Approx {\frac {s} {\sqrt {\gamma _{1}}}}}

usuwa wszystkie, z wyjątkiem kilku procent odchylenia spowodowanego autokorelacją, czyniąc to estymatorem o zmniejszonym odchyleniu, a nie bezstronnym estymatorem. W praktycznych sytuacjach pomiarowych redukcja odchylenia może być znacząca i użyteczna, nawet jeśli nadal istnieje niewielkie odchylenie. Powyższy rysunek, pokazujący przykład odchylenia standardowego w stosunku do wielkości próby, opiera się na tym przybliżeniu; rzeczywiste odchylenie byłoby nieco większe niż wskazane na tych wykresach, ponieważ odchylenie transformacji θ nie jest tam uwzględnione.

Szacowanie odchylenia standardowego średniej próby edytuj

bezstronna wariancja średniej pod względem wariancji populacyjnej i ACF jest dana przez

V A R = σ 2 n γ 2 {\displaystyle {\RM {Var}}\left={\frac {\sigma ^{2}}{n}}\gamma _{2}}

{\displaystyle {\RM {var}}\Left={\frac {\Sigma ^{2}}{N}}\Gamma _{2}}

a ponieważ nie ma tu oczekiwanych wartości, w tym przypadku można wziąć pierwiastek kwadratowy, tak że

σ x = σ n γ 2 {\displaystyle \Sigma _{\overline {x}}={\frac {\Sigma }{\sqrt {n}}}{\sqrt {\gamma _{2}}}}

{\displaystyle \sigma _{\overline {x}}={\frac {\sigma }{\sqrt {n}}}{\sqrt {\gamma _{2}}}}

korzystając z powyższego bezstronnego wyrażenia oszacowania dla σ, oszacowanie odchylenia standardowego średniej będzie wtedy wynosić

σ ^ x = S θ n γ 2 γ 1 {\displaystyle {\Hat {\sigma} {\overline {x}}={\frac {s} {\Theta {\sqrt {n}}}} {\frac {\sqrt {\Gamma _{2}}} {\sqrt {\gamma _{1}}}}}

{\displaystyle {\Hat {\Sigma}} _{\overline {x}}={\frac {s} {\theta {\sqrt {n}}}} {\frac {\sqrt {\Gamma _{2}}} {\sqrt {\gamma _{1}}}}}

Jeśli dane są NID, więc że ACF znika, to zmniejsza się do

σ ^ x = S c 4 n {\displaystyle {\hat {\sigma }}_{\overline {x}}={\frac {s}{c_{4}{\sqrt {n}}}}}

{\displaystyle {\hat {\sigma }}_{\overline {x}}={\frac {s}{C_{4}{\sqrt {n}}}}}