Estimarea imparțială a deviației standard
materialul de mai sus, pentru a sublinia din nou punctul, se aplică numai datelor independente. Cu toate acestea, datele din lumea reală nu îndeplinesc adesea această cerință; este autocorelat (cunoscut și sub numele de corelație serială). Ca un exemplu, citirile succesive ale unui instrument de măsurare care încorporează o formă de proces de „netezire” (mai corect, filtrare low-pass) Vor fi autocorelate, deoarece orice valoare particulară este calculată dintr-o combinație a citirilor anterioare și ulterioare.
estimările varianței și deviației standard ale datelor autocorelate vor fi părtinitoare. Valoarea preconizată a varianței eșantionului este
E = zecimal 2 {\displaystyle {\rm {e}}\left=\sigma ^{2}\left}
unde N este dimensiunea eșantionului (numărul de măsurători) și Rho _{k}}
este funcția de autocorelare (ACF) a datelor. (Rețineți că expresia din paranteze este pur și simplu una minus autocorelația medie așteptată pentru citiri.) Dacă ACF constă din valori pozitive, atunci estimarea varianței (și a rădăcinii sale pătrate, abaterea standard) va fi părtinitoare scăzută. Adică, variabilitatea reală a datelor va fi mai mare decât cea indicată printr-o variație necorectată sau un calcul al deviației standard. Este esențial să recunoaștem că, dacă această expresie trebuie utilizată pentru a corecta prejudecata, împărțind estimarea s 2 {\displaystyle S^{2}}
la cantitatea din parantezele de mai sus, atunci ACF trebuie să fie cunoscut analitic, nu prin estimare din date. Acest lucru se datorează faptului că ACF estimat va fi el însuși părtinitor.
exemplu de părtinire în deviația standardedit
pentru a ilustra magnitudinea părtinirii în deviația standard, luați în considerare un set de date care constă din lecturi secvențiale de la un instrument care utilizează un filtru digital specific al cărui ACF este cunoscut a fi dat de
k {\displaystyle \rho _{k} = (1 − \alpha) ^{k}}
unde ecuația este parametrul filtrului și ia valori de la zero la unitate. Astfel, ACF este pozitiv și scade geometric.
figura prezintă raportul dintre deviația standard estimată și valoarea sa cunoscută (care poate fi calculată analitic pentru acest filtru digital), pentru mai multe setări de la hectolitru în funcție de mărimea eșantionului n. Schimbarea lui XXL modifică raportul de reducere a varianței filtrului, despre care se știe că este
V R R = 2 − 2-XL {\displaystyle {\rm {VRR}}={\frac {\alpha }{2-\alpha }}}
astfel încât valori mai mici de rezultat în mai multe varianță de reducere, sau „netezire.”Părtinirea este indicată de valori pe axa verticală diferite de unitate; adică, dacă nu ar exista părtinire, raportul dintre abaterea standard estimată și cea cunoscută ar fi unitatea. În mod evident, pentru dimensiunile modeste ale eșantionului poate exista o părtinire semnificativă (un factor de două sau mai multe).
varianța medieid
este adesea de interes pentru a estima varianța sau deviația standard a unei medii estimate, mai degrabă decât varianța unei populații. Atunci când datele sunt autocorelate, acest lucru are un efect direct asupra varianței teoretice a mediei eșantionului, care este
V A R = 2 n . {\displaystyle {\rm {Var}} \ left = {\frac {\sigma ^{2}}{n}} \ left.}
varianța mediei eșantionului poate fi apoi estimată prin substituirea unei estimări a lui X2. O astfel de estimare poate fi obținută din ecuația pentru E dată mai sus. Mai întâi definiți următoarele constante, presupunând, din nou, un ACF cunoscut:
γ 1 ≡ 1 − 2 n − 1 ∑ k = 1 n − 1 ( 1 − k n ) ρ k {\displaystyle \gamma _{1}\equiv 1-{\frac {2}{n-1}}\sum _{k=1}^{n-1}{\left(1-{\frac {k}{n}}\right)}\rho _{k}}
γ 2 ≡ 1 + 2 ∑ k = 1 n − 1 ( 1 − k n ) ρ k {\displaystyle \gamma _{2}\equiv 1+2\sum _{k=1}^{n-1}{\left(1-{\frac {k}{n}}\right)}\rho _{k}}
astfel încât
E = 2, 2, 1, 2, 2 {\displaystyle {\rm {e}}\stânga = \sigma ^{2}\gamma _{1}\Rightarrow {\rm {e}}\stânga=\sigma ^{2}}
acest lucru spune că valoarea așteptată a cantității obținute prin împărțirea varianței eșantionului observat la factorul de corecție 1 {\displaystyle \gamma _{1}}
dă o valoare estimare imparțială a varianței. În mod similar, rescrierea expresiei de mai sus pentru varianța mediei, V A R = 2 N 2 {\displaystyle {\rm {Var}}\left={\frac {\sigma ^{2}}{n}}\gamma _{2}}
și substituind estimarea pentru 2 {\displaystyle \Sigma ^{2}}
dă v a r = e = e {\displaystyle {\rm {var}}\left={\RM {e}}\left={\RM {e}}\left={\RM {e}} \left}
care este un estimator imparțial al varianței mediei în ceea ce privește varianța eșantionului observat și cantitățile cunoscute. Dacă autocorelațiile k {\displaystyle \rho _{k}}
sunt identic zero, această expresie se reduce la rezultatul bine cunoscut pentru varianța mediei pentru datele independente. Efectul operatorului de așteptare în aceste expresii este că egalitatea se menține în medie (adică în medie).
estimarea deviației standard a populațieiedit
având expresiile de mai sus care implică varianța populației și a unei estimări a mediei acelei populații, ar părea logic să luăm pur și simplu rădăcina pătrată a acestor expresii pentru a obține estimări imparțiale ale abaterilor standard respective. Cu toate acestea, este cazul în care, deoarece așteptările sunt integrale,
E ≠ E ≠ σ γ 1 {\displaystyle {\rm {E}}\neq {\sqrt {{\rm {E}}\stânga}}\neq \sigma {\sqrt {\gamma _{1}}}}
în Schimb, să își asume o funcție de θ există astfel încât imparțial estimatorul abaterii standard poate fi scris
E = σ θ γ 1 ⇒ σ ^ = e θ γ 1 {\displaystyle {\rm {E}}=\sigma \theta {\sqrt {\gamma _{1}}}\Rightarrow {\hat {\sigma }}={\frac {s}{\theta {\sqrt {\gamma _{1}}}}}}
și XV depinde de mărimea eșantionului n și ACF. În cazul datelor NID (distribuite în mod normal și independent), radicandul este unitate, iar XV este doar funcția c4 dată în prima secțiune de mai sus. La fel ca în cazul c4, la fel ca și în cazul modelului C4, se apropie de unitate, pe măsură ce mărimea eșantionului crește (la fel ca și în cazul modelului C41).
se poate demonstra prin modelare prin simulare că ignorarea acestui element (adică luarea lui ca unitate) și utilizarea
E 1, 1 {\displaystyle {\RM {e}}\aprox \Sigma {\sqrt {\gamma _{1}}}\rightarrow {\Hat {\Sigma }}\aprox {\frac {s}{\sqrt {\gamma _{1}}}}}
elimină toate, cu excepția câtorva procente, părtinirea cauzată de autocorelare, făcând acest lucru un estimator cu părtinire redusă, mai degrabă decât un estimator imparțial. În situații practice de măsurare, această reducere a prejudecății poate fi semnificativă și utilă, chiar dacă rămâne o prejudecată relativ mică. Figura de mai sus, care arată un exemplu de părtinire în deviația standard vs.dimensiunea eșantionului, se bazează pe această aproximare; părtinirea reală ar fi ceva mai mare decât cea indicată în acele grafice, deoarece părtinirea de transformare a lui Ecuador nu este inclusă acolo.
estimarea deviației standard a mediei probei
varianța nepărtinitoare a mediei în termeni de varianță a populației și ACF este dată de
V A R = 2 N 2 {\displaystyle {\rm {Var}}\left={\frac {\sigma ^{2}}{n}}\gamma _{2}}
și din moment ce nu există valori așteptate aici, în acest caz, rădăcina pătrată poate fi luată, astfel încât
{\Gamma _{2}}}}
folosind expresia de estimare imparțială de mai sus pentru Ecuator, o estimare a deviației standard a mediei va fi apoi
Ecuator ^ X = s Ecuator n Ecuator 2 Ecuator 1 {\displaystyle {\hat {\Sigma}} _{\overline {x}}={\frac {s} {\Theta {\sqrt {n}}}} {\frac {\sqrt {\Gamma _{2}}} {\sqrt {\gamma _{1}}}}}
dacă datele sunt NID, deci că ACF dispare, aceasta se reduce la
x = S C 4 n {\displaystyle {\hat {\sigma }}_{\overline {x}}={\frac {s}{C_{4}{\sqrt {n}}}}}
Leave a Reply