四分位間範囲
連続分布の四分位間範囲は、確率密度関数を積分することによって計算できます(累積分布関数を生成します—CDFを計算する他の 下四分位数Q1はPDFの−∞からQ1への積分が0.25に等しくなるような数であり、上四分位数Q3は−∞からQ3への積分が0.75に等しくなるような数である。CDFに関しては、四分位数は次のように定義できる。
Q1=CDF−1(0.25){\displaystyle Q_{1}={\text{CDF}}.{-1}(0.25){\displaystyle Q_{1}={\text{CDF}}.{-1}(0.25){\displaystyle Q_{1}={\text{CDF}}.{-1}(0.25){\displaystyle Q_{1}={\text{CDF}}.{-1}(0.25){\displaystyle Q_{1}={\text{CDF}}.{-1}(0.2525),}Q3=CDF−1(0.75),{\displaystyle Q_{3}={\text{CDF}}{\text{CDF}}{\text{CDF}}{\text{CDF}}{\text{CDF}}}}^{-1}(0.75),}
ここで、CDF−1は分位数関数です。
の範囲やしの中央値は、共通し分布は以下に示
配布 | 中央値 | IQR |
---|---|---|
通常の | μ | 2Φ−1(0.75)σ≈1.349σ≈(27/20)σ |
ラプラス | μ | 2b ln(2)≈1.386b |
コーシー | μ | 2γ |
分布の正規性の四分位範囲検定編集
母集団PのIQR、平均、および標準偏差pが正規分布であるか、ガウス分布であるかの簡単なテストでは。 Pが正規分布の場合、最初の四分位数z1の標準スコアは-0.67であり、3番目の四分位数z3の標準スコアは+0.67です。 Pに対して平均=Xと標準偏差=σが与えられ、Pが正規分布であれば、第一四分位数
Q1=(σ z1)+X{\displaystyle Q_{1}=(\sigma\,z_{1})+X}
および第三四分位数
Q3=(σ z3)+X{\displaystyle Q_{3}=(\sigma\,z_{3})+X}
第一四分位数または第三四分位数の実際の値が計算された値と実質的に異なる場合、Pが正規分布であれば、第一四分位数
Q1=(σ z1)+X{\displaystyle Q_{1}=(\sigma\,z_{3})+X}
正規分布ではありません。 しかし、正規分布は、そのQ1およびQ2標準を維持するために自明に摂動される可能性があります。 0.67と-0.67のスコアは正規分布していない(したがって、上記のテストでは偽陽性が生成されます)。 Q-Qプロットのような正規性のより良い検定がここに示されます。
Leave a Reply