Articles

四分位数範囲&外れ値

&Boxes5-Number SummaryIQRs&&&/div>外れ値

Purplemath

“四分位間範囲”は、”iqr”と略され、ボックスとウィスカプロットのボックスの幅にすぎません。 すなわち、IQR=Q3−Q1である。 IQRは、値がどのように拡散されているかの尺度として使用できます。

統計は、値が中心値の周りにクラスタ化されていることを前提としています。 また、他の値のいくつかが中央値から「遠すぎる」ときに伝えるために使用することもできます。 これらの「遠すぎる」点は、私たちが期待する範囲の外に「ある」ため、「外れ値」と呼ばれます。

IQRは、ボックスとウィスカーのプロットのボックスの長さです。 外れ値は、ボックスの両端からボックスの長さの1.5倍以上の値です。

コンテンツは以下に続きます

MathHelp。com

ボックスとウィスカプロットオンMathHelp.comつまり、データポイントがQ1–1.5×IQRより下またはQ3+1.5×IQRより上にある場合、中心値から遠すぎて合理的ではないと見なされます。 たぶん、あなたはその一つの測定をしていたときに体重計をぶつけた、または多分あなたの研究室のパートナーは馬鹿であり、あなたは彼が機器のいずれか 誰が知ってる? しかし、その原因が何であれ、外れ値は「適合」していないように見える点です。外れ値のボックスの幅の1.5倍はなぜですか?

その特定の値が”許容可能な”値と”許容できない”値の違いをマークするのはなぜですか? なぜなら、John Tukeyが1977年にこれらの値を表示するためにbox-and-whiskerプロットを発明していたとき、彼は外れ値の脱標線として1.5×IQRを選んだからです。 これはうまくいったので、私たちはそれ以来その価値を使い続けてきました。 さらに統計に進むと、ベルカーブ型のデータの合理性の尺度は、通常、データの約1%が外れ値になる可能性があることを意味します。

以下のMathwayウィジェットを使用して、”H-spread”とも呼ばれる四分位間の範囲を見つける練習をすることができます(またはウィジェットをスキッ 入力した運動を試してみるか、自分の運動を入力してください。 次に、ボタンをクリックして下にスクロールして、あなたの答えをMathwayのものと比較するために「四分位間範囲(H-Spread)を見つける」。このウィジェットを有効にするには、”環境設定”cookieを受け入れてください。

(有料アップグレードのためにMathwayサイトに直接取られる”タップしてステップを表示する”をクリックします。IQRを見つけるのが快適になったら、外れ値がある場合は、その位置を特定することに進むことができます。

  • 次のデータセットの外れ値がある場合は、その値を検索します。

10.2,14.1,14.4。 14.4, 14.4, 14.5, 14.5, 14.6, 14.7, 14.7, 14.7, 14.9, 15.1, 15.9, 16.外れ値があるかどうかを調べるには、まずIQRを見つける必要があります。 15個のデータポイントがあるため、中央値は8番目の位置になります。

(15 + 1) ÷ 2 = 8

次にQ2=14.6です。

中央値の両側には7つのデータポイントがあります。 2つの半分は次のとおりです。

10.2、14.1、14.4。 14.4,14.4,14.5,14.5

。..そして:

14.7, 14.7, 14.7, 14.9, 15.1, 15.9, 16.4

Q1はリストの4番目の値で、リストの前半の中央の値です; そして、Q3はリストの後半の中間値であり、十二の値です。

Q1=14.4

Q3=14.9

次に、IQRは次のように与えられます。

Iqr=14.9–14.4=0.5

外れ値はQ1–1.5×IQR=0.5

外れ値はQ1–1.5×IQR=0.5

外れ値はQ1-1.5×IQR=0.5

外れ値はQ1-1.5×IQR=0.5

外れ値はQ1-1.5×IQR=0.5 14.4-0.75=13.65以上q3+1.5×iqr=14.9+0.75=15.65。次に、外れ値は次のとおりです。

10.2、15.9、および16.4

コンテンツは次のとおりです。

Q1–1.5×IQRとQ3+1の値。5×IQRは、外れ値から「合理的な」値をマークする「フェンス」です。 外れ値はフェンスの外にあります。あなたの割り当てが外れ値だけでなく「極値」も考慮している場合、Q1–1.5×IQRとQ3+1.5×IQRの値は「内部」フェンスであり、Q1–3×IQRとQ3+3×IQRの値は「外

外れ値(アスタリスクまたは開いたドットでマーク)は内側と外側のフェンスの間にあり、極値(外れ値に使用しなかったシンボルでマーク)は外側のフェちなみに、あなたの本は「1.5×IQR」の値を「ステップ」と呼んでいるかもしれません。 次に、外れ値はヒンジから1〜2ステップの間の数値になり、極端な値はヒンジから2ステップ以上の数値になります。前の例をもう一度見ると、外側のフェンスは14.4–3×0.5=12.9、14.9+3×0.5=16.4になります。 16.4は上の外側のフェンスにあるので、これは外れ値であり、極端な値ではないと考えられます。 しかし、10.2は完全に下の外側のフェンスの下にあるので、10.2は極端な値になります。

Affiliate

Affiliate

グラフ電卓は、ボックスアンドウィスカープロットに外れ値が含まれているかどうかを示す場合としない場合があります。 たとえば、上記の問題には、外れ値としてポイント10.2、15.9、および16.4が含まれています。 私のグラフ電卓の一つの設定は、五数の要約のみを使用する単純なボックスとウィスカーのプロットを与えるので、最も遠い外れ値はウィスカーの端点:

外れ値のない電卓プロット

別の電卓設定では、外れ値が特別にマークされたボックスアンドウィスカープロットが与えられます(この場合は、開いたドットのシミュレーションがあります)。私の計算機は、外れ値と極値を区別しません。 あなたもそうではないかもしれません。 次のテストの前にあなたの所有者マニュアルを、今点検して下さい。

これらのプロットを支援するためにグラフ電卓を使用している場合は、使用することになっている設定と結果が何を意味するのかを知っているか、電卓があなたに完全に正しいが”間違った”答えを与える可能性があることを確認してください。

  • 次のデータセットの外れ値と極値(存在する場合)を見つけ、箱ひげ図を描画します。 外れ値にはアスタリスクを付け、極値には開いた点を付けます。

21, 23, 24, 25, 29, 33, 49

広告

外れ値と極値を見つけるには、まずIQRを見つける必要があります。 リストには7つの値があるので、中央値は4番目の値です。

Q2=25

リストの前半は次のとおりです。

21,23,24

…だからQ1=23;後半は次のとおりです。

29,33,49

…だからq3=33。 次に、IQRは次のように与えられます。:外れ値は以下の任意の値になります。

23 – 1.5×10 = 23 – 15 = 8

。..またはそれ以上:

33 + 1.5×10 = 33 + 15 = 48

極端な値は以下の値になります。

23 – 3×10 = 23 – 30 = -7

。..またはそれ以上:

33 + 3×10 = 33 + 30 = 63だから私は49で外れ値を持っていますが、極値はありません。 Q3も最高の非外れ値であるため、私は私のプロット上のトップウィスカーを持っていません。 だから私のプロットは次のようになります:上記で概説した方法、用語、およびルールは、私が教えてきたものであり、私が最も一般的に教えてきたものであることに注意してください。 ただし、コースには異なる特定のルールがある場合や、計算機の計算方法が若干異なる場合があります。 あなたのカリキュラムに特定の答えを見つけることで幾分適用範囲が広い必要がある場合もある。/p>

URL:https://www.purplemath.com/modules/boxwhisk3.htm

ページ1ページ2ページ3

ページ1ページ2ページ3

ページ1ページ2ページ3