Articles

range interquartili & Outlier

Quartili & Boxes5-Numero SummaryIQRs & Outlier

Purplemath

“intervallo interquartile”, abbreviato “IQR”, è solo la larghezza del box in box-and-whisker plot. Cioè, IQR = Q3-Q1 . L’IQR può essere utilizzato come misura di come spread-out i valori sono.

Le statistiche presuppongono che i valori siano raggruppati attorno a un valore centrale. L’IQR indica come sono distribuiti i valori “medi”; può anche essere usato per dire quando alcuni degli altri valori sono” troppo lontani ” dal valore centrale. Questi punti ” troppo lontani “sono chiamati” valori anomali”, perché” si trovano al di fuori ” dell’intervallo in cui li aspettiamo.

L’IQR è la lunghezza della casella nella trama box-and-whisker. Un outlier è qualsiasi valore che si trova più di una volta e mezza la lunghezza della casella da entrambe le estremità della casella.

Il contenuto continua sotto

MathHelp.com

Trame di scatole e baffi su MathHelp.com

Cioè, se un punto dati è inferiore a Q1 – 1,5×IQR o superiore a Q3 + 1,5×IQR, viene considerato troppo lontano dai valori centrali per essere ragionevole. Forse hai urtato la bilancia quando stavi facendo quella misura, o forse il tuo compagno di laboratorio è un idiota e non avresti mai dovuto lasciarlo toccare nessuna delle apparecchiature. Chi lo sa? Ma qualunque sia la loro causa, i valori anomali sono quei punti che non sembrano “adattarsi”.

Perché una volta e mezza la larghezza della scatola per i valori anomali? Perché quel particolare valore demark la differenza tra valori” accettabili “e” inaccettabili”? Perché, quando John Tukey stava inventando la trama box-and-whisker nel 1977 per visualizzare questi valori, ha scelto 1.5×IQR come linea di demarkation per i valori anomali. Questo ha funzionato bene, quindi abbiamo continuato a usare quel valore da allora. Se approfondisci le statistiche, scoprirai che questa misura di ragionevolezza, per i dati a forma di campana, significa che di solito solo forse circa l’uno per cento dei dati sarà mai valori anomali.

Puoi usare il widget Mathway qui sotto per esercitarti a trovare l’intervallo Interquartile, chiamato anche “H-spread” (o saltare il widget e continuare con la lezione). Prova l’esercizio inserito o digita il tuo esercizio. Quindi fai clic sul pulsante e scorri verso il basso fino a” Trova l’intervallo interquartile (H-Spread) ” per confrontare la tua risposta con quella di Mathway.

Per abilitare questo widget, ti preghiamo di accettare i cookie “preferenze”.

(Fare clic su “Toccare per visualizzare i passaggi” da prendere direttamente al sito Mathway per un aggiornamento a pagamento.)

Una volta che ti senti a tuo agio nel trovare l’IQR, puoi passare a localizzare gli outlier, se presenti.

  • Trova gli eventuali valori anomali per il seguente set di dati:

10.2, 14.1, 14.4. 14.4, 14.4, 14.5, 14.5, 14.6, 14.7, 14.7, 14.7, 14.9, 15.1, 15.9, 16.4

Per scoprire se ci sono valori anomali, devo prima trovare l’IQR. Ci sono quindici punti dati, quindi la mediana sarà all’ottava posizione:

(15 + 1) ÷ 2 = 8

Quindi Q2 = 14.6.

Ci sono sette punti dati su entrambi i lati della mediana. Le due metà sono:

10.2, 14.1, 14.4. 14,4, 14,4, 14,5, 14,5

…e:

14.7, 14.7, 14.7, 14.9, 15.1, 15.9, 16.4

Q1 è il quarto valore nell’elenco, essendo il valore medio della prima metà dell’elenco; e Q3 è il dodicesimo valore, essendo th valore medio della seconda metà della lista:

Q1 = 14.4

Q3 = 14.9

Poi IQR è dato da:

IQR = 14.9 – 14.4 = 0.5

Outlier saranno i punti di seguito Q1 – 1.5 ×IQR = 14.4 – 0.75 = 13.65 o sopra Q3 + 1.5×IQR = 14.9 + 0.75 = 15.65.

Quindi gli outlier sono a:

10.2, 15.9 e 16.4

Il contenuto continua sotto

I valori per Q1 – 1.5×IQR e Q3 + 1.5×IQR sono i ” recinti “che segnano i valori” ragionevoli ” dai valori anomali. Valori anomali si trovano al di fuori delle recinzioni.

Se il tuo incarico ti fa considerare non solo valori anomali ma anche “valori estremi”, allora i valori per Q1 – 1.5×IQR e Q3 + 1.5×IQR sono i recinti “interni” e i valori per Q1 – 3×IQR e Q3 + 3×IQR sono i recinti “esterni”.

I valori anomali (contrassegnati con asterischi o punti aperti) si trovano tra le recinzioni interne ed esterne e i valori estremi (contrassegnati con qualsiasi simbolo non utilizzato per i valori anomali) si trovano al di fuori delle recinzioni esterne.

A proposito, il tuo libro potrebbe fare riferimento al valore di “1.5×IQR” come un “passo”. Quindi i valori anomali saranno i numeri che si trovano tra uno e due passi dalle cerniere, e il valore estremo saranno i numeri che sono più di due passi dalle cerniere.

Guardando di nuovo l’esempio precedente, le recinzioni esterne sarebbero a 14,4 – 3×0,5 = 12,9 e 14,9 + 3×0,5 = 16,4. Poiché 16.4 è proprio sulla recinzione esterna superiore, questo sarebbe considerato solo un valore anomalo, non un valore estremo. Ma 10.2 è completamente al di sotto della recinzione esterna inferiore, quindi 10.2 sarebbe un valore estremo.

Affiliate

Affiliate

La calcolatrice grafica può indicare o meno se un grafico box-and-whisker include valori anomali. Ad esempio, il problema di cui sopra include i punti 10.2, 15.9 e 16.4 come valori anomali. Un’impostazione sul mio calcolatore grafico fornisce la semplice trama box-and-whisker che utilizza solo il riepilogo a cinque numeri, quindi i valori anomali più lontani sono mostrati come gli endpoint dei baffi:

calcolatrice trama senza outlier

Un’altra calcolatrice consente di impostare la box-and-whisker plot con gli outliers appositamente contrassegnati (in questo caso, con una simulazione di un open dot), e i baffi di andare solo per quanto riguarda i valori massimi e minimi che non sono valori anomali:

calcolatrice trama con valori anomali

la Mia calcolatrice non fa alcuna distinzione tra valori anomali e valori estremi. Il tuo non può, neanche. Controlla il manuale del tuo proprietario ora, prima del prossimo test.

Se stai usando la tua calcolatrice grafica per aiutarti con questi grafici, assicurati di sapere quale impostazione dovresti usare e cosa significano i risultati, o la calcolatrice potrebbe darti una risposta perfettamente corretta ma “sbagliata”.

  • Trova i valori anomali e i valori estremi, se presenti, per il seguente set di dati e disegna il grafico box-and-whisker. Segna eventuali valori anomali con un asterisco e qualsiasi valore estremo con un punto aperto.

21, 23, 24, 25, 29, 33, 49

Pubblicità

Per trovare i valori anomali e i valori estremi, devo prima trovare l’IQR. Dato che ci sono sette i valori dell’elenco, la mediana è il quarto valore, così:

Q2 = 25

La prima metà della lista è:

21, 23, 24

…quindi Q1 = 23; la seconda metà è:

29, 33, 49

…così Q3 = 33. Quindi l’IQR è dato da:

IQR = 33 – 23 = 10

I valori anomali saranno i seguenti:

23 – 1.5×10 = 23 – 15 = 8

…o superiore:

33 + 1.5×10 = 33 + 15 = 48

I valori estremi saranno quelli seguenti:

23 – 3×10 = 23 – 30 = -7

…o superiore:

33 + 3×10 = 33 + 30 = 63

Quindi ho un outlier a 49 ma nessun valore estremo. Non avrò un baffo superiore sulla mia trama perché Q3 è anche il più alto non-outlier. Quindi la mia trama assomiglia a questo:

box-and-whisker plot

Va notato che i metodi, i termini e le regole sopra descritti sono ciò che ho insegnato e ciò che ho più comunemente visto insegnato. Tuttavia, il tuo corso potrebbe avere regole specifiche diverse o la tua calcolatrice potrebbe eseguire calcoli in modo leggermente diverso. Potrebbe essere necessario essere un po ‘ flessibile nel trovare le risposte specifiche per il tuo curriculum.

URL:https://www.purplemath.com/modules/boxwhisk3.htm

Pagina 1 Pagina 2 Pagina 3