Interkvartile Områder & Outliers
Kvartiler & Bokser5-Nummer SummaryIQRs & Outliers
purplemath
«interkvartile range», forkortet «iqr», er bare bredden på boksen i box-and-Whisker-plottet. DET vil SI, IQR = Q3-Q1 . IQR kan brukes som et mål på hvor spredt verdiene er.
Statistikk antar at verdiene dine er gruppert rundt en sentral verdi. IQR forteller hvordan spredt ut de» midtre «verdiene er; det kan også brukes til å fortelle når noen av de andre verdiene er «for langt» fra den sentrale verdien. Disse» for langt unna «punktene kalles «outliers», fordi de» ligger utenfor » området der vi forventer dem.
IQR er lengden på boksen i box-and-whisker-plottet. En outlier er en verdi som ligger mer enn en og en halv ganger lengden på boksen fra hver ende av boksen.
Innholdet Fortsetter Under
MathHelp.com
Det vil si at hvis et datapunkt er under Q1 – 1.5×IQR eller Over Q3 + 1.5×IQR, anses DET å være for langt fra de sentrale verdiene til å være rimelige. Kanskje du bumped veieskalaen når du gjorde den ene måling, eller kanskje din laboratoriepartner er en idiot, og du burde aldri ha latt ham røre noe av utstyret. Hvem vet? Men uansett årsak, er outliers de punktene som ikke ser ut til å «passe».
Hvorfor en og en halv ganger bredden på boksen for uteliggere? Hvorfor setter den spesielle verdien forskjellen mellom «akseptable» og «uakseptable» verdier? Fordi, Da John Tukey oppfant box-and-whisker-plottet i 1977 for å vise disse verdiene, valgte Han 1,5×IQR som demarkasjonslinje for outliers. Dette har fungert bra, så vi har fortsatt å bruke den verdien helt siden. Hvis du går videre inn i statistikk, vil du finne at dette mål på rimelighet, for bell-kurve-formet data, betyr at vanligvis bare kanskje så mye som om lag en prosent av dataene noensinne vil være uteliggere.
Du kan bruke Mathway-widgeten nedenfor for å øve på Å finne Det Interkvartile Området, også kalt «H-spread» (eller hopp over widgeten og fortsett med leksjonen). Prøv den angitte øvelsen, eller skriv inn din egen øvelse. Klikk deretter på knappen og bla ned til «Finn Interquartile Range (H-Spread)» for å sammenligne svaret Ditt Til Mathways.
vennligst godta» innstillinger » informasjonskapsler for å aktivere denne widgeten.
(Klikk På «Trykk for å vise trinn» for å bli tatt direkte til Mathways nettsted for en betalt oppgradering.)
Når du er komfortabel med å finne IQR, kan du gå videre til å finne outliers, hvis noen.
-
Finn eventuelle avvik for følgende datasett:
10.2, 14.1, 14.4. 14.4, 14.4, 14.5, 14.5, 14.6, 14.7, 14.7, 14.7, 14.9, 15.1, 15.9, 16.4
for å finne ut om det er noen outliers, må jeg først finne IQR. Det er femten datapunkter, så medianen vil være i åttende posisjon:
(15 + 1) ÷ 2 = 8
Deretter Q2 = 14.6.
det er syv datapunkter på hver side av medianen. De to halvdelene er:
10,2, 14,1, 14,4. 14,4, 14,4, 14,5, 14,5
…og:
14.7, 14.7, 14.7, 14.9, 15.1, 15.9, 16.4
Q1 Er den fjerde verdien i listen, som er midtverdien av første halvdel av listen; Og Q3 er den tolvte verdien, som er den midterste verdien av den andre halvdelen av listen:
Q1 = 14.4
Q3 = 14.9
DA er IQR gitt av:
IQR = 14.9 – 14.4 = 0.5
Uteliggere vil være noen poeng under Q1 – 1.5 ×iqr = 14.4 – 0.75 = 13.65 eller høyere q3 + 1.5×Iqr = 14.9 + 0.75 = 15.65.
så er outliers på:
10.2, 15.9 og 16.4
Innholdet Fortsetter Under
verdiene For q1 – 1.5×IQR og Q3 + 1.5×IQR er » gjerder «som markerer de» rimelige » verdiene fra outlier-verdiene. Uteliggere ligger utenfor gjerdene.
vurderer du ikke bare uteliggere, men også «ekstreme verdier», er verdiene For q1 – 1.5×IQR OG Q3 + 1.5×iqr de «indre» gjerdene, og verdiene For Q1 – 3×Iqr OG Q3 + 3×iqr er de «ytre» gjerdene.
uteliggerne (merket med stjerner eller åpne prikker) er mellom de indre og ytre gjerdene, og de ekstreme verdiene (merket med hvilket symbol du ikke brukte for utligningene) er utenfor de ytre gjerdene.
for øvrig kan boken din referere til verdien av » 1,5×IQR «som et»trinn». Da vil uteliggerne være tallene som er mellom ett og to trinn fra hengslene, og ekstremverdien vil være tallene som er mer enn to trinn fra hengslene.
ser du igjen på forrige eksempel, vil de ytre gjerdene være på 14.4-3×0.5 = 12.9 og 14.9 + 3×0.5 = 16.4. Siden 16.4 er rett på det øvre ytre gjerdet, vil dette anses å være bare en outlier, ikke en ekstrem verdi. Men 10.2 er helt under det nedre ytre gjerdet, så 10.2 ville være en ekstrem verdi.
Affiliate
Affiliate
For eksempel inkluderer problemet ovenfor punktene 10.2, 15.9 og 16.4 som uteliggere. En innstilling på min grafisk kalkulator gir enkel box-and-whisker plot som bruker bare fem-nummer sammendrag, så lengst uteliggere vises som endepunktene på værhår:
en annen kalkulatorinnstilling gir boksen og whisker-plottet med utligningene spesielt merket (i dette tilfellet med en simulering av en åpen prikk), og vispene går bare så langt som de høyeste og laveste verdiene som ikke er utliggere:
kalkulatoren min skiller ikke mellom outliers og ekstreme verdier. Kanskje ikke din heller. Sjekk din brukerhåndbok nå, før neste test.
hvis du bruker grafisk kalkulator for å hjelpe med disse tomter, sørg for at du vet hvilken innstilling du skal bruke og hva resultatene betyr, eller kalkulatoren kan gi deg en helt riktig, men «feil» svar.
-
Finn outliers og ekstreme verdier, hvis noen, for følgende datasett, og tegn box-and-whisker-plottet. Merk eventuelle uteliggere med en stjerne og eventuelle ekstreme verdier med en åpen prikk.
21, 23, 24, 25, 29, 33, 49
Annonse
for å finne outliers og ekstreme verdier, må jeg først finne IQR. Siden det er syv verdier i listen, er medianen den fjerde verdien, så:
Q2 = 25
første halvdel av listen er:
21, 23, 24
…Så Q1 = 23; andre halvdel er:
29, 33, 49
…så q3 = 33. DA ER IQR gitt av:
IQR = 33 – 23 = 10
uteliggerne vil være noen verdier under:
23 – 1.5×10 = 23 – 15 = 8
…eller over:
33 + 1.5×10 = 33 + 15 = 48
de ekstreme verdiene vil være de nedenfor:
23 – 3×10 = 23 – 30 = -7
…eller over:
33 + 3×10 = 33 + 30 = 63
Så jeg har en outlier på 49, men ingen ekstreme verdier. Jeg vil ikke ha en topp whisker på min tomt fordi Q3 er også den høyeste ikke-outlier. Så min tomt ser slik ut:
det skal bemerkes at metodene, vilkårene og reglene som er skissert ovenfor, er det jeg har lært og det jeg oftest har sett lært. Kurset ditt kan imidlertid ha forskjellige spesifikke regler, eller kalkulatoren din kan gjøre beregninger litt annerledes. Du må kanskje være litt fleksibel for å finne svarene som er spesifikke for læreplanen din.
URL:https://www.purplemath.com/modules/boxwhisk3.htm
side 1page 2Page 3
Leave a Reply