Google Classroom
GeoGebraGeoGebra Classroom

Alt om boksplot

Hvad er et boksplot?

Et boksplot er en slags figur i statistik, som man kan bruge til hurtigt at aflæse fem forskellige deskriptorer fra et datasæt. I et boksplot er det kun x-aksen, som man skal bruge til at aflæse værdierne - så højden (y-aksen) på et boksplot betyder ikke noget. I et boksplot kan man aflæse:
  • Mindsteværdien Den mindste værdi i et datasæt
  • 1. kvartil (25%) Den observation, der ligger midt mellem mindsteværdien og medianen i et sorteret datasæt.
  • Medianen (50%) Den midterste observation i et sorteret datasæt
  • 3. kvartil (75%) Den observation, der ligger midt mellem medianen og størsteværdien i et sorteret datasæt.
  • Størsteværdien Den største værdi i et datasæt
BONUS: Når man kender både mindste- og størsteværdien, så kan man også beregne variationsbredden:    Så man kan altså finde hele seks deskriptorer ud fra et boksplot!
Image

Prøv selv: Indtast et datasæt

Herunder kan du prøve at indtaste et datasæt (én observation i hver grøn boks), og se hvad der sker med boksplottet.
  1. Lav et datasæt, hvor medianen er 4
  2. Lav et datasæt, hvor medianen er 4 og mindsteværdien er 1
  3. Lav et datasæt, hvor medianen er det samme som 3. kvartil
  4. Lav et datasæt, hvor mindsteværdien er 1 og 1. kvartil er 4
  5. Lav et datasæt, hvor 1. kvartil, median og 3. kvartil er over 5, men mindsteværdien er under 2
  6. Lav et datasæt, på 7 observationer, hvor medianen er halvdelen af gennemsnittet.
  7. Kan du lave et datasæt, hvor alle deskriptorerer er med i tre-tabellen?

Prøv selv: Aflæs et boksplot

Sammenligning af datasæt med boksplots

Det som er så jävla smart ved boksplots er, at de gør det nemmere at sammenligne to datasæt ud fra deres deskriptorer. Eksempel på en sammenligning Herunder kan du set et eksempel på en sammenligning af to boksplots - De kunne fx vise den alder man havde, da man første gang smagte en kiwi-frugt på to forskellige arbejdspladser. Jeg kalder den øverste boksplot for A og den nederste for B. Man kan bl.a. se at:
  • Der er 25% i B, som var mellem 6 og 7 år da de smagte en kiwi. I A er der ikke en gruppe, der på samme måde ligger så tæt
  • De nederste 50% af den nederste boksplot var mellem 5 og 8 år, da de smagte en kiwi, mens de i den øverste undersøgelse har en større spredning, idet de var mellem 4 og 16 år.
  • Folk i den øverste undersøgelse var generelt ældre, da de smagte end kiwi end dem i den nederste undersøgelse. Det kan man se, fordi de øverste 50% i A havde en alder på mellem 16 og 18 år, da de smagte en kiwi første gang, mens de øverste 50% (fra median → størsteværdi) i B er mellem 13 og 17 år. De er altså yngre.
Et eksempel på to boksplots
Et eksempel på to boksplots

Prøv selv: Sammenlign to boksplot

Lav en ny opgave ved at trykke på knappen
  1. Hvilken situation kunne de to boksplot beskrive? (Fx karakterer, søvn etc)
  2. Aflæs deskriptorerne
  3. Sammenlign de to datasæt - Hvad kan du sige om deres forskelle og ligheder?