Denne historien begynner der introduksjonen sluttet.

Det var en gang 33 sydensteiner som ble plukket av en ivrig statistiker. Steinene var runde og glatte og gode å kjenne på. Statistikeren puttet steinene i en grønn tomflaske og tok dem med seg hjem.

DSC_1689

Steingamle minner til venstre. Den nye vinen til høyre.

S1

Vel hjemme la hun steinene på eikebordet i stua. På den lille fliken av bordet som ble ryddet til fotograferingen lå de 33 steinene så pent dandert med sine duse fargetoner, at det så ut som om de nettopp var leid inn av et interiørmagasin.

IMG_20160825_115745

Steiner med Instagram-filter @statistrikk

Etter at hun hadde postet steinene på Instagram @statistrikk (steinene kniste henrykt over å ha blitt fotografert så nakne. -Dette er vår nakne protest mot alt fokuset på fasong, sa de), veide hun dem på kjøkkenvekta, og sorterte dem etter størrelsen (til mumlende kommentarer om kroppspress fra dem som nettopp hadde posert nakne).

Selv om det ikke er helt stuerent å oppgi vekt på en blogg, gjøres et unntak her. Den minste veide mindre enn ett gram, og den største 12 gram.

S2

Så var det frem med grillpinnene. Grillpinner er uunnværlig i enhver hobbyskuff, selv om de er for spisse og ru til at de kan brukes som strikkepinner. Grillpinnene ble lagt ut med jevne mellomrom.

s30

Grillpinnene delte dermed steinene inn i grupper. Statistikeren gjorde som geitekillingen, og telte opp antallet steiner mellom hver grillpinne. Dette skjedde til høylytte protester fra steiner som mente de var feilklassifisert, og som prøvde å rulle over i en lettere vekt-kategori.

(Dette høres kanskje litt teit ut? Men fakta er at når forskere sender ut spørreskjemaer som spør etter opplysninger om vekt, fysisk aktivitet, sunt kosthold, røyking etc, så lyver folk. De oppgir generelt at de veier mindre, trener mer, spiser sunnere, og røyker mindre enn de faktisk gjør, selv om svarene anonymiseres. Det vet vi fra studier der man har sammenlignet selvrapporterte opplysninger med målinger. Steinene måtte pent finne seg i å bli liggende der de lå.)

For å oppsummere hvor mange steiner det var i hver gruppe, og lettere se hvordan vektfordelingen til steinene var, klippet statistikeren av grillpinnene i høyder som tilsvarte antallet i hver gruppe. Denne oppsummeringen kalles et histogram.

s20

Histogrammet oppsummerer hvordan vekten til steinene fordeler seg. Vi velger selv intervallene, og histogrammet viser antallet steiner i hvert intervall.

…Og snipp, snapp snute, hadde statistikeren laget et histogram som var et interiørmagasin verdig.


Men historien slutter ikke her.

I stedet for å legge grillpinnene med lik avstand mellom hverandre, ville nemlig statistikeren også legge pinnene slik at de hadde like mange steiner mellom hverandre.

s21

Først la hun en grillpinne i midten slik at det ble to grupper med like mange steiner på hver side. -Det går ikke, for vi er 33, og det kan ikke deles på to, fnyste sydensteinene. -Joda, sa statistikeren tålmodig (vi statistikere er faktisk ganske tålmodige), -Halvparten på hver side betyr at det skal være 16 steiner på hver side, og pinnen legges midt på en stein.

Midtsteinen var *ikke* fornøyd. Ikke bare hadde hun en uelegant grillpinne tvers over magen. Så fikk hun også vite at hun ble kalt “Median”, og da ble det enda verre. -Hvem vil være en middelmådighet, liksom! Men noen må være det også. Noen av oss er de vanlige. Ikke alle er spesielle eller ekstreme, uansett om det er vekt, matematikkferdigheter, strikkehastighet eller tålmodighet som måles.

Statistikeren gjorde det samme på hver side av midtpinnen:

s16

Tell selv: Med ca 8 steiner mellom hver grillpinne, ble steinene delt inn i fire grupper. I hver gruppe er det 8 steiner.

Til sammenligning:

I histogrammet var avstanden mellom hver pinne lik, men antallet steiner mellom pinnene forskjellig:

s30s16

Nå er det like mange steiner mellom hver grillpinne, men avstanden mellom pinnene er forskjellig.

Så lagde statistikeren en pinneboks rundt den midterste halvparten av steinene. Samtlige steiner som havnet inne i boksen følte nå at de også hadde havnet i kategorien vanlig. De hadde blitt satt i bås som vanlige, mente de. Og det var jo akkurat det de hadde.

s14

En boks for de vanligste 50%.

Den fjerdedelen av steinene som havnet på venstre side av boksen, og fjerdedelen på høyre side av boksen følte derimot at det var noe ekstra med dem. Det hadde også de litt rett i. Men til sammen utgjorde de halvparten av steinene, og skulle vi kalt halvparten av steinene spesielle, kunne vi like gjerne gjort som på facebook, og kalt alle sammen verdens vakreste.

Altså: Noen ganger holder det ikke å bare identifisere den midterste/vanligste halvparten, og de ytterste fjerdedelene. Noen ganger er det faktisk helt nødvendig å identifisere hvem som faktisk *er* spesielle eller ekstreme, altså de som skiller seg vesentlig fra de andre.

Lærere gjør det for å finne ut hvem som trenger ekstra utfordringer. Helsesøster gjør det for å finne ut hvem som trenger ekstra oppfølging.

s13

1,5 bokslengder

s12

1,5 bokslengder fra midten

s11

3 bokslengder fra midten

Statistikere gjør det noen ganger ved å måle bredden på boksen, og se hvilke steiner som for eksempel er mer enn 1,5 bokslengder unna midten (de er spesielle, og markeres med en ring), og hvilke som er mer enn tre bokslengder unna midten (de er ekstreme, og markeres med en stjerne). Denne oppsummeringen kalles et boksplott.

s40

Boksplottet oppsummerer oppsummerer også hvordan vekten til steinene fordeler seg. Boksplottet viser hvor de vanlige verdiene er, og hvilke verdier som er spesielle eller ekstreme.

…Og snipp, snapp snute, hadde statistikeren også laget et boksplott som var et interiørmagasin verdig.

Den største steinen var ambivalent. Skulle hun rulle rundt og protestere? Skulle hun juge på vekta? Trøstespise en pose potetgull? Eller skulle hun slå seg til ro med at hun var en stjerne? Hun valgte det siste.

(I parentes bemerkes: Du lurer kanskje på hva dette har med strikking å gjøre? Svaret er enkelt: Boksplottet er yndlingsplottet mitt, og derfor har jeg allerede både strikket og blogget et boksplott, se innlegget om skjerfet som trolig er verdens første strikkede publikasjonsliste

DSC_0836

Oppskrift kommer senere i høst. Det var imidlertid ikke så lett å blogge forklaringen til hva et boksplott er. Men så fant jeg steinene, se forrige blogginnlegg. Resten er historie, og den starter øverst på denne siden.)