Variasjon og standardavvik:kivvadradnats go nojsairaV

Variasjon gjør at verden aldri blir kjedelig, og at statistikere aldri blir arbeidsledige, skrev jeg tidligere i sommer.

Variasjon i barn.

Siden variasjon er så viktig, finnes det mange måter å beskrive den på. Det har jeg, trebarnsmor og strikkende statistiker, tenkt å vise med barn og garn.

Variasjon i garn.

Før vi kan beskrive variasjon nærmere, må vi velge å fokusere på noe interessant som varierer. Jeg velger svangerskap. Det er mange ting som varierer med svangerskap, og en av dem er svangerskapslengden.

Det er bokstavelig talt barnelærdom at en graviditet varer i 9 måneder. De som jobber med gravide måler det i uker. Jeg har derfor målt og tegnet både unnfangelse, 9 måneder og 40 uker med gatekritt på fortauet utenfor der vi bor:

Uke 0: Unnfangelse. (Mens jeg tegnet dette, skjønte jeg at naboen i det nærmeste huset hadde bursdagsfest. Heldigvis kom verken han eller noen av gjestene ut mens jeg tegnet dette digre hjertet på gata rett utenfor huset hans. Det kunne blitt litt -eh- rart.)
9 måneder, eventuelt 40 uker senere: Fødsel! Legg merke til avstanden fra hjertet langt der borte. Dette tar tid!

Men de færreste føder etter nøyaktig 40 uker. Noen barn skvetter ut etter 38 eller 39 uker. Andre babyer har null hastverk, og venter til mor er overmoden og i 42. uke før de omsider lar seg trykke ut.

Jeg har ikke nyfødte barn å drysse utover fortauet, så jeg har tatt det som rimer mest, nemlig garn. Hvert nøste garn symboliserer nå et lite (nøste)barn.

Her er 31 nyfødte garn, lagt utover for å vise hvor langt svangerskapet var.
Tallene er oppdiktet, men de er basert på det jeg kan om svangerskapslengder, så sånn kan det veldig gjerne se ut i virkeligheten også.

Det er en opphoping av garnefødsler rundt uke 40. Hvis vi teller opp, viser det seg at like mange garn er født før uke 40, som etter uke 40. Det betyr at medianen er 40. Regner vi på det, finner vi at gjennomsnittet også er nøyaktig 40. Da har vi to tall som beskriver det typiske, det vanlige.

Hvordan skal vi beskrive variasjonen? Det enkleste er å oppgi minste og største verdi:
Alle svangerskapene varte mellom 37,1 uker og 41,8 uker. Naturen er altså ikke mer presis enn at det er et slingringsmonn på ca 5 uker.

Disse svangerskapene varte mellom 37,1 uker og 41,8 uker. Vi kaller det «range».

Noen ganger er det mer hensiktsmessig å oppgi variasjonen for de midterste 50%:
De midterste 50% av svangerskapene varte mellom 39,5 og 40,7 uker. 50% av barna er altså født innen litt over en uke. Det er ganske lite variasjon!

Den hvite pila går fra minimum til maksimum. Den lyseblå går fra nedre til øvre kvartil. Vi kaller det «interkvartil range».
Variasjon: Fra minste til største, og de midterste 50%.

Men vi gir oss ikke med det: Her kommer standardavviket!

Overskriften inneholder både variasjon og standardavvik. Den er helt symmetrisk fordi standardavviket er en måte å beskrive variasjon på som er basert på at variasjonen er like stor på hver side av midten. Vi som kjenner standardavviket godt kaller det bare SD.

Størrelsen på SD tilsvarer omtrent avstanden mellom den minste og største målingen, delt på 4 (eller 5 eller 6),

At jeg i garasjen fant 4 planker som var omtrent et SD lange er nærmest et statistisk mirakel.

men det er bare hvis fordelingen er omtrent lik på hver side av gjennomsnittet, og det ikke er noen ekstremt høye eller ekstremt lave verdier. SD gir altså ikke meining å regne ut hvis fordelingen er skjev eller du har ekstremverdier i datasettet ditt. Formelen for SD er sånn:

Men for min magefølelse for statistikk er det mye nyttigere å tenke sånn: 4*SD spenner over nesten alle dataene mine.

Dokumentet Deskriptiv statistikk for kontinuerlige data pdf gir to eksempler med repetisjonsoppgaver om dette temaet og kan fritt brukes av elever, studenter eller lærere. Velbekomme!

Livet kan bare forstås baklengs, men det må leves forlengs.

~Søren Kierkegaard 

Ok! Snurr film!

Værvariasjon

Jeg blir aldri lei av utsikten fra huset jeg vokste opp i.

I tirsdagens blogginnlegg fortalte jeg hvor begeistret man kan bli over utsikten fra stua til foreldrene mine. Men det er ikke bare variasjon i båtstørrelse som får store og små til å gå av skaftet i begeistring: Variasjonen i nordmørsværet er spektakulær. I løpet av denne feriens første dager var vi gjennom dette og mer til (#nofilter, altså!):

Den røde brygga på bildene er den gamle klippfiskbrygga fra min oldefars tid. Da min oldefar drev klippfiskbusiness her, flekket de bergene for alt grønt, la saltet torsk utover bergene og tørket den i sola og vinden, før de eksporterte den til blant annet Spania og Portugal.

På 70- og 80-tallet da jeg vokste opp husker jeg at vi lurte på hvordan i all verden de klarte å få tørket en eneste fisk, sånn som det bøttet ned med regn hele sommeren. Og regnet det ikke, var det tåke, i dager og uker i strekk. Hesjene våre råtnet der de sto, og i blomsterbedene på berget var det grønske. Hadde klimaet virkelig forandret seg så mye på en generasjon?

De siste årene har det vært mye finvær. Et år var det så fint at jordbærene modnet før sesongarbeiderne var kommet. Og da begynner man å lure: Er dette egentlig bare værvariasjon, eller er det virkelig klimaet som endrer seg? En ting er i hvert fall sikkert: Når været varierer så mye som det gjør på Nordmøre, må vi observere det over lang tid før vi kan si noe om klimaendringer.

Dette forklares eksemplarisk i den korte animasjonen om hunden og eieren fra Jo Røisliens program Siffer. Har du ikke sett den før, er det 60 vel anvendte sekunder. (Og har du sett den før er det fortsatt 60 vel anvendte sekunder. Dette er en liten perle.)

Skjermbilde fra animasjonen Hunden og eieren, fra TV-serien Siffer.

I animasjonsfilmen får vi se en eier som lufter hunden sin. Hvis vi skal gjette hvor hunden vil befinne seg noen minutter senere, er det ikke nok å se på de aller siste bevegelsene til hunden, der den vimser rundt og snuser på ting i grøftekantene. Da må vi også se på eieren som styrer hunden, og hvilken retning han har.
Jo oppsummerer: Hunden er været. Eieren er klimaet.

Klimaendringer eller ei: I en uke har jeg koset meg med denne utsikten mens jeg har strikket. Stua til foreldrene mine har vært full av mine halvferdige statistrikkeprosjekter, ungenes halvleste Donaldblader, og Oles gitarer.

Nå tar Statistrikk ferie frem til august.

Da gleder jeg meg til å presentere flere nye oppskrifter, kul statistikk, undervisningsopplegg og reisebrev (men det blir ikke mer tran på tråd!). Tusen takk til alle dere som følger med og for hyggelige tilbakemeldinger, jeg setter stor pris på det! Tusen takk også til dere som inviterer meg til å holde statistrikkeforedrag – og ikke minst til alle dere som kommer på statistrikketreff og deler begeistringen min! På gjensyn i august 🙂

Feriehilsen fra begeistret statistrikkeblogger.

Variasjon, del 1

Variasjon gjør at verden aldri blir kjedelig, og at statistikere aldri blir arbeidsledige. 

Da eldstedattera nærmet seg to år, sto hun i stua hos foreldrene mine og så omtrent denne utsikten:

Hun hadde akkurat lært seg forskjellen på stor og liten, og gestikulerte frenetisk mens hun løp frem og tilbake foran vinduet og pekte vekselsvis på Tustnaferga på den andre siden av sundet, og bestefars lille hvite båt ved brygga. Hun rettet først en dirrende pekefinger mot den store ferga og ropte med dyp stemme -TOJE BÅTEN!!, deretter mot den lille båten og pep med pipestemme *litten-båten!!* Frem og tilbake: -TOJE BÅTEN!! *litten-båten!!* *litten-båten!!* TOOOJE BÅTEN!!
Ikke rart hun var begeistret: Hun var nesten to år og hadde oppdaget variasjon.

Lys i forskjellige farger. Båter i forskjellige størrelser. Livet er vidunderlig!

En stor del av jobben til statistikere er å studere variasjon. Vi beskriver variasjon på mange forskjellige måter, avhengig av hva slags type informasjon vi har:
* Farger: 3 røde, 4 oransje, 4 rosa, 5 gule.
* Båtstørrelse: Mellom 17,5 fot og 223 fot.

, og hva som er problemstillingen vår:
* Hvor mange forskjellige farger har juletrelys?
* Hvor stor andel av fritidsbåtene er maks 5 meter lange?
* Hvor bred må brygga på et fergetillegg være?

I statistiske tabeller vil vi derfor finne ulike tall for variasjon. Noen ganger får vi vite antallet i ulike kategorier,

Variasjon i yndlingsfarge for norske statistikere. Klassisk frekvenstabell.

noen ganger får vi vite minimumsverdien og maksimumsverdien, noen ganger kvartilene, og noen ganger oppgis standardavviket. De av dere som falt av på kvartiler kan prøve å lese dette blogginnlegget. Men både kvartilene og standardavviket skal jeg strikke i rikt monn senere.

Bildet under viser variasjon ved hjelp av et såkalt boksplott:

, og dette viser variasjon slik det uttrykkes med en normalfordeling (gaussfordeling):

Målet er at minst to av dere etter hvert skal bli like begeistret for statistisk variasjon som hun med båtene.

Skrell og tell med 4d

I et klasserom sitter tjuetre niåringer klar til å kapp-skrelle hver sin appelsin.

Tørkepapir ligger i bunker på hver pult. Klar – ferdig – SKRELL!! Den digitale stoppeklokka på tavla løper avgårde, og små fingre borer seg inn i det bitre appelsinskallet. Alt er oransje og klissete, og lufta er mettet av en intens lukt av konkurranse og saftig appelsinkjøtt.

b1
Klassesett med appelsiner

Onsdag før påske dro jeg på besøk på Nesoddtangen skole for å ha statistikkshow med sterk lukt og sterk farge.

Idéen kom da jeg forberedte appelsinbåtstatistikken til appelsin-sitteunderlaget. Den gang ba jeg venner og kolleger telle appelsinbåter. De telte og telte. En dag kom Arnoldo og fortalte at han hadde spist en appelsin med FEMTEN båter (alle i lunsjen bare «WOOOW!!!«), men at det hadde vært en veldig stor appelsin. Alle ville selvsagt slå Arnoldos rekord. Men frustrasjonen meldte seg raskt, for mange store appelsiner hadde slett ikke mange båter. Dette måtte undersøkes!

PS1: Dette var så gøy at jeg vil absolutt oppfordre andre lærere til å bruke idéen!
PS2: Jeg har prøvd det på voksne også, og det fungerte like bra. Perfekt for jobbseminaret!
PS3: Dette ble et langt blogg-innlegg, men det passet ikke å dele det opp, så dere får bare sperre opp neseborene og lese videre!

Sånn gjorde vi det:

Tips: Jeg hadde revet opp tørkepapir på forhånd og lagt det ut på pultene før vi begynte. Det var lurt. Det var også lurt å ha en vask tilgjengelig.

Vi hentet hver vår appelsin fra klassesettet, for riktig å kjenne på den.

Innledningsvis fant vi ut at alle i 4d visste at i England heter denne frukten det samme som fargen den har. Dessuten betyr «Appelsin» «eple fra Kina».

b2
I følge Google translate er det slik «eple» skrives på kinesisk.

Alle visste dessuten at appelsiner er fulle av C-vitaminer, og noen visste at hvis du ikke får C-vitamin, kan du få skjørbuk. Skjørbuk er en sykdom som sjømennene på seilskutene fikk i gamle dager, og da fikk de flekker på kroppen, begynte å blø i munnen, og tennene løsnet (æsj!).

James Lind

jameslind
James Lind på skuta for 250 år siden. Bilde fra http://www.britishempire.co.uk/images4/jameslind.jpg

James Lind levde for over 200 år siden, og var sjef på store seilskuter der sjøfolkene ofte ble syke eller døde av skjørbuk. På den tiden ante de ikke hva C-vitamin var, men James Lind hadde hørt at det var lurt å gi sjømennene appelsiner. For å finne ut om dette var sant, delte han inn sjømennene i to grupper. Halvparten skulle få tørrmat (brød, fisk etc.) slik de vanligvis fikk på lange turer, og den andre halvparten skulle få appelsin- og sitronjuice i tillegg. Og ganske riktig: Flere av dem som bare spiste tørrmat ble syke, mens de som fikk juice holdt seg friske. Dermed ble James Lind den første vi vet om som gjorde forskning ved å dele inn i to grupper og gi ulik behandling til de to gruppene.

I likhet med James Lind skulle 4d også forske på appelsiner, og som gode forskere satte vi opp forskningsspørsmålene på tavla først:

Spm

Altså:
1) Hvor mye veier en appelsin?
2) Hvor lang tid bruker man på å skrelle en appelsin?
3) Hvor mange båter har en appelsin?
4) Har store appelsiner og små appelsiner like mange båter?

Deretter gjettet vi svarene:
1) Vekt:
5 kg! 300 g! 100 g! 350 g!
2) Skrelletid:
5 sek! 1 time! 30 sek! 5 min!
3) Antall båter:
10, 12, 8, 9, 12, 13, 11, 6, 8, 7?
4) Like mange båter?
12 gjettet ja, 7 gjettet nei.

1) Klar – ferdig – vei!

b5v2

b6

2) Klar – ferdig – SKRELL!!
Alle fikk lov til å bruke stoppeklokka på mobilen sin. Læreren viste også stoppeklokke på tavla.

b8

b7

b9

3) Klar – ferdig – TELL!!
Noen appelsiner var mer juice enn båter etter at de var skrelt, men de ble telt i dyp konsentrasjon allikevel.

b10

b11

b12

OBS: Vi telte bare hovedbåtene, ikke de små båtene som vokser inni appelsinen nederst.

Forskningsfrynsegode: Fortæring av forskningsmateriale.

b13

_20160412_114202
Gode notater er viktig!

Oppsummering:
Antall båter

DSC_0451
Tallinje som viser antall båter ble tegnet på tavla. Hver elev sa sitt båt-tall, og læreren tegnet et kryss, deretter søyler som er like høye som antall kryss.

Dette kalles et søylediagram.

Vi ser av søylediagrammet at 10 båter var vanligst hos 4d, men at det var stor variasjon i antallet. Kanskje var det målefeil inn i bildet også, for som en av forskerne kommenterte:

_20160412_114057
Det er ikke lett å telle båtene i et klissete appelsinkadaver som ligger foran deg på pulten. Eller når appelsinen er intakt, og du teller rundt og rundt og rundt og.

Appelsinvekt

b14
Tallinja ble tegnet på tavla. Hver elev leste sin appelsinvekt, og læreren tegnet et kryss.
b15
Tell hvor mange kryss det er i hver «luke», og lag en søyle for hver luke, der høyden viser antallet kryss.

Dette kalles et histogram.

Vi ser av histogrammet at appelsinene vide mellom 280 og 360 gram. Gjennomsnittsvekten, som sier hva som er vanlig for en appelsin, var 323 gram.

Kommentar: Søylediagrammet over antall båter er som LEGO (adskilte søyler, for det er bare heltalls antall båter), mens histogrammet er som plastelina (søylene er klint inni hverandre fordi målingene gjøres på en findelt skala).

Skrelletid
Vi kunne tegnet opp et histogram for skrelletid også, selv om vi ikke gjorde det i 4d:

b16

Skrellerekorden var på 24 sekunder, og  nesten alle hadde skrelt ferdig etter 3 og et halvt minutt.

Kommentar:
b17 skjev
Disse to histogrammene (appelsinvekt og skrelletid) er utmerket til å illustrere forskjellen på symmetriske fordelinger og skjeve fordelinger. Appelsinvekt  er et godt eksempel på en ganske symmetrisk fordeling (der kan du bruke gjennomsnitt og standardavvik for å oppsummere), mens skrelletiden er skjevfordelt (og der må du bruke median og kvartiler for å oppsummere). Dette er imidlertid et tema som passer bedre i en gruppe med eldre elever, så det hoppet vi over.

Sammenheng mellom størrelsen og antall båter
Til slutt plottet vi appelsinvekten mot antall båter:

b19

Her har jeg tegnet det opp og lagt på en oransje linje, en såkalt regresjonslinje. Hvis det virkelig var sånn at små appelsiner hadde få båter, og store appelsiner hadde mange båter, ville linja pekt på skrå oppover. Når den er så flat som dette, viser det at det ikke er noen sammenheng mellom størrelsen på appelsinen og antall båter.

Forskerne i 4d fant altså ingen sammenheng mellom vekt og antall båter.

Det vi gjettet mot det vi fant ut
Nå visste vi så mye mer om appelsiner at vi kunne stryke ut fra tavla de svarene vi hadde gjettet som var feil. Det som stod igjen var dette:

b20

Altså: En vanlig appelsin veier ikke 5 kg, heller ikke 100 g, og det tar vanligvis verken en time eller 5 sekunder å skrelle den. Antallet båter varierer så mye at nesten alle gjettene var riktige, og flertallet gjettet riktig på at det ikke var en sammenheng mellom størrelsen og antall båter.

Vi kunne også se at appelsinen på appelsin-sitteunderlaget var riktig:

P1040996

Joda, 12 båter er ok, selv om det vanligste i denne undersøkelsen var 10.

Jeg delte ut restene av klassesettet, samlet sammen alle kjøkkenvektene, brettet sammen strikke-appelsinen og takket for meg, men da var det en som kakket meg på skuldra: «Du må jo veie den appelsinen også.» De andre istemte: «JA, du MÅ veie den!»

DSC_0460

Og resultatet? Ganske fiffig! 312 g, og helt innenfor det normale for en helt vanlig appelsin.

Lykke til med fremtidige skrell-og-tell-arrangementer i klasserom, på julebord, teambuildingsseminarer eller rundt leirbål. Jeg kan garantere en saftig telleopplevelse!

Årets første blåveis

hvitveis på Roa

Nordmøringer som meg har vokst opp i en hvit verden, altså en biotop der hvitveisen har dekket bakken mellom hvite bjørkelegger, og der sola viser seg så sjelden at våre egne legger har omtrent samme farge.

Den eneste blåveisen jeg hadde sett før jeg flyttet til storbyen Oslo, var en tam en som bodde komfortabelt i solveggen på hytta til tante Bjørg. Ergo var det mye jeg ikke visste om blåveisen.

Blåveis nesodden1

Dette visste jeg: Blåveisen er blå. Skikkelig blå. Blåere enn bluegrass-musikk, blåere enn de kongeliges blod, ja til og med blåere enn den blå-blå regjeringen. Jeg visste også at i deler av landet er blåveisen selve symbolet på vår og varmere tider, og at blåveisen ikke trenger mye brunt rundt seg før den spruter opp av bakken.

Og like sikkert som at bokfinken kommer hjem fra Syden hver vår og kvitrer nå-nå-nå-nånånå-med-en-eneste-gang, dukker Årets første blåveis-overskrifter opp i lokalavisene. Men spørsmålet er: Når skjer det? Når kan jeg forvente å finne den?

For å finne ut dette, googlet jeg «Årets første blåveis», fikk over 3500 treff, og noterte datoen på de første 33 lokalavisoppslagene jeg fant.

P1050446 (3)

OBS: Det var viktig å lese litt mer enn datoen, for 7/4 2015 var for eksempel overskriften «Årets første blåveis i Tippeligaen», og det er en annen type blåveis.

P1050436 (2)

Alle datoene ble tastet inn i statistikkprogrammet SPSS, og så laget SPSS følgende histogram

Blåveishistogram, og regnet ut at gjennomsnittsdatoen for årets første blåveis er 7. mars.

Det betyr altså at per i dag, den 3. april, har de fleste blåveisinteresserte mest trolig allerede funnet eller fått årets første blåveis (av typen Hepatica nobilis). Ha det på badet, jeg skal ut og lete etter hvitveis!

PS: Oppskrift kommer i morgen.

Kvikk-strikk

Noen ganger er det deilig at ting går litt fort, og at man slipper å tenke altfor mye. Her er et raskt strikkeprosjekt, inspirert av enda raskere karbohydrater. (Spis gjerne sjokolade mens du strikker, for maksimal energi og fart.)

DSC_0808

Aftenpostens påskestatistikkreportasje fra 2015 forteller at i 2014 da påska var i april, ble det i løpet av den måneden solgt nesten 14 millioner  (fjorten millioner) Kvikk Lunsj (ja, det er faktisk sånn det skrives) i dagligvare, kiosk og bensinstasjoner.

Jeg har tatt utgangspunkt i Aftenpostens grafKvikklunsjdiagram, og uttrykt den i Kvikk-Lunsj-enheter. Dersom januarsalget av Kvikk Lunsj tilsvarer en hel Kvikk Lunsj, kan vi sammenligne salget de andre månedene med salget i januar, og runde av til nærmeste hele Kvikk Lunsj:

Jan Feb Mar Apr Mai Jun Jul Aug Sep Okt Nov Des
1 2 3 9 1 1 1 1 1 1 2 1

Det totale salget i 2014 tilsvarer da 24 Kvikk-Lunsj-enheter, og 9 av dem ble solgt i april. Aftenpostens graf er mer nøyaktig enn min, men statistikk på bryggekanten er mer tur.

DSC_0783
Mitt skip er lastet med
DSC_0827
Tur-sjokolade på langs
DSC_0840
Tur-sjokolade på tvers

Legg merke til hvordan inntrykket av grafen endrer seg når vi endrer måten vi stabler sjokoladene. Estetisk sett liker jeg den første grafen best. Den minner meg om et lasteskip på vei inn Oslofjorden, hvilket igjen minner meg om å pendle til barnehage i byen med to små barn, og om onkelen min som jobbet 6 måneder i strekk på svære skip da jeg var liten, og som kom hjem med Seiko «gullklokke» da jeg ønsket meg klokke til skolestart da jeg var sju. Ikke særlig statistiske assosiasjoner, egentlig. Men tankene er like raske som energien i Kvikk Lunsj.

Rask oppskrift
Kjøp tre nøster ullgarn (rødt, gult og grønt) på nærmeste garnbutikk. Her er det brukt TOVE fra Sandnes (strikkefasthet 24 m per 10 cm på p 3,5), men alle garn i omtrent samme tykkelse (og som kan toves) kan brukes.

Finn begge endene på garnet (både den inni og den utenpå nøstet), og legg opp med dobbel tråd 75 m på p 5 med rødt. Strikk rettstrikk frem og tilbake (riller) til du har brukt opp nøstet. Fortsett med gult, deretter grønt, og fell av. Fest trådene. Strikk så mange du vil, men da må du først kjøpe mer garn. Vask det på vanlig vaskeprogram på 40 grader, så det tover skikkelig, og du får bort alle sjokoladesmulene du sølte mens du strikket.