Confidence betyr vanligvis (selv)tillit.

Både selvtillit, tillit, fortrolighet og tiltro er noe du kan ha mye eller lite av. Du kan også jobbe for å få mer av det, eller være uheldig og miste det du hadde.

Ole hadde for eksempel full tillit til mine skum-universalklisterferdigheter i dag, satte nesten ny rekord i bakglatte ski, men stoler fortsatt på meg. Selv hadde jeg tiltro til at 18 år med grå festesmurning skulle fungere utmerket i kombinasjon med klister. Ganske riktig: Spikerfeste! Både oppover og nedover, faktisk.

Til tross for smørebom var ski-selvtilliten på topp både før, under og etter dagens herlige påsketur langs jordene på Nesodden.

Påske-konfidens i Blåveisbakken.

I statistikkens verden har confidence en helt spesiell betydning, nemlig hvor stor tiltro du har til det du prøver å beregne.

Hvis jeg for eksempel prøver å finne ut hvor mange gram et barn legger på seg i slutten av svangerskapet, kan jeg se på en gjeng nyfødte barn og sammenligne termindatoen med når de ble født, og hvor tunge de var.

Fra http://www.momjunction.com/pregnancy/pregnancy-week-by-week

Jeg har beregnet dette mange ganger, for forskjellige grupper av nyfødte barn, og får litt forskjellig svar hver gang. Det er helt naturlig, for det er forskjellige nyfødte i hver gruppe, og da vil også svaret variere litt mellom gruppene.

En av de siste gangene jeg skulle beregne dette for et statistikkurs, hadde jeg fødselsvekt for nesten tusen nyfødte barn, og fant ut at de la på seg gjennomsnittlig 175 gram per uke de siste ukene av graviditeten. Jeg forventer altså at gjennomsnittsvekten til babyer som er født to uker før termin skal være 700 gram mindre enn gjennomsnittsvekten til babyer som blir født fire uker senere, altså to uker etter termin (fordi 4*175 gram = 700 gram).

Men hvor sikker kan jeg være på det? Hvor stor tiltro kan jeg ha til dette tallet? For å vurdere det beregner vi statistikere et såkalt konfidensintervall. Det er altså her den statistiske konfidensen kommer inn. Vi angir  tiltroen med et tall som vi kaller konfidensgraden (ofte ønsker vi minst 95% konfidens), og så ser vi hvor stort slingringsmonn det tilsvarer. Jeg beregnet at konfidensintervallet for hvor mye en baby legger på seg per uke strakk seg fra 141gram per uke til  209 gram per uke.

Det betyr at mitt beste gjett for hvor mye babyer legger på seg per uke er 175 gram, og at jeg har stor tiltro (95% konfidens) til at det riktige tallet er et sted mellom 141 gram og 209 gram, trolig ikke mindre enn 141 gram, og heller ikke mer enn 209 gram.

Konfidensintervaller er superviktige for at vi skal kunne si noe om usikkerheten i det vi beregner. Men det er ikke alltid så lett verken å lære seg det første gang, eller lære det bort til noen for første gang. Det kan fort gå på selvtilliten løs, både for lærere og elever.

Et helt gjennomsnittlig nyfødt nurk.

Jeg har undervist om konfidensintervall for statistiske nybegynnere nesten hvert semester siden våren 1994, og har etter hvert funnet ut noen triks som virker, og noen sammenligninger som er oppklarende for hva et konfidensintervall er og ikke er. Det skal jeg snakke om på kurs for lærerspesialister i Oslo etter påske, og på den nordiske statistikkonferansen jeg er invitert til i juni.

Etter flere dager med familiehygge, skitur, ishakking, kaninmating, fest og sprengstrikking, fikk jeg endelig skrevet ferdig det korte sammendraget til denne konferansen. Tittelen er den samme som på dette blogginnlegget:

How to build confidence

Explaining the construction and interpretation of a confidence interval is a challenging and never-ending teaching task.

In my talk I will present several teaching approaches that can make it easier to teach and learn confidence interval with confidence. Several statistical topics are used to view the confidence interval in different perspectives. These include variation vs estimation error, estimation error vs sample size, the Central Limit Theorem vs Bootstrapping, and a frequentistic vs Bayesian approach.

Teaching material include cards made for classroom interaction, a manuscript for an effective blackboard-session, R simulations and visualizations.

Det er ikke usannsynlig at normalfordelingsskjerfene vil dukke opp i Tartu hvis de viser seg å passe inn.

Jeg burde selvsagt hatt et nytt konfidensintervall-strikkedesign klart, men det er fortsatt bare på idé-stadiet. I over to år har jeg pønsket på en rundfelt genser med konfidensintervall og sentralgrenseteoremet som tema. Jeg vet nesten hvordan den skal være, men jeg mangler kanskje den siste resten av selvtillit som trengs for å sette i gang… Dessuten har jeg ikke bestemt meg for farger. Mørkegrønt bærestykke, tenkte jeg først. Men da blir det kanskje vanskelig å se kontrastene, så kanskje bærestykket heller bør være hvitt med svart eller grått mønster? Eller mørkegrønt mønster på hvit bunn? Eller rødt? Jeg er ikke helt ferdig med designfasen, som du skjønner. Men det kan jeg pønske mer på i påskesola. Nyt den du også!

Se, så idyllisk! Påskesol og juletre!

Kommer jeg til å få ferdig genseren i løpet av påska? Det tror jeg. Med stor konfidens.