Vi har svårt tänka statistiskt

Baserat huvudsakligen på [Kahneman2011], del 2

De olika tumregler och tankefel, som beskrivs nedan, åskådliggör att vi har har starkt behov av att förenkla för oss och svårt att tänka statistiskt. Att tänka statistiskt kräver t ex att vi kan ta hänsyn till felkällor i de delmängder av händelser som vi generaliserar från. I st för att anstränga oss att skaffa oss en allsidig bild, drar vi slutsatser utifrån exempel/händelser etc, som vi snabbt råkar hämta från minnet. Eller så tar vi beslut efter vad vi känner. Vi har en tendens att bortse från slumpens inverkan och tycker oss se mönster (och orsakssamband) från alltför litet antal utfall. Vi ersätter en svår fråga med en som är lättare att svara på. Vi håller gärna fast vid ett första intryck i st för att ompröva när ny information finns tillgänglig - en onyanserad värld är lättare att hantera.  

De små talens lag

När vi ser ett litet antal utfall (dvs har ett litet stickprov) så har vi en stark tendens att se mönster trots att utfallen mest beror på slumpen. Större urval är mer exakta än mindre (el. med andra ord: små urval ger oftare extrema utfall än större).

Ex 1: om ett lag vinner en specifik match  i fotboll tror vi ofta att det laget är bättre än förlorande laget och sportjournalister är duktiga att  leta upp orsaker till att laget är bättre. 
Ex 2 : om man ber en statistiker ta reda på vilka som är de mest framgångsrika skolorna (har bäst medelresultat), så kommer denne antagligen fram till att små skolor är bäst. Om man i st ber en statistiker ta reda på vilka skolor som är sämst, så kommer hen troligen också då fram till att små skolor utmärker sig och är sämst. Slutsatsen när man ska tolka resultaten är att man måste komma ihåg att dessa kan variera mer på små skolor än på stora skolor (eftersom negativa och positiva faktorer jämnar ut sig mer på de senare).
Ex 3: Antag att ett läkemedelsföretag internt är väl medvetet om att ett visst av dess läkemedel inte är effektivare än placebo (och kanske sämre om man tar hänsyn till placebo med biverkningar, aktiv placebo). Om ett sådant företag hade kriminell läggning så skulle det kunna göra ett stort antal små försök, publicera de som visar "bra" resultat och hemlighålla de andra. De publicerade resultaten skulle då visa att läkemedlet är bättre än placebo och därmed lura både läkare och allmänhet.

Anm.: För att minska/eliminera slumpens inverkan enl. de små talens lag måste man ha ett stort stickprov i sitt försök. Då närmar sig medelvärdet från försöket ett s.k. väntevärde enl. de stora talens lag. Typiska exempel där detta utnyttjas är förstås försäkringsföretag med många försäkringstagare eller ett spelbolag med för detta gynnsamt inställda spelparametrar och många spelomgångar.

Ex 4: Antag att det tänkta läkemedelsföretaget enl. ex. 3 har hypotesen att dess läkemedel är något effektivare än åtminstone passiv placebo. Det kan då i stället göra ett stort försök (i st för många små) där man jämför med passiv placebo. Om dess hypotes stämmer redovisar företaget (med bistånd av statistisk expertis) resultatet, som då visar att läkemedlets effekt jämfört med placebo är statistiskt signifikant.

Förankringseffekten

Vår hjärna skaffar sig snabbt en uppfattning baserad på godtyckliga associationer. Det kan vara initiala associationer som vi gör beroende på informationsfragment, som vi tagit emot - t ex via massmedia. Detta första intryck cementeras ofta och påverkar vårt beteende (våra beslut) både på kort och lång sikt. Ibland bestämmer slumpen första beslutet; följande beslut överensstämmer med det första. Förankringseffekten (förankringsbias) beror på två olika mekanismer:

  • en medveten men otillräcklig justeringsprocess i System 2: man utgår från ett förankringsläge, bedömer om det är för högt eller lågt, och justerar skattningen en bit (så långt att man blir osäker om man ska gå längre)
Ex: Om en förälder ber en tonåring skruva ner ljudet på musiken i sitt rum, skruvar denna snällt ner ljudet men inte tillräckligt. Föräldern och tonåringen utgår från helt olika förankringslägen för rimlig nivå.
  • priming i system 1 (det snabba, associativa systemet) får intellektet att selektivt hämta (snedvridna) tankeurval (enl. [Kahneman2011]. s 140, innebär det vi kallar suggestion att primingmekanismen är verksam)

Ex: Två frågor, den första i två varianter, ställdes till två grupper av besökare till ett museum i San Fransisco:

1. Är högsta redwoodträdet högre el lägre än 366 (variant 2: 55) m?

2. Hur högt tror du högsta redwoodträdet är?

Gruppernas genomsnittliga skattning skilde sig mycket: 257 m resp 86 m!


Ankare bestämmer ofta priser mer än utbud och efterfrågan, [Ariely2009]:


Ex: Dyrt Starbucks´kaffe riskerar (i onödan kanske?) sätta standarden vid kaffedrickande.


Slutsats (för längre utläggning, se [Ariely2009], kap. 2): 

Traditionell teori, som säger att oberoende utbuds-/efterfrågans-krafter (jämför lk120301natekon, kap. om Neoklassiska mikro-teorinbestämmer priset, stämmer ej så bra eftersom: 
1. konsumenten vet eg. inte vad han/hon vill betala (slumpmässiga ankaret bestämmer)
2. oberoendet gäller inte. 
Ankarna kommer från c:a-priser, annonser etc och bestäms av tillverkaren. Alltså: det är marknadens priser som bestämmer viljan att betala. Att vi köper mer när priset på en vara sänka har inte med preferenser att göra utan beror på att vi 
minns det gamla priset och jämför med det. Alltså: marknadskrafter som utbud och efterfrågan garanterar inte optimala priser (priser som maximerar nyttorna).


Tillgänglighet i minne och känslor leder till felaktig slutsats


Tillgänglighetstankefelet (tillgänglighetsbias) innebär att en fråga ersätts med en annan, som är lättare att svara på. Frågan kanske handlar om att man ska uppskatta en kategoris storlek eller en händelses frekvens. Det man i st rapporterar är ett intryck av hur lätt man kommer på fall, som tillhör kategorin eller händelsen. Alltså: tillgänglighet i minnet är avgörande för svaret.


Ex 1: Om man har hört eller läst om två flygplanskrascher senaste månaden har man kanske tendens att ta bilen i st. Detta även om bilåkning enl. statistik är betydligt farligare.


Ex 2: Om för ett äkta par man frågar parterna vilket bidrag (t ex i %) resp. part ger för dammsugning eller uttagning av sopor etc, har vardera parten en tendens att övervärdera sin egen insats eftersom det är sina egna ansträngningar man kommer ihåg bäst. Det är bra om man har insikt om att båda parter övervärderar sina insatser. För det mesta finns det subjektivt mer än 100 % erkänsla att dela ut.


Ofta görs bedömningar på grundval av känslor, affektheuristik. En svår fråga: Vad anser jag om det här? ersätts med den enklare frågan: Vad känner jag inför det här? Detta förenklar vår tillvaro eftersom världen blir mer onyanserad. Att väga alla för- och nackdelar är ofta alltför besvärligt. Affektheuristiken har alltså säkert varit bra för människan. 


Vi människor har inte så bra känsla för skillnaden mellan låga och försumbart låga sannolikheter för problem. Oro kan uppstå på gr av moderna massmedias förstärkande roll. En i det stora hela ganska obetydlig händelse förstoras upp (och blir säljande). Allmänheten sprider oron mellan sig i fikapauser etc. Oron rapporteras av media varvid oron ökar ytterligare o.s.v. Den som påstår att faran är överdriven blir misstänkliggjord. Denna kedjereaktion kallar Kahneman för tillgänglighetskaskad. Problemet på samhällsnivå kan vara att andra större problem prioriteras ner. Idealet kan tyckas vara att opartiska experter med bred syn på samtliga risker får styra fördelning av resurser i samhället. Men det kanske inte är så enkelt. Riskbedömningar är ofta är komplexa och svåra även för experter. Och det kanske inte alltid är så lätt att hitta opartiska experter.

Representativitet och "mindre är mer"

Vi tror oss se allt som finns att se (WYSIATI) och tror på de historier som diktas ihop om dom verkar logiskt sammanhängande. Och vi bedömer ofta sannolikheten för ett utfall efter hur väl en historia stämmer med stereotyper, dvs hur representativ historien är - snarare än att utgå från relativa frekvensen el granska bevisens kvalitet.


Ex 1: Gräsmattan är nyklippt, receptionisten ger kompetent intryck och möblerna är snygga. Men är detta bevis på att företaget är välskött?


Ex 2 (här förenklat): Fiktiva Linda var lysande student, aktiv i frågor om diskriminering och social rättvisa etc. Vilket scenario för Linda är mest sannolikt: 1. Linda är banktjänsteman, 2.  Linda är banktjänsteman och aktiv i feministrörelse. Den som är logisk sätter 1. före 2. Den som är intuitiv tänker snabbt att 2. verkar mer representativt. Men sannolikheter (P) adderas ju enl följande:

P(Linda banktjänsteman) = P(Linda feminist-banktjänsteman) + P(Linda icke-feminist-banktjänsteman)

Alltså har vi en konflikt mellan intuition och logik. 


Exempel 2 är alltså ett exempel på det s.k. konjunktionsfelet, dvs att man överskattar sannolikheten för en kombination av två händelser jämfört med sannolikheten för ingående händelser. Om vi formulerar om frågan i ex 2 från att gälla sannolikheter till att gälla frekvenser i en viss konkret population, så har vi lättare för att svara rätt:

Ex 3: Antag att det finns 100 personer, som kan beskrivas som att ha egenskaper som Linda i ex 2. Hur många av dessa är feminister? Banktjänstemän? Både feminister och banktjänstemän?

Ett sätt att visuellt illustrera hur mängder förhåller sig till varandra kan vara att använda Venndiagram.

Vi har tendens lägga mer vikt vid individuellt fall (orsaksberättelse) än statistik


Två exempel att fundera på:


Ex 1: En taxi var inblandad i smitningsolycka på kvällen. Två taxiföretag, ett grönt och ett blått, verkar i stan. Dessa fakta finns tillgängliga:

    • 85% av taxibilar är gröna och 15% blåa.
    • Ett vittne identifierade taxin  som blå. Separat test visade att vittnet angav rätt färg i 80% av fallen med de ljusförhållanden etc. som gällde vid olyckan.. 
Fråga: vilken är sannolikheten att smittaxin var blå. Gör gärna ett försök att lösa problemet innan du ser lösningen här.

Ex 2: Medicinskt problem: Vad är sannolikheten att en slumpmässigt vald person som testas positivt för HIV verkligen har HIV? Följande data finns tillgängliga:

    • sensitiviteten hos testet är 99%, dvs HIV-bärare testas positiva i 99 fall av 100)
    • specificiteten är 99%, dvs icke-HIV-bärare testas negativa i 99 fall av 100 (eller positiva i 1 fall av 100)
    • 0.5% av befolkningen har HIV (dvs prevalensen är 0.5 %)
En lösning finns här.

Slutsatser: Enstaka episoder styr vår tanke mer än statistik. Vi har svårt att intuitivt kombinera förkunskap om generell statistisk information (här: basfrekvenser = base rates) med specifik kunskap om ett konkret fall. Ofta bortser man från den statistiska informationen. Dvs om man har en trovärdig historia om ett individuellt fall, tycker man ofta det är onödigt att ta fram och bry sig om känd statistik om klassen av händelser som specifika fallet tillhör.

Regression mot medelvärdet

Ett (mätbart) utfall av en typ av experiment el händelse etc vill man ofta uppskatta före händelsens inträffande. Därvid kan man utnyttja:


1. speciella omständigheter, som man tror inverkar (intuitiv skattning)

2. medelvärden från statistik gjord över likartade händelser (basskattning)


Det man brukar glömma är följande:


3. att slumpen (tur eller otur) ofta också inverkar, dvs kan öka eller minska mätetalet för den aktuella händelsen. Om ett mätetal blir ovanligt högt vid ett tillfälle, så kan man i genomsnitt anta att utfallet nästa tillfälle ger ett lägre värde. Detta beror på att slumpen ju verkar både uppåt och nedåt. Detta fenomen, dvs att extrema värden närmar sig medelvärdet, upptäcktes och namngavs av Sir Francis Galton i slutet av 1800-talet.


Ett enkelt sätt att beskriva detta är Kahnemans "favoritekvation" för framgång:


- framgång = begåvning + tur

- stor framgång = lite mer begåvning + mycket tur


Ex: Vid en golfturnering lyckades en spelare osedvanligt bra första dagen jämfört med genomsnittet. Hur kommer han att lyckas 2:a dagen i förhållande till genomsnittet och i förhållande till sitt eget resultat dag 1?

Lösning: Med angivna fakta förmodar vi att spelaren är bättre än genomsnittet men dessutom hade mycket tur. Bästa möjliga gissning är då att han kommer att prestera bättre än genomsnittet även dag 2. Dock kommer han att göra ett sämre resultat än dag 1 eftersom "mycket tur" troligen inte håller sig.


Anm: Regression är ett statistiskt begrepp. I regressionsanalys försöker man skapa en funktion ("medel"-kurva eller -linje etc), som bäst passar observerade data. Observerade data ligger alltså över eller under denna linje p gr av slumpvariationer.

Tips: Avsnittet Vetenskap, sanning och makt innehåller mer information om fallgropar när det gäller statistik - bl.a. på sidan Lögn, ... och statistik 
____________________________________________________
Direktlänk till nästa sida Slump och kompetens eller länk tillbaka till överordnad sida Tumregler och tankefel