Leif Klöfvers webbplats

Slump och kompetens

eller: Tur eller skicklighet?

Förståelseillusioner

Kompetensillusioner

Dunning-Kruger-effekten: ju mer inkompetenta vi är desto mer överskattar vi vår kompetens

Expertutlåtanden eller enkla formler?

När kan man lita på expertens intuition?

Utifrån- vs. inifrånperspektiv (planeringsillusionen)

Överdriven optimism och pre mortem-övningen

Vi har övertro på det vi tror att vi eller experter vet. Och vi glömmer bort att räkna med tillfälligheter. När vi tittar tillbaka på en händelsekedja så tycker vi - med facit i hand - att vi förstår varför saker hänt på det sätt dom gjort. Med hjälp av det som är synligt och känt tror vi ibland också att vi kan planera komplexa projekt.

De flesta illusionsexemplen nedan är hämtade från [Kahneman2011] del 3.

Förståelseillusioner

Strävan att hitta orsaker, som ju vårt System 1 är utrustad med, gör att vi uppfattar världen som mer begriplig och förutsägbar än den är. Vi skapar enkla, konkreta, övertygande, förklarande berättelser. Dessa berättelser tillskriver begåvning, enfald och avsikter större betydelse än tur. En raffinerad, aktuell händelse kan bli grund för en orsaksberättelse, som vi tror är sann. Kahneman nämner Nassim Talebs bok Den svarta svanen. Taleb beskriver hur förvridna berättelser om det förflutna formar var syn på världen och på framtiden. De största förändringarna i världen, både inom politik och ekonomi, har i st enl. Taleb nästan alltid varit sådana som inte gick att förutse, dvs s.k. svarta svanar. Dessa kännetecknas av:

1. Ingenting i det förflutna kan övertygande förutse händelsen

2. Händelsen får extremt stor påverkan

3. Vår mänskliga natur gör att vi efteråt ändå försöker hitta orsaksförklaringar till varför det otänkbara inträffade. Vi underskattar därvid tillfälligheter (tur/otur)

Exempel på svarta svanar (se också Jan Gradvall, 2007 Den svarta svanen, kollat 1309):

Ex 1: En detaljerad historik om framgången med Google - baserad på tillgänglig information - skulle förstås berätta om ett stort mått av skicklighet. Hänger historien ihop så skulle vi tro på den. Men troligen skulle berättelsen missa att tala om på vilket sätt tur eller slumpen har påverkat skeendet i verkligheten. Och ju mer slumpen har inverkat desto färre insikter kan man få ut av exemplet.

Ex 2; Vad lärde vi oss av 11 september-katastrofen? Jo, att kolla upp islamiska terrorister och bevaka kända byggnader. Om någon kommit på en regel att dörrar till cockpit ska vara skottsäkra hade denne inte blivit hjälte för att ha förhindrat 11 sept. En sådan förebyggande insats skulle inte uppmärksammas speciellt mycket. Detta eftersom man tror att den åtgärden skulle förhindra en katastrof som ingen tror ska hända.

Kompetensillusioner

Illusionen om intelligent aktieurval.

Kahneman beskriver aktiemarknaden som ett stort mysterium. Köpare är övertygade om att kursen är för låg och säljarna tror att kursen är för hög. Varför tror både säljare och köpare att priserna är fel men åt olika håll?

Ex: Investeringsanalytiker etc jobbar kanske hårt och tar reda på mycket om olika företag. Varje analytiker för sig tycker att hen är speciellt duktig. Ett ev. misslyckande kan hen förklara med diverse faktorer. I själva verket har forskare visat att de flesta aktiehandlare inte väljer bättre än slumpen. När man studerade aktietransaktioner på 10 000 individuella investerares konton fann man att under ett års period hade medelvärdet på värdena sjunkit, dvs de aktier som de sålde hade gått upp och de som dom behöll hade gått ner. Förklaringen är att man behåller en sjunkande aktie för att slippa synliggöra en förlust (förlustaversion, se prospektteorin) och säljer stigande aktier för att det känns bra att ta hem en vinst.

Expertillusioner. System 1 kan dra slutsatser från väldigt torftig evidens. System 1 struntar i mängden evidens och dess kvalitet. Det viktiga är att man kan få ihop en fin story, som verkar konsistent. Illusionen att vi eller våra experter förstår vad som hänt tidigare, gör att vi också har en övertro på experters (politiska och ekonomiska etc) förmåga att förutse framtiden. Men det finns inte skäl att anta att kända statsvetare, nationalekonomer etc är speciellt bra på att förutspå kommande kriser. Det beror inte på att experter är dåliga utan på att världen är komplicerad och oförutsägbar. Dvs det vi kallar slumpen har stor betydelse.

Ex: Kahneman tar exemplet att innan resp. ägg som blev Hitler, Stalin och Mao Zedong befruktades, skulle sannolikheten att alla dessa tre missdådare i st blivit kvinnor vara 1/8 (= 1/2 * 1/2 *1/2). Och då hade knappast historien sett ens ungefär likadan ut som den kom att göra?

Dunning-Kruger-effekten: ju mer inkompetenta vi är desto mer överskattar vi vår kompetens

Denna tanke (som jag inte fann beskriven i [Kahneman2011]) är gammal; t ex Confucius, c:a 500 f Kr, lär ha sagt: "Real knowledge is to know the extent of one's ignorance" (länk: Confucius-citat). Många har nog tyckt sig känna igen effekten - hos andra men inte hos sig själva. Den blev dock inte bekräftad förrän Kruger och Dunning gjorde och redovisade ett antal experiment 1999 (se Kruger-Dunning1999), Slutsatserna av deras experiment är att de som är inkompetenta inom ett område tenderar att a) kraftigt överskatta sin egen kompetens (eftersom de inte inser sina brister) men också att b) ha svårt identifiera kompetens hos andra. En kognitionspsykolog skulle antagligen tala om bristande metakognition. Båda faktorerna - a) och b) - bidrar till felaktiga val. De som är mycket kompetenta inom ett område tenderar i stället att underskatta sin kompetens (antagande: "om något känns lätt för mig så är det troligen lätt för andra också").

I Kruger-Dunning1999 studerades människors förmåga inom tre områden: humor (social förmåga), logiskt resonerande (intellektuell förmåga), grammatik (språklig förmåga). I figur nedan visas resultatet av experiment inom området humor. Humorexperimentet handlade om att förstå vad som är roligt och vad andra anser är roligt. Det krävs en ganska subtil och underförstådd kunskap och insikt om andra människors smak. Sextiofem studenter utsattes för ett antal skämt som de skulle poängsätta. Sedan jämfördes resultaten med poängsättningen från åtta professionella komiker (sju av dessa hade bra samstämmighet med varandra (dvs positiv korrelation etc). Resultatet (förmågan) för en viss student jämfördes med hela gruppen genom att rangordna individerna i percentiler. T ex om en individ ansåg sig ligga på 60:e percentilen så ansåg denne att 60% av individerna var sämre och 40 % bättre än honom/henne själv. Utgående från faktiska testresultaten gjordes en indelning av deltagarna i s.k. kvartiler, dvs de indelades i fyra grupper med 25% av individerna i vardera. Detta innebär att t ex lägsta kvartilens individer låg i spannet 0:e till 25:te percentilen, dvs i medel på percentilen 12.5 och andra kvartilen i medel på 37.5 etc. Se figur nedan. Observera att förmåga (y-axeln) här kvantifieras i form av (bedömd eller faktisk) rangordning mellan de 65 deltagarna i studien. Detta är alltså fråga om en slags relativ betygsättning.

Här sammanfattas resultat från experimentet, som mer el mindre tydligt indikeras i figuren ovan:

Studenterna bedömde i genomsnitt sin förmåga att förstå vad som är roligt ligga i 66:e percentilen. Verklig medelpercentil är definitionsmässigt 50. Överdrift alltså 16 percentilenheter.
Relativt inkompetenta individer (1:a kvartilen) låg (definitionsmässigt, i medel) i 12:e percentilen men trodde att dom låg i 58:e percentilen, dvs dom trodde dom var bättre än medel för hela testgruppen. De överskattade alltså sin förmåga med 46 percentilenheter!
Deltagare i dom andra kvartilerna överdrev inte sin förmåga i samma utsträckning. Individer i 4:e kvartilen t.o.m. underskattade sin förmåga jämfört med kompisar.

Man skulle kunna invända att bedömningar av humor inte kan vara entydiga. Men resultaten från de andra studierna var likartade. För t ex studien i logiskt resonerande fanns full entydighet om ett svar var rätt eller fel.

När man ser kurvorna i figuren ovan skulle man tänka sig att överskattningen i kvartil 1 beror på en statistisk effekt, nämligen regression mot medelvärdet (se Vi har svårt tänka statistiskt/Regression mot medelvärdet). För de som ligger i 1:a kvartilen är det ju betydligt svårare att underskatta än att överskatta ens resultat. Forskarna var medvetna om att en sådan effekt var möjlig (även om ungefär lika dålig kalibrering då borde gälla även i 4:e kvartilen). Dock kontrollerade man den statistiska regressionseffekten noggrannare i andra studier. Slutsatsen blev att huvudförklaringen till överskattning av egen förmåga är mer psykologisk än statistisk.

Man skulle kunna tycka att människor borde lära sig av negativ återkoppling från omgivningen. I Kruger-Dunning1999, avsnitt: Incompetence and failure of feedback, hävdas att folk sällan tar emot negativ återkoppling om sin skicklighet och förmåga från andra människor i dagliga livet (ett antal referenser som ska styrka detta finns med). När någonting blir lyckat beror det ofta på flera samverkande positiva faktorer: förmåga, ansträngning, omgivande förutsättningar och tur. För misslyckanden kan det räcka att en av dessa faktorer falerar och man kanske vägrar att tro att just brist på förmåga var huvudfaktorn.

I ett av experimenten (logiskt resonerande) visades att ett sätt att göra deltagarna mer medveten om sin inkompetens är att göra dom mer kompetenta genom (ganska korta) träningssessioner. Efter träningen hade individer i kvartil 1 större förmåga att inse vilka frågor hen hade svarat korrekt resp inkorrekt på i ett utfört test. Man förbättrade noggrannheten i självbedömningen (dvs sänkte egenbedömt percentilvärde) och var således bättre kalibrerade än tidigare. Tränade individer i kvartil 4 förbättrade också noggrannheten i sitt värde (dvs ökade värdet), eftersom dom efter träningen bättre förstod att deras sätt att resonera hade varit korrekt.

Effekten att inkompetenta underskattar sin inkompetens bör förstås inte generaliseras in absurdum. Om man t ex kan få direkt, tydlig och uppenbart objektiv återkoppling på sin prestation inom ett område (t ex när man kastar pil på en tavla och räknar poäng) och dessutom inte kan skylla på omgivning eller slump så borde man får rätt bra grepp om sin kompetens inom just det området. Annat exempel: en coach som teoretiskt vet allt om en sport kan vara smärtsamt medveten om sin egen bristande förmåga att utöva sporten.

Exempel: Dunning-Kruger-effekten och klimatfrågan. Kan möjligen Dunning-Kruger-effekten vara kraftigare inom vissa politiska grupperingar än andra? Läs detta blogginlägg (av Dan Satterfield; American Geophysical Union; kontrollerat 13-12-03) om en statistisk undersökning av åsikter i klimatfrågan hos medlemmar av olika partier i USA, men med Teaparty-rörelsen som en separat grupp. Åsikterna hos den senare stack ut. Åsikter, som jag förmodar förstärks via vissa massmedia, kanske TV-kanalen Fox News (se Miljöaktuellt 1308)? Generellt får man väl räkna med att ekonomiska intressen (i energibranchen etc) påverkar åsiktsbildningen.

Expertutlåtanden eller enkla formler?

Studier visar att enkla statistiskt baserade formler eller regler slår avancerade, djupgående expertbedömningar när det gäller att prognosticera vad som ska hända på lite sikt. Kahneman refererar till Paul Meehls "besvärande lilla bok" Clinical vs statistical prediction: A theoretical analysis and a review of the evidence (1954), som gått igenom 20 sådana studier. Ett typiskt exempel (övriga studier hade liknande resultat):

Mål: att jämföra två sätt att i början på läsåret prognosticera studenters betyg efter första läsåret på universitetet.

Metod 1: Studievägledare (skolade akademiker) intervjuade varje student i 45 min. Dessutom hade de tillgång till gymnasiebetyg, ett antal lämplighetstest och fyra sidor personligt brev.

Metod 2: Statistisk formel baserad enbart på gymnasiebetyg och ett lämplighetstest.

Resultat: Metod 2 visade sig mer exakt än 11 av de 14 studievägledarna.

Mehls bok väckte bestörtning bland kliniska psykologer och det uppstod en kontrovers som ännu inte helt ebbat ut. Antal studier som jämför kliniska och statistiska prognoser har vuxit till c:a 200. Ställningen är ungefär densamma: I c:a 60 % av studierna är formlerna signifikant bättre; resten gav oavgjort resultat. Förklaring till resultatet är enl. Meehl att experter försöker vara smarta och väga in komplexa kombinationer av faktorer. Oftast sjunker då validiteten, dvs förmågan att mäta (eller bedöma) det man verkligen vill mäta. Dessutom kan vi människor vara inkonsekventa när vi ska summera bedömningar från komplex information. Dvs vi ger olika bedömningar i likartade fall vid olika tillfällen (beroende på diverse ovidkommande faktorer, t ex om vi sovit gott, nyss ätit eller druckit kaffe etc).

En annan sak är att vi har mer sympati för en människa som gör en missbedömning än en formel som gör det. I efterhand, om vi tittar på ett enskilt fall, kan vi säkert också komma på förklaringar till missen, som verkar rimliga.

När kan man lita på expertens intuition?

I vilken mån kan man lita på en erfaren specialist, som påstår sig ha intuition?

Herbert Simon, som studerat beslutsprocesser, säger att intuitivt beslutsfattande baseras på igenkänning av mönster som finns lagrade i minnet. Intuition är alltså inget magiskt utan alltså en erfarenhet som finns lagrad i minnet. Man skulle kunna tro att det som är speciellt med intuition är att man vet intuitivt utan att veta hur man vet. Men att veta utan att veta hur gäller generellt. Jag känner t ex igen en gammal bekant när han dyker upp men jag vet inte hur.

Hur lagras information i minnet? Känslor, t ex rädsla kan göra att vi lär oss snabbt och (ibland alltför) effektivt. Ofta räcker en enda otäck erfarenhet för att vi ska känna igen en liknande situation hela livet. Sakkunskap i komplexa uppgifter, t ex att läsa eller att spela schack, tar däremot lång tid att lära sig. En stormästare i schack måste träna målmedvetet minst 10 000 timmar för att nå hög nivå.

Villkor för att uppnå expertkunskap är att erfarenheterna erhålls genom lång träning i regelbundna, välordnade situationer och med tillräckligt snabb och tydlig återkoppling. Ex på saker som är för komplexa och oregelbundna är för en finansexpert att välja rätt aktier och för en Mellanösternexpert att förutsäga framtiden i regionen. Experter kan givetvis ha gedigna kunskaper men vissa uppgifter är omöjliga även för dom. Det gäller att inse begränsningarna.

Svaret på inledande frågan är att man kan bedöma expertens intuition genom att själv bedöma miljöns regelbundenhet och expertens inlärningshistorik.

Anm: Peter Gärdenfors har skrivit en bra sammanfattning om intuition: Intuition är implicit kunskap.

Utifrån- vs. inifrånperspektiv (planeringsillusionen)

När man planerar ett stort komplext projekt kan man ha två olika förhållningssätt. Ett sätt, som vi gärna har en förkärlek för, är att utnyttja all kunskap som finns tillgänglig om just detta projekts krav, förutsättningar etc och därifrån extrapolera till en komplett bedömning av resursåtgång. Kahneman kallar det för inifrånperspektivet. Ett annat sätt är att titta på statistik från andra redan genomförda liknande projekt och ha detta som grund för en basprognos, dvs ett ankare för vidare justeringar. Detta sätt kallar Kahneman för utifrånperspektivet.

Utifrånperspektivet är överlägset för att få en bra prognos.Anledningen är att inifrånperspektivet missar att ta hänsyn till "okända okändheter", t ex sjukdomar, modifiering av krav, svårigheter med samordningar etc. Många orsaker till att en plan går i stöpet är för osannolika för att förutsägas, men att något går snett i ett stort projekt är sannolikt. Detta är inkluderat i statistiken för redan genomförda projekt.

Exempel från Kahnemans bok:

Uppgift: bedöm längden på en kvinna.

Info: kvinnan bor i NY

Basprognos: längden = medellängden för kvinnor i NY

Tillkommande fallspecifik info: hennes son är center i skolans basketlag

Justerad prognos: Längden skattas till högre värde än medelvärdet.

Överdriven optimism och pre mortem-övningen

Man överdriver lätt förmågan att planera och har en illusion av kontroll eftersom det som är känt och synligt ser bra ut (enl. WYSIATI). Egna företagare har startat företag för att dom tror att dom är överlägsna andra inom sitt område. Genomsnittligt är resultaten av företagsstarter dåliga (ändå är det bra för samhället om många försöker - några försök blir lyckade!).

Anledningen till övertro är alltså egenskaperna hos system 1, bl a att man har en subjektiv tilltro till den berättelse man har konstruerat utan att reflektera över faktas kvalitet och täckningsgrad. Ett sätt att få med mer fakta är pre mortem-övningen. Samla, innan förslaget ska klubbas, till ett möte med sakkunniga på beslutsområdet. Var och en får följande uppdrag:

Föreställ er att det gått ett år. Utfallet blev katastrofalt. Ta nu 50 min på er att skriva en kort berättelse om katastrofen.

När ett team - och speciellt ledaren - enats om ett beslut, så betraktas alla tvivel som uttryck för bristande lojalitet. Pre mortem-övningen gör tvivel legitima.

______________________________________________

Direktlänk till nästa sida Prospektteorin eller länk tillbaka till överordnad sida Tumregler och tankefel.

Report abuse