Lösning till ex 1 (smet blå eller grön taxi?)
Vi använder (liksom Kahneman gör i noter sist i sin bok) odds-formen av Bayes´ sats, "Bayes´ regel" (kontrollerat 131016). (Jag är inte matematiker så jag reserverar mig för ev. bristande stringens och felaktigheter i lösningar för ex 1 och ex 2).
Beteckningar:
P(x) = sannolikhet för x, P(x|y) = sannolikhet för x om y gäller, O = odds, O(x) = oddsen för x = P(x)/(1 - P(x)), blå = taxin är blå, "blå" = vittnet säger att taxin är blå.
Initiala statistikbaserade oddsen ("prior odds"), dvs oddsen före olyckan och före vittnets framträdande, att taxin är blå:
prior odds = O(blå) = P(blå)/P(grön) = 0.15/0.85 = 0.176
Detta odds behöver justeras efter vittnets uttalande då ju ny information tillkommer. Vittnet säger att taxin var blå och sannolikheten att uppgiften är rätt betecknar vi P (”blå”|blå) och att den är fel P (”blå”|icke blå) eller P (”blå”|grön) . Sannolikhetskvoten (= oddsen för att vittnets utsaga blir "blå" under hypotesen att taxin är blå i stället för "blå" under hypotesen att taxin är grön) kallas Bayes faktor = "lamda"). Alltså:
lamda (”blå”|blå) = P (”blå”|blå) / P (”blå”|icke blå) = 0.80/0.20 = 4
(dvs om vittnet säger att taxin var blå så är oddsen att taxin verkligen var blå och inte grön 4:1)
Lamda får sedan modifiera initiala statistikbaserade oddsen till oddset efteråt ("posterior odds"), betecknat O(blå | ”blå”), att taxin var blå då vittnet framträtt och sagt "blå":
posterior odds = O(blå | ”blå”) = O(blå) * lamda (”blå”|blå) = (15/85) * (80/20) = 0.706/1
Här kan vi erinra oss definitionen av odds för att konvertera till sannolikhet igen:
O(blå|"blå") = P(blå|"blå")/P(grön|"blå") = P(blå|"blå")/(1-P(blå|"blå")) =>
P(blå|"blå") = O(blå|"blå")/(1 + O(blå|"blå")) =>
Sannolikhet att det var en blå taxi som smet:
P(blå|"blå") = 0.706/(1 + 0.706) = 0.41 = 41 %
Många har, liksom jag själv, initialt bortsett från statistisk information om andel gröna/blå bilar och svarat 80%, dvs helt tagit fasta på vittnesmålet. Naturligtvis ska man inte behöva ha Bayes´ sats`aktuell för sig tillsammans med papper och penna och räknedosa. Poängen är väl att vi ofta inte ens försöker göra en grov justering baserat på tillgänglig statistik utan vi fokuserar helt på det konkreta fallet.
Vi kan fundera på en variant där första uppgiften är ändrad från att uttala sig om statistiska relativa frekvenser till att uttala sig om "kausala" relativa frekvenser. Den andra uppgiften är oförändrad:
- De båda företagen har lika många taxibilar men de gröna är inblandade i 85 % av olyckorna
- Ett vittne identifierade taxin som blå. Separat test visade att vittnet angav rätt färg i 80 % av fallen med de ljusförhållanden etc. som gällde vid olyckan.
De båda versionerna av problemet är matematiskt likvärdiga men psykologiskt helt olika. Här anser vi att gröna taxibilar kör som galningar. Vår bedömning ligger nu - när vi formulerat om statistisk relativ frekvens till kausal relativ frekvens - antagligen nära det bayesianska resultatet ovan.
_____________________________________
Länk tillbaka till överordnad sida Vi har svårt tänka statistiskt