Hva er bakoverinduksjon?
Bakover induksjon i spillteori er en iterativ prosess med å resonnere bakover i tid, fra slutten av et problem eller en situasjon, for å løse begrenset omfattende form og sekvensielle spill, og utlede en sekvens av optimale handlinger.
Bakoverinduksjon forklart
Bakoverinduksjon har blitt brukt til å løse spill siden John von Neumann og Oskar Morgenstern etablerte spillteori som et akademisk emne da de i 1944 publiserte sin bok, Theory of Games and Economic Behaviour .
På hvert trinn i spillet bestemmer induksjon bakover den optimale strategien til spilleren som gjør det siste trekket i spillet. Deretter bestemmes den optimale handlingen fra den neste til siste spilleren som beveger seg, og tar den siste spillerens handling som gitt. Denne prosessen fortsetter bakover til den beste handlingen for hvert tidspunkt er bestemt. Effektivt er det å bestemme Nash-likevekten for hvert underspill i det originale spillet.
Resultatene som trekkes ut av tilbaketrekning, klarer imidlertid ikke å forutsi faktisk menneskelig lek. Eksperimentelle studier har vist at "rasjonell" atferd (som forutsagt av spillteori) sjelden vises i det virkelige liv. Irrasjonelle spillere kan faktisk ende opp med å oppnå høyere utbetaling enn spådd av tilbaketaking, som illustrert i tusenbeins-spillet.
I tusenbeinsspillet får to spillere vekselvis en sjanse til å ta en større andel av en økende pott med penger, eller til å gi potten videre til den andre spilleren. Utbetalingen er ordnet slik at hvis potten blir gitt til ens motstander og motstanderen tar potten på neste runde, får man litt mindre enn om man hadde tatt potten på denne runden. Spillet avsluttes så snart en spiller tar stash, med at spilleren får den større delen og den andre spilleren får den mindre delen.
Eksempel på bakoverinduksjon
For eksempel antar at spiller A går først og må bestemme seg for om han skal “ta” eller “passere” stashen, som for tiden utgjør $ 2. Hvis han tar, får A og B $ 1 hver, men hvis A passerer, må avgjørelsen om å ta eller passere nå tas av spiller B. Hvis B tar, får hun $ 3 (dvs. forrige stash på $ 2 + $ 1) og A får $ 0. Men hvis B passerer, får A nå bestemme seg for å ta eller bestå, og så videre. Hvis begge spillerne alltid velger å passere, mottar de hver en utbetaling på $ 100 på slutten av spillet.
Poenget med spillet er at A og B begge samarbeider og fortsetter å passere til slutten av spillet, de får den maksimale utbetalingen på $ 100 hver. Men hvis de mistroer den andre spilleren og forventer at de skal "ta" ved første mulighet, spår Nash-likevekten at spillerne vil ta lavest mulig krav ($ 1 i dette tilfellet).
Nash-likevekten i dette spillet, der ingen spillere har et insentiv til å avvike fra sin valgte strategi etter å ha vurdert en motstanders valg, antyder at den første spilleren vil ta potten på den aller første runden av spillet. I virkeligheten gjør imidlertid relativt få spillere det. Som et resultat får de en høyere utbetaling enn utbetalingen spådd av likevektsanalysen.
Løs rekkefølgende spill ved hjelp av bakoverinduksjon
Nedenfor er et enkelt sekvensielt spill mellom to spillere. Etikettene med Player 1 og Player 2 i dem er informasjonssettene for henholdsvis en eller to spillere. Tallene i parentesene nederst på treet er utbetalingen på hvert respektive punkt. Spillet er også sekvensielt, så spiller 1 tar den første avgjørelsen (venstre eller høyre) og spiller 2 tar sin beslutning etter spiller 1 (opp eller ned).
Figur 1
Bakover induksjon, som all spillteori, bruker forutsetningene om rasjonalitet og maksimalisering, noe som betyr at spiller 2 vil maksimere gevinsten sin i en gitt situasjon. Ved begge informasjonssettene har vi to valg, fire i alt. Ved å eliminere valgene som spiller 2 ikke vil velge, kan vi begrense treet vårt. På denne måten vil vi fede linjene som maksimerer spillerens utbetaling ved det gitte informasjonssettet.
Figur 2
Etter denne reduksjonen kan Player 1 maksimere utbetalingen nå som Player 2s valg blir gjort kjent. Resultatet er en likevekt funnet ved tilbaketrekking av spiller 1 som velger "riktig" og spiller 2 velger "opp." Nedenfor er løsningen på spillet med likevektsveien med fet skrift.
Figur 3
For eksempel kunne man enkelt sette opp et spill som ligner det over ved å bruke selskaper som spillere. Dette spillet kan omfatte produktutgivelsesscenarier. Hvis firma 1 ønsket å gi ut et produkt, hva kan firma 2 gjøre som svar? Vil Company 2 gi ut et lignende konkurrerende produkt? Ved å spå om salg av dette nye produktet i forskjellige scenarier, kan vi sette opp et spill for å forutsi hvordan hendelser kan utfolde seg. Nedenfor er et eksempel på hvordan man kan modellere et slikt spill.
Figur 4
