Vad är bakåtinduktion?
Framåtriktad induktion i spelteorin är en iterativ process att resonera bakåt i tiden, från slutet av ett problem eller en situation, för att lösa begränsad omfattande form och sekvensiella spel, och dra slutsatsen av en serie av optimala åtgärder.
Bakåtinduktion förklarat
Bakåtinduktion har använts för att lösa spel sedan John von Neumann och Oskar Morgenstern etablerade spelteori som ett akademiskt ämne när de publicerade sin bok, Theory of Games and Economic Behaviour 1944.
I varje steg i spelet avgör induktion bakåt den optimala strategin för spelaren som gör det sista steget i spelet. Sedan bestäms den optimala handlingen för den nästa-till-sista rörliga spelaren, och tar den sista spelarens handling som anges. Denna process fortsätter bakåt tills den bästa handlingen för varje tidpunkt har fastställts. Man bestämmer effektivt Nash-jämvikten för varje underspel i det ursprungliga spelet.
Men resultaten som härleds från induktion bakåt misslyckas ofta med att förutsäga faktiskt mänskligt spel. Experimentella studier har visat att ”rationellt” beteende (som förutses av spelteori) sällan visas i verkligheten. Irrationella spelare kan faktiskt hamna i högre utbetalningar än förutsagt av bakåtinduktion, vilket illustreras i tusenbeinsspelet.
I tusenfaldspelet får två spelare växelvis en chans att ta en större andel av en växande pott pengar, eller att skicka potten till den andra spelaren. Utbetalningarna är ordnade så att om potten överförs till ens motståndare och motståndaren tar potten i nästa omgång, får man något mindre än om man hade tagit potten på denna omgång. Spelet avslutas så snart en spelare tar stash, med den spelaren får den större delen och den andra spelaren får den mindre delen.
Exempel på bakåtinduktion
Anta som exempel att spelare A går först och måste bestämma om han ska "ta" eller "passera" stashen, som för närvarande uppgår till $ 2. Om han tar, får A och B $ 1 vardera, men om A passerar måste beslutet att ta eller passera nu göras av spelare B. Om B tar, får hon $ 3 (dvs den tidigare stashen på $ 2 + $ 1) och A får $ 0. Men om B passerar får A nu besluta om att ta eller passera, och så vidare. Om båda spelarna alltid väljer att passera, får de var och en en vinst på $ 100 i slutet av spelet.
Poängen med spelet är om A och B båda samarbetar och fortsätter att passera till slutet av spelet, de får den maximala utbetalningen på $ 100 vardera. Men om de misstroar den andra spelaren och förväntar sig att de ska "ta" vid första tillfället, förutspår Nash-jämvikten att spelarna kommer att ta lägsta möjliga fordran ($ 1 i detta fall).
Nash-jämvikten i detta spel, där ingen spelare har ett incitament att avvika från sin valda strategi efter att ha övervägt en motståndares val, antyder att den första spelaren skulle ta potten i den första omgången av spelet. Men i verkligheten gör relativt få spelare det. Som ett resultat får de en högre vinst än den vinst som förutses av jämviktsanalysen.
Lösa sekventiella spel med hjälp av bakåtinduktion
Nedan finns ett enkelt sekventiellt spel mellan två spelare. Etiketterna med Player 1 och Player 2 i dem är informationsuppsättningarna för spelare en respektive två. Siffrorna i parenteserna längst ner i trädet är utdelningarna vid respektive punkt. Spelet är också sekventiellt, så spelare 1 fattar det första beslutet (vänster eller höger) och spelare 2 fattar sitt beslut efter spelare 1 (upp eller ner).
Figur 1
Bakåt induktion, som alla spelteorier, använder antagandena om rationalitet och maximering, vilket innebär att spelare 2 kommer att maximera sin vinst i varje given situation. Vid endera informationsuppsättningen har vi två val, fyra totalt. Genom att eliminera de val som spelare 2 inte kommer att välja, kan vi begränsa vårt träd. På det här sättet kommer vi att feta de rader som maximerar spelarens vinst vid den angivna informationsuppsättningen.
figur 2
Efter denna minskning kan spelare 1 maximera sina utbetalningar nu när spelarens 2 val görs kända. Resultatet är en jämvikt som återfinns genom bakåtinduktion av spelare 1 som väljer "rätt" och spelare 2 väljer "upp". Nedan är lösningen på spelet med jämviktsvägen fet.
Figur 3
Till exempel kan man enkelt skapa ett spel som liknar det ovan med företag som spelare. Det här spelet kan innehålla produktutgivarscenarier. Om företag 1 ville släppa en produkt, vad kan företag 2 göra som svar? Kommer Company 2 att släppa en liknande konkurrerande produkt? Genom att förutse försäljning av denna nya produkt i olika scenarier kan vi skapa ett spel för att förutsäga hur händelser kan utvecklas. Nedan följer ett exempel på hur man kan modellera ett sådant spel.
Figur 4
