Kirjutanud: CB Garcia ja WI Zangwill

Boothi ​​ärikooli juhtimisteaduste professorid (mõlemad pensionil)

Muudetud august 18, 2018 (Garcia ja Zangwill [8, 9]).

Märksõnad: Mänguteooria, kinnipeetava dilemma, Bayesi keel, subjektiivsed tõenäosused

Abstraktne: Von Neumann ja Morgenstern (VNM) esitasid eeldatava kasulikkuse hüpoteesi kasutades mänguteooria probleemi põhimõttelise sõnastuse. Kuni selle hetkeni oli seda sõnastust olnud raske lahendada ilma täiendavaid eeldusi seadmata. Nash pidi eeldama, et mängijad on lahti ühendatud nii, et mängija A toimingu tegemise tõenäosus sõltus mängija B toimingu tõenäosusest. Selles artiklis kõrvaldame Nashi eeldused, sealhulgas eelduse, et mängijate strateegiad on üldteada, ja toetame mudelit, mis on täiesti samaväärne üldise VNM-i probleemiga. Meie hõlpsasti lahendatav sõnastus kõrvaldab mõned Naši lähenemisviisile omased raskused, mis andsid sageli vastuolulisi ja vastuolulisi tulemusi, näiteks kinnipeetava dilemma, kanamäng, Newcombi paradoks, poissjaht ja paljud muud mängud. Näiteks visates Nasi vastastikuse iseseisvuse eelduse kinnipeetava dilemmasse, näitab meie mudel, et mängijad on võimelised saavutama paremaid väljamakseid ja selle saavutamiseks ei pea nad mängima ühiselt ega suhtlema, vaid rakendama üksnes Bayesi teoreemi stiilis (Harsanyi [10]; Kadane ja Larkey [11]). Meie lähenemisviis jagab tõenäosusruumi kaheks pooleks või piirkonnaks, mille suhteline suurus sõltub väljamaksetest. Nüüd ei pea tõenäosust täpselt hindama, vaid tuleb ainult kindlaks teha, millises piirkonnas see asub. See annab olulisi eeliseid, kuna kui üks piirkond on teisest oluliselt suurem, annab see kohe olulise ülevaate mängu mängimisest. Meie üldlahendus, mis ei ole korrelatsioonis, öeldes Aumanni tähenduses [1], sisaldab konkreetsete lahendusena Nashi tasakaalu. Vastupidiselt kirjeldavatele Nashi lahendustele on meie lahendus ratsionaalsete-ootuste puhaste strateegiate ettekirjutav paar, mis annab uue aluse mänguteooriale. Laiendame oma lähenemisviisi üldistele M-Person mängudele, nagu näeme kivi-paber-kääride mängus ja riba tõrjumise probleemist.

Tulemuste kokkuvõte.

Nüüd võtame mõne tulemuse kokku, tuginedes allpool toodud üksikasjadele ja otsestele väljamaksetele. Usume, et need tulemused näitavad meie lähenemisviisi väärtust õpetamisel ja uurimisel, kuna tulemused pakuvad sageli uusi lahendusi.

Koordinatsioonimäng: Nassi iseseisvuse eeldus jätab kahe silma vahele kõrgema Bayeside lähenemisviisi, mida me kasutame. Allpool toodud väljamaksete jaoks mängige esimest strateegiat, kui usute, et vastase tõenäosus mängida oma esimest strateegiat on vähemalt 1 / 3, mängige teist strateegiat. Nash ei saa teadmisi selle kohta, millal millist strateegiat rakendada. Samuti, kui väljamakseid muudetakse, pakub meie lähenemisviis muudetud tõenäosusi. Suguvõitlus: Kaks osapoolt erinevad, kuhu nad peaksid minema, kuid neil pole lubatud suhelda. Mõlemad pooled saavad hea väljamakse, kui nad mõlemad valivad sama valiku, sest vähemalt on nad mõlemad koos. Antud partei saab boonuse, kui nad mõlemad käivad selle peo valikul. Kumbki ei saa head tulu, kui nad käivad erinevates kohtades. Allpool esitatud väljamakseid arvestades peaks mängija A mängima oma soovitud strateegiat, kui ta usub, et ka teine ​​mängija valib A soovitud valiku tõenäosusega vähemalt 33%. Seevastu Nash pakub kolme tasakaalu ilma igasuguse ülevaateta, millal mängida, ja ilma tõenäosuste analüüsita. Sobivad pennid: Kaks mängijat, paar ja paaritu, paljastavad samaaegselt penni. Kui pennid ühtivad, hoiab Even mõlemad penne; muidu hoiab Odd mõlemad penne. Selle nullsummaga mängu ainulaadne Neši tasakaal on mõlemal mängijal juhuslikult mängida. Allpool toodud väljamakseid arvestades peaks Even mängima päid, kui ta usub, et Odd mängib päid tõenäosusega vähemalt 50%. Teisest küljest peaks Odd mängima päid, kui ta usub, et Even mängib päid tõenäosusega kuni 50%. Kanade mäng: Kaks autot kiirustavad üksteise poole ja on peagi krahh. Nash soovitab, et üks auto peaks pöörlema ​​ja teine ​​minema otse, kuid pakub vähe ülevaadet sellest, mis peaks pöörlema. Arvestades allpool toodud väljamakseid, soovitab meie lähenemisviis teil pöörduda, kui usute, et vastane kiigub tõenäosusega kuni 90%, vastasel juhul minge otse. Pange tähele, et mõlemad mängijad, kes pöörlevad (või mõlemad lähevad otse), ei ole Nassi tasakaal, vaid et mõlemad mängijad, kes pöörduvad (või mõlemad lähevad otse) ootuses, et vastane läheb otse (või pöördub), on tasakaalustsenaarium. Samuti, kui väljamakseid muudetakse, pakub meie lähenemisviis värskendatud tõenäosusi. Relvavõistlus: iga riik varustab algselt relvi, et seda ei rünnataks. Kuid nagu allpool näidatud, realiseerub relvade ladustamisel vähenev tulu, avades võimaluse rahulepingu sõlmimiseks. Nash ei tuvasta rahulepingu sõlmimise võimalust. Stag hunt: jahti stag, kui usute, et vastane küttib stag tõenäosusega vähemalt 50%, vastasel juhul jahtige jäneseid. (Puhas Naši tasakaal on mõeldud mõlemale jahti pidama või mõlemale jänese jahtimiseks). Newcombi probleem: kui Newcombi probleem püstitatakse vangide dilemmana, saab Newcombi probleemile lahenduse leida kahel viisil: mitte-kooperatiivse Nashi tasakaaluna, kasutades domineerimise põhimõtet, või koostöölahendusena, kasutades eeldatavat kasulikkuse hüpoteesi. Kivipaber-kääride mäng: Nashi tasakaal on teie jaoks juhusliku 3-küljega mängu mängimiseks. Selle iidse mängu uus strateegia näib teile olevat rocki mängimine, kui usute, et teie vastane mängib paberit tõenäosusega maksimaalselt 33% ja kääridega, mille tõenäosus on vähemalt 33%; paberit mängima, kui usute, et teie vastane mängib käärid tõenäosusega maksimaalselt 33% ja rokib tõenäosusega vähemalt 33%; muidu kääride mängimiseks. (Meie lähenemisviis võib teid aidata, kui öelda, et teil on andmeid teie vastase eelmiste mängude kohta.) Baaride tõrjumise mängul on 3 sõbrad A, B ja C: Igaüks, kes läheb baari üksi, ei saa midagi - koju jäämine on parem valik. Kui kaks sõpra lähevad baari, on see parim valik. Kui kõik kolm lähevad, viskab latt kõik kolm välja. Nashi tasakaal on selleks, et kõik jääksid koju või et kõik saaksid oma esimest strateegiat mängida tõenäosusega, mis on võrdne 33% -ga. Kuid kui teil on oma sõprade kohta ülevaadet ja saate hinnata Bayeside tõenäosust nende käitumises, võib meie strateegia aidata.

Laiendame ka oma lähenemist M-inimese mängule ja saame sarnaseid teadmisi. Näiteks näitame täielikku lahendust üldistele 2-person mängudele ja üldistele 3 person x-mängudele.

Eeldatav kasulikkuse hüpotees.

2-Person mängus laske mängijatel A ja B 2 strateegiad: mängija A1 või A2 ja mängija B puhul B1 või B2.

Ootuspärase kasuliku teooria aluseks on von Neumann - Morgenstern kasuliku teoreem (von Neumann ja Morgenstern [20]): lase Aij ja Bij olla vastavalt mängijale A ja B, kui mängija A mängib Ai ja mängija B mängib Bj, sest i , j = 1 või 2. Eeldatav kasulikkuse hüpotees ütleb, et mängijad A ja B peavad maksimeerima oma eeldatavat väljamakset1:

kus pA (Ai ja Bj) on mängija A tõenäosus, et A mängib Ai ja B mängib Bj ja sarnaselt mängijale B.

Tingimuslikud tõenäosused[1].

Meie lähenemise jaoks tilk Nashi eeldus, et mängijate tõenäosused on üksteisest sõltumatud. See võimaldab meie probleemil (1) olla üldisem ja saada rohkem lahendusi, mis vastavad eeldatavale kasulikkuse hüpoteesile.

Olgu EP (A | Ai) ja EP (B | Bj) oodatavad väljamaksed[2],[3] A ja B, arvestades, et A mängib Ai ja B mängib Bj, i, j = 1, 2:

Alustagem tõestades elementaarne mängude “Bayesi” teoreem mis näitab meie lähenemise VNM-i koostisele samaväärsust:

Teoreem 1[5]. Alltoodud probleemid (3) on samaväärsed probleemidega (1)[6]:

Tõend. Bayesi teoreemi järgi

Seejärel

Maksimaalne[7] ülaltoodud võrrandist on pA (A1) = 1 (st mängida strateegia A1), kui EP (A | A1) ≥ EP (A | A2) või pA (A1) = 0 (st mängida strateegia A2), kui EP ( A | A1) EP (A | A2). Seega (3) kehtib mängijale A. Sarnane argument kehtib ka mängijale BQED

VNM-i piirkonnad.

Määrake VNM piirkonnad A1 ja A2 kumeradeks polütopideks:

Nagu allpool näidatud, peaks A mängima strateegiat A1, kui ta eeldab, et B on piirkonnas A1. Vastasel juhul peaks A mängima A2. Tasakaalu joon

eraldab tõenäosusruumi kaheks piirkonnaks ja annab visuaalselt abivalmis olukorra olukorra analüüsimiseks[8].

Regioonide tähtsus: Mõlemad piirkonnad on praktiliselt olulised, sest praegu ei pea tõenäosust täpselt hindama, vaid ainult määrama, milline kahest piirkonnast see on. Sageli on näha, et tõenäosus on tõenäoliselt ühes piirkonnas ja selle piirkonna identifitseerimine on piisav teave, et soovitada mängu asjakohast mängu. Oletame näiteks, et piirkond A1 on teistest tunduvalt suurem, seega on tõenäosus selles piirkonnas A1 tõenäoliselt suur. See annab veenva teabe, et mängija A mängib tõenäoliselt A1i.

Analoogselt B:

VNM-i piirkonnad sõltuvad mängijate varasematest tõenäosusjaotustest, mida sageli nimetatakse sageli preesteriteks (Jaynes [13]; Harsanyi [10]; Kadane ja Larkey [11]), mis on mängijate veendumuste väljendus tõenäosusjaotuse kohta nende vastane. [9]

2. Arvestades (3), mängib A strateegiat A1 ainult siis, kui ta eeldab, et mängija B on VNM piirkonnas A1. Else, A mängib strateegiat A2. Samamoodi mängib B strateegiat B1 ainult siis, kui ta eeldab, et mängija A kuulub VNM piirkonnas B1. Else, B mängib strateegiat B2.

Tõend. EP (A | A1) ≥ EP (A | A2) kui ja ainult siis, kui A11 pA (B1 | A1) + A12 pA (B2 | A1) ≥ A21 pA (B1 | A2) + A22 pA (B2 | A2) kui ja ainult siis, kui (A11 - A12) pA (B1 | A1) + (A21 - A22) pA (B2 | A2) + A12 - A21 ≥ 0.

Samamoodi on EP (B | B1) ≥ EP (B | B2), kui ja ainult siis, kui B11 pB (A1 | B1) + B21 pB (A2 | B1) ≥ B12 pB (A1 | B2)

+ B22 pB (A2 | B2) kui ja ainult siis, kui (B11 - B21) pB (A1 | B1) + (B12 - B22) pB (A2 | B2) + B21 - B12 ≥ 0. QED

Teoreemist 1 ja Corollary 2, piirkondade punktide (5) ja (7) puhul, eeldatakse eeldatavat kasulikkuse hüpoteesi, st VNM-piirkonnad määratlevad 2-isiku mängu üldise lahenduse[10].

Nashi tasakaal.

Kui mängijate tõenäosused on üksteisest sõltumatud, lihtsustavad VNM-i piirkonnad:

Propositsioon 3. Oletame, et Nashi tasakaal (p (A1), p (B1)) on vastavalt VNM regioonis Ai ja VNM piirkonnas Bj mõnede i, j = 1, 2 puhul. Seejärel mängib A mängija strateegiat Ai ja mängija B mängib strateegiat

Bj.

Tõend. Nashi tasakaaluprobleem on probleem (1), kus pA (Ai ja Bj) = pB (Ai ja Bj) = p (Ai) p (Bj) või probleem (3), kus pA (Bj | Ai) = p (Bj ) ja pB (Ai | Bj) = p (Ai), i, j = 1, 2. Seega omab Corollary 2, kus VNM piirkonnad on defineeritud (8), pA (B1) = p (B1) ja pB (A1) = p (A1) puhul. QED

Meenuta, et tasakaalu võrrandid

eraldada VNM-piirkonnad, andes seeläbi üldise lahenduse mis tahes mängule. Need samad tasakaalu võrrandid, kus pB (A1) = p (A1) ja pA (B1) = p (B1), annavad segatud Nash-tasakaalu11, nagu näitame alltoodud tabelis.

Propositsioon 4. Võttes arvesse mängu A = [[A11, A12], [A21, A22]] ja B = [[B11, B12], [B21, B22]], arvutatakse mängu Nash-tasakaalu tabeli 112 vastava rea ​​järgi.

Tõend. Pange tähele, et (i, j) on puhas Nashi tasakaal, kui ja ainult siis, kui sgn (2i - 1) * (A11 - A21)> 0 ja sgn (2j - 1) * (B11 - B12)> 0, i, j = 0, 1. Seda asjaolu kasutades loetletakse tabeli 1 iga rea ​​jaoks kõik paarid (i, j), mis on puhtad Nashi tasakaalud.

Lõpuks, kui (9) defineeritud paar (a, b) on segatud Nashi tasakaal, peame ainult näitama, et 0 <a <1 ja 0 <b <1. Pange tähele, et tabeli 6 ridade 7, 10, 11 ja 1 puhul on a, 1-a, b või 1-b loendaja ja nimetaja nii positiivsed kui mõlemad negatiivsed; seega a, 1 - a, b, 1 - b on kõik suuremad kui 0. QED

Itereeritud domineerimise näide[13].

Olgu A = [[2, 2], [3, 1]] ja B = [[0, 1], [0, 2]]. „Play A1 & B2” on Nashi tasakaal.

Propositsioon 5. Arvestades A = [[2, 2], [3, 1]] ja B = [[0, 1], [0, 2]], siis mängija A mängib A1i ja mängija B mängib B2i.

Tõend. VNM piirkond A1 on: pA (B2 | A2) ≥ 1 / 2 ja VNM piirkond B2 on: pB (A2 | B2) ≥ -1. Seega mängib B mängijat B2. Mängija A teab ka seda, seega pA (B2 | A2) = 1. Kuna pA (B2 | A2) = 1 on punkt VNM piirkonnas A1, mängib mängija A1. QED

Koordineerimise näide.

Olgu A = B = [[2, 0], [0, 1]]. Seal on 3 Nashi tasakaalupunktid: “mängida A1 & B1”, “mängida A2 & B2” ja “mängida A1i (või B1) tõenäosusega 1 / 3”. VNM piirkond A1 on: 2pA (B1 | A1) ≥ pA (B2 | A2) ja VNM piirkond B1 on: 2pB (A1 | B1) ≥ pB (A2 | B2). Nende VNM-piirkondade visuaalselt analüüsides valivad A ja B tõenäoliselt vastavalt strateegiaid A1 ja B1.

Propositsioon 6. Arvestades A = B = [[2, 0], [0, 1]], kui mängijate tõenäosused on üksteisest sõltumatud, siis esitage esimene strateegia, kui arvate, et vastase tõenäosus mängida oma esimest strateegiat on vähemalt 1 / 3, teine ​​mängib teist strateegiat.

Tõend. VNM piirkond A1 on: pA (B1) ≥ 1 / 3 ja VNM piirkond B1 on: pB (A1) ≥ 1 / 3. QED

Sekside näide.

Olgu A = [[3, 1], [1, 2]] ja B = [[2, 1], [1, 3]]. Seal on 3 Nashi tasakaalupunktid: “mängida A1 & B1”, “mängida A2 & B2” ja “mängida A1i tõenäosusega 2 / 3, mängida B1i tõenäosusega 1 / 3”. VNM piirkond A1 on: 2pA (B1 | A1) ≥ pA (B2 | A2) ja VNM piirkond B1 on: pB (A1 | B1) ≥ 2pB (A2 | B2). A eelistaks valida A1 ja B valiks pigem B2i.

Propositsioon 7. Arvestades A = [[3, 1], [1, 2]] ja B = [[2, 1], [1, 3]], kui mängijate tõenäosused on teineteisest sõltumatud, siis: esitage A1, kui pA (B1 ) ≥ 1 / 3, muidu mängib A2; esitage B1, kui pB (A1) ≥ 2 / 3, muidu mängib B2.

Tõend. VNM piirkond A1 on: pA (B1) ≥ 1 / 3 ja VNM piirkond B1 on: pB (A1) ≥ 2 / 3. QED

Sobivad penni näited.

Olgu A = [[1, -1], [-1, 1]] ja B = [[-1, 1], [1, -1]]. Sellel nullsummaga mängul on segatud Nashi tasakaal: “mängida A1i tõenäosusega 1 / 2, mängida B1i tõenäosusega 1 / 2”.

Propositsioon 8. Arvestades A = [[1, -1], [-1, 1]] ja B = [[-1, 1], [1, -1]], kui mängijate tõenäosused on üksteisest sõltumatud, siis: play A1 kui pA (B1) ≥ 1 / 2, siis mängida A2; B1i mängimine, kui pB (A1) 1 / 2, muidu B2[14].

Tõend. VNM piirkond A1 on: pA (B1) ≥ 1 / 2 ja VNM piirkond B1 on: pB (A1) 1 / 2. QED

Kana mängu näide (Sugden [19]).

Olgu A = [[0, -1], [1, -10]] ja B = [[0, 1], [-1, -10]]. Nashi tasakaal on "A1 (swerve) ja B2 (sirge) mängimine", "A2i mängimine (sirge) ja B1 (swerve)" ja "A1 (B1) mängimine" tõenäosusega 0.9 ".

Propositsioon 9. Kana mängus, kui mängijate tõenäosused on üksteisest sõltumatud, siis: nihutage, kui usute, et vastane varieerub tõenäoliselt maksimaalselt 90%, muidu sirge.

Tõend. VNM piirkond A1 on: pA (B1) + 11pA (B2) ≥ 2 või pA (B1) ≤ 9 / 10. Sarnaselt on VNM piirkond B1: pB (A1) ≤ 9 / 10. QED

Pange tähele, et kui teie vastane näitab liiga palju entusiasmi (vähemalt 90%), siis peaksite minema otse.

Eelistatud stsenaarium: mängijad on tõenäolisem, et nad varitsevad rohkem kui minna otse.

Kana stsenaarium: Oletame, et pA (B1) = pB (A1) = 0. Mõlemad mängijad eeldavad, et teine ​​mängija läheb otse. Mõlemad muutuvad.

Katastroofi stsenaarium: Oletame, et pA (B1) = pB (A1) = 1. Mõlemad mängijad ootavad, et teine ​​mängija vahelduks. Mõlemad lähevad otse[15].

Nash-tasakaalu stsenaarium: Oletame, et pA (B1) = 1 - pB (A1) ja pB (A1) = 0 või 1. Mängija, kes eeldab, et teine ​​mängija läheb otse, varieerub ja mängija, kes ootab, et teine ​​mängija vahetuks, läheb otse.

Relva rasside näide.

Tehke 9-sse A = [[0, -x], [1, -10x]], B = [[0, 1], [-y, -10y]], x, y ≥ 0. Olgu A1 või B1 „otsida rahu” ja A2 või B2 on „tuumarünnak”. Väärtused x ja y tähistavad vastavalt B ja A relvavarusid.

A-riik otsib rahu, kui tõenäosus, et riigi B rünnakud on suuremad kui 1 / (9x + 1); muidu rünnakud. Tõenäosuskõver pA (B1) = 1 / (9x + 1) langeb kiiresti, nt pA (B1) = 1 / 2 x = 1 / 9, kuid varsti langeb dramaatiliselt: B peab algselt kiiresti varuma, kuid kõverana lamedaks, B-le on vähe kasu relvade ladustamiseks.

Ja sarnaselt riigile B.

Kokkuvõtteks võib öelda, et iga riik varutab esialgu relvi, et seda ei rünnata. Kuid varude kogumisest saadav tulu väheneb kiiresti, avades võimaluse rahulepingu otsimiseks.

Arvestage 2018i hinnangulist ülemaailmset tuumavarusid[16] tabelis 2.

Ülaltoodud tulemuste ja tabeli 2 põhjal peaks ratsionaalne Põhja-Korea otsima rahulepingut Ameerika Ühendriikide ja Venemaaga.

Skyrms [16]).

Olgu A = [[4, 1], [3, 2]] ja B = [[4, 3], [1, 2]]. Nashi tasakaal on "A1 (Stag) & B1 (Stag)", "A2 (Hare) & B2 (Hare)" ja "A1 (B1) mängimine" tõenäosusega 0.5 ".

Propositsioon 10. Stag hunt, kui mängijate tõenäosused on üksteisest sõltumatud, siis: hunt stag, kui te arvate, et vastane hakkab jahtima vähemalt 50% tõenäosusega, muidu jahima.

Tõend. VNM piirkond A1 on: 3pA (B1) + pA (B2) ≥ 2 või pA (B1) ≥ 1 / 2. Sarnaselt on VNM piirkond B1: pB (A1) ≥ 1 / 2. QED

Vangla dilemma[17].

Olgu A12 <A22 <A11 <A21, ja lase B võrdseks A ülekandega. Kuna A11 <A21 ja A12 <A22, annab domineerimise põhimõtte kasutamine Nashi tasakaalu, nimelt mittesiduva lahenduse “play A2 (defekt) ja B2 (defekt) ”. Aga kuna A22 <A11, A ja B on paremad, kui nad mõlemad mängivad koostöölahendust „A1 (vaikimine) ja B1 (vaikimine)”.

Propositsioon 11. Kinnipeetava dilemmas, kui mängijate tõenäosused on üksteisest sõltumatud, mängivad mängijad mitte-koostööd[18].

Tõend. Pöörake tähelepanu VNM piirkonna vasakule küljele A1:

(A11 - A12 - A21 + A22) lkA(B1) + A12 - A22.

Kui A11 - A12 - A21 + A22 ≤ 0, siis (A11 - A12 - A21 + A22) pA(B1) + A12 - A22 ≤ A12 - A22 <0. Teisest küljest, kui A11 - A12 - A21 + A22> 0, siis (A11 - A12 - A21 + A22) pA(B1) + A12 - A22 ≤ (A11 - A12 - A21 + A22) + A12 - A22 = A11 - A21 <0. Seega on iga A-mängija jaoks eelnev VNM-piirkond A1 null-komplekt, seega peab ta mängima strateegiat 2.

Samamoodi peab mängija B mängima strateegiat 2. QED

Ettepanek 11 näitab selgelt, et iseseisvuse ülevõtmine piirab meid mittesiduva lahendusega.

Klassikalise vangla dilemma näide.

Klassikalise vangi dilemmas A = [[-1, -3], [0, -2]] ja B = [[-1, 0], [-3, -2]].

Propositsioon 12. Klassikalise vangi dilemmas, kui mängijate preester on: pA (B1 | A1) + pA (B2 | A2) ≥ 3 / 2, pB (A1 | B1) + pB (A2 | B2) ≥ 3 / 2, siis mängijad mängivad ühist lahendust19.

Tõend. VNM piirkond A1 on: pA (B1 | A1) + pA (B2 | A2) ≥ 3 / 2 ja VNM piirkond B1 on: pB (A1 | B1) + pB (A2 | B2) ≥ 3 / 2. Seega peavad antud preesterite puhul mängijad A ja B mängima ühist lahendust. QED

Proposition 12 puhul märkige ühislahenduse mängimiseks vajalik suur riba. Mängijad eelistaksid pigem mitteühistavat lahendust mängida.

Näide, kus Nash-lähenemine ei suuda kaaluda koostööstrateegia mängimist.

Mõtle vangi dilemma, kus A11 - A12 = A21 - A22, A21 = A11 + m ja A22 = A11 - M, kus m> 0 on väike ja M> 0 on väga suur. Näiteks A = [[100, -3], [101, -2]]. Meenuta ettepanekust 11, et kui mängijate tõenäosused on üksteisest sõltumatud, mängivad mängijad koostööd.

Ilmselt oleks rumal, kui mängijad ei kaaluks isegi strateegia 1 mängimist, sest kui mängija mängib 2i, tekitab võimalus, et teine ​​mängija mängib ka 2i, märkimisväärset kahjumit, nii et miks seda riskida. On selge, et Nashi lähenemisviis ei arvesta koostöölahenduse mängimist isegi siis, kui see on ilmselge lahendus - väga oluline punkt, rääkides turuhäiretest üldistes majandusliku tasakaalu mudelites.

Teisest küljest, nagu näitab järgmine ettepanek, sõltumatuse eelduse kaotamisega mängib meie lähenemine pigem koostöölahendust kui mitteühistavat lahendust.

Must joon on klassikalise vangi dilemma ükskõiksus. Mängija mängib tõenäolisemalt strateegiat 2, sest tõenäoliselt on selles piirkonnas strateegiat mängida

1.

Roheline joon on vangide dilemma selle astme ükskõiksusjoon: pA (B1 | A1) + pA (B2 | A2) = 1 + m / (M + m). Siin on strateegia 1 tõenäosuspiirkonna suurus peaaegu strateegia 2 puhul. Meie lähenemine on aidata mängijatel kaaluda strateegia 1 mängimist.

Propositsioon 13. Arvestades kinnipeetava dilemma, kus A11 - A12 = A21 - A22, A21 = A11 + m ja A22 = A11 - M, kus m> 0 on väike ja M> 0 on väga suur, mängivad A ja B ühist lahendust20.

  • Seetõttu ei mängi mängijad mitteühistavat lahendust.
  • Praegu lisatakse koostöölahenduse saavutamiseks eeldused, nt piiratud ratsionaalsus, mittetäielik teave (Aumann ja Maschler [2]; Acevedo ja Krueger [4]; Daley Arvestades A eeldatavaid ühiseid tõenäosusi pA (Ai ja Bj), A järeldab, et pA (A1 ja B1) peavad olema 1i lähedal, sest A ja B mängivad tõenäoliselt strateegiat 1, kus nende tasuvus on üsna kõrge ja ainult m ühikut vähem kui maksimaalne.

Seetõttu peab pA (B1 | A1) = pA (A1 ja B1) / pA (A1) olema samuti 1i lähedal.

A järeldab ka, et pA (A2 ja B2) pA (A2 ja B1), kuna B on tõenäolisem mängida strateegiat 2, kui A mängib strateegiat 2. Seega pA (B2 | A2) = pA (A2 ja B2) / (pA (A2 ja B1) + pA (A2 ja B2)) 1 / 2. A järeldab joonise 1 abil, et B on piisavalt VNM piirkonnas A1. Samamoodi mängib B strateegiat 1. QED

Newcombi paradoks kui vangla dilemma versioon.

Kuulus Newcombi paradoksis (Wolpert ja Benford [21]) on ennustaja B, mängija A ja kast X. Mängijale A antakse võimalus kasti X või kasti X pluss 1,000. Enne A valimist B ennustab, mida A teeb, ja B ennustused on peaaegu kindlad. Kui B ennustab, et A võtab ainult kasti X, siis B paneb $ 1,000,000i lahtrisse X. Sel juhul, kui kastis on selles $ 1,000,000, saab A $ 1,000,000 või $ 1,001,000 sõltuvalt sellest, kas A valib kasti X või X pluss $ 1,000. Teisest küljest, kui B ennustab, et A võtab kasti X pluss $ 1,000, siis B ei kanna kastis X midagi. Sel juhul, olenevalt valikust, saab A kas $ 1,000 või mitte midagi.

Newcombi paradoks on see, et kaks täiesti ratsionaalset analüüsi annavad vastukäivad vastused mängija A optimeerimisprobleemile: eeldatava kasulikkuse hüpoteesi kohaselt peaks mängija A võtma ainult kasti X, kuna eeldatav X-i kasutamise tasuvus on palju suurem. Teisest küljest peaks domineerivuse põhimõtte kohaselt mängija A võtma kasti X pluss $ 1,000.

Parimat mõistetakse kõige paremini lõigus (Wolpert ja Benford [21]): “… Newcomb ütles, et ta võtab lihtsalt X; miks võitlete Jumala sarnase olendiga? Kuid Nozick ütles: „Peaaegu kõigile on täiesti selge ja selge, mida teha. Probleem on selles, et need inimesed jagavad probleemi peaaegu ühtlaselt, suur arv arvab, et vastandlik pool on lihtsalt rumal.

Wolpert ja Benford lahendavad paradoksi, näidates, et Newcombi probleem kujutab endast tegelikult kahte erinevat tõenäosusliku tulemusega mängu.

Selles osas lahendame paradoksi, pannes Newcombi probleemi vangla dilemma. Seda tehes saab Newcombi probleemi lahenduse leida kahel viisil: mittesiduva lahendusena (kasti X pluss $ 1,000), kasutades domineerimise põhimõtet, või koostöölahendusena (võtke ainult lahter X), kasutades eeldatavat kasulikkuse hüpotees.

Oletame, et on olemas rikkalik heategija, kes lubab rahastada ennustaja B jaoks tasuvusmaatriksi, andes järgmise mängu: A = [[$ 1,000,000, 0], [$ 1,001,000, $ 1,000]] ja B = [[1,000,000, $ 1,001,000 ], [0, $ 1,000]].

Kui B ennustab õigesti, saab B, mida mängija A saab. Aga kui B ennustab valesti, saab B $ 1,001,000 miinus selle, mida A saab saada21.

Ettepanekust 13 mängivad A ja B mängijad selles mängus koostööd.

Kui Nash on sarnane, lahendab mängija probleemi domineerimise põhimõttega, nii et ka ennustaja. Nii ennustaja kui ka mängija on mitte-ühistu lahenduses: võta X pluss $ 1,000. Kui mängija lahendab probleemi eeldatava kasulikkuse hüpoteesiga, siis ka ennustaja ja nii ennustaja kui ka mängija on koostöölahenduses: võtke ainult X. Mõlemal juhul on ennustaja ennustus on

ja Sadowski [6]) või uusi meetodeid kirjeldatakse, näiteks tib-tat-korrelatsiooniga tasakaalud (Axelrod [3]; Aumann [1]).

21 Pange tähele, et Newcombi probleemi PD-probleemina esitamisel antakse ennustajale isiklik stiimul, mida Newcombi probleem ei sisalda.

teatud. Kuna mängust 13 ei mängi mängijad mitteühistavat lahendust, nõustume Newcombiga, et koostöö on ilmselge strateegia.

Märkus joonisel 1 on koostööpiirkond siiski tühine kui koostööst hoidumise piirkond. Siis pole meile üllatav, kui inimesed jagavad ühtlaselt, millist strateegiat võtta.

Vangla dilemma üldistamine M-isikuteks.

Et paremini mõista, kuidas Nashi lahendus üldistes majanduslikes tasakaaluolemudelites laguneb, üldistagem vangide dilemma M-isikutele, kusjuures iga mängija omab 2i strateegiaid M jaoks 2.

Kirjeldagem M-isiku mängu binaarpuude kaudu.

Joonis 2 on vangi dilemma väljamakse mängijale A. Puu (2, 1) on binaarne puu, kus on mängija B (mängija 2) vanemana ja mängija A (mängija 1) lapsena. B-mängija tasu saamiseks vahetage lihtsalt vanema ja lapse rollid puu (1, 2). Meenuta, et kinnipeetava dilemma puhul A12 <A22 <A11 <A21.

Järgnevalt oletame, et puu (M - 1, M - 2,…, 2, 1) tähistab mängija A tasumist (M - 1) - Person mängu eest M 3. M-mängija mängu jaoks A-mängija puidu (M, M-1,…, 2, 1) ehitamine, andes mängija A-puu (M-1, M-2,…, 2, 1) mõlemale emaettevõtte M. filiaalid

Parema alampuude väljamaksete arvulised väärtused on teistsugused kui vasakul alampuudel, kui suhe A12 <A22 <A11 <A21 hoitakse kõikjal puus.

Lõpuks, antud mängija (M, M - 1,…, 2, 1) mängija A jaoks, loo mängija B (mängija 1) jaoks puu (1, M, M - 3, ..., 2, 2), tehes 1i kõrgeima vanem; 1i mängija (2, 1, M, M - 4, 3, 3), tehes 2i teiseks suurimaks vanemaks,…, Tree (1, 2, 3,…, M - 2, M, M - 1, M, M - 1 mängija M - 2 jaoks, tehes M - 1 kolmanda väikseima lapse, puu (2, 3, 1,…, M - 1, M) mängija M jaoks, tehes M - XNUMX teise väikseima lapse.

See lõpetab mängijate palgamäära kirjelduse M-isiku vangla dilemma mängus, kus iga mängija omab 2i strateegiaid.

Teoreem 14. M-isiku vangi dilemma puhul M 2, kasutades domineerimispõhimõtet, on Nashi lahendus selles, et mängijad mängivad strateegiat 2.

Tõend. Me teame juba, et teoreem kehtib M = 2. Oletame induktsiooni abil, et teoreem kehtib M-1 jaoks, M 3. Näitagem, et teoreem kehtib M.

Arvestades puud (M, M-1,…, 2, 1) mängijale A, tuletage meelde, et ehitamisel on vasakul ja paremal asuvate alampuude kujuline puu (M - 1, M - 2,…, 2 , 1) mängijale 1, puule (M, M - 1,…, 2) mängijale 2, puule (2, M, M - 1,…, 4, 3) mängijale 3, ..., Tree (2,…) , M - 2, M, M - 1) mängijale M - 1. Need alampuud on mängijate 1, 2,…, M-1 puhul identsed, välja arvatud märgistamine vanemate sõlmedes. Pange tähele, et iga mängija strateegia 2 domineerib oma strateegias 1 mis tahes tingimustel. Induktsiooni abil mängivad 1 mängijad 1-i, kasutades domineerimise põhimõtet.

Seega, kui mängija M puhul on antud puu (1, 2,…, M - 1, M), kui M mängib 1i, on mängija M tasuvus b (teise parempoolse sõlme puus), samas kui M mängib 2i, siis väljamaksmine mängija M puhul on A22 (puu parempoolne sõlm). Kuna domineerimise põhimõte, kuna A12 <A22, mängib mängija M ka strateegiat 2. QED

Oletame nüüd, et A11-i tüüpi väljamaksed on palju suuremad kui A22-i tüüpi väljamaksed; ja et A21 = A11 + m, kus tasud A11 ja A21 on külgnevates sõlmedes.

On selge, et Nashi lähenemisviis ei võta arvesse koostöölahenduse mängimist „mängida strateegiat 1” isegi siis, kui see on ilmne lahendus.

Teoreemi 14 induktiivset argumenti silmas pidades võime järeldada ka, et kuna vasakul ja paremal asuvad filiaalid on mängija 1, Puu (M - 2, M - 2,…, 1, 1) kujul. M - 1, M - 2, ..., 2) mängijale 2, puu (2, M, M - 1,…, 4, 3) mängijale 3,…, Tree (2,…, M - 2, M, M - 1) mängija M - 1 jaoks, induktsiooni abil, kasutades eeldatavat kasulikkuse hüpoteesi, mängivad 1 mängijad M - 1i strateegiat 1, kus tasuvus on A11.

Seega, kui mängija M puhul on puul (1, 2,…, M - 1, M), kui M mängib 1i, on mängija M tasu a (puidu vasakpoolne sõlm), samas kui M mängib 2i, siis kui mängib 21, siis kasum mängija M on A11 = A11 + m (puu teine ​​vasakpoolne sõlm). Kuna A21 <A2, võib mängija M kiusata mängida strateegiat 2. Aga miks riskida mängida strateegiat 11 m ühikutele rohkem kui A22, kui see võib viia A11 tüüpi maksete tasumiseni, mis on oluliselt väiksem kui AXNUMX?

Ootuspärase hüpoteesi kohaselt peab mängija M mängima ka strateegiat 1.

Üldised M-isiku mängud.

Lõpuks me üldistame Teoreem 1 üldiste M-isikute mängude jaoks.

Olgu M-mängijad, kus igal mängijal on igasugused võimalikud strateegiad iga i = 1, 2,…, M. jaoks. Arvestades strateegia vektorit (j1, j2,…, jM), laske mängijal i olla Aij1j2… jM. Olgu xi segmendi strateegia mängijale i, st strateegia xi kus Σj xij = 1, xij 0, kõik j ja lase x = (xi, xi) tähistada kõigi mängijate strateegiaid. Nashi probleem on:

kus EP (i | xi) on oodatav väljamakse mängijale i, mis on antud xi ja kus summeerimine on üle kogu jk ja kõik k.

Strateegia x * on Nashi tasakaal, kui xi * on lahendus ülaltoodud mängija i probleemile, arvestades xi *.

Meie lähenemise jaoks laske pij1, j2,…, jM olge mängija i eeldatav tõenäosus, et mängija k mängib jk, kõigi jk ja k kõigi puhul. Von Neumann-Morgensterni eeldatav kasuliku teooria ütleb, et mängija i eesmärk on maksimeerida oodatavat tasuvust:

kus summeerimine on üle kogu jk ja kõik k.

Määratle

kus -i mängib j-i tähendab, et mängija k mängib jk ja kus summeerimine on üle kõigi jk, kõigi k puhul i.

Teoreem 15. Probleemid (13) on samaväärsed probleemidega (11):

Tõend.. Definitsiooni järgi,

kus summeerimine on üle kõigi rk, mis tahes k puhul i.

(14) nimetaja on tõenäosus pi (i mängib ji). Seega,

Alates Σ pi (i plays ji) = 1 ja pi (i mängib ji) 0 kõigile ji-le, sellest järeldub, et mängija mängib strateegiat [arg maxji EP (i | i plays ji)]. QED

Meetod mängijale i parima strateegia leidmiseks on järgmine: Iga mängija paari strateegiate jaoks, st strateegia r ja strateegia s, arvutage punktide koht, kus i eeldatavad väljamaksed sõltuvad mängijast i mängides kas r või s, on võrdsed . See määratleb ükskõiksuse pinna, mis jagab tingimusliku tõenäosusruumi 2 VNM piirkondadesse. Üks VNM piirkond on märgistatud r-ga, kuna valitud strateegia on r ja teine ​​VNM-piirkond on märgistatud s-ga, kuna valitud strateegia on s.

Pärast ülaltoodud arvutusi on iga VNM piirkond märgistatud nii palju kordi, kui on olemas strateegiate paarid. Võta mis tahes antud VNM-i piirkonnast välja kõik kaks mitmikmärgist ja kõrvaldage üks neist etikettide paari poolt loodud ükskõiksuse pinnast. Protsess lõpeb, kui igal VNM-i piirkonnal on ainult üks silt.

Üldised 2i mängud.

Olgu mängija A-l strateegiad Ai, i = 1, 2,… n1 ja mängija B-l on strateegiad Bj, j = 1, 2,… n2. Oletame, et mängijate tõenäosused on teineteisest sõltumatud. Probleem (13) on:

Seega on VNM-piirkonnad defineeritud kumerate polütoopidega:

Nagu võib täheldada (16), on lahenduse leidmine üldisele 2-mängule lihtne. Näiteks kaaluge üle kahe tuhande aasta vanust Rock-Paper-Scissors mängu, kus Nashi tasakaal on: mängida mis tahes strateegiat 33% tõenäosusega:

Strateegia A1 või B1 (rock) kaotab strateegia A2 või B2 (paber) kaotab strateegia A3 või B3 (käärid) kaotab rock.

Mängijale A on üldiselt olemas, kus 0 pA (Bj) 1,

mis vähendab

Ja sarnaselt mängijale B.

Selle iidse mängu uus strateegia näib olevat: mängida rocki, kui arvate, et teie vastane mängib paberit, mille tõenäosus on maksimaalselt 33% ja käärid tõenäosusega vähemalt 33%; mängige paberit, kui arvate, et teie vastane mängib käärid, mille tõenäosus on maksimaalselt 33% ja kivi tõenäosusega vähemalt 33%; muidu mängida scissors22.

3-isiku mängud, kus igal inimesel on 2i strateegiad.

Rakendame Teoreem 15, et leida lahendus, mis on seatud 3-i inimesele, kus igal mängijal A, B ja C on 2-strateegiad Ai, Bi, Ci, vastavalt i = 1, 2.

Oletame, et mängijate tõenäosused on teineteisest sõltumatud. Mängija A puhul on võrrand (13)

ja sarnaselt B ja C mängijale. Teoreemi 15 abil määrab lahenduse:

Kasutame ülalpool Bar-crowdingi mängu[21]:

Kui mängija on kodus, on selle väljamaksmine 1; kui mängija on baaris üksi, on selle väljamaksmine 0; kui mängija on teise isiku baaris, on selle väljamaksmine 2; muidu on selle tasuvus -1.

Meil on: A111 - A211 = -2, A112 - A212 = A121 - A221 = 1, A122 - A222 = -1, seega on VNM piirkond A1 piirkond -3pA (B1) pA (C1) + 2pA (B1) + 2pA (B1) + 1pA (C0) - XNUMX ≥ XNUMX või samaväärselt piirkond[22] pA (B1) ≥ (1 - 2pA (C1)) / (2 - 3pA (C1)). Sarnaselt on VNM piirkond B1 piirkond pB (A1) ≥ (1 - 2pB (C1)) / (2 - 3pB (C1)) ja VNM piirkond C1 on piirkond pC (B1) ≥ (1 - 2pC (A1)) / (2 - 3pC (A1)). Nashi tasakaal on p (A) = p (B) = p (C) = 1 ja p (A) = p (B) = p (C) = 1 / 3.

Kinnitus.

Tahaksime tänada Al Rothi ja Todd Davies'e nende hindamatute nõuannete ja juhiste eest selle dokumendi koostamisel.

Allmärkused

[1] Lihtsuse huvides teeme üldise eelduse, et kasulikkus on kasumi lineaarne funktsioon (Starmer [18]). Seega on eeldatava kasulikkuse maksimeerimine sama, mis oodatava tasuvuse maksimeerimine.

[2] Meie Bayesi lähenemine mängudele erineb eelnevast Bayesi tööst (näiteks Acevedo ja Krueger [4]; Aumann [1]; Daley ja Sadowski [6]; McKelvey ja Palfrey [12]; Quattrone ja Tversky [15]) sellega, et erinevalt teistest lähenemistest viitab meie lähenemine tingimuslikele tõenäosustele üheselt eeldatavale kasulikkuse hüpoteesile, mille meie lahendus alati rahuldab.

[3] Kriitik ütleb, et „ratsionaalsed mängijad ei pea ja ei peaks arvestama tingimuslike tõenäosustega… Kujutage ette agenti, kes teab, et vihma tõenäosus on p. Teie "lahendus" tundub olevat, et agent peaks vihmaga katma, kui sajab ja jätab vihmavarju, kui see ei vihma. "
Teoreem 1 näitab, et endine kriitika on põhjendamatu. Mis puudutab viimast kriitikat, lase EP-l (agent | tuua vihmavari) = p ja EP (agent | ei tooda vihmavari) = 1 - p. Meie lahendus oleks siis: tuua vihmavari, kui p ≥ 1 / 2; ärge viige vihmavarju, kui p ≤ 1 / 2.

[4] (2) tingimuslikud tõenäosused ei riku Spohni [17] põhimõtet: „Iga piisav kvantitatiivne otsustusmudel ei tohi otseselt ega kaudselt sisaldada toimingute subjektiivseid tõenäosusi…” Mängija tingimuslikud tõenäosused on vastase subjektiivsed tõenäosused strateegiad, mitte oma strateegiad.

[5] See teoreem on üldistatud üheks M-isiku mängudeks.

[6] Mängijate vahel puudub signaal.

[7] Maksimaalse probleemi puhul eeldatakse sõltumatute muutujate pA (B1 | A1) ja pA (B2 | A2) kasutamist, mis lihtsustab lõpmatu regressiooni probleemi (sarnaneb Nashi eeldusele, et p (B1) on antud mängijale A oma maksimeerimisprobleemi sõnastamisel).

[8] Ebavõrdsus (5) on probleemi (avastatud) lahendus (1) samamoodi, nagu ruutkompositsioon on lahendus üldisele kvadratilisele võrrandile.

[9] Mängija ülemused võivad sõltuda osaliselt jälgitavast juhuslikust sündmusest, nagu näiteks ilm. Preesteride kasutamiseks mängudes, kus Bayesi mängijad mängivad puudulikku teavet, vaadake (Harsanyi [10]).

[10] See üldine lahendus sisaldab Nash-tasakaalu kui konkreetseid lahendusi. Erinevalt kirjeldavatest Nash-lahendustest on meie lahendus paar ettekirjutavat ratsionaalsete ootuste puhast strateegiat. Pealegi, kui mängija A on ekslikult VNM piirkonnas A1 ja mängib A2i, siis Corollary 2 väidab, et mängija A saab oodatust väiksema taseme.

[11] On huvitav märkida, et Nashi segatud tasakaalu korral sõltub mängija strateegia strateegiast teise mängija tasumisfunktsiooni tundmisest.

[12] Tabelis on nullmärke ignoreeritud, kuna need juhtumid on degenereerunud: mängija ei saa valida kahe strateegia vahel. Samuti on huvitav märkida, et iga Nashi tasakaal ilmneb täpselt neljas reas.

[13] Järgmised 3i näited on kohandatud (Davies [7]) viisil, mis võiks olla mänguteooria õpilaste pedagoogiline tehnika. Tabelit 1 võib kasutada kõigi siin kirjeldatud 2-mängu mängude näidete Nash-tasakaalu kiireks leidmiseks.

[14] A tegevus ei mõjuta B tegevuse valikut. Seda sellepärast, et A uskumused on B uskumustega korrelatsioonita. Teisest küljest, kui uskumused on omavahel seotud, peavad mõlema mängija tõenäosused olema võrdsed 50% -ga, vastasel juhul, kui öelda, on mängijate tõenäosused mõlemad> 50%, A teab, et B mängib strateegiat 2 (sabad), seega mängides strateegiat 1 (pead) ei saa olla õige retsept A. Kui öelda, on A tõenäosus> 50% ja B tõenäosus on <50%, B teab, et A mängib pead, seega ei saa pead mängida õigeks retseptiks A. jne. unikaalne lahendus on seega Nashi tasakaal: mängida juhuslikult mõlemale.

[15] Pange tähele, et pA (B1) = pB (A1) = 0 või 1 on tasakaalu stsenaarium: mõlemad mängijad vahelduvad (või mõlemad lähevad otse), kui mõlemad mängijad eeldavad, et teine ​​mängija läheb otse (või vaheldub). Vastupidi, p (A1) = p (B1) = 0 või 1 ei saa olla Nashi tasakaal: kui B läheb sirgeks (või liigub), siis A varieerub (või läheb otse).

[16] Allikad: relvastuskontrolli ühing, Ameerika teadlaste föderatsioon, lõhustuvate materjalide rahvusvaheline vaekogu, USA kaitseministeerium, USA välisministeerium ja Stockholmi rahvusvaheline rahuteaduse instituut.

[17] Alates Floodist ja Dresheri algsest paberist on selle kohta avaldatud tuhandeid artikleid. Google Scholari otsing „vangla dilemma” annab 104,000i tulemuste sellel kirjutamisel. Palun andke (Kuhn [14]).

[18] Seetõttu ei mängi mängijad ühist lahendust.

[19] Kui teie vastane mängib mitte-juhuslikult, võib teie vastane olla mõjutatud teie vastase eelmistest mängudest.

[20] Valemit saab laiendada M-isikutele, kui M> 3.

[21] See mäng põhineb El Faroli baari probleemil (Arthur [5]).

[22] Ükskõiksuse lookus on punktide kaudu läbitav ruutkõver (pA (C1), pA (B1)) = (0.5, 0), (0.33, 0.33), (0, 0.5).

viited

[1] Aumann RJ (1974) subjektiivsus ja korrelatsioon randomiseeritud strateegiates. Matemaatilise majanduse ajakiri 1: 67-96

[2] Aumann RJ, Maschler M (1995) korduvate mängudega, millel on puudulik teave. MIT Press, Cambridge London

[3] Axelrod R (1984) Koostöö areng. Põhiraamatud

[4] Acevedo M, Kruegeri JI (2005) kinnipidamine vangla dilemmas. American Journal of Psychology 118: 431-457

[5] Arthuri WB (1994) induktiivne põhjendus ja piiritletud ratsionaalsus. American Economic Review 84: 406-411

[6] Daley B, Sadowski P (2017) Maagiline mõtlemine: esinduse tulemus. Teoreetiline majandus 12: 909-956 24 See mäng põhineb El Faroli baari probleemil (Arthur [5]). 25 Ükskõiksuse lookus on punktide kaudu läbitav ruutkõver (pA (C1), pA (B1)) = (0.5, 0), (0.33, 0.33), (0, 0.5).

[7] Davies T (2004) kasuliku teooria ja mänguteooria. Loengumärkused

[8] Garcia CB, Zangwill WI (2017) Uus lähenemine sõjale või rahule. Tööpaber

[9] Garcia CB, Zangwill WI (2018) domineerimine, oodatav kasulikkus ja vangla dilemma. Tööpaber

[10] Harsanyi J (1967) mängud ebatäieliku informatsiooniga, mida mängisid “Bayesi” mängijad I-III. J. Juhtimisteadus 14 (3): 159-182

[11] Kadane JB, Larkey PD (1982) Subjektiivne tõenäosus ja mänguteooria. Juhtimisteadus 28 (2): 113-120

[12] McKelvey RD, Palfrey TR (1995) Quantal Response Equilibria normaalsetele vormimängudele. Mängud ja majanduslik käitumine 10: 6-38

[13] Jaynes ET (1968) Eelnev tõenäosus. IEEE tehingud süsteemiteaduse ja küberneetika valdkonnas 4 (3): 227-241

[14] Kuhn S (2017) vangide dilemma. Stanfordi filosoofia enciklopeedia

[15] Quattrone GA, Tversky A (1984) põhjuslik versus diagnoosivälised juhud: enesepettusel ja valija illusioonil. Isikupära ja sotsiaalse psühholoogia ajakiri 46: 237-248

[16] Skyrms B (2004) Stag Hunt ja sotsiaalse struktuuri areng. Cambridge University Press, Cambridge

[17] Spohn W (1977) Kui Luce ja Krantz üldistavad Savage'i otsustusmudelit. Erkenntnis 11: 113-134

[18] Starmer C (2000) Arengud eeldatava kasulikkuse teoorias: ohtliku kirjeldava teooria valimine. Majandusliku kirjanduse ajakiri 38: 332-382

[19] Sugden R (2005) Õiguste majandus, koostöö ja heaolu. Palgrave MacMillan, 2 väljaanne: 132

[20] Von Neumann J, Morgenstern O (1953) mängude ja majandusliku käitumise teooria. Princetoni ülikooli ajakirjandus, New Jersey

[21] Wolpert DH, Benford G (2011) Newcombi paradoksi õppetund. Synthese 190: 1637-164