Kur kas didesnį iššūkį dirbtinio intelekto tyrinėtojams kėlė diplomatijos žaidimas – mėgstamas tokių politikų kaip Johnas F. Kennedy ir Henry Kissingeris. Vietoj dviejų varžovų žaidime dalyvauja septyni žaidėjai, kurių motyvus gali būti sunku perskaityti. Norėdami laimėti, žaidėjas turi derėtis ir sudaryti bendradarbiavimo susitarimus, kuriuos bet kas gali bet kada pažeisti. Diplomatija yra tokia sudėtinga, kad grupė iš Metos džiaugėsi, kai 2022 m AI programa Cicero sukūrė „žmogaus lygio žaidimą“ per 40 žaidimų. Nors tai nenugalėjo pasaulio čempiono, Ciceronui sekėsi pakankamai gerai, kad patektų į 10 procentų geriausių dalyvių prieš žmones.
Projekto metu Jacobą, „Meta“ komandos narį, nustebino tai, kad Ciceronas rėmėsi kalbos modeliu, kad sukurtų dialogą su kitais žaidėjais. Jis pajuto neišnaudotą potencialą. Pasak jo, komandos tikslas buvo „sukurti geriausią kalbos modelį, kokį tik galime žaisti šį žaidimą“. O kas, jei vietoj to jie sutelktų dėmesį į geriausio žaidimo kūrimą, kad pagerintų didelių kalbų modelių našumą?
Konsensualinė sąveika
2023 m. Jokūbas pradėjo nagrinėti šį klausimą MIT, dirbdamas su Yikang Shen, Gabrielė Farinair jo patarėjas, Jokūbas Andreasas, apie tai, kas taptų konsensuso žaidimu. Pagrindinė idėja kilo įsivaizduojant dviejų žmonių pokalbį kaip bendradarbiavimo žaidimą, kai sėkmė atsiranda, kai klausytojas supranta, ką kalbėtojas bando perteikti. Visų pirma, konsensuso žaidimas yra skirtas suderinti dvi kalbos modelio sistemas – generatorių, kuris tvarko generatyvius klausimus, ir diskriminatorių, kuris tvarko diskriminacinius.
Po kelių mėnesių sustojimų ir startų komanda šį principą sukūrė į pilną žaidimą. Pirma, generatorius gauna klausimą. Jis gali kilti iš žmogaus arba iš jau esamo sąrašo. Pavyzdžiui, „Kur gimė Barackas Obama? Tada generatorius gauna kai kuriuos kandidatų atsakymus, tarkime, Honolulu, Čikagą ir Nairobį. Vėlgi, šios parinktys gali būti gaunamos iš žmogaus, sąrašo arba paieškos, kurią atlieka pats kalbos modelis.
Tačiau prieš atsakant generatoriui taip pat pasakoma, ar jis turėtų atsakyti į klausimą teisingai, ar neteisingai, priklausomai nuo sąžiningo monetos metimo rezultatų.
Jei tai galvos, aparatas bando atsakyti teisingai. Generatorius siunčia pradinį klausimą kartu su pasirinktu atsakymu diskriminatoriui. Jei diskriminatorius nustato, kad generatorius tyčia atsiuntė teisingą atsakymą, kiekvienas gauna po vieną tašką, kaip tam tikrą paskatinimą.
Jei moneta nukrenta ant uodegos, generatorius siunčia, jo nuomone, neteisingą atsakymą. Jei diskriminatorius nusprendžia, kad buvo tyčia neteisingai atsakyta, jie abu vėl gauna tašką. Idėja čia yra paskatinti susitarimą. „Tai tarsi išmokyti šunį gudrybės“, – paaiškino Džeikobas. „Pavaišink juos, kai jie elgiasi teisingai“.
Generatorius ir diskriminatorius taip pat pradeda nuo tam tikrų pradinių „įsitikinimų“. Tai yra tikimybių pasiskirstymas, susijęs su skirtingais pasirinkimais. Pavyzdžiui, generatorius, remdamasis informacija, kurią jis surinko iš interneto, gali manyti, kad yra 80 procentų tikimybė, kad Obama gimė Honolulu, 10 procentų tikimybė, kad jis gimė Čikagoje, 5 procentai – Nairobyje ir 5 procentų tikimybė patekti į kitas vietas. Diskriminatorius gali prasidėti nuo kitokio paskirstymo. Nors abu „žaidėjai“ vis dar yra apdovanoti už susitarimą, jie taip pat gauna taškų už per daug nukrypimą nuo savo pirminių įsitikinimų. Toks susitarimas skatina žaidėjus į savo atsakymus įtraukti savo žinias apie pasaulį, vėlgi gautas iš interneto, todėl modelis turėtų būti tikslesnis. Be kažko panašaus jie gali susitarti dėl visiškai neteisingo atsakymo, pavyzdžiui, Delis, bet vis tiek kaupia taškus.