Inteligența artificială a cucerit acum aproape pokerul

Inteligența artificială a depășit ultima etapă majoră în stăpânirea pokerului: Texas Hold’em fără limită pentru șase jucători.

Jocurile precum pokerul, cu cărți ascunse și jucători care blufează, prezintă o provocare mai mare pentru AI decât jocurile în care fiecare jucător poate vedea întreaga tablă. În ultimii câțiva ani, computerele au devenit asi la formele din ce în ce mai complicate de poker unu-la-unu, dar jocurile multiplayer duc această complexitate la nivelul următor (SN Online: 5/13/15).

Acum, un rechin de cărți AI numit Pluribus a depășit mai mult de o duzină de profesioniști de elită la Texas Hold’em cu șase jucători, raportează cercetătorii online pe 11 iulie în Ştiinţă. Algoritmii care pot complota împotriva mai multor adversari folosind astfel de informații neplăcute ar putea face negociatori de afaceri pricepuți, strategii politici sau câini de pază a securității cibernetice.

Pluribus și-a perfecționat strategia inițială jucând împotriva copiilor lui însuși, pornind de la zero și învățând treptat care acțiuni au ajutat la câștig. Apoi, AI-ul a folosit acea intuiție pentru când să țină și când să renunțe în timpul primei runde de pariere a fiecărei mâini împotriva a cinci jucători umani.

În timpul rundelor de pariere ulterioare, Pluribus și-a ajustat strategia imaginându-și cum s-ar putea desfășura jocul dacă ar lua diferite acțiuni. Spre deosebire de inteligența artificială antrenată pentru pokerul cu doi jucători, Pluribus nu a speculat până la sfârșitul jocului – ceea ce ar necesita prea multe calcule atunci când ai de-a face cu atât de mulți jucători (SN: 4/1/17, str. 12). În schimb, AI și-a imaginat mai multe mișcări înainte și a decis ce să facă pe baza acelor viitoare ipotetice și a diferitelor strategii pe care jucătorii le-ar putea adopta.

În 10.000 de mâini de Texas Hold’em, Pluribus a concurat împotriva a cinci concurenți dintr-un grup de 13 profesioniști, toți dintre care câștigaseră peste 1 milion de dolari jucând poker. La fiecare 100 de mâini, Pluribus a câștigat, în medie, aproximativ 480 de dolari de la concurenții săi umani.

„Aceasta este aproximativ suma cu care profesioniștii umani de elită aspiră să învingă jucătorii mai slabi”, ceea ce înseamnă că Pluribus a fost un jucător mai priceput decât adversarii săi umani, spune Noam Brown de la Facebook AI Research din New York City. Brown, împreună cu Tuomas Sandholm de la Universitatea Carnegie Mellon din Pittsburgh, au creat Pluribus.

Acum că AI are poker în geantă, algoritmii și-ar putea testa raționamentul strategic în jocuri cu informații ascunse mai complexe, spune informaticianul Viliam Lisý de la Universitatea Tehnică Cehă din Praga, care nu a fost implicat în acest lucru. În jocuri precum Kriegspiel — un spin-off de șah în care jucătorii nu se pot vedea reciproc piesele — necunoscutele pot deveni mult mai complicate decât câteva cărți ținute aproape de pieptul adversarilor, spune Lisý.

Jocurile video precum StarCraft, care permit mult mai multe tipuri de mișcări și eliberează jucătorii de la un joc rigid, pe rând, ar putea servi și ca noi teste ale inteligenței AI (SN: 5/11/19, str. 34).