Как един робот може да блъфира?

Photo by Gerd Altmann, Pixabay

 

Изследванията в сферата на изкуствения интелект достигнаха нов връх, след като играещ покер робот на име Pluribus успя да победи няколко професионалисти едновременно в мултиплейър игра.

Още преди години успешни разработки на роботи показаха превъзходство над хората в игри като шах и Го. Макар и достатъчно трудни, тези две игри имат нещо общо, което липсва в покера – пълна информация. Това означава, че всяка от страните вижда ходовете, позицията и фигурите на опонента, което прави и „обучението“ на робота доста по-лесно. От друга страна, в играта на покер информацията е ограничена, картите са обърнати надолу и играчите могат само да предполагат какво държи съперникът им в ръце.


РЕКЛАМА:

***

Поради сложността на конфигурацията, появата на умни машини като DeepStack и Libratus през 2017 г. се превърна в истински пробив и сензация. Именно те бяха първите роботи, които успяха да победят професионалисти в играта на покер. Техните създатели са открили печелившата комбинация чрез специфични алгоритми и машинно обучение, наподобяващо до известна степен човешкия мозък и позволяващо на машината да се учи сама.

Целта на традиционните роботи, играещи игри, е да изчислят възможните резултати в играта, доколкото е възможно и да открият най-печелившата стратегия чрез натрупаните данни. При покер роботите обаче тази калкулация предвижда резултатите едва няколко хода напред, за да може да преизчислява алгоритъма при получаването на нова информация.

Успешният покер AI (artificial intelligence) трябва да мисли върху скритата информация и внимателно да балансира стратегията си, така че да остане непредвидим, докато избира правилния ход.

В проучване DeepStack изиграва близо 45 хиляди ръце и се изправя срещу 33-ма професионалисти в покера, като успява да ги победи със значителна преднина. Неговата специалност е heads up no-limit Texas Hold ‘em, което означава, че опонентите в играта са двама и могат да залагат колкото искат, без ограничения.

 Photo by PokerNews

Същата вариация на покер играе и Libratus, който изиграва близо 3 пъти повече ръце срещу опонентите си и отново успява да ги надвие със значително преимущество. Той придоби и доста по-голяма популярност и обществено внимание, като след постижението си шеговито „написа“ в Туитър, че би искал да кандидаства за членство в професионалния отбор на PokerStars.

Сами по себе си тези постижения на компютърните програми не са толкова значими, колкото възможностите, които се откриват пред тях.

Преди броени седмици най-новото попълнение в отбора на покер роботите Pluribus се нареди на челното място сред своите „колеги“ роботи. Самоуката машина използва технология, чрез която играе срещу себе си, или по-точно срещу свои копия, за да се научи как да печели, без да използва реални данни от изиграни ръце. Макар да използва по-малко изчислителни ресурси от предшествениците си, основното превъзходство на Pluribus идва от факта, че е способен да играе срещу повече от един опонент. Неговата специалност е мултиплейърът six-player no-limit Hold’em, която включва още петима играчи.

Създателите му от Carnegie Mellon University и AI екипа на Facebook тестват Pluribus в различни вариации на играта – 5 робота срещу един човек или 5 човека срещу един робот. В проучването се включват професионалисти, някои от които дори шампиони от Световните серии по покер. Всеки от професионалистите е спечелил повече от милион долара от покер, а много от тях са натрупали повече от 10 млн. Въпреки това превъзходството на робота е убедително.

Pluribus проследява възможностите, до които може да достигне играта в конкретния момент за всяка ръка, в съотвествие със своята стратегия. Всъщност независимо от това какви са картите му, той първо изчислява как би действал с всяка възможна ръка, като внимава да балансира стратегията си във всички ръце, така че да остане непредвидим. След като направи необходимите изчисления, той действа спрямо ръката, която държи в конкретния момент.

Всъщност може да се каже, че той е ъпгрейдната версия на Libratus, която дължи успеха си именно на няколко подобрения и нови алгоритми. Той превъзхожда другите роботи не само в играта, а и отвъд нея.

Игрите с два опонента, от които единият трябва да спечели, а другият да загуби, са често срещани, но не и в реалния живот. Сценариите в реалния свят, като например киберсигурност или онлайн търговия, обикновено включват множество участници и/или скрита информация. Именно възможностите за приложение на технологията отвъд играта превръщат покер роботите във важно откритие със светло бъдеще.

 

 


Европейска нощ на учените 2022 г.: