Как един робот може да блъфира?

Категория: Наука
(виж списанието)

Накратко: Изкуственият интелект успява да блъфира в покера чрез използване на алгоритми и машинно обучение, които му позволяват да балансира стратегиите си и да остане непредвидим при липса на пълна информация. Чрез прецизно изчисляване на вероятните резултати няколко хода напред, системи като DeepStack и Libratus успяват да постигнат победи над професионални играчи.

Photo by Gerd Altmann, Pixabay

Изследванията в сферата на изкуствения интелект достигнаха нов връх, след като играещ покер робот на име Pluribus успя да победи няколко професионалисти едновременно в мултиплейър игра.

Още преди години успешни разработки на роботи показаха превъзходство над хората в игри като шах и Го. Макар и достатъчно трудни, тези две игри имат нещо общо, което липсва в покера – пълна информация. Това означава, че всяка от страните вижда ходовете, позицията и фигурите на опонента, което прави и „обучението“ на робота доста по-лесно. От друга страна, в играта на покер информацията е ограничена, картите са обърнати надолу и играчите могат само да предполагат какво държи съперникът им в ръце.

Поради сложността на конфигурацията, появата на умни машини като DeepStack и Libratus през 2017 г. се превърна в истински пробив и сензация. Именно те бяха първите роботи, които успяха да победят професионалисти в играта на покер. Техните създатели са открили печелившата комбинация чрез специфични алгоритми и машинно обучение, наподобяващо до известна степен човешкия мозък и позволяващо на машината да се учи сама.

Целта на традиционните роботи, играещи игри, е да изчислят възможните резултати в играта, доколкото е възможно и да открият най-печелившата стратегия чрез натрупаните данни. При покер роботите обаче тази калкулация предвижда резултатите едва няколко хода напред, за да може да преизчислява алгоритъма при получаването на нова информация.

Успешният покер AI (artificial intelligence) трябва да мисли върху скритата информация и внимателно да балансира стратегията си, така че да остане непредвидим, докато избира правилния ход.

В проучване DeepStack изиграва близо 45 хиляди ръце и се изправя срещу 33-ма професионалисти в покера, като успява да ги победи със значителна преднина. Неговата специалност е heads up no-limit Texas Hold ‘em, което означава, че опонентите в играта са двама и могат да залагат колкото искат, без ограничения.

Photo by PokerNews

Същата вариация на покер играе и Libratus, който изиграва близо 3 пъти повече ръце срещу опонентите си и отново успява да ги надвие със значително преимущество. Той придоби и доста по-голяма популярност и обществено внимание, като след постижението си шеговито „написа“ в Туитър, че би искал да кандидаства за членство в професионалния отбор на PokerStars.

Сами по себе си тези постижения на компютърните програми не са толкова значими, колкото възможностите, които се откриват пред тях.

Преди броени седмици най-новото попълнение в отбора на покер роботите Pluribus се нареди на челното място сред своите „колеги“ роботи. Самоуката машина използва технология, чрез която играе срещу себе си, или по-точно срещу свои копия, за да се научи как да печели, без да използва реални данни от изиграни ръце. Макар да използва по-малко изчислителни ресурси от предшествениците си, основното превъзходство на Pluribus идва от факта, че е способен да играе срещу повече от един опонент. Неговата специалност е мултиплейърът six-player no-limit Hold’em, която включва още петима играчи.

Създателите му от Carnegie Mellon University и AI екипа на Facebook тестват Pluribus в различни вариации на играта – 5 робота срещу един човек или 5 човека срещу един робот. В проучването се включват професионалисти, някои от които дори шампиони от Световните серии по покер. Всеки от професионалистите е спечелил повече от милион долара от покер, а много от тях са натрупали повече от 10 млн. Въпреки това превъзходството на робота е убедително.

Pluribus проследява възможностите, до които може да достигне играта в конкретния момент за всяка ръка, в съотвествие със своята стратегия. Всъщност независимо от това какви са картите му, той първо изчислява как би действал с всяка възможна ръка, като внимава да балансира стратегията си във всички ръце, така че да остане непредвидим. След като направи необходимите изчисления, той действа спрямо ръката, която държи в конкретния момент.

Всъщност може да се каже, че той е ъпгрейдната версия на Libratus, която дължи успеха си именно на няколко подобрения и нови алгоритми. Той превъзхожда другите роботи не само в играта, а и отвъд нея.

Игрите с два опонента, от които единият трябва да спечели, а другият да загуби, са често срещани, но не и в реалния живот. Сценариите в реалния свят, като например киберсигурност или онлайн търговия, обикновено включват множество участници и/или скрита информация. Именно възможностите за приложение на технологията отвъд играта превръщат покер роботите във важно откритие със светло бъдеще.

Живейте по-добре с наука!

Развийте критично мислене и изградете защита срещу дезинформация.
Придобийте ключови умения за по-добър живот с нашите курсове във формат текст, видео и аудио.
Открийте новостите и иновациите в медицината.
Само 3 минути дневно са достатъчни, за да трансформирате живота си!
Всеки месец ви очаква нов брой с увлекателни статии по биология, космос, технологии, история, медицина и много други.

Изживейте науката навсякъде и по всяко време, като я четете на най-удобното за вас устройство.

Създадохме платформа, която предлага курсове и ръководства, насочени към решаването на житейски предизвикателства чрез научно обосновани методи. Тя не само подпомага личностното развитие, но и предоставя ценни знания за водене на по-здравословен, успешен и пълноценен живот. Благодарение на научния подход, потребителите ще имат възможност да подобрят своето благосъстояние и да постигнат по-високо качество на живот.

Естествени науки

Исторически науки

Събития

Здраве и технологии

Новини

Общи науки

Защита от дезинформация

сп. „Българска Наука“, брой 197

сп. „Българска Наука“, брой 196

сп. „Българска Наука“, брой 195

Шест месеца

45.50€ / 89 лв.

Абонамент за 1 година

86.41€ / 169.00 лв.

Семеен план

204€ / 399 лв.

Подкаст на Петър Теодосиев – Науката днес (еп. 1)

Важна ли е възрожденската литература? | гл. ас. д-р Андриана Спасова

Какво е БГ Наука и как се финансираме?

Как да слушаш подкаста на БГ Наука?

Наука в България

Как един робот може да блъфира?

Живейте по-добре с наука!

Българска наука

Естествени науки

Исторически науки

Здраве и технологии

Общи науки

Наука в България

За Българска наука

Свържи се с нас

Партньори на Българска наука