Използване на изкуствен интелект за обучение на екипи от роботи

Категория: Технологии
(виж списанието)

Накратко: Изследователи от Университета на Илинойс са разработили метод за обучение на екиби от роботи чрез мултиагентно обучение с подкрепление, което позволява на агентите да работят заедно без директна комуникация. Технологията използва машинно обучение, за да идентифицира индивидуалния принос на всеки робот към постигането на общата екипна цел в сложни и непредсказуеми условия.

Когато комуникационните връзки са отворени, индивидуалните агенти като роботи или дронове могат да работят заедно и да изпълнят задача. Но какво ще стане, ако не са оборудвани с правилния хардуер или сигналите са блокирани, дали ще възможно осъщесвяване на комуникация? Изследователите от университета на Илинойс в Ърбана-Шампейн (University of Illinois Urbana-Champaign) търсят отговори на това по-трудно предизвикателство. Те са разработили метод за обучение на множество агенти, които да работят заедно като изполвват мултиагентно обучение с утвърждение, което е вид изкуствен интелект.

Huy Tran, който е авиоконструктор в Илинойс каза, че „е по-лесно, когато агентите могат да си говорят помежду си“. „Но искаме да го направим по децетрализиран начин, което означава, че те не говорят помежду си. Също така се фокусирахме върху ситуации, където не е ясно какви различни роли или работи трябва да имат агентите .“

Tran каза, че този сценарий е много по-сложен и по-труден, защото не е ясно какво един агент трябва да прави в сравнение с друг.

„Интересният въпрос е как да се научим да изпълняваме задача заедно за определено време.“

Tran и неговите сътрудници са използвали машинно обучение, за да решат този проблем чрез създаване на полезни функции, които казват на агента, когато прави нещо полезно или добро за екипа.

Също така той допълни, „С екипни цели е трудно да се знае кой допринася за победата“. „Ние разработваме техника за машинно обучение, която ни позволява да идентифицираме, когато определен агент допринася за глобалната екипна цел. Ако погледнете на проекта като на спортни правила един футболист може да отбележи гол, но ние искаме да научим повече и за неговите съотборници, които са помогнали за за отбелязването на гола. Трудно е да се разберат тези отложени ефекти.“

Алгоритмите, които изследователите разработват могат да открият кога агент или робот не допринасят за целта. „Това не се отнася дали роботът решава да избере да направи нещо грешно, понякога действието му не е полезно за крайната цел.“

Изследователите тестват алгоритмите като използват симултанни популярни игри, като Capture the Flag и StarCraft.

Можете да гледате видео на Huy Tran как демонстрира свързани проучвания като използва силно обучение с утвърждение, за да помогне на роботите да оценят своето следващо движение в играта Capture the Flag.

„StarCraft може да е малко по-непредсказуема – ние бяхме развълнувани да видим нашия метод да работи добре в тази среда.“

Tran каза, че този тип алгоритъм е приложим в много реални ситуации, например при военно наблюдение, роботи работещи заедно в склад, контрол на светофарна уредба, автономни превозни средства, координиращи доставкит или контрол на електрически мрежи.

Tran каза, че Seung Hyun Kim е изградил почти цялата теория за идеята докато е бил студент по механично инженерство, заедно с Neale Van Stralen студент по авиокосмос който му помогнал с внедряването. Tran и Girish Chowdhary са били напреднали студенти. Прочването наскоро е представено пред ИИ обществото в Автономния агент и системите за множество агенти на партньорски проверки.

Превод: Павлинка Балабанова

Източници:

Materials provided by University of Illinois Grainger College of Engineering. Original written by Debra Levey Larson. Note: Content may be edited for style and length.

Препратка:

Seung Hyun Kim, Neale Van Stralen, Girish Chowdhary, Huy T. Tran. Disentangling Successor Features for Coordination in Multi-agent Reinforcement Learning. Proceedings of the 21st International Conference on Autonomous Agents and Multiagent Systems, 2022 [abstract]

University of Illinois Grainger College of Engineering. „Using AI to train teams of robots to work together.“ ScienceDaily. ScienceDaily, 25 July 2022. <www.sciencedaily.com/releases/2022/07/220725124120.htm>.

Живейте по-добре с наука!

Развийте критично мислене и изградете защита срещу дезинформация.
Придобийте ключови умения за по-добър живот с нашите курсове във формат текст, видео и аудио.
Открийте новостите и иновациите в медицината.
Само 3 минути дневно са достатъчни, за да трансформирате живота си!
Всеки месец ви очаква нов брой с увлекателни статии по биология, космос, технологии, история, медицина и много други.

Изживейте науката навсякъде и по всяко време, като я четете на най-удобното за вас устройство.

Създадохме платформа, която предлага курсове и ръководства, насочени към решаването на житейски предизвикателства чрез научно обосновани методи. Тя не само подпомага личностното развитие, но и предоставя ценни знания за водене на по-здравословен, успешен и пълноценен живот. Благодарение на научния подход, потребителите ще имат възможност да подобрят своето благосъстояние и да постигнат по-високо качество на живот.

Естествени науки

Исторически науки

Събития

Здраве и технологии

Новини

Общи науки

Защита от дезинформация

сп. „Българска Наука“, брой 197

сп. „Българска Наука“, брой 196

сп. „Българска Наука“, брой 195

Шест месеца

45.50€ / 89 лв.

Абонамент за 1 година

86.41€ / 169.00 лв.

Семеен план

204€ / 399 лв.

Подкаст на Петър Теодосиев – Науката днес (еп. 1)

Важна ли е възрожденската литература? | гл. ас. д-р Андриана Спасова

Какво е БГ Наука и как се финансираме?

Как да слушаш подкаста на БГ Наука?

Наука в България

Използване на изкуствен интелект за обучение на екипи от роботи

Живейте по-добре с наука!

Българска наука

Естествени науки

Исторически науки

Здраве и технологии

Общи науки

Наука в България

За Българска наука

Свържи се с нас

Партньори на Българска наука