HOME > 研究プロジェクト - 群知能・マルチエージェント

研究プロジェクト - 群知能・マルチエージェント

・M2 美濃邊 大樹

ロボット群の協調ナビゲーションは、複数のロボットが互いに衝突せず目標に向かう行為です。集中型、分散型、階層型アプローチなどの手法がありますが、これらは環境の変化に対応するのが難しいです。最近の研究では、学習ベースのアプローチが注目されています。この手法では、ロボットが周囲の情報を学習し、他のロボットと情報を共有しながら行動します。しかし、大規模なロボット群では視覚情報が複雑になり、タスクの成功率が下がる問題があります。それを解決するために、生物が使うフェロモンの概念を借りてロボット間のコミュニケーションを行う手法を研究しています。またシミュレーションだけでなく、実機ロボットで実験も考えています。そのため、はんだごでや3Dプリンターを用いた実機ロボットの制作も行っているので小型ロボットの制作に興味ある方は一緒に作りましょう!

フェロモンを用いた複数ロボットの協調制御
・M1 堂丸 健吾

私はマルチエージェントシステムにおける強化学習の研究をしています。マルチエージェントシステムとはそれぞれが判断する能力を持った複数のエージェントが存在するシステムのことです。このシステムの例としては、工場の作業ロボット群の振る舞い、人をエージェントとしてとらえた交差点など幅広いものがあります。私はエージェントが協力しあうマルチエージェント強化学習に興味を持ちました。この分野の面白さは、協力や対立しているからこそ現れるエージェントの挙動を見られることだと考えています。私が現在研究している内容は、優先度付き経験再生機構をマルチエージェント問題である追跡問題に適用し、収束速度を速めることです。これを実現することでマルチエージェント強化学習も現在の課題であるエージェントの増加に従って収束時間が急速に増加するという問題が改善されます。今後の展望としてロボットへの応用も考えています。

追跡問題の一例(赤い点:逃亡エージェント、青い点:追跡エージェント、白い円:障害物)


 立命館大学 情報理工学部 知能情報学科


Copyright © 2008 Computational Intelligence Laboratory All Rights Reserved.