私はマルチエージェントシステムにおける強化学習の研究をしています。マルチエージェントシステムとはそれぞれが判断する能力を持った複数のエージェントが存在するシステムのことです。このシステムの例としては、工場の作業ロボット群の振る舞い、人をエージェントとしてとらえた交差点など幅広いものがあります。私はエージェントが協力しあうマルチエージェント強化学習に興味を持ちました。この分野の面白さは、協力や対立しているからこそ現れるエージェントの挙動を見られることだと考えています。私が現在研究している内容は、優先度付き経験再生機構をマルチエージェント問題である追跡問題に適用し、収束速度を速めることです。これを実現することでマルチエージェント強化学習も現在の課題であるエージェントの増加に従って収束時間が急速に増加するという問題が改善されます。今後の展望としてロボットへの応用も考えています。