AIエージェントは、知識を事前学習に依存しがちですが、実際の業務や未知の環境では 「その場で学び、適応する力」 が求められます。
本記事では、NeurIPS 2024 に採択された論文「Mars: Situated Inductive Reasoning in an Open-World Environment」を取り上げ、AIエージェントにおけるメモリ設計の考え方を検討します。
続きを読む
Marsの提案 ― 経験を「ルール」と「スキル」に変換する
論文では、環境Marsを提案し、AIエージェントの手法として、Skill LibraryとInduction from Reflection(IfR)でルール抽出&活用を実施しています。その際、単に経験を記憶するのではなく、「抽象化」して再利用することに注目しています。
ルール(世界モデル):経験から導かれる一般的な因果関係
スキル(成功パターン):ゴール達成に有効だった手順
AIは「経験 → 抽象化 → 応用 → 失敗から修正 → 知識化」という学習サイクルを繰り返し、未知の状況でも柔軟に推論できるようになります。