空間的信念を築けるか？ Foundation Modelsの能力を測る「Theory of Space」

スタンフォード大学AIラボは、Foundation Modelsが能動的な探索を通じて空間的信念を構築、修正、活用できるかをテストするベンチマーク「Theory of Space」を発表しました。この研究では、6つの最先端モデルを評価した結果、空間認識における重要な「探索のボトルネック」、テキストと視覚の間の持続的な「モダリティギャップ」、そして深刻な「信念の不確実性」が明らかになりました。

なぜ、AIは空間を理解することが難しいのでしょうか？ Theory of Spaceは、AIが単にパターンを認識するだけでなく、環境との相互作用を通じて物理的な空間における自身の位置や関係性を把握する能力を評価する、新たな基準を提供します。このベンチマークは、AIの空間理解能力の限界を浮き彫りにし、今後の研究開発の方向性を示す重要な洞察を提供しています。