空間的信念を構築できるか？ Foundation Modelsの限界を問う「Theory of Space」

スタンフォード大学AIラボは、Foundation Models（基盤モデル）が能動的な探求を通じて空間的信念を構築、修正、利用できるかをテストするベンチマーク「Theory of Space」（TOS）を発表しました。この研究では、最先端の6つのモデルを評価した結果、重要な「探求のボトルネック」、永続的な「テキストと視覚のモダリティギャップ」、そして深刻な「信念の不確実性」が明らかになりました。

TOSは、AIが現実世界、特に空間的な関係性をどれだけ深く理解できているのかを測定するために設計されています。モデルは、仮想環境を探索し、オブジェクトの配置や移動を学習することで、空間的な推論能力を試されます。このベンチマークは、AIが真に状況を把握し、それに基づいて意思決定を行う能力を評価する上で不可欠です。

今回の結果は、現在のFoundation Modelsが、テキストや画像データから学習する能力は高いものの、物理的な世界における空間的理解や、それに基づいた能動的な行動においては、まだ大きな課題を抱えていることを示唆しています。