# 策展 · X (Twitter) 🔥🔥🔥

> 📖 本站完整內容索引（documentation index）：[llms.txt](/llms.txt)

> 作者：NVIDIA AI (@NVIDIAAI) · 平台：X (Twitter) · 日期：2026-06-18

> 原始來源：https://x.com/nvidiaai/status/2066974091689476320

## 中文摘要

NVIDIA Research 推出 SpatialClaw 提升視覺推理。

**核心機制**
SpatialClaw 是一種無需訓練（training-free）的 Agent 架構，其核心創新在於捨棄了傳統固定的工具呼叫模式，改為讓 Agent 在持久化的 Python 核心（persistent kernel）中撰寫程式碼。這種方式具備以下優勢：
- **動態組合**：Agent 可將感知模組的輸出視為一般變數，並與 `NumPy` 或 `SciPy` 等函式庫靈活結合。
- **即時除錯與修正**：Agent 能夠檢查中間執行結果，並根據回饋在不同步驟間動態調整策略，而非一次性提交程式碼。
- **靈活推理**：相較於受限的 JSON 介面或單次執行（single-pass）程式碼，SpatialClaw 允許 Agent 自由組合感知結果，解決了傳統工具呼叫在複雜幾何運算上的局限性。

**效能表現**
根據研究數據，SpatialClaw 在無需針對特定基準測試或模型進行微調的情況下，展現了強大的通用性：
- 在 20 項基準測試中，平均領先先前技術（SpaceTools-Toolshed）達 11.2 個百分點。
- 該架構在 6 種不同的視覺語言模型（VLM）骨幹網路（backbone）上均能穩定提升效能。
- 實驗顯示，效能增益主要源自於「程式碼作為互動介面」的架構優勢，而非依賴特定的工具封裝或工程化預設工具。

![](https://pub-75d4fe1e4e80421b9ecb1245a7ae0d1a.r2.dev/curated/9c7d896c094a1eb5.jpg)
> NVIDIA Research 提出的 SpatialClaw 在 20 個空間推理基準測試中表現優異，在無需針對特定基準或模型進行微調的情況下，平均超越先前的智慧體 11.2 分，且在所有測試指標上均顯著優於 SpaceTools、pySpatial 及無工具（No-tool）基準。

**研究洞察**
NVIDIA Research 指出，空間推理 Agent 的能力瓶頸往往不在於工具的多寡，而在於工具如何被「組合」。SpatialClaw 的成功證明了程式碼是空間推理最合適的抽象層，即便移除部分預設工具，其表現依然優於無工具的基準線。這項研究強調了 Agent 應具備自主適應工具組合的能力，特別是在需要跨影格與視角進行鏈式幾何運算的場景中，其優勢尤為明顯。

欲了解更多技術細節，可參閱 [SpatialClaw 專案頁面](https://nvda.ws/4esHxr9)。

## 媒體內容

**NVIDIA Research 提出的 SpatialClaw 在 20 個空間推理基準測試中表現優異，在無需針對特定基準或模型進行微調的情況下，平均超越先前的智慧體 11.2 分，且在所有測試指標上均顯著優於 SpaceTools、pySpatial 及無工具（No-tool）基準。**

**數據表**

|   | SpatialClaw | pySpatial | SpaceTools | No-tool |
| --- | --- | --- | --- | --- |
| ERQA | 最高 | 次高 | 中等 | 最低 |
| Omni3D | 最高 | 次高 | 中等 | 最低 |
| OmniSpatial | 最高 | 次高 | 中等 | 最低 |
| SPBench | 最高 | 次高 | 中等 | 最低 |
| MindCube | 最高 | 中等 | 次高 | 最低 |
| MMSI | 最高 | 中等 | 次高 | 最低 |
| SPAR-Bench | 最高 | 中等 | 次高 | 最低 |
| MMSI-Video | 最高 | 中等 | 次高 | 最低 |
| OSI-Bench | 最高 | 中等 | 次高 | 最低 |
| PAI-Bench | 最高 | 中等 | 次高 | 最低 |
| VSI-Bench-U | 最高 | 中等 | 次高 | 最低 |
| VSTI-Bench | 最高 | 中等 | 次高 | 最低 |
| DSI-Bench | 最高 | 中等 | 次高 | 最低 |
| BLINK | 最高 | 中等 | 次高 | 最低 |
| SpatialTree | 最高 | 中等 | 次高 | 最低 |
| ViewSpatial | 最高 | 中等 | 次高 | 最低 |
| CV-Bench | 最高 | 中等 | 次高 | 最低 |
| PerceptComp | 最高 | 中等 | 次高 | 最低 |
| Video-MME | 最高 | 中等 | 次高 | 最低 |
| Video-MME-v2 | 最高 | 中等 | 次高 | 最低 |

## 標籤

Agent, 研究論文, 開源專案, OpenClaw, NVIDIA
