# 策展 · X (Twitter) 🔥

> 📖 本站完整內容索引（documentation index）：[llms.txt](/llms.txt)

> 作者：Exa (@ExaAILabs) · 平台：X (Twitter) · 日期：2026-06-17

> 原始來源：https://x.com/ExaAILabs/status/2066946215250690228

## 中文摘要

Exa Agent 正式發布，透過模型融合與高效能 harness 架構，以不到 GPT-5.5 與 Opus 一半的成本提供前沿網路研究能力。

<video src="https://pub-75d4fe1e4e80421b9ecb1245a7ae0d1a.r2.dev/curated/1781658952104-wquy902z.mp4" poster="https://pub-75d4fe1e4e80421b9ecb1245a7ae0d1a.r2.dev/curated/a85ab5262e5374d5.jpg" controls playsinline preload="metadata" style="max-width:100%;height:auto;display:block;margin:1rem 0"></video>
> 這支影片展示了名為 Exa Agent 的自動化研究工具，透過 AI 代理人執行複雜的網路搜尋與資料整理任務。

**核心功能與技術優勢**
Exa Agent 是一款專為複雜網路研究任務設計的 API，其核心價值在於將 Exa 的「Agent 優先」搜尋引擎與具備 token 效率的內容處理技術相結合。該工具透過一套專門設計的 harness 進行排程，能將大型研究任務拆解為多個子任務，並指派子 Agent 同時搜尋不同領域，實現高效率的資料整合。

- **成本與效能平衡**：透過「模型融合」（Model Fusion）與 token 高效能摘要模型，Exa Agent 在維持前沿研究品質的同時，能顯著降低 token 使用量（最高可達 94% 的減幅），並在 BrowseComp、DSQA 與 WideSearch 等公開基準測試中展現出色的性價比。

![](https://pub-75d4fe1e4e80421b9ecb1245a7ae0d1a.r2.dev/curated/f6b720b164b574c1.jpg)
> Exa Agent 在 BrowseComp 基準測試中展現出極佳的性價比，以不到 GPT 5.5 和 Opus 4.8 一半的成本達成了高準確度。

- **靈活的任務規模**：該工具支援自動化調整運算資源，開發者亦可針對特定需求設定「努力程度」（Effort Level），從輕量級的 `minimal`（0.012 美元/請求）到高價值的 `xhigh`（1.00 美元/請求），以平衡成本、延遲與研究深度。

**實際應用場景**
Exa Agent 適用於需要大規模資料收集與結構化輸出的場景，特別是在金融分析與市場進入（Go-to-market）策略中表現突出：
- **金融研究**：能即時從網路擷取資料，並將其聚合為使用者所需的任何輸出格式，例如針對特定企業的財務簡報、融資動態、產品發布與合作夥伴關係整理。

![](https://pub-75d4fe1e4e80421b9ecb1245a7ae0d1a.r2.dev/curated/69d2c1e18516104d.jpg)
> 在 FinanceAgent-v2 基準測試中，Exa Agent 在各配置下均展現出極佳的性價比，其高階配置（High）能以不到 GPT 5.5 與 Opus 4.8 一半的成本（約 0.5 美元對比大於 1.2 美元）取得更高的準確度分數（64%）。

- **市場開發**：支援大規模名單建立（List-building）與實體資料豐富化（Entity enrichment），例如自動化生成數百個潛在客戶或目標企業的詳細清單。

![](https://pub-75d4fe1e4e80421b9ecb1245a7ae0d1a.r2.dev/curated/db1c348be0e124ae.jpg)
> 在 Company FindAll 測試中，Exa Agent 能以不到 GPT 5.5 與 Opus 一半的單次任務成本，達到更高或相當的任務通過率，展現出領先的性價比。

**開發者整合指南**
開發者可透過 API 直接呼叫 Exa Agent，並利用 `outputSchema` 參數定義結構化輸出，或透過 `input.data` 導入自有資料。若要開始建置，可參考以下資源：
- 官方部落格：[Exa Agent 介紹](http://exa.ai/blog/exa-agent)
- API 互動測試：[Exa API Playground](http://dashboard.exa.ai/playground/agent)

**基準測試與效能驗證**
Exa 團隊採用了 2025 年 8 月推出的「WideSearch」方法論來評估 Agent 在跨網路聚合與結構化實體資訊的能力。該測試要求 Agent 產出結構化表格，並以 F1 分數計算行（row）的準確度，確保每個實體及其對應的豐富化欄位皆正確無誤。在實際演示中，Exa Agent 展現了處理複雜查詢的能力，例如自動整理 SpaceX 等企業的 IPO 相關限制、產業分類及關鍵日期，證明了其在處理大規模、多維度資料時的穩健性。

![](https://pub-75d4fe1e4e80421b9ecb1245a7ae0d1a.r2.dev/curated/e1f76ef1ceb74e00.jpg)
> 在 DeepSearchQA 基準測試中，Exa Agent 以不到 GPT 5.5 和 Opus 一半的成本，達到了領先的網頁搜尋研究效能。

![](https://pub-75d4fe1e4e80421b9ecb1245a7ae0d1a.r2.dev/curated/a4c373dc2c1a66ed.jpg)
> Exa Agent 在 WideSearch 基準測試中，以不到 GPT 5.5 和 Opus 一半的成本，實現了頂尖的網頁搜尋與研究效能（Row-F1）。

![](https://pub-75d4fe1e4e80421b9ecb1245a7ae0d1a.r2.dev/curated/66738dad2b9b0f3f.jpg)
> Exa Agent 在 People FindAll 測試中，以遠低於 GPT 5.5 和 Opus 一半的成本，達成了更優異的任務通過率與性價比。

## 媒體內容

**這支影片展示了名為 Exa Agent 的自動化研究工具，透過 AI 代理人執行複雜的網路搜尋與資料整理任務。**

**影片中的 Prompt 與操作**

Prompt（00:01）：

```
找出所有關於 SpaceX IPO 的資訊
```

原文：Find everything about the SpaceX IPO

Prompt（00:10）：

```
找出所有關於 SpaceX IPO 的資訊並製作一份財務研究報告
```

原文：Find everything about the SpaceX IPO and create a financial research report

Prompt（00:17）：

```
從網路的每個角落找出所有關於 SpaceX IPO 的資訊並建立一份財務報告
```

原文：Find everything about the SpaceX IPO and create a financial from every corner of the web

操作步驟：

1. （00:01）在搜尋框輸入查詢並點擊 Run
2. （00:10）在搜尋框輸入更複雜的指令並點擊 Run
3. （00:17）在搜尋框輸入進階查詢指令並點擊 Run

**Exa Agent 在 BrowseComp 基準測試中展現出極佳的性價比，以不到 GPT 5.5 和 Opus 4.8 一半的成本達成了高準確度。**

**數據表**

| 項目 | 數值 |
| --- | --- |
| 起始 | (0.02, 43.5) |
| 中點 | (0.09, 53.0) |
| 結束 | (0.5, 74.0) |
| 起始 | (0.01, 10.0) |
| 中點 | (0.2, 47.0) |
| 結束 | (0.55, 49.0) |
| 起始 | (0.02, 24.0) |
| 中點1 | (0.3, 45.0) |
| 中點2 | (0.6, 51.0) |
| 中點3 | (1.2, 56.0) |
| 結束 | (2.4, 58.0) |
| 單點 | (0.96, 72.0) |
| 單點 | (1.97, 84.0) |

**在 DeepSearchQA 基準測試中，Exa Agent 以不到 GPT 5.5 和 Opus 一半的成本，達到了領先的網頁搜尋研究效能。**

**數據表**

| 項目 | 數值 |
| --- | --- |
| Low | (0.03, 0.60) |
| Medium | (0.10, 0.66) |
| Exa Agent High | (0.50, 0.77) |
| 點1 | (0.03, 0.58) |
| 點2 | (0.10, 0.585) |
| 點3 | (0.25, 0.666) |
| 點4 | (0.60, 0.762) |
| 點1 | (0.11, 0.386) |
| 點2 | (0.25, 0.503) |
| 點3 | (0.90, 0.593) |

**Exa Agent 在 WideSearch 基準測試中，以不到 GPT 5.5 和 Opus 一半的成本，實現了頂尖的網頁搜尋與研究效能（Row-F1）。**

**數據表**

| 項目 | 數值 |
| --- | --- |
| Low | ($0.02, 36%) |
| Medium | ($0.11, 43%) |
| High | ($0.50, 52%) |
| 點1 | ($0.02, 14%) |
| 點2 | ($0.28, 39.5%) |
| 點3 | ($0.60, 51%) |
| 點1 | ($0.08, 18.5%) |
| 點2 | ($0.11, 26.5%) |
| 點3 | ($0.90, 49.5%) |
| 單點 | ($1.90, 51.5%) |
| 單點 | ($2.15, 52.5%) |

**在 FinanceAgent-v2 基準測試中，Exa Agent 在各配置下均展現出極佳的性價比，其高階配置（High）能以不到 GPT 5.5 與 Opus 4.8 一半的成本（約 0.5 美元對比大於 1.2 美元）取得更高的準確度分數（64%）。**

**數據表**

| 項目 | 數值 |
| --- | --- |
| Low | (0.03, 36.5) |
| Medium | (0.1, 58.5) |
| High | (0.5, 64.0) |
| 點1 | (0.03, 32.8) |
| 點2 | (0.1, 42.0) |
| 點3 | (0.3, 56.0) |
| 點4 | (0.6, 63.0) |

**在 Company FindAll 測試中，Exa Agent 能以不到 GPT 5.5 與 Opus 一半的單次任務成本，達到更高或相當的任務通過率，展現出領先的性價比。**

**數據表**

| 項目 | X | Y |
| --- | --- | --- |
| Exa Agent Low | 0.03 | 10.5 |
| Exa Agent Medium | 0.10 | 15.3 |
| Exa Agent High | 0.50 | 19.3 |
| Parallel Task Ultra | 0.03 | 6.0), (0.06, 7.7), (0.30, 15.0), (0.60, 16.5 |
| Perplexity Agent Pro | 0.07 | 11.4), (0.33, 9.2 |
| Opus 4.8 | 0.13 | 4.2 |
| GPT 5.5 | 2.10 | 18.5 |

**Exa Agent 在 People FindAll 測試中，以遠低於 GPT 5.5 和 Opus 一半的成本，達成了更優異的任務通過率與性價比。**

**數據表**

| 項目 | 數值 |
| --- | --- |
| Low | (0.02, 6.6) |
| Medium | (0.1, 11.5) |
| High | (0.5, 16.4) |
| Point 1 | (0.03, 2.7) |
| Point 2 | (0.05, 4.7) |
| Point 3 | (0.08, 7.4) |
| Parallel Task Ultra | (0.3, 12.1) |
| Point 5 | (0.6, 11.9) |
| Point 1 | (0.04, 4.3) |
| Point 2 | (0.3, 8.9) |
| Point 1 | (0.03, 0.0) |
| Point 1 | (2.13, 14.4) |

## 標籤

Agent, 新產品, Harness, Exa, GPT, Opus
