# 策展 · X (Twitter) 🔥🔥

> 作者：Augment Code (@augmentcode) · 平台：X (Twitter) · 日期：2026-05-05

> 原始來源：https://x.com/augmentcode/status/2051350118360891584

## 中文摘要

# 我們不需要更多的 Agent。我們需要的是一套更好的系統。所以我們打造了一套。

今天，我們正式將 Augment Cosmos 轉為公開預覽（Public Preview）。Cosmos 是專為 Agentic 程式開發所設計的作業系統：這些 Agent 可以在任何地方執行（你的環境、我們的雲端），並橫跨整個 SDLC（軟體開發生命週期）運作，而人類則在需要判斷的關鍵時刻進行引導。

此外，Cosmos 是為團隊打造的：具備共享的 context 與記憶、自我優化的 Agent 迴圈、與你所有工具的連結，並且預設支援多模型。你現在就可以開始試用。

![](https://pub-75d4fe1e4e80421b9ecb1245a7ae0d1a.r2.dev/curated/1777947342954-diaHHfbKdkbsAEkvIjpg.jpg)

對我們來說，分享「我們發布了什麼」並不是最重要的，分享「為什麼我們需要打造它」才更有價值。

## 三個核心信念形塑了 Cosmos 的誕生

1. 沒有系統，你就無法轉型組織。

我們對談過的每一位工程主管都面臨同樣的斷層。他們 99% 的工程師都已經採用了 Agent。程式碼的產出量比以往任何時候都多，但這種生產力的提升卻沒有轉化為組織的整體效益。

我們幾個月前在關於「AI 原生化最困難的部分」一文中寫過：僅僅擁有新技術是不夠的，你還需要系統和人員共同適應。

當個人在沒有統一系統的情況下採用 Agent 時，四個問題會隨之惡化：

- 設定碎片化：每位工程師都建立自己的工作流程，沒有共享的模式。

- 專業知識被困住：那位為你的帳務服務（billing service）想出絕佳 Prompt 的工程師，將其鎖在自己的設定檔中，其他地方無從得知。

- 缺乏品質指標：沒有方法知道哪些 Agent 設定在團隊間真正有效。

- 審查瓶頸變得更糟，而非改善：人類只有在最後的 PR 階段才被介入，而這正是發現問題成本最高的地方。

2. 未來的軟體工廠將是完全 Agentic 的。

去年 11 月的 Opus 4.5 時刻，是大多數嚴肅的軟體工程師首次達成共識：手寫大部分程式碼已不再合理。

以目前模型進步的速度，到今年年底，我們將擁有比 Opus 4.5 強大 10 倍的模型！這是一個驚人的現實：在不久的將來，我們將擁有比那個改變人們對程式撰寫認知之模型還要強大 10 倍的模型。在那個世界裡，我們建構軟體的方式將與過去幾十年截然不同。

我們相信未來是：由少數人類組成的團隊與龐大的 Agent 團隊協作——這就是橫跨整個 SDLC 的 Agentic 程式開發。在 Cosmos 出現之前，這種工作方式所需的工具並不存在。

3. 你的 Agentic SDLC 必須是模型無關（Model-agnostic）的。

近期的飛躍（Opus 4.7、GPT‑5.5）顯示了模型進步的速度有多快。程式撰寫已接近成為一個被解決的問題，但我們預期模型開發將持續進行，並專注於更大、更困難的任務。這意味著，最先進的模型很快就會在軟體任務上顯得「殺雞用牛刀」。預設對所有事情都使用頂尖模型將是浪費且昂貴的。理性的選擇是找到成本與品質的最佳組合來完成工作。

如果你鎖定單一供應商，你就必須承擔他們的定價、他們的路線圖，以及當你需要多元化配置時必須支付的遷移成本。保持模型無關則能避免這個陷阱。

這正是我們透過 Prism 努力的方向：模型路由（Model routing）已經能在不犧牲品質的情況下，節省約 20–30% 的 token 成本。

## Cosmos 將 Agent 的干擾轉化為流暢的工作流

Agent 帶來的個人生產力提升是真實存在的。工程師產出的程式碼比以往任何時候都多。但組織並沒有感覺到生產力提升了 10 倍，因為工作結構仍然圍繞著人類在每個步驟中的介入：綜合回饋、在會議與討論串中進行分類、研究問題、撰寫規格、使用 Agent 寫程式、使用 Agent 測試、審查 PR、發布與監控。在一個產品改進迴圈中，這就產生了八次干擾。

下一個階段不是「人類為主，Agent 輔助」，而是「Agent 為主，人類引導」。

透過 Cosmos，八次干擾變成了三次檢查點。

![](https://pub-75d4fe1e4e80421b9ecb1245a7ae0d1a.r2.dev/curated/1777947343178-iaHHfbVQIbAAAZzZqjpg.jpg)

優先順序排定。與其每天早上在 Slack 閱讀回饋頻道開始工作，不如讓 Agent 全程監控、彙整資訊並找出模式。當你坐在辦公桌前時，它已經提出了當天的優先事項。你只需進行審查。

這裡有兩種重要的回饋。第一種很直觀：你可以直接修正優先事項本身，回覆一則 Slack 訊息就足夠了。但第二種更重要：你可以修正「心智模型」。「針對這類回饋，未來的優先順序應該這樣排。」Agent 會記住這一點，因此明天的優先順序排定會變得更好。

人類的槓桿作用從「親自排定優先順序」轉變為「教授優先順序函數」。一旦清單確認，Cosmos 就能啟動並行的 Agent 來開啟 PR 或嘗試執行工作。規格會回到你手中進行審查，因為我們相信未來是「以成果為導向」的，人類的工作是在 Agent 獨立去撰寫、測試與審查程式碼之前，先審視規格。

透過規格與意圖審查來理解 context。程式碼審查（Code review）對我們來說是一個「啊哈！」時刻。市面上所有的程式碼審查工具都建立在一個即將過時的假設上：人類正在閱讀程式碼。因此，它們優化的是精確度：呈現最重要問題、減少雜訊、尊重讀者的時間。

但如果審查者是 Agent，你就不需要精確度，你需要的是召回率（Recall）。你希望捕捉到每一個可能的 Bug。這是一個本質上完全不同的產品。我們稱之為「深度程式碼審查」，它之所以有效，是因為你不需要讓人類去閱讀輸出結果。

那麼，人類如何持續掌握變更內容？經過大量的實驗，我們找到了一種體驗：人類與 Agent 及 PR 協作，以理解程式庫是如何演進的。這種體驗會呈現出關鍵假設發生變動的地方，也就是人類真正需要關注的事物。這就是人類維持對程式庫理解的方式，正如我們在最近的文章中所主張的，這對於充滿信心地發布產品至關重要。

## Cosmos 使用越久，就越聰明

在我們為雲端 Agent 平台建構基礎組件時，出現了一些更強大的東西。我們意識到，我們真正想要的不是只能執行任務的 Agent，而是能記憶並透過回饋不斷改進的專業化 Agent。

透過設計不同的 Agent 架構、賦予它們共享的記憶，並讓系統能夠自我更新，我們解鎖了更像隊友一樣工作的 Agent。在 Augment 最明顯的例子是我們的測試 Agent——Milo。我們曾試圖預先將關於 Augment 如何進行測試的所有 context 載入 Milo，將我們所知的一切都塞進它的 context 視窗中。結果失敗了。真正有效的方法完全不同。我們將 Milo 定位為 Augment 最強的測試專家，並針對持續學習與記憶進行了調校。當 Milo 執行測試並遇到困難時，Slack 上的工程師會介入指導。Milo 被設計為能從對話中提煉重要資訊並儲存起來。

專業化 Agent 的強大之處在於它們能透過回饋不斷進步。隨著時間推移，它們會成為最適合你環境、在特定任務上表現最好的 Agent，這是任何現成的 Agent 都無法比擬的。

## 公開預覽

Cosmos 即日起對 MAX 計畫的使用者開放公開預覽。現在還很早期，難免有些粗糙之處。我們分享它是因為我們寧願與少數團隊公開學習，也不願在私下閉門造車。

個人採用並不等於組織轉型。如果你一直關注我們，如果你是一位工程主管，正看著個人採用率領先於組織影響力，看著專業知識被困住，看著審查隊列不斷增長，我們很樂意將 Cosmos 呈現給你，讓我們一起學習。

---

作者：@VinayPerneti 與 @amateurhuman

## 標籤

Agent, 新產品, 自動化, Augment, Cosmos
