# 策展 · X (Twitter) 🔥🔥🔥🔥🔥

> 作者：Saito (@SaitoWu) · 平台：X (Twitter) · 日期：2026-05-03

> 原始來源：https://x.com/SaitoWu/status/2050574771994427885

## 中文摘要

Karpathy從Vibe Coding躍升至Agentic Engineering，AI已成全新計算範式。

Karpathy去年提出「Vibe Coding」，今年卻坦言作為程式員從未如此落後，轉折點在去年12月，AI從輔助工具轉為能獨立完成大塊工作的全新計算範式，從Vibe Coding走向Agentic Engineering。

**分水嶺時刻**

去年12月前，使用如Claude Code的Agent僅能寫小段程式碼需人類修復；之後Karpathy實驗發現最新模型可連續完成大塊工作，几乎無需修正。他原話：「一直讓它繼續做，它就一直做對，我甚至想不起上一次需要我改它是什么時候。」此後，他的側項目資料夾充滿隨機想法，全以「憑感覺寫」方式推進，即Vibe Coding。

**Software 3.0框架**

Karpathy提出Software 3.0作為理解核心，對比三代軟體範式：
- Software 1.0：手寫規則程式碼
- Software 2.0：準備資料集訓練神經網路
- Software 3.0：prompt加context window，即程式本身

LLM不再是工具，而是新「電腦」；程式撰寫從寫程式碼轉為組織輸入，在資訊空間透過上下文指揮計算。

**具體案例轉變**

兩個案例凸顯變化。

**OpenClaw安裝**：過去需複雜跨平台shell腳本處理環境差異；如今複製一段prompt給Agent，它自行理解環境、除錯、完成安裝，體現Software 3.0：非精確描述每步，而是Agent用自身「智慧」解決。

**MenuGen應用**：過去寫完整應用含OCR、圖像生成、部署Vercel極其痛苦；現在拍菜單照片丟給Gemini，加指令讓其在原圖疊加真實菜品圖，直接輸出最終結果。

許多現有軟體僅為舊範式中間產物，在新範式下無需存在。

**模型能力概念**

**Jagged Intelligence（鋸齒狀智能）**：模型能力極不均勻：
- 程式碼、數學等高度可驗證領域極強
- 常識、審美領域很弱

如「50米去洗車，應開車還是走路」，模型常給荒謔答案。

**Verifiability（可驗證性）**：差異源於可驗證任務易經強化學習優化。模型可重構十萬行程式碼、發現零日漏洞，卻在生活問題頻錯，因程式碼數學有明確對錯，常識無標準答案。故程式碼數學進步極快，其他領域相對緩慢。

**階段區分**

**Vibe Coding**：大幅降低門檻，讓更多人快速做出東西。

**Agentic Engineering**：在維持專業軟體標準（如安全性、可靠性）前提，利用Agent實現數量級提速。Karpathy判斷，掌握者效率遠超10x engineer。

**人類剩餘角色**

短期三能力關鍵：品味、判斷、理解。Agent處理細節，但整體方向、審美、最終把控需人類。例如Agent試用email匹配Stripe與Google帳號，導致資金關聯失敗，此類「常識錯誤」需人兜底。理解無法外包，但思考過程可外包，藉LLM與知識庫更快建立理解。

**創業方向**

優先尋「高度可驗證、但模型尚未重點優化」領域。因可驗證即建強化學習環境，能力將迅速爆發。避開大模型公司重點賽道，找「可驗證但資料不足」空白。

**未來判斷**

系統須從頭按agent-native設計，內容如prompt、感測器、執行介面直接服務Agent，而非人類閱讀。未來Agent代表個人/組織互動完成事務。教育轉向理解判斷，API細節重要性降，因Agent記得更牢。

從「用AI輔助程式撰寫」跨越至「與AI共同完成工程」；Vibe Coding僅起點，Agentic Engineering為專業必修，人類價值在判斷值得做之事、定義優良標準、探索「新電腦」邊界。

## 標籤

Agent, Claude Code, 產業趨勢, Anthropic, Claude
