# 策展 · X (Twitter) 🔥

> 📖 本站完整內容索引（documentation index）：[llms.txt](/llms.txt)

> 作者：Andrej Karpathy (@karpathy) · 平台：X (Twitter) · 日期：2026-04-10

> 原始來源：https://x.com/karpathy/status/2042334451611693415

## 中文摘要

AI 能力認知的巨大鴻溝源於模型層級與應用場景的錯位。

目前大眾對人工智慧能力的認知存在嚴重斷層，這主要源於使用者對「免費版模型」與「頂尖 Agent 模型」的使用體驗差異，以及不同領域技術進步速度的不對等。

**認知斷層的成因**
許多人對人工智慧的印象仍停留在去年試用的免費版 ChatGPT，這導致大眾往往過度關注模型在簡單任務上的失誤，例如社群媒體上廣為流傳的 OpenAI「Advanced Voice Mode」在處理基礎生活問題時的笨拙表現。然而，這些被淘汰或免費的模型，完全無法代表今年最先進的 Agent 模型（如 OpenAI Codex 或 Claude Code）的真實實力。

**技術進步的「尖峰」現象**
即便付費使用頂尖模型，使用者也會發現人工智慧的能力呈現「尖峰」分布，而非全面提升：
- 搜尋、寫作與一般建議等大眾化領域，並非近期技術突破最顯著的範疇。
- 企業在研發資源分配上，優先投入能創造高商業價值的領域，而非大眾常用的基礎功能。
- 強化學習（Reinforcement Learning）依賴可驗證的回饋，這使得程式撰寫、數學與研究等領域的進步幅度遠超一般任務。

**技術領域的「AI 精神錯亂」**
對於在程式開發、數學與研究等專業領域使用頂尖 Agent 模型的人來說，他們正經歷著所謂的「AI 精神錯亂」（AI Psychosis），因為這些領域的進步速度極其驚人。當這些模型獲得電腦終端存取權限時，它們能解決原本需要數天甚至數週才能完成的複雜程式問題，這種能力帶來的震撼感與大眾對 AI 的認知完全不在同一個維度。

**核心矛盾與未來展望**
目前社會上存在兩個群體，他們對人工智慧的理解幾乎是平行線：
- 第一群體：僅接觸免費或過時模型，認為 AI 只是會犯蠢的聊天機器人。
- 第二群體：深度使用頂尖 Agent 模型，見證了 AI 在專業領域的毀滅性生產力。

這種認知落差之所以存在，是因為程式開發等領域具備兩大優勢：
- **可驗證性**：程式碼擁有明確的獎勵函數（如單元測試是否通過），這讓強化學習訓練極其有效，遠比判斷寫作品質容易。
- **商業價值**：B2B 市場對自動化程式開發的需求極高，促使研發團隊將絕大多數資源集中於此，進而推動了該領域的劇烈變革。
