# 策展 · X (Twitter) 🔥🔥🔥🔥🔥

> 作者：OpenAI Developers (@OpenAIDevs) · 平台：X (Twitter) · 日期：2026-04-24

> 原始來源：https://x.com/OpenAIDevs/status/2047377079352877534

## 中文摘要

GPT-5.5 發布，Agentic 程式開發與電腦使用達巔峰水準。

OpenAI 於 2026 年 4 月 23 日推出 GPT-5.5，這是其最智慧且直覺的模型，專為 Agentic 程式開發、電腦使用、知識工作及科學研究帶來全新智慧等級，已在 ChatGPT 和 Codex 推出，API 即將上線。它不僅在多項評測中達到最先進成績，還維持 GPT-5.4 的 token 延遲，同時更高效使用 token，標誌人工智慧加速軟體工程及科學研究的轉型。

**Agentic 程式開發巔峰表現**

GPT-5.5 是 OpenAI 最強的 Agentic 程式開發模型，在 Terminal-Bench 2.0 達到 82.7% 準確率，超越前代，尤其在命令列工作流程及 GitHub 問題解決上更強勁。
- 在 SWE-Bench Pro 上達 58.6%，單次通過端到端解決更多真實 GitHub 問題。
- 在內部 Expert-SWE 評測（中位人類完成時間 20 小時的長時程程式任務）中，超越 GPT-5.4。
在 Codex 中，GPT-5.5 可 End to End (端到端) 執行程式任務，從理解程式庫、修改程式碼、除錯、測試到驗證，全程更深入。

**電腦使用與工具應用領先**

GPT-5.5 在電腦使用、工具使用等關鍵評測中創最先進成績，讓使用者給予混亂的多階段任務，它能自行規劃、使用工具、檢查工作、處理歧義並持續推進，而非需逐一管理步驟。
- OSWorld-Verified：78.7%。
- Toolathlon：55.6%。
在 ChatGPT 中，「GPT-5.5 Thinking」提供更快速的複雜問題協助，答案更智慧且用字更簡短，特別適合程式撰寫、研究、資訊合成、分析及文件密集任務，尤其搭配 plugin 時表現卓越。它更自然地完成知識工作全循環：搜尋資訊、辨識重點、使用工具、驗證輸出並轉化成有用成果。

**科學研究工作流程提升**

GPT-5.5 在科學及技術研究上大幅進步，能持續執行探索想法、蒐集證據、測試假設、解讀結果及決定下一步的迴圈，比其他模型更持久。
- GeneBench（基因及定量生物的多階段科學資料分析）：25.0%，較 GPT-5.4 的 19.0% 提升。
- FrontierMath Tier 4：35.4%，較 GPT-5.4 的 27.1% 進步。
這適用於早期科學研究，加速從想法到實作的流程。

**基礎設施自我優化**

GPT-5.5 助其服務基礎設施改進，為達到 GPT-5.4 延遲，團隊利用 Codex 及 GPT-5.5 加速從想法到可基準實作、串聯實驗及找出推論層級最佳化。Codex 分析數週生產流量模式，撰寫自訂負載平衡及分割啟發式，提升 token 生成速度逾 20%。模型專為 NVIDIA GB200 及 GB300 NVL72 系統共同設計、訓練及服務，重新思考推論為整合系統，而非孤立最佳化。

**資安任務顯著躍進與防護**

GPT-5.5 在資安任務上大幅提升，在 CyberGym 達 81.8%，較 GPT-5.4 的 79.0% 進步；在擴充的困難 Capture-the-Flags 挑戰中達 88.1%。OpenAI 依「Preparedness Framework」將其資安能力評為 High 等級，與 GPT-5.4 一致，推出更強防護措施，限制高風險資安活動，並為驗證的防禦工作提供可信任存取。準備世界應對擅長找出及修補安全漏洞的模型需全生態系合作，透過民主化模型存取及迭代部署，建構下一時代資安防禦韌性。

**token 效率與成本優勢**

GPT-5.5 比 GPT-5.4 更節省 token，在 Codex 中多數使用者以較少 token 獲更好結果，同時維持各訂閱等級的慷慨使用量。在 Artificial Analysis 的 Coding Index 上，以競爭前沿程式模型一半成本，提供最先進智慧。

**推出細節與安全措施**

自即日起，GPT-5.5 向 ChatGPT 及 Codex 的 Plus、Pro、Business 及 Enterprise 使用者推出；GPT-5.5 Pro 向 Pro、Business 及 Enterprise 使用者推出。API 部署需不同防護，正與合作夥伴及客戶密切合作安全需求，即將上線。OpenAI 以最強防護套件發布，包括全套安全及準備框架評估、內外部紅隊測試、進階資安及生物能力針對測試，以及近 200 名可信任早期存取夥伴的真實使用案例回饋，降低濫用同時保留有益工作存取。這不僅提升智慧，還更有效率地解決問題，常以較少 token 及重試達更高品質輸出，推動全球 Agentic 人工智慧基礎設施，讓人與企業透過 AI 完成電腦工作。

## 標籤

Agent, 新產品, 功能更新, LLM, OpenAI, GPT, Codex
