GPT 5.4 Pro 的競爭力顯示 OpenAI 下一代旗艦模型將超越 Mythos
AI 語音朗讀 · Edge TTS
AI 中文摘要Claude 生成
GPT 5.4 Pro 的競爭力顯示 OpenAI 下一代旗艦模型將超越 Mythos。
儘管市場焦點多集中於 Mythos 的強勢表現,但數據顯示 GPT 5.4 Pro 在現有評測基準上已展現出極高的競爭力,這預示著 OpenAI 下一代旗艦模型「Spud Pro」將具備超越對手的實力。
評測數據分析
從現有的評測數據來看,GPT 5.4 Pro 與 Mythos 在多項指標上呈現互有勝負的態勢:
- GPQA 基準測試中,兩者幾乎打平(94.4 對 94.5)。
- BrowseComp 測試中,GPT 5.4 Pro 以 89.3 分勝過 Mythos 的 86.9 分。
- 儘管 Mythos 在「Humanity’s Last Exam」中領先(無工具輔助下 56.8 對 42.7;有工具輔助下 64.7 對 58.7),但 GPT 5.4 Pro 的表現已證明其具備極強的追趕能力。
未來趨勢展望
作者認為,GPT 5.4 Pro 目前的競爭力已讓 OpenAI 處於極佳的追趕位置。一旦 OpenAI 推出下一個重大升級版本「Spud Pro」,Mythos 的領先優勢將難以維持,市場格局極可能隨之翻轉。
Honestly this chart makes me more bullish on GPT 5.4 Pro than anything else.
— Chris (@chatgpt21) April 12, 2026
People are focusing on Mythos looking strong, but what stands out to me is how well 5.4 Pro already stacks up on the overlap we actually have. GPQA is basically a tie at 94.4 vs 94.5. BrowseComp is a… pic.twitter.com/sWkV6M1rlf
