ChatGPT 使用者本週集體回報輸出品質大幅躍升、回應時間明顯拉長,引發 OpenAI 秘密 A/B 測試下一代模型 GPT-5.6 的狂熱猜測。從一鍵生成 3D 遊戲到機器人模擬,多位開發者在 X 平台貼出實測對比,聲稱「5.5 Pro 已被悄悄換成 5.6」。據傳正式發布最快6月25日登場,但 OpenAI 至今保持沉默。
(前情提要: 谷歌 Gemini 聯合負責人 Noam Shazeer 離職投奔 OpenAI )
(背景補充: Anthropic 新版 Mythos 訓練完成,Sonnet 5 本週發布在即 )
本文目錄
Toggle
本 週 ChatGPT 使用者突然發現一件事,對話品質好像不一樣了。不是小範圍的個別感受,而是橫跨開發者、創作者、評測機構的大量回報,全都指向同一個方向:OpenAI 可能正在秘密測試新模型。
開發者 Anshu Chimala 週四在 X 平台貼出對比影片 ,展示一鍵生成的登陸頁面品質差異,直言:「Well well well,我就是那個有幸搶先體驗 GPT-5.6 Pro 的幸運兒。」另一位開發者 Dobroslav Radosavljevič 則在 X 上發文 表示,他在 Codex 中使用的模型「感覺跟 5.5 完全不一樣」,回覆區則分裂為深信不疑與持保留態度的兩派。
使用者集體回報:回應變慢、品質暴增
最明顯的共同特徵是時間。開發者 Conor Dart 做了一項測試,用單一提示詞生成一款附物理引擎與鏡頭控制的 3D 瀏覽器遊戲,耗時超過一小時,而 GPT-5.5 Pro 平常只需約 10 分鐘。他寫道:「不完美,但單一提示詞做到這個程度,實在令人印象深刻。」
AI 圈內人 Chetas Lua 也在 X 平台報告 類似狀況:測試機器人模擬時,回應時間拉長至 20 到 40 分鐘,稱這種節奏「自 GPT-5.5 上線後就沒見過」。他更直言:「GPT-5.6 Pro 在 3D 測試上持續輾壓 Anthropic 的 Fable 5。」
不過並非所有測試都一面倒。AI 基準測試者 Chris 用同一個太空船建造提示詞測試兩款模型:疑似 GPT-5.6 Pro 跑了 87 分鐘,而 GPT-5.5 Extra High 僅需 34 分 42 秒。他 分析 道:「如我之前所說,GPT-5.6 是對 5.5 的漸進式穩健升級,不是 Fable 殺手。大概會在部分基準上與 Fable 5 互有勝負,但整體不會明顯超越。」
洩漏細節浮現:Juice Value 拉高、知識截止日更新
隨著討論升溫,更多洩漏資訊開始流傳。爆料者 Pankaj Kumar 詳細列出 多項規格變動:知識截止日期推進至 2025 年 12 月;被測試者稱為「Juice Value」的推理強度設定據傳從 768 拉高到 960;SVG 與 3D 設計生成能力在部分任務上超越 Fable 5。訊息來源雖未經 OpenAI 證實,但跨帳號的敘述高度一致:更強的推理能力、未完成的前端介面、以及代號「Kindle-Alpha」的候選版本。
AI 領域意見領袖 Leo 引用匿名訊息 發文 指出,GPT-5.6「目前正在部分 Pro 帳號中進行隱蔽測試,當使用者勾選 GPT-5.5 Pro 時,實際跑的是 5.6」,並預測公開發布時間為 6 月 25 日(週四)。
OpenAI 的沉默與過往的「靜默發布」紀錄
這不是 OpenAI 第一次走「先上線、不公告」路線。回顧 GPT-4.5 的推出過程,OpenAI 同樣選擇在沒有預告的情況下直接替換模型,直到使用者發現差異後才低調確認。這種 stealth release 策略一方面讓公司在不引起過度關注的情況下收集真實使用資料,另一方面也能在出現問題時低調回滾,避免公關危機。
不同於 Anthropic 每代模型發布時的高調造勢,Fable 5 與 Mythos 5 從訓練完成到正式上線皆有明確時間線,OpenAI 近幾次迭代越來越傾向「先做再說」。首席科學家 Jakub Pachocki 據報在內部會議中表示,新模型是對 GPT-5.5 的 meaningful improvement,但 The Information 的報導也僅止於此,並未確認任何 A/B 測試或發布時程。
值得注意的是,Decrypt 就此事向 OpenAI 提問,截稿前未獲回應。
急著推新模型的背後:GLM-5.2 追趕、Anthropic 受出口管制
如果 OpenAI 確實正在加速推出新一代旗艦模型,背後有充分的競爭壓力。中國開源模型 GLM-5.2 在 FrontierSWE 基準上僅以 1 分之差落後 Claude Opus 4.8,同時已直接超越 GPT-5.5。這項針對 AI Agent 在多小時複雜工程任務中表現的指標,正成為業界衡量模型真實能力的新標準。
Anthropic 陣營則陷入自傷困境。其旗艦模型 Mythos 5 與 Fable 5 因美國政府 6 月 12 日發布的出口管制指令遭到下架,理由是一項具爭議的越獄漏洞。這不僅讓頂級模型市場出現真空,也給了 OpenAI 一個珍貴的時間視窗,若能搶在 Anthropic 解決出口管制問題之前推出 GPT-5.6,就有機會填補市場缺口。
與此同時,華爾街日報報導 OpenAI 正在評估對開發者與企業的降價方案,為即將到來的雙重 IPO 做準備。競爭加劇、價格戰一觸即發,新模型的推出時機對 OpenAI 的資本市場敘事至關重要。
無論社群如何狂熱猜測,真正能驗證 GPT-5.6 存在的只有 OpenAI 官方。但 Polymarket 的預測市場交易者顯然不想等待,截至週末,GPT-5.6 在 6 月 22 日至 28 日期間發布的合約價格已飆至 89%。
?相關報導?
OpenRouter 大逃殺遊戲實測:Grok 稱王、Claude 的好習慣反成致命傷
Anthropic 新版 Mythos 訓練完成,Sonnet 5 本週發布在即
谷歌 Gemini 聯合負責人 Noam Shazeer 離職投奔 OpenAI
OpenAI 宣布「修補地球」計畫,為 cURL、Python、PyPI 等 19 個知名開源專案提供資安協助
Token補貼戰將熄火?Google Ventures創辦人警告:AI若降價,商業模式將全面崩盤
