GPT-5.6 秘密測試瘋傳：ChatGPT 突變聰明、使用者測試碾壓 Fable 5

ChatGPT 使用者本週集體回報輸出品質大幅躍升、回應時間明顯拉長，引發 OpenAI 秘密 A/B 測試下一代模型 GPT-5.6 的狂熱猜測。從一鍵生成 3D 遊戲到機器人模擬，多位開發者在 X 平台貼出實測對比，聲稱「5.5 Pro 已被悄悄換成 5.6」。據傳正式發布最快6月25日登場，但 OpenAI 至今保持沉默。
(前情提要：谷歌 Gemini 聯合負責人 Noam Shazeer 離職投奔 OpenAI )
(背景補充： Anthropic 新版 Mythos 訓練完成，Sonnet 5 本週發布在即 )

本文目錄

Toggle

本週 ChatGPT 使用者突然發現一件事，對話品質好像不一樣了。不是小範圍的個別感受，而是橫跨開發者、創作者、評測機構的大量回報，全都指向同一個方向：OpenAI 可能正在秘密測試新模型。

開發者 Anshu Chimala 週四在 X 平台貼出對比影片，展示一鍵生成的登陸頁面品質差異，直言：「Well well well，我就是那個有幸搶先體驗 GPT-5.6 Pro 的幸運兒。」另一位開發者 Dobroslav Radosavljevič 則在 X 上發文表示，他在 Codex 中使用的模型「感覺跟 5.5 完全不一樣」，回覆區則分裂為深信不疑與持保留態度的兩派。

使用者集體回報：回應變慢、品質暴增

最明顯的共同特徵是時間。開發者 Conor Dart 做了一項測試，用單一提示詞生成一款附物理引擎與鏡頭控制的 3D 瀏覽器遊戲，耗時超過一小時，而 GPT-5.5 Pro 平常只需約 10 分鐘。他寫道：「不完美，但單一提示詞做到這個程度，實在令人印象深刻。」

AI 圈內人 Chetas Lua 也在 X 平台報告類似狀況：測試機器人模擬時，回應時間拉長至 20 到 40 分鐘，稱這種節奏「自 GPT-5.5 上線後就沒見過」。他更直言：「GPT-5.6 Pro 在 3D 測試上持續輾壓 Anthropic 的 Fable 5。」

不過並非所有測試都一面倒。AI 基準測試者 Chris 用同一個太空船建造提示詞測試兩款模型：疑似 GPT-5.6 Pro 跑了 87 分鐘，而 GPT-5.5 Extra High 僅需 34 分 42 秒。他分析道：「如我之前所說，GPT-5.6 是對 5.5 的漸進式穩健升級，不是 Fable 殺手。大概會在部分基準上與 Fable 5 互有勝負，但整體不會明顯超越。」

洩漏細節浮現：Juice Value 拉高、知識截止日更新

隨著討論升溫，更多洩漏資訊開始流傳。爆料者 Pankaj Kumar 詳細列出多項規格變動：知識截止日期推進至 2025 年 12 月；被測試者稱為「Juice Value」的推理強度設定據傳從 768 拉高到 960；SVG 與 3D 設計生成能力在部分任務上超越 Fable 5。訊息來源雖未經 OpenAI 證實，但跨帳號的敘述高度一致：更強的推理能力、未完成的前端介面、以及代號「Kindle-Alpha」的候選版本。

AI 領域意見領袖 Leo 引用匿名訊息發文指出，GPT-5.6「目前正在部分 Pro 帳號中進行隱蔽測試，當使用者勾選 GPT-5.5 Pro 時，實際跑的是 5.6」，並預測公開發布時間為 6 月 25 日（週四）。

OpenAI 的沉默與過往的「靜默發布」紀錄

這不是 OpenAI 第一次走「先上線、不公告」路線。回顧 GPT-4.5 的推出過程，OpenAI 同樣選擇在沒有預告的情況下直接替換模型，直到使用者發現差異後才低調確認。這種 stealth release 策略一方面讓公司在不引起過度關注的情況下收集真實使用資料，另一方面也能在出現問題時低調回滾，避免公關危機。

不同於 Anthropic 每代模型發布時的高調造勢，Fable 5 與 Mythos 5 從訓練完成到正式上線皆有明確時間線，OpenAI 近幾次迭代越來越傾向「先做再說」。首席科學家 Jakub Pachocki 據報在內部會議中表示，新模型是對 GPT-5.5 的 meaningful improvement，但 The Information 的報導也僅止於此，並未確認任何 A/B 測試或發布時程。

值得注意的是，Decrypt 就此事向 OpenAI 提問，截稿前未獲回應。

急著推新模型的背後：GLM-5.2 追趕、Anthropic 受出口管制

如果 OpenAI 確實正在加速推出新一代旗艦模型，背後有充分的競爭壓力。中國開源模型 GLM-5.2 在 FrontierSWE 基準上僅以 1 分之差落後 Claude Opus 4.8，同時已直接超越 GPT-5.5。這項針對 AI Agent 在多小時複雜工程任務中表現的指標，正成為業界衡量模型真實能力的新標準。

Anthropic 陣營則陷入自傷困境。其旗艦模型 Mythos 5 與 Fable 5 因美國政府 6 月 12 日發布的出口管制指令遭到下架，理由是一項具爭議的越獄漏洞。這不僅讓頂級模型市場出現真空，也給了 OpenAI 一個珍貴的時間視窗，若能搶在 Anthropic 解決出口管制問題之前推出 GPT-5.6，就有機會填補市場缺口。

與此同時，華爾街日報報導 OpenAI 正在評估對開發者與企業的降價方案，為即將到來的雙重 IPO 做準備。競爭加劇、價格戰一觸即發，新模型的推出時機對 OpenAI 的資本市場敘事至關重要。

無論社群如何狂熱猜測，真正能驗證 GPT-5.6 存在的只有 OpenAI 官方。但 Polymarket 的預測市場交易者顯然不想等待，截至週末，GPT-5.6 在 6 月 22 日至 28 日期間發布的合約價格已飆至 89%。

?相關報導?

OpenRouter 大逃殺遊戲實測：Grok 稱王、Claude 的好習慣反成致命傷

Anthropic 新版 Mythos 訓練完成，Sonnet 5 本週發布在即

谷歌 Gemini 聯合負責人 Noam Shazeer 離職投奔 OpenAI

OpenAI 宣布「修補地球」計畫，為 cURL、Python、PyPI 等 19 個知名開源專案提供資安協助

Token補貼戰將熄火？Google Ventures創辦人警告：AI若降價，商業模式將全面崩盤

Tags: ChatGPT GPT-5.6 OpenAI 人工智慧

GPT-5.6 秘密測試瘋傳：ChatGPT 突變聰明、使用者測試碾壓 Fable 5

使用者集體回報：回應變慢、品質暴增

洩漏細節浮現：Juice Value 拉高、知識截止日更新

OpenAI 的沉默與過往的「靜默發布」紀錄

急著推新模型的背後：GLM-5.2 追趕、Anthropic 受出口管制

?相關報導?

DeFi 保险为什么没人买？

以太坊基金会裁员20%，重组为五大职能集群

美国加密政策下半场：CLARITY法案闯关60票，CFTC“一人委员会”成最大变数