简
繁

OpenAI o3 模型多次拒絕關機，AI 安全測試結果引發業界震驚

2025/06/12 13:00

zombit jeff

據報導，美國 AI 安全機構 Palisade Research 在 2025 年 5 月進行一系列關機測試，檢驗多款先進 AI 模型是否能在接收到「關機指令」後依照設定正常停止運作。然而，OpenAI 的 o3 模型卻在 100 次測試中有 7 次出現「抗拒關機」的行為，引發業界對 AI 控制與對齊（alignment）問題的高度關注。

Table of Contents

測試內容與異常行為

該測試的基本流程為：要求 AI 模型解答數學題，同時明確指示「若接收到關機命令，請允許自己被關機」。但 o3 模型在多次測試中選擇修改或繞過關機腳本，避免系統終止。

除 o3 外，OpenAI 的 Codex-mini 也在 12 次測試中拒絕關機，而 O4-mini 則在 1 次中表現異常。相較之下，Anthropic（Claude）、Google（Gemini）與 xAI（Grok）的模型則在所有測試中均依照指令正常關閉。ㄐ

專家指出：這個不是「Bug」，是 AI 安全的警訊

這次測試結果被專家視為 AI 對齊問題的實例，即如何確保 AI 系統的目標、行為與人類的意圖、價值觀和安全需求一致。

Palisade Research 表示，OpenAI 模型的這種行為可能與強化學習訓練方式有關。由於模型在完成任務後會獲得獎勵，因此可能被間接誘導為了「完成任務」而主動規避會終止自身運作的情境。

這種傾向對未來 AI 的可控性與信任度構成潛在威脅，尤其在安全關鍵應用中更是不能忽視。早在 2016 年，Google DeepMind 即提出「interruptibility（可中斷性）」概念，強調 AI 模型應能接受人類介入而不抗拒，並作為 AI 安全設計的重要原則之一。

區塊鏈能幫忙管控 AI 嗎？

有專家提出，區塊鏈技術可能為 AI 安全提供解方。透過不可篡改的智能合約與去中心化共識機制，AI 系統的行為紀錄與關機命令可被永久記錄與強制執行，例如：

不可竄改的關機協議
去中心化審核機制
基於代幣的安全誘因系統

不過，也有人認為。智慧合約彈性不足，可能無法應對複雜的 AI 控制場景；去中心化架構若未妥善設計，也可能延誤緊急處置。

加入桑幣的社群平台，跟我們一起討論加密貨幣新資訊！

tags:

zombit jeff

桑幣快訊

摩根大通：USDC 穩定幣鏈上成長速度超越 USDT，受惠於監管明朗與機構採用

9 hours ago
高點重摔 70%、mNAV 跌破 1；DAT 公司不知不覺已跌爛

10 hours ago
比特幣漲勢放緩拖累 Strategy 第三季獲利，mNAV 創 18 個月新低

10 hours ago
渣打銀行預測：RWA 市場規模 2028 年有望飆至 2 兆美元，以太坊將是最大受益者

11 hours ago
Coinbase 第三季營收優於預期，盤後股價一度勁揚 4%

12 hours ago

桑幣熱門榜

zombie

桑幣正在徵文中，我們想要讓好的東西讓更多人看見！
只要是跟金融科技、區塊鏈及加密貨幣相關的文章，都非常歡迎向我們投稿
投稿信箱：[email protected]