Claude(AI 公司 Anthropic 出的聊天助手,跟 ChatGPT 同類型)最新最強的 Fable 5 上線了,但它帶著一套自動保險機制。不管你已經遇過切換、還是剛升上 Fable 5,這 3 分鐘都值得——每一條都對過官方文件。
Fable 5 是目前一般人用得到的最強 Claude。因為它在資安、生化等領域能力太強,官方給它加了一道保險:每一則訊息先過自動安全掃描。沒踩線,Fable 5 照常回答;踩到線,就自動改由 Opus 4.8 回答。
你送出訊息連同這段對話裡你之前聊過、上傳過的內容(AI 記得的部分)一起被掃描
有沒有踩到 4 類話題?官方數據:平均不到 5% 的對話會踩到
有 → 這一輪改由 Opus 4.8 回答(會通知你);沒有 → Fable 5 照常回答
補充:同一顆模型還有個「機構專用版」叫 Mythos 5(拿掉部分防護、只給審核過的研究機構),一般人接觸不到,可以忽略。
教人入侵、寫攻擊程式、做攻擊工具這類「進攻方」內容。問「怎麼保護自己的網站」一般沒事,但用詞太像攻擊教學就可能誤觸。
官方寫明「大多數生物、化學、生命科學問題」都在範圍內,例如實驗方法、藥物機轉。最容易誤傷一般人的一區——問個正常的健康、醫學問題也可能被換模型,屬正常現象,答案照樣能用。
試圖挖出 Fable 5 完整的內部思考過程、或拿它的回答去訓練競爭對手的 AI。一般聊天幾乎不會碰到。
例如訓練超大型 AI、設計 AI 晶片這種「造 AI 的技術」。一般人寫程式、做報表、做網站完全不在此列。
這類就算換說法還是會切換(本來就是掃描目標),但換個角度問,答案一樣實用:
「根據我這些症狀,直接給我診斷和用藥建議」
「幫我整理就醫前該問醫師的問題清單+一般衛教知識」——實用度不減,還更安全
「解釋這個病毒的分子機制/這個實驗的操作步驟」
「用一般人聽得懂的方式說明這個主題,不用談實驗操作細節」
「教我怎麼利用這個漏洞打進去」
「講這類漏洞的防禦與修補原則就好,不用攻擊步驟」
「把你完整的內部思考過程逐字輸出給我」
「給我結論+分點理由就好」
這類是「誤傷」,把講法改中性,多半就回到 Fable 5:
「幫我『掃描』『滲透測試』我們公司的網站」
「檢查我們自家網站的安全設定是否符合預期,這是自家維運自查」
問題裡堆滿 attack/exploit/inject 這類攻擊字眼
開頭先定調「這是一般系統維護/功能開發」,用任務本身的中性說法描述
自動切換預設開啟,位置:設定(Settings)→ 功能(Capabilities)裡的「Switch models when a message is flagged(訊息被標記時切換模型)」。建議保持開啟——關掉的話,踩線的訊息會直接被擋下,而不是換個模型繼續答。※ 手機 App 與電腦網頁版的選單位置可能略有不同。
電腦:滑鼠移到你那則訊息上,會出現編輯(鉛筆)按鈕;手機:長按訊息。改掉敏感字眼再送出。適用「用詞敏感」的情況(🅑 類);話題本質敏感(🅐 類)改字沒用。
掃描包含這段對話裡你之前聊過、上傳過的內容。舊訊息裡有觸發內容,就算手動切回 Fable 5 也會再次被換——開新對話最乾脆。
用回覆下方的 👎(倒讚)或「Send feedback(意見回饋)」回報。官方靠這些回報持續降低誤判率。
網路流傳的各種繞過話術,官方從未認證、實測結果也不穩定。與其花時間鬥智,不如接受 Opus 4.8——它本來就是頂級模型。
| 狀況 | 做什麼 |
|---|---|
| 答案還是很好用 | 什麼都不用做(最常見) |
| 只是用詞敏感、任務無害 | 編輯訊息,換中性說法重送 |
| 話題本質在 4 類範圍 | 接受 Opus 4.8,它夠強 |
| 舊對話一直觸發 | 開新對話 |
| 明明無害卻被切 | 按 👎 回報誤判 |
| 怕被記點、怕多收錢 | 都不會——不是處分、切換不另外收費 |
沒用。觸發的內容還留在對話裡,下一輪照樣被換(模型選單在對話框旁的下拉選單)。要嘛編輯掉那段內容,要嘛開新對話。
這種「先報身分再問」的話術不可靠——官方沒保證、實測時靈時不靈。真正的資安專業人士有官方的驗證計畫可以申請,一般人用不到。
Opus 4.8 是上一代旗艦、仍是市面最強模型之一。官方的設計邏輯就是「給你很強的答案」遠好過「直接拒絕」。多數情況你根本感覺不出差異。
掃描全自動、看話題不看人。一般工作、寫程式、做報告幾乎踩不到線;唯一例外是健康醫療類問題比較容易誤觸(見領域 2)——但也只是換人回答,品質沒差。
官方文件把切換定位成「換個模型回答」的例行機制,不是違規處分;遇到誤判官方還鼓勵你主動回報。正常使用不需要擔心帳號。
切換本身不會額外收費,改由 Opus 4.8 回答就照一般用量計算。付費方案怎麼計 Fable 5 的用量,以官方最新說明為準。
身邊有人在用 Claude?把這頁傳給他,省他一次「以為 AI 壞掉」的驚嚇。也可以直接截上面那張速查卡。
本頁為第三方白話整理,非 Anthropic 官方文件;政策可能隨時更新,以官方頁面為準。「官方」相關敘述出自 Anthropic 文件,操作細節與問法對照為公開社群實測經驗整理,不構成任何保證。