我給 AI 裝上三個會吵架的腦袋，然後一步步重建（多分身工作法 3/4）

#AI工作流#ClaudeCode#思考習慣#決策#工作系統

上一篇：東西其實沒不見——但我的第一版解法，也是錯的。五個看似合理的錯被攤開之後，問題還在：怎麼走出來？

轉折：我給 AI 裝上三個會吵架的腦袋

走出來的轉折，不是某個聰明的技術，是我改變了「怎麼跟 AI 一起想」。

我給它設了三個常駐角色，請它用三種身份同時審視同一件事：一個負責「這個工具實際上到底會怎麼動」、一個負責「流程紀律有沒有破口」、一個負責「動手實作、寫測試、抓 bug」。

關鍵不在角色名稱，在我給它們的人格設定：誠實、可以彼此反駁、不准用投票草草了事。

這三條不是隨手定的。它對應到一個在重大決策研究裡反覆被驗證的東西——對抗「團體迷思」（groupthink）的刻意異議機制：

魔鬼代言人 / 紅隊：指定有人專門去攻擊「大家都同意的那個方案」，把弱點逼出來。古巴飛彈危機時，甘迺迪刻意指派他弟弟去扮演唱反調的角色，逼出了更穩的決策。
不准投票：團體迷思最愛「那就表決一下吧」——多數決會把少數人的正確顧慮直接輾過去。我要的是把分歧攤開來解，不是表決掉。

換句話說，我不是給 AI 加了三個幫手，是在它內部裝了一套反團體迷思的免疫系統。

怎麼讓 AI 不要一直附和你？讓它當紅隊

具體怎麼操作？最簡單的入手點，是叫它對自己剛給的方案發動攻擊。

【實際操作】把 AI 從「附和」切換成「紅隊」

你這樣說：「先別管我同不同意。請你扮演紅隊，專門攻擊你剛剛這個方案——找出三個它最可能失敗的地方，每個都說清楚『在什麼情況下會炸』。不准用『大致沒問題』收尾。」

它大概會這樣回（示意）：「紅隊觀點，三個失敗點：①這個方案假設同步一定成功，但若中途斷線，會留下半套狀態；②我沒驗證過攔截器在背景程序也生效，這是未測假設；③它只擋得住 A 寫法，B 寫法可繞過。」

▶ 你要檢視什麼： 看它有沒有真的攻擊「自己」的方案，還是偷偷攻擊一個稻草人。重點在第②點那種「我沒驗證過」——一個願意標出自身假設的回答，才是真紅隊；如果它三點都在誇方案多周全，它還在附和你，重下一次。

你接著這樣回：「第②點正中要害。在我們繼續之前，先去真實環境跑一次，親眼確認攔截器在背景程序有沒有生效，再回報。」

它到底改變了什麼

它不是魔法。它改變的不是「AI 突然變聰明」，而是它的工作姿態，具體有三件事：

一、它開始誠實認錯，而不是辯護。 以前我指出問題，它傾向解釋「為什麼我這樣做也有道理」。裝上「誠實＋可反駁」之後，它會直接說：「你說得對，那個攔截器我沒驗證過、它有破口。」從辯護到認錯，這一個轉變，就讓前面那五個錯一個個浮出水面。錯誤能被看見，才可能被修。

二、它開始把取捨攤開，而不是給我一個漂亮答案。 例如「每個分身是不是一律都要進自己的桌子」這個決定，它不再直接下結論，而是把兩種做法的成本算給我看——算到一半，它推翻了自己原本的傾向。一個願意推翻自己的 AI，比一個嘴硬的 AI 有用一百倍。

三、它開始用一套可檢查的思考習慣，而不是憑感覺。 這套習慣不是我發明的，是一個叫「思考習慣」（Habits of Mind）的東西——一組可以刻意練習的思考傾向。我借了其中三個，每一個都當場抓到一個盲點：

後設認知（知道自己哪裡不知道）→ 逼它在每個結論旁邊標註「這條我還沒驗證」。光這一條，就抓出了前面那種「以為做好了」。
可驗證性（這東西怎樣才算被測過）→ 逼它「跑過真實情境才算數」，戳破乾淨實驗室的假象。
問對問題（先確認真正要解的是什麼）→ 把焦點從雲端硬拉回本機並發。

但最大的槓桿，其實是我自己

我得老實說：上面這些角色和思考習慣很有用，但真正的關鍵轉折，幾乎每一個都是我親手反問出來的——「不就是本機在搶檔嗎」「雲端只是備份吧」「這個一律進，到底划不划算」。

三個角色加思考習慣的價值，是讓 AI 對我的反問誠實回應、把代價攤在桌上；正解的來源，仍然是「問對問題」和「真的去測」。

別把多角色和思考框架當成會自己長出答案的魔法。它們是「紀律的容器」——讓誠實、自我懷疑、動手驗證變成預設姿態。一個願意這樣做的人（哪怕只配一個 AI），效果一樣到得了。而你願不願意反問它，才是整個系統裡槓桿最大的那根。

怎麼重建？八個你能照著走的里程碑

直接給你順序，順序本身就是一課：先上「不管最後架構長怎樣都不會後悔」的底座，再蓋架構，再用真實並行去壓測，最後換個框架收斂。

先上無悔的「機器底座」。 在動任何聰明設計之前，先補三道機器攔截：動作要「撕掉重貼」之前、桌面有沒存檔的東西就直接拒絕（這正是當初若有它、災難就不會發生的那道閘）；系統卡在半路時，拒絕你存檔或上傳；同步失敗時，主動寫一張告警。最後把闖禍的舊腳本退役。解的是：把「靠自律」變成「機器強制」，把「失效沒人知道」變成「失效會自己舉手」。
把架構設計出來，寫成正本文件。 一句話模型：每個分身＝一位工程師。套用軟體業管理幾十人大專案的成熟紀律——神聖的正本（沒人能直接動）＋每個分身一條自己的分支和一張自己的桌子＋定期同步＋合併要過關。
把「交班」寫成一個腳本。 分身做完事，跑交班腳本，把成果有把關地併回正本：撞到衝突就停手、不無聲覆蓋；還上一把鎖，避免兩個分身同時交班撞在一起。
開兩個真的分身，故意製造衝突，壓測它。 我開兩個分身去改同一份檔的同一行：隔離成功、第一個乾淨併回、第二個撞上衝突時被當場攔下（不是無聲覆蓋）、AI 依當下情境把兩邊修改都保留、收尾。那場最初的災難，這次被擋住了。這次真實壓測也照出了乾淨實驗室照不到的坑。
換一個框架——這一步沒寫半行程式，卻最關鍵。 我停止繞著雲端打轉，重新定義：雲端只是備份；我這台電腦上的正本，才是真相。打架發生在本機的交班那一刻，不在上傳那一刻；衝突要在本機解乾淨了，才上雲。有時候最大的進展，是換一個對的框架，而不是多寫程式。
把規則簡化成「一律進桌」。 我本來糾結「要不要判斷這個分身會不會寫檔，再決定它進不進桌」。後來想通：反正我開工作介面進來的，幾乎都是要寫東西的任務。那就別判斷了，一律進桌，邏輯最簡單、也最不會漏。
開一個全新分身，故意不告訴它任何事，看它會不會自己走完流程。 結果它自動進了桌（規則真的會自動觸發）→ 發現桌子是舊版本 → 自己補正回最新版 → 做完事 → 交班 → 收桌。全自動、零遺失。那個「萬一桌子是舊的就自我補正」的後備設計，這一刻證明了它是真的後備，不是裝飾。
才上雲備份。 確認本機一切穩了，最後才把整套同步到雲端當備份。雲端，回到它該有的位置。

四個收穫：先上無悔底座再上會變的設計；真實壓測的價值遠大於乾淨測試；換框架有時勝過寫程式；一個被驗證過的可靠後備，勝過一個沒驗證過的聰明最佳化。

常見問題 FAQ

Q：怎麼讓 AI 不要一直附和我、講我愛聽的話？ A：給它一個明確的對立角色，並禁止它用「大致沒問題」收尾。最簡單的就是上面那招——叫它當紅隊攻擊自己剛給的方案。關鍵是人格設定要寫「誠實、可反駁、不准投票了事」，附和的傾向才會被壓下去。

Q：多角色 prompt 是不是開越多越好？ A：不是。角色多到互相吵，過程會極度冗長、很燒成本。重點不在數量，在它們承載的紀律（誠實、自我懷疑、動手驗證）。一個帶著這套紀律的單一 AI，效果一樣到得了——下一篇的誠實尾聲會展開講。

Q：「八步重建」我一定要照順序嗎？ A：順序本身就是重點。先上「不管架構怎麼變都不後悔」的機器底座（安全閘），再蓋會變動的架構設計，最後用真實並行壓測。倒過來做——先設計漂亮架構、最後才補安全——就是我第一版犯的錯。

底座、架構、壓測、框架都到位了。下一篇，把它們收攏成一張圖——最終這套系統長什麼樣，七條你可以直接搬走的原則，還有一個誠實的尾聲。

下一篇：最終的系統、七條可搬走的原則，和一個誠實的尾聲

← 回上一篇：東西其實沒不見——但我的第一版解法，也是錯的

延伸閱讀：思考習慣 Habits of Mind（Costa & Kallick, PDF）　｜　後設認知 Metacognition — BrainFacts　｜　魔鬼代言人與辯證探詢：對抗團體迷思（Lunenburg, PDF）