我給 AI 裝上三個會吵架的腦袋,然後一步步重建(多分身工作法 3/4)
上一篇:東西其實沒不見——但我的第一版解法,也是錯的。五個看似合理的錯被攤開之後,問題還在:怎麼走出來?
轉折:我給 AI 裝上三個會吵架的腦袋
走出來的轉折,不是某個聰明的技術,是我改變了「怎麼跟 AI 一起想」。
我給它設了三個常駐角色,請它用三種身份同時審視同一件事:一個負責「這個工具實際上到底會怎麼動」、一個負責「流程紀律有沒有破口」、一個負責「動手實作、寫測試、抓 bug」。
關鍵不在角色名稱,在我給它們的人格設定:誠實、可以彼此反駁、不准用投票草草了事。
這三條不是隨手定的。它對應到一個在重大決策研究裡反覆被驗證的東西——對抗「團體迷思」(groupthink)的刻意異議機制:
- 魔鬼代言人 / 紅隊:指定有人專門去攻擊「大家都同意的那個方案」,把弱點逼出來。古巴飛彈危機時,甘迺迪刻意指派他弟弟去扮演唱反調的角色,逼出了更穩的決策。
- 不准投票:團體迷思最愛「那就表決一下吧」——多數決會把少數人的正確顧慮直接輾過去。我要的是把分歧攤開來解,不是表決掉。
換句話說,我不是給 AI 加了三個幫手,是在它內部裝了一套反團體迷思的免疫系統。
怎麼讓 AI 不要一直附和你?讓它當紅隊
具體怎麼操作?最簡單的入手點,是叫它對自己剛給的方案發動攻擊。
【實際操作】把 AI 從「附和」切換成「紅隊」
你這樣說:「先別管我同不同意。請你扮演紅隊,專門攻擊你剛剛這個方案——找出三個它最可能失敗的地方,每個都說清楚『在什麼情況下會炸』。不准用『大致沒問題』收尾。」
它大概會這樣回(示意):「紅隊觀點,三個失敗點:①這個方案假設同步一定成功,但若中途斷線,會留下半套狀態;②我沒驗證過攔截器在背景程序也生效,這是未測假設;③它只擋得住 A 寫法,B 寫法可繞過。」
▶ 你要檢視什麼: 看它有沒有真的攻擊「自己」的方案,還是偷偷攻擊一個稻草人。重點在第②點那種「我沒驗證過」——一個願意標出自身假設的回答,才是真紅隊;如果它三點都在誇方案多周全,它還在附和你,重下一次。
你接著這樣回:「第②點正中要害。在我們繼續之前,先去真實環境跑一次,親眼確認攔截器在背景程序有沒有生效,再回報。」
它到底改變了什麼
它不是魔法。它改變的不是「AI 突然變聰明」,而是它的工作姿態,具體有三件事:
一、它開始誠實認錯,而不是辯護。 以前我指出問題,它傾向解釋「為什麼我這樣做也有道理」。裝上「誠實+可反駁」之後,它會直接說:「你說得對,那個攔截器我沒驗證過、它有破口。」從辯護到認錯,這一個轉變,就讓前面那五個錯一個個浮出水面。錯誤能被看見,才可能被修。
二、它開始把取捨攤開,而不是給我一個漂亮答案。 例如「每個分身是不是一律都要進自己的桌子」這個決定,它不再直接下結論,而是把兩種做法的成本算給我看——算到一半,它推翻了自己原本的傾向。一個願意推翻自己的 AI,比一個嘴硬的 AI 有用一百倍。
三、它開始用一套可檢查的思考習慣,而不是憑感覺。 這套習慣不是我發明的,是一個叫「思考習慣」(Habits of Mind)的東西——一組可以刻意練習的思考傾向。我借了其中三個,每一個都當場抓到一個盲點:
- 後設認知(知道自己哪裡不知道)→ 逼它在每個結論旁邊標註「這條我還沒驗證」。光這一條,就抓出了前面那種「以為做好了」。
- 可驗證性(這東西怎樣才算被測過)→ 逼它「跑過真實情境才算數」,戳破乾淨實驗室的假象。
- 問對問題(先確認真正要解的是什麼)→ 把焦點從雲端硬拉回本機並發。
但最大的槓桿,其實是我自己
我得老實說:上面這些角色和思考習慣很有用,但真正的關鍵轉折,幾乎每一個都是我親手反問出來的——「不就是本機在搶檔嗎」「雲端只是備份吧」「這個一律進,到底划不划算」。
三個角色加思考習慣的價值,是讓 AI 對我的反問誠實回應、把代價攤在桌上;正解的來源,仍然是「問對問題」和「真的去測」。
別把多角色和思考框架當成會自己長出答案的魔法。它們是「紀律的容器」——讓誠實、自我懷疑、動手驗證變成預設姿態。一個願意這樣做的人(哪怕只配一個 AI),效果一樣到得了。而你願不願意反問它,才是整個系統裡槓桿最大的那根。
怎麼重建?八個你能照著走的里程碑
直接給你順序,順序本身就是一課:先上「不管最後架構長怎樣都不會後悔」的底座,再蓋架構,再用真實並行去壓測,最後換個框架收斂。
- 先上無悔的「機器底座」。 在動任何聰明設計之前,先補三道機器攔截:動作要「撕掉重貼」之前、桌面有沒存檔的東西就直接拒絕(這正是當初若有它、災難就不會發生的那道閘);系統卡在半路時,拒絕你存檔或上傳;同步失敗時,主動寫一張告警。最後把闖禍的舊腳本退役。解的是:把「靠自律」變成「機器強制」,把「失效沒人知道」變成「失效會自己舉手」。
- 把架構設計出來,寫成正本文件。 一句話模型:每個分身=一位工程師。套用軟體業管理幾十人大專案的成熟紀律——神聖的正本(沒人能直接動)+每個分身一條自己的分支和一張自己的桌子+定期同步+合併要過關。
- 把「交班」寫成一個腳本。 分身做完事,跑交班腳本,把成果有把關地併回正本:撞到衝突就停手、不無聲覆蓋;還上一把鎖,避免兩個分身同時交班撞在一起。
- 開兩個真的分身,故意製造衝突,壓測它。 我開兩個分身去改同一份檔的同一行:隔離成功、第一個乾淨併回、第二個撞上衝突時被當場攔下(不是無聲覆蓋)、AI 依當下情境把兩邊修改都保留、收尾。那場最初的災難,這次被擋住了。這次真實壓測也照出了乾淨實驗室照不到的坑。
- 換一個框架——這一步沒寫半行程式,卻最關鍵。 我停止繞著雲端打轉,重新定義:雲端只是備份;我這台電腦上的正本,才是真相。打架發生在本機的交班那一刻,不在上傳那一刻;衝突要在本機解乾淨了,才上雲。有時候最大的進展,是換一個對的框架,而不是多寫程式。
- 把規則簡化成「一律進桌」。 我本來糾結「要不要判斷這個分身會不會寫檔,再決定它進不進桌」。後來想通:反正我開工作介面進來的,幾乎都是要寫東西的任務。那就別判斷了,一律進桌,邏輯最簡單、也最不會漏。
- 開一個全新分身,故意不告訴它任何事,看它會不會自己走完流程。 結果它自動進了桌(規則真的會自動觸發)→ 發現桌子是舊版本 → 自己補正回最新版 → 做完事 → 交班 → 收桌。全自動、零遺失。那個「萬一桌子是舊的就自我補正」的後備設計,這一刻證明了它是真的後備,不是裝飾。
- 才上雲備份。 確認本機一切穩了,最後才把整套同步到雲端當備份。雲端,回到它該有的位置。
四個收穫:先上無悔底座再上會變的設計;真實壓測的價值遠大於乾淨測試;換框架有時勝過寫程式;一個被驗證過的可靠後備,勝過一個沒驗證過的聰明最佳化。
常見問題 FAQ
Q:怎麼讓 AI 不要一直附和我、講我愛聽的話? A:給它一個明確的對立角色,並禁止它用「大致沒問題」收尾。最簡單的就是上面那招——叫它當紅隊攻擊自己剛給的方案。關鍵是人格設定要寫「誠實、可反駁、不准投票了事」,附和的傾向才會被壓下去。
Q:多角色 prompt 是不是開越多越好? A:不是。角色多到互相吵,過程會極度冗長、很燒成本。重點不在數量,在它們承載的紀律(誠實、自我懷疑、動手驗證)。一個帶著這套紀律的單一 AI,效果一樣到得了——下一篇的誠實尾聲會展開講。
Q:「八步重建」我一定要照順序嗎? A:順序本身就是重點。先上「不管架構怎麼變都不後悔」的機器底座(安全閘),再蓋會變動的架構設計,最後用真實並行壓測。倒過來做——先設計漂亮架構、最後才補安全——就是我第一版犯的錯。
下一篇
底座、架構、壓測、框架都到位了。下一篇,把它們收攏成一張圖——最終這套系統長什麼樣,七條你可以直接搬走的原則,還有一個誠實的尾聲。
← 回上一篇:東西其實沒不見——但我的第一版解法,也是錯的
延伸閱讀:思考習慣 Habits of Mind(Costa & Kallick, PDF) | 後設認知 Metacognition — BrainFacts | 魔鬼代言人與辯證探詢:對抗團體迷思(Lunenburg, PDF)