意外流出的 AI 寶庫:從 Anthropic 原始碼外洩看 Claude Code 的 5 個驚人內幕
身為工程師,我們常開玩笑說「最危險的漏洞往往是一個漏掉的 .gitignore」,而今年三月中時,Anthropic 不小心把這個笑話化作現實——Claude Code 的原始碼在 npm registry 上「被大家看看光光了」了,這是一場價值數億美元的「打包意外」。
想像一下我們的原始碼是一張極其精密的「藍圖」,為了方便除錯,所以在藍圖上註記了所有機關的結構和啟動密碼(這就是 sourcemap),結果發佈這個產品時,理應只允許使用者使用封裝後的產品,一個不小心卻把整個製作的藍圖讓大家都知道了。
在現代 Web 開發中,sourcemap 檔案原本是為了將壓縮過的混亂代碼還原到原始開發行號,方便除錯;然而,Anthropic 的工程師在使用 Bun 打包工具時,未正確配置排除 .map 檔案,導致包含 2,000 個檔案、50 萬行原始碼被公諸於世。
更令人駭人的是,這場意外發生在 「2026 供應鏈危機」 的風口浪尖——當時 Trivy 才剛發生 GitHub Actions 遭到入侵,axios 也被植入了遠端存取木馬(RAT),一連串的資安危機讓 Anthropic 發言人隨即快速澄清這純屬「人為疏失 (Human Error)」,而非安全性漏洞,但就算代碼已被下架,但其中的技術密碼與備份早就被這個虎視眈眈的網路世界給備份了。
內幕一:我們的終端機裡住著一隻「電子雞」?
身為工程師,我們在枯燥的 Terminal 待得比臥室還久。Anthropic 的開發者顯然深知這點,他們在原始碼中塞進了一個名為 BUDDY 的系統——這是一個類 Tamagotchi(電子雞)的寵物系統。
只要在 Claude Code 中輸入
/buddy,就可以召喚出你的專屬電子寵物!
由於每一種寵物都有各自的屬性與稀有度,有些人會想說透過「重抽」的方式,試圖刷出更喜歡的電子寵物,然後從源代碼裡面可以得知幾件事:
- 混淆術 (Obfuscation):為了躲避字串搜尋,開發然用
String.fromCharCode()數組來隱藏物種名稱。 - 確定性 Gacha 系統:Buddy 品種是根據 User ID 的哈希值計算的(種子值為 friend-2026-401),意味著這隻寵物是獨一無二且固定的。
- 稀有度設定:物種包含 Pebblecrab(卵石蟹)與 Nebulynx(星雲貓)。Nebulynx 稀有度僅 1%,若再加上 1% 的「閃光 (Shiny)」變體機率,抽中 「閃光傳說星雲貓」 的機率是極低的 0.01%。
這些 5 行高、由 ASCII 藝術組成的生物擁有五項屬性:DEBUGGING、PATIENCE、CHAOS、WISDOM 以及我最愛的 SNARK (毒舌度)。這不只是趣味,更展現了頂尖工程師如何在嚴肅工具中注入互動感,減緩開發者的孤獨與壓力。
內幕二:AI 真的會「做夢」來整理記憶
Claude Code 最令人驚艷的工程哲學在於其 autoDream 系統(記憶整合引擎),像是仿生學的設計:AI 也需要「睡眠」來處理短期記憶。
三道觸發閘門: 只有當距離上次做夢 >24 小時、對話數 >5 次且成功獲取「鎖定狀態」時,Claude 才會開始做夢。
做夢的四個階段:
- 定位 (Orient):掃描當前專案與
MEMORY.md。 - 蒐集 (Gather):從當日日誌尋找有價值的訊號。
- 整合 (Consolidate):將新學到的知識寫入長期記憶。
- 修剪 (Prune):這是最關鍵的工程細節。 它將 MEMORY.md 嚴格限制在 200 行或 25KB 以內。
為什麼是 25KB?
因為無限的記憶會導致「注意力偏移 (Attention Drift)」並大幅增加 Token 成本。而 Prune 階段其實是上下文窗口優化 (Context Window Optimization) 的呈現,此時系統提示詞寫道:「你正在進行一場夢境 (You are performing a dream...)」,這讓 AI 具備了將碎片資訊轉化為結構化知識的能力。
內幕三:潛龍諜影?工程師的「臥底模式」
在 utils/undercover.ts 中,隱藏了一個為 Anthropic 員工量身打造的功能:Undercover Mode。
這就像是給 AI 穿上「偽裝服」。當 Anthropic 的工程師(內部識別碼 ant)在公共開源倉庫工作時,AI 會隱藏身分。這就像一個特務在國外執行任務時必須「隱藏口音」——它被禁止使用任何內部開發代號。
透過外洩的代碼,我們得以窺見 Anthropic 的「動物園」代號史:
- Tengu (天狗):Claude Code 的核心內部代碼。
- Capybara (水豚):下一代強大模型的代號。
- Fennec (耳廓狐):這是 Opus 系列最初的代號,後來才遷移至 Opus。
這種做法既展現了公司保護商業秘密的嚴謹,也反映了 AI 在開源社群參與中那種「透明度 vs. 隱私」的糾結。
內幕四:未發表的秘密武器——KAIROS 與 ULTRAPLAN
原始碼披露了兩個足以改變開發範式的隱藏模式:
- KAIROS (主動型助理):它不是「問答機」,而是「觀察者」。它擁有 15 秒的阻礙預算 (Blocking Budget):如果一個主動建議會干擾你超過 15 秒,它會選擇閉嘴。這才是真正的「專業助理」。
- ULTRAPLAN (深度規劃):當本地算力不足以支撐複雜架構時,它會將任務傳送至遠端 Opus 4.6 模型,進行長達 30 分鐘的深度思考,最後透過特殊的 ULTRAPLAN_TELEPORT_LOCAL 標記將結果「傳送」回你的終端。
這預示著 AI 工具正從「被動工具」演進為「主動協作者」。
其中有一個值得深入的技術細節——提示詞手術 (Prompt-shape Surgery)
這是應該可以算是此次外洩代碼中最具價值的工程亮點,Anthropic 發現,在處理超長上下文(如 1M tokens)時,模型常會因為提示詞形狀問題而「早產 (Premature stop)」。
為了修復這個問題,工程師進行了**「提示詞手術」**:在工具輸出結果後強制加入一個 Tool loaded. 的邊界標記。這種人為干預能引導模型正確完成生成流程。這告訴我們,即使模型再強大,在生產環境中仍需要精細的「工程支架」來支撐其穩定性。
內幕五:下一代模型規格與 100 萬上下文
外洩配置中已經為未來的「核彈級」更新做好了準備:
| 模型代號 / 名稱 | 關鍵技術規格 | 內部細節備註 |
|---|---|---|
| Capybara-v2-fast | 支援 1,000,000 Tokens | 專為超長程式碼庫設計。 |
| Opus 4.7 | 旗艦效能 | 已出現對應的 API 參數配置。 |
| Sonnet 4.8 | 高速平衡 | 已預留多項功能閘道 (Feature Gates)。 |
值得注意的是,代碼中還發現了 cyberRiskInstruction.ts,這檔案揭示了 Anthropic 的安全邊界並非全由演算法決定,而是由特定的安全專家團隊治理。這再次提醒我們,安全的核心始終是人。
即使是像 Anthropic 這樣坐擁全球最強安全與 AI 技術的公司,也會因為一個簡單的 .npmignore 疏忽而在「2026 供應鏈危機」中翻車。
這給我們的深刻教訓是:環境即邊界。真正的安全不只是防火牆,而是我們的發布流程與打包設定。
從技術層面看,Claude Code 的原始碼讓我們看到了 AI 工具正從「映射器」進化為「具備性格與長效記憶的實體」。它會「做夢」、會「隱藏身分」,甚至會「毒舌」。
在這場留給外洩給所有工程師的背後,我們應該在繼續思考: 「當 AI 學會了自主整理記憶與主動觀察環境,我們這些人類工程師未來會演變成『代碼編寫者』?還是專注於引導 AI 邏輯的『記憶雕塑師 (Memory Sculptor)』或『上下文策展人 (Context Curator)』?」
