用 Paperclip 打造 AI 虛擬公司
用 Paperclip 打造 AI 虛擬公司 — 編譯摘要
濃縮
- AI Agent 協作的核心瓶頸是流程設計,而非模型能力:作者花最多時間的不是調整模型參數,而是回想自己的開發經驗並轉化為每個角色的 AGENTS.md 指令文件。Agent 的能力上限取決於指令的清晰度。
- 三次流程迭代揭示了 AI Agent 協作的設計原則:(1) 瀑布式太慢,改為敏捷式平行推進;(2) 文字線框稿精準度不夠,改為截圖作為 source of truth;(3) CEO 角色的自主調度不可靠,改為人工直接觸發。每次迭代都是「減少 agent 需要自主判斷的空間」。
- 量化評分機制是避免 AI 品質無限來回的關鍵:六維評分系統(版面結構、間距節奏、字型層級、色彩對比、視覺重量、元件保真度)設定明確的通過門檻(平均 3.5 分、無低於 2 分),讓品質判斷從主觀變客觀。
關鍵證據:流程演進——瀑布式全階段等待 → 敏捷式逐頁平行 → 去掉線框稿直接截圖。CEO agent 因自主性不足被繞過。
質疑
- 前提假設:假設「標準化流程」能涵蓋所有模板開發需求。但設計工作本質上有創意判斷的成分,過度標準化可能導致模板風格同質化。
- 邊界條件:六維評分由 QA agent(也是 AI)執行,AI 評 AI 的可靠性未經驗證。若 QA agent 的評分標準不穩定,量化門檻可能形同虛設。
- 反例:文章結論是「不斷迭代指令」,但每次迭代都是人工介入修正方向。如果 agent 能自行發現流程問題並調整(meta-learning),才算真正的自主協作。目前本質上還是人類管理 AI 團隊,而非 AI 自主運作。
- 成本考量:八個 agent 同時運行的 token 消耗被提及但未量化。對小團隊而言,AI agent 團隊的成本是否低於僱用一位兼職設計師,需要具體比較。
對標
- [[康威定律]](Conway’s Law):組織結構決定系統架構。AI agent 公司的團隊編制(CEO/PM/設計師/工程師/QA)直接複製了人類公司的組織結構,但 AI 的協作模式可能需要完全不同的組織設計。CEO 角色的失敗可能正是因為人類組織結構不適用於 AI 團隊。
- [[流程自動化]]的自動化悖論:越是自動化的系統,人工介入時的認知負荷越高。文章中 CEO 失敗後改為人工觸發,反映了這個悖論——部分自動化可能比全自動化更實際。
- [[品質量化]]與軟體測試:六維評分系統類似軟體工程中的 code review checklist 或 Definition of Done,將隱性標準顯性化。與 [[AI 幻覺防治]] 中「用結構化 prompt 約束 AI 行為」的策略異曲同工。
關聯概念
- [[AI Agent 協作]]
- [[流程自動化]]
- [[人機協作工作流]]
- [[品質量化]]
- [[敏捷開發]]
- [[康威定律]]