用 Paperclip 打造 AI 虛擬公司

編譯摘要 2026/4/17

用 Paperclip 打造 AI 虛擬公司 — 編譯摘要

濃縮

AI Agent 協作的核心瓶頸是流程設計，而非模型能力：作者花最多時間的不是調整模型參數，而是回想自己的開發經驗並轉化為每個角色的 AGENTS.md 指令文件。Agent 的能力上限取決於指令的清晰度。
三次流程迭代揭示了 AI Agent 協作的設計原則：(1) 瀑布式太慢，改為敏捷式平行推進；(2) 文字線框稿精準度不夠，改為截圖作為 source of truth；(3) CEO 角色的自主調度不可靠，改為人工直接觸發。每次迭代都是「減少 agent 需要自主判斷的空間」。
量化評分機制是避免 AI 品質無限來回的關鍵：六維評分系統（版面結構、間距節奏、字型層級、色彩對比、視覺重量、元件保真度）設定明確的通過門檻（平均 3.5 分、無低於 2 分），讓品質判斷從主觀變客觀。

關鍵證據：流程演進——瀑布式全階段等待 → 敏捷式逐頁平行 → 去掉線框稿直接截圖。CEO agent 因自主性不足被繞過。

質疑

前提假設：假設「標準化流程」能涵蓋所有模板開發需求。但設計工作本質上有創意判斷的成分，過度標準化可能導致模板風格同質化。
邊界條件：六維評分由 QA agent（也是 AI）執行，AI 評 AI 的可靠性未經驗證。若 QA agent 的評分標準不穩定，量化門檻可能形同虛設。
反例：文章結論是「不斷迭代指令」，但每次迭代都是人工介入修正方向。如果 agent 能自行發現流程問題並調整（meta-learning），才算真正的自主協作。目前本質上還是人類管理 AI 團隊，而非 AI 自主運作。
成本考量：八個 agent 同時運行的 token 消耗被提及但未量化。對小團隊而言，AI agent 團隊的成本是否低於僱用一位兼職設計師，需要具體比較。

對標

[[康威定律]]（Conway’s Law）：組織結構決定系統架構。AI agent 公司的團隊編制（CEO/PM/設計師/工程師/QA）直接複製了人類公司的組織結構，但 AI 的協作模式可能需要完全不同的組織設計。CEO 角色的失敗可能正是因為人類組織結構不適用於 AI 團隊。
[[流程自動化]]的自動化悖論：越是自動化的系統，人工介入時的認知負荷越高。文章中 CEO 失敗後改為人工觸發，反映了這個悖論——部分自動化可能比全自動化更實際。
[[品質量化]]與軟體測試：六維評分系統類似軟體工程中的 code review checklist 或 Definition of Done，將隱性標準顯性化。與 [[AI 幻覺防治]] 中「用結構化 prompt 約束 AI 行為」的策略異曲同工。

關聯概念

[[AI Agent 協作]]
[[流程自動化]]
[[人機協作工作流]]
[[品質量化]]
[[敏捷開發]]
[[康威定律]]