品質量化
品質量化
定義
將主觀的品質判斷轉化為可量測的數值指標,設定明確的通過門檻,避免品質審查陷入無限來回。
案例:六維評分系統
Paperclip AI 虛擬公司中,QA agent 使用六維評分來判斷前端產出品質:
| 維度 | 評估內容 |
|---|---|
| 版面結構 | 區塊排列是否與參考一致 |
| 間距節奏 | 元素間的留白比例 |
| 字型層級 | 標題/內文/標註的字型大小層級 |
| 色彩對比 | 色彩搭配與可讀性 |
| 視覺重量 | 頁面視覺重心的分佈 |
| 元件保真度 | 元件細節與參考截圖的吻合度 |
通過標準:平均分 >= 3.5 且無任何維度低於 2 分。
設計原則
- 維度要具體、可觀測(避免「好看」這類模糊指標)
- 門檻要明確(數字門檻而非主觀判斷)
- 未通過時需附帶具體改善建議
延伸:量化不是唯一解
當我們把 8 支 WordPress SEO 外掛攤開比對時,會發現「品質要不要量化」本身就是設計選擇(詳見 [[評分系統設計哲學]]):
- 分數派(Yoast、Rank Math 等):信「明確門檻避免無限拉扯」
- 清單派(Slim SEO、SureRank):信「作者該專注本質,分數會扭曲行為」
- 色塊派(Xagio):綠/黃通過與否,不追求精確數字
三派對應管理學的 KPI / OKR / Traffic Light Reporting,同構關係說明「SEO 量化」其實是管理哲學問題,不是技術問題。分數派在「要避免爭論」時有用,清單派在「要避免被指標綁架」時有用。
關聯
- [[AI Agent 協作]] — 量化標準是 agent 間品質交接的基礎
- [[AI 幻覺防治]] — 量化驗證可偵測 AI 產出的偏差
- [[敏捷開發]] — 類似 Definition of Done 的概念
- [[評分系統設計哲學]] — 量化的三種路線選擇
- [[品質評分機制]] — Skill 內部的分數派實作