品質評分機制

概念 2026/4/17

品質評分機制

定義

在 Skill 中定義量化的品質標準，讓 AI 在完成任務後自我評估產出品質。包含兩種形式：(1) 寫作品質的多維度評分（直接性、節奏、信任度、真實性、精煉度各 10 分），(2) 程式碼審查的嚴重程度分級（CRITICAL/HIGH/MEDIUM/LOW）搭配信心度門檻（> 80%）。

關鍵數據點（附來源）

寫作評分五維度各 10 分，加上 11 項交付前檢查清單（來源：寫作 Skill 文章）
程式碼審查四級嚴重度 + 80% 信心度門檻 + 同類問題合併（來源：Payload CMS 文章）
不分級的 checklist 等於沒有 checklist——開發者不知道哪些問題要優先處理（來源：Payload CMS 文章）

前提與局限性

AI 的自我評分 calibration 可能不準確——給自己打高分不代表品質真的好
80% 信心度門檻是任意設定，可能漏掉低信心度但真正危險的問題
量化評分可能產生「通過所有 checklist = 品質好」的虛假信心

衝突標記

無明確衝突。

關聯概念

[[Claude Code Skill 系統]]
[[AI 輔助寫作流程]]
[[AI 程式碼審查]]