品質評分機制
品質評分機制
定義
在 Skill 中定義量化的品質標準,讓 AI 在完成任務後自我評估產出品質。包含兩種形式:(1) 寫作品質的多維度評分(直接性、節奏、信任度、真實性、精煉度各 10 分),(2) 程式碼審查的嚴重程度分級(CRITICAL/HIGH/MEDIUM/LOW)搭配信心度門檻(> 80%)。
關鍵數據點(附來源)
- 寫作評分五維度各 10 分,加上 11 項交付前檢查清單(來源:寫作 Skill 文章)
- 程式碼審查四級嚴重度 + 80% 信心度門檻 + 同類問題合併(來源:Payload CMS 文章)
- 不分級的 checklist 等於沒有 checklist——開發者不知道哪些問題要優先處理(來源:Payload CMS 文章)
前提與局限性
- AI 的自我評分 calibration 可能不準確——給自己打高分不代表品質真的好
- 80% 信心度門檻是任意設定,可能漏掉低信心度但真正危險的問題
- 量化評分可能產生「通過所有 checklist = 品質好」的虛假信心
衝突標記
無明確衝突。
關聯概念
- [[Claude Code Skill 系統]]
- [[AI 輔助寫作流程]]
- [[AI 程式碼審查]]