品質評分機制

概念

品質評分機制

定義

在 Skill 中定義量化的品質標準,讓 AI 在完成任務後自我評估產出品質。包含兩種形式:(1) 寫作品質的多維度評分(直接性、節奏、信任度、真實性、精煉度各 10 分),(2) 程式碼審查的嚴重程度分級(CRITICAL/HIGH/MEDIUM/LOW)搭配信心度門檻(> 80%)。

關鍵數據點(附來源)

  • 寫作評分五維度各 10 分,加上 11 項交付前檢查清單(來源:寫作 Skill 文章)
  • 程式碼審查四級嚴重度 + 80% 信心度門檻 + 同類問題合併(來源:Payload CMS 文章)
  • 不分級的 checklist 等於沒有 checklist——開發者不知道哪些問題要優先處理(來源:Payload CMS 文章)

前提與局限性

  • AI 的自我評分 calibration 可能不準確——給自己打高分不代表品質真的好
  • 80% 信心度門檻是任意設定,可能漏掉低信心度但真正危險的問題
  • 量化評分可能產生「通過所有 checklist = 品質好」的虛假信心

衝突標記

無明確衝突。

關聯概念

  • [[Claude Code Skill 系統]]
  • [[AI 輔助寫作流程]]
  • [[AI 程式碼審查]]