AI 代理介面選擇框架

概念

AI 代理介面選擇框架

定義

將 AI 代理(agent)連接到外部系統時的介面決策框架。核心變數不是「哪個技術好」,而是「AI 的自主程度」——介面選擇必須匹配你願意讓 AI 自主操作的範圍。三條軸線決定選擇:自主程度、信任邊界、可觀測性。

關鍵數據點(附來源)

  • 三層分配(來源:WordPress AI 代理文章):
    • 內容與商業邏輯(發文、SEO、商品上架、訂單回應)→ MCP,AI 直接操作
    • 設定變更(外掛、佈景主題、權限)→ MCP,需人類確認步驟
    • 主機層維運(部署、備份、漏洞修補)→ SSH,人類駕駛
  • 介面與自主程度的對應(來源:WordPress AI 代理文章):
    • 完全自主多步驟 → MCP
    • 半自主、需人類審查每步 → REST API 加薄封裝
    • 人類駕駛、AI 副駕 → SSH 加命令列
  • 自寫 MCP 伺服器約 200-400 行程式碼能涵蓋多數場景(來源:WordPress AI 代理文章)

三個核心判斷維度

1. 自主程度(核心問題)

流程是否需要 AI 自主判斷下一步?

  • 需要 → 任務導向介面(MCP),把多步驟編排藏在伺服器端
  • 不需要 → 增刪查改介面(REST API)或命令列(適合固定排程腳本)

2. 信任邊界

憑證的存放位置決定攻擊面:

  • REST API:AI 持有應用程式密碼 / 登入權杖,憑證進入對話脈絡
  • MCP:憑證留在伺服器端,AI 只持有短期通行證,伺服器端可做白名單、流量限制、人類確認、回傳結果過濾
  • SSH:等於整台機器的 root 鑰匙,作業系統層完全暴露

3. 可觀測性

失敗後能不能追?

  • MCP / REST API:應用層,每個呼叫可進錯誤監控系統、可結構化記錄、可接審查機制
  • SSH:黑盒,應用層觀測系統打不到,要靠系統操作紀錄或自己包一層日誌

前提與局限性

  • 資源前提:「自寫 MCP 伺服器」假設讀者有 200-400 行程式碼能力。沒有開發資源的客戶只能退回 REST API 加薄封裝
  • 場景前提:分界線針對「全自主 AI 代理」場景。如果是「人類駕駛、AI 副駕」(每步審查),REST API 跟 SSH 的劣勢大幅縮減
  • 平台前提:託管型 WordPress(WordPress.com、WP Engine)沒有 SSH,框架只剩 MCP vs REST API 二選一
  • 時間前提:MCP 生態系還在成長中(2026 年),WordPress 沒有業界標準的 MCP 伺服器,自寫是預設選項;兩年後可能改變
  • 模型前提:「WP-CLI 失敗率比想像高」跟模型版本相關,隨模型能力提升此結論可能弱化

衝突標記

  • 與 [[MCP 外部工具整合]] 中既有的「SSH 文章認為 MCP 太受限」觀點看似衝突,實則互補:差別在誰在駕駛——人類駕駛時 SSH 是工具加倍器,AI 自主時 SSH 是核彈級風險

跨域類比

  • 人機介面設計史:CLI(工程師)、GUI(一般使用者)、語音(對話式)的設計演進。MCP 之於 AI,等於 GUI 之於人類——介面要匹配使用者的認知模式
  • 銀行櫃員與金庫管理員的分權:櫃員(MCP)只能執行特定操作、留稽核紀錄;金庫管理員(人類駕駛 SSH)才有 root 權限。最小權限原則跑了一百年,AI 業界才剛開始學
  • 醫療院所角色分層:護理師、醫師、外科醫師的自主範圍被嚴格定義,越權操作有法律後果。AI 代理是「新角色」,自主範圍該怎麼定義是同類問題

關聯概念

  • [[MCP 外部工具整合]]
  • [[開發工具鏈整合]]
  • [[AI 工具選擇策略]]
  • [[wordpress-外掛開發實踐]]