unhardcoded
參考 · 格式

policy_ir

單次模型呼叫的路由語言:六元素 sigma-pol/v2 項(term)。

單次模型呼叫的路由語言。策略(policy)是一個六元素 JSON 陣列:標籤加上五個操作槽位:filter、rank、select、mutate、fallback。您編寫 filter、rank 與 select;mutate 和 fallback 有穩定的預設值。

policy.support.json
[
  "policy",
  ["and", ["meets_req"],                                 // filter
         ["not", ["is", "disabled"]],
         ["has_cap", "supports_tools"],
         ["cmp", "bench_intelligence", "ge", 0.5]],
  ["neg", ["normalize", ["field", "price_out"]]],     // rank: cheapest first
  ["argmax"],                                            // select: top survivor
  ["id"],                                                // mutate: pass through
  ["always", { "action": "next_candidate" }]            // fallback: next survivor
]

五個槽位

filter/rank/select 沒有外層包裹關鍵字。標籤加五個槽位,完全由陣列位置決定。(sigma-pol/v2 移除了舊版的 evidence 槽位;該槽位從未影響過任何決策。)

1 · "policy"
標籤。標記語法版本 sigma-pol/v2
2 · filter Pred
入口門控:決定哪些候選模型具備參與資格。由純謂詞(predicate)構成。未通過的模型直接排除,不會被靜默降級。策略只能收窄託管方的底線,不能放寬。
3 · rank Scorer
對通過篩選的候選模型評分排序。純評分器對通過底線的模型排序:用 ["neg", ["normalize", ["field", "price_out"]]] 實現成本優先(最低價在前),亦可依 intelligence、延遲或任意加權組合排序。
4 · select Selector
從排序清單中取出得分最高的候選模型。argmax 選取得分最高的存活者;僅當評分器依價格排序時,選中的才是成本較低的模型。
5 · mutate Xform
id 為恆等轉換:提示詞與參數原樣傳遞;路由只替換模型,不修改您的呼叫內容。
6 · fallback FailPlan
基於封閉動作詞彙表的宣告式表格,而非使用者程式碼。任何失敗時移至下一候選模型;每次跳轉均寫入追蹤紀錄。
← 返回文件