트레이스(실행 추적) & 재현
트레이스 스키마, 재현이 결정을 재현하는 방법, 그리고 적합성 보장.
트레이스 스키마
모든 완료 응답에는 트레이스(실행 추적)가 포함됩니다. 이는 모델이 어떻게 선택되었는지에 대한 구조화되고 재현 가능한 기록입니다. 증명 객체로서, 어떤 모델이 검토되었는지, 각각이 왜 통과하거나 실패했는지, 무엇이 사용되었는지, 그리고 어떻게 재현하는지를 담고 있습니다.
deepseek-v4-flashrejected · cmp bench_intelligence ge 0.5
minimax-m2.7rejected · cmp bench_intelligence ge 0.5
deepseek-v4-proranked #1 · chosen
glm-5.1ranked #2 · cascade
gpt-5.5ranked #3 · cascade
deepseek-v4-prodecision_path · attempted · 412 ms
policy_fingerprint 301140696-1054914287 · sigma-pol/v2
policy_fingerprint
정규화된 정책의 저렴한 캐시 키로,
301140696-1054914287과 같이 두 개의 십진수 레인으로 구성됩니다. 동일한 항(term)은 동일한 지문(fingerprint)을 공유합니다. 완전한 식별자는 호스트 측 정규 인코딩의 sha256입니다.chosen
호출을 처리한 모델의
{ model_family, served_model_id, price_in, price_out }.ranked[]
선택 순서대로 정렬된 통과 모델들:
{ provider, model_family, served_model_id, tier, price_out, score }. 첫 번째가 선택된 모델이며, 나머지는 캐스케이드입니다.rejected[]
탈락 규칙과 함께 필터링된 각 후보 모델:
{ model_family, reason }, 예: cmp bench_intelligence ge 0.5.decision_path[]
순서가 있는 시도 로그:
{ event, provider_id, attempt, latency_ms, error_kind? }. 모든 폴백 전환은 여기에 attempted 항목으로 기록됩니다.total_latency_ms
총 라우팅 + 추론 시간. 워크플로우는 대신
flow_fingerprint와 flow_nodes[]를 반환하며, 노드마다 하나의 트레이스가 있습니다.재현. 식별자는 정책의 정규 인코딩의 sha256이므로, 트레이스와 카탈로그 스냅샷이 주어지면 동일한 정책과 입력이 호스트 또는 자신의 머신에서 동일한 결정을 재현합니다.
적합성
정책은 어디서 실행되든 동일한 의미를 가져야 합니다. 정규 인코딩, sha256 식별자, 참조 인터프리터, 그리고 공유된 골든 벡터 집합이 이를 보장합니다.
same policy = same inputs = same catalog = same seed = same result. 시맨틱은 올바르게 반올림된 산술만 사용하므로, 적합한 호스트는 골든 벡터(tests/golden/sigma_pol_v2.json, engine 저장소)를 재현하여 모든 결정을 비트 단위로 재현합니다. 동일한 항(term)은 동일한 바이트로 인코딩되므로 호스트 간에 하나의 sha256 식별자를 공유합니다.