AGENTS.md — charnorm

Назначение уровня

Сервисная граница charnorm — нормализация характеристик (характеристика-сырьё → канонические значения + единицы) через LLM-gateway. Pre-condition для matching tier 2 + canonical assignment.

Содержание

charnorm/
├── AGENTS.md     # ← вы здесь
└── README.md     # назначение, контракты, зависимости

Ключевые концепции уровня

  • offer_characteristic_raw — input очередь, заполняется ingestion.
  • offer_characteristic_normalized — output, idempotent через inputs_hash.
  • Batch runcmd/charnorm-worker --batch-once, под scheduler.Ticker в prod.
  • LLM gateway abstractioninternal/platform/llm инкапсулирует Anthropic/Gemini/Local через CLIProxy.

Когда смотреть сюда

  • Нужно понять как «текст» характеристики становится {value, unit, range}.
  • Tier 2/3 matching фейлит — посмотреть mapped_pct для проблемной партии.
  • Tuning LLM batch size, prompt, threshold.

Когда НЕ смотреть сюда

  • Сами «правильные» характеристики (canonical) → ../catalog-core/ (canonical_characteristic).
  • Решение «какой canonical product подходит этому offer» → ../matching/.
  • Сборка characteristics из multi-source («mode/latest/trust_weighted» chain) → ../catalog-core/canonical-assignments/.

Связано

  • ../catalog-core/ — нормализованные значения попадают в canonical через assignment chain.
  • ADR-0044 — charnorm architecture.