Историја ревизија

Аутор SHA1 Порука Датум
  Tobi Lutke f96766cce8 Fix GRPO model loading to use SFT base first пре 4 месеци
  Tobi Lutke f6a6716c44 Refactor evals into separate run and score scripts пре 4 месеци
  Tobi Lutke 6062dc769f Add named entity extraction to GRPO reward function пре 4 месеци
  Tobi Lutke 994a094546 Update README with final evaluation results пре 4 месеци
  Tobi Lutke 7cca164dd9 Add query expansion model finetuning infrastructure пре 4 месеци