Commit History

Автор SHA1 Съобщение Дата
  Tobi Lütke bf1b8fc90a lots of training stuff преди 3 месеца
  Tobi Lutke 7de18ee066 Merge main into finetune преди 3 месеца
  Tobi Lutke 785620467a refactor: reorder output format to put hyde line first преди 3 месеца
  Tobi Lütke 46ff098361 Change only: format to only:lex (no space after colon) преди 3 месеца
  Tobias Lütke eb1b77c8cb Deploy fine-tuned GRPO model as default query expansion (#67) преди 3 месеца
  Tobi Lutke 32706a720f Refactor finetune folder: train/rl scripts with YAML configs преди 4 месеца