Commit History

Автор SHA1 Съобщение Дата
  Tobi Lutke 0353994e7d Fix GRPO training script for TRL API compatibility преди 4 месеца
  Tobi Lutke 7cca164dd9 Add query expansion model finetuning infrastructure преди 4 месеца