Historie revizí

Autor SHA1 Zpráva Datum
  Tobi Lutke 0353994e7d Fix GRPO training script for TRL API compatibility před 4 měsíci
  Tobi Lutke 7cca164dd9 Add query expansion model finetuning infrastructure před 4 měsíci