Historial de Commits

Autor SHA1 Mensaje Fecha
  Tobi Lutke 0353994e7d Fix GRPO training script for TRL API compatibility hace 4 meses
  Tobi Lutke 7cca164dd9 Add query expansion model finetuning infrastructure hace 4 meses