Historial de Commits

Autor SHA1 Mensaje Fecha
  Tobi Lutke 6062dc769f Add named entity extraction to GRPO reward function hace 4 meses
  Tobi Lutke 32706a720f Refactor finetune folder: train/rl scripts with YAML configs hace 4 meses