Historial de Commits

Autor SHA1 Mensaje Fecha
  Tobi Lutke f96766cce8 Fix GRPO model loading to use SFT base first hace 4 meses
  Tobi Lutke f6a6716c44 Refactor evals into separate run and score scripts hace 4 meses
  Tobi Lutke 6062dc769f Add named entity extraction to GRPO reward function hace 4 meses
  Tobi Lutke 994a094546 Update README with final evaluation results hace 4 meses
  Tobi Lutke 7cca164dd9 Add query expansion model finetuning infrastructure hace 4 meses