コミット履歴

作者 SHA1 メッセージ 日付
  Tobi Lutke 0353994e7d Fix GRPO training script for TRL API compatibility 4 ヶ月 前
  Tobi Lutke 7cca164dd9 Add query expansion model finetuning infrastructure 4 ヶ月 前