コミット履歴

作者 SHA1 メッセージ 日付
  Tobi Lutke f96766cce8 Fix GRPO model loading to use SFT base first 4 ヶ月 前
  Tobi Lutke f6a6716c44 Refactor evals into separate run and score scripts 4 ヶ月 前