Revīziju vēsture

Autors SHA1 Ziņojums Datums
  Tobi Lütke 189916d6fb Move GRPO training out of default finetune pipeline 3 mēneši atpakaļ