Lịch sử commit

Tác giả SHA1 Thông báo Ngày
  Tobi Lutke d32e13c172 Add HuggingFace login and comprehensive scoring to GRPO v2 training 4 tháng trước cách đây
  Tobi Lutke 0353994e7d Fix GRPO training script for TRL API compatibility 4 tháng trước cách đây
  Tobi Lutke 7cca164dd9 Add query expansion model finetuning infrastructure 4 tháng trước cách đây