This website works better with JavaScript
首頁
探索
說明
註冊
登入
suby
/
qmd
關注
1
讚好
0
複刻
0
檔案
問題管理
0
合併請求
0
Wiki
目錄樹:
d32e13c172
分支列表
標籤列表
main
oivo
v2.1.0-upstream
v2.1.0
v2.0.1
v2.0.0
v1.1.6
v1.1.5
v1.1.2
v1.1.1
v1.0.7
v1.0.6
v1.0.5
v1.0.0
v0.9.0
提交歷史
查找
作者
SHA1
備註
提交日期
Tobi Lutke
d32e13c172
Add HuggingFace login and comprehensive scoring to GRPO v2 training
4 月之前
Tobi Lutke
0353994e7d
Fix GRPO training script for TRL API compatibility
4 月之前
Tobi Lutke
7cca164dd9
Add query expansion model finetuning infrastructure
4 月之前