This website works better with JavaScript
首页
发现
帮助
注册
登录
suby
/
qmd
关注
1
点赞
0
派生
0
文件
工单管理
0
合并请求
0
Wiki
目录树:
d32e13c172
分支列表
标签列表
main
oivo
v2.1.0-upstream
v2.1.0
v2.0.1
v2.0.0
v1.1.6
v1.1.5
v1.1.2
v1.1.1
v1.0.7
v1.0.6
v1.0.5
v1.0.0
v0.9.0
提交历史
查找
作者
SHA1
备注
提交日期
Tobi Lutke
d32e13c172
Add HuggingFace login and comprehensive scoring to GRPO v2 training
4 月之前
Tobi Lutke
0353994e7d
Fix GRPO training script for TRL API compatibility
4 月之前
Tobi Lutke
7cca164dd9
Add query expansion model finetuning infrastructure
4 月之前