This website works better with JavaScript
首頁
探索
說明
註冊
登入
suby
/
qmd
關注
1
讚好
0
複刻
0
檔案
問題管理
0
合併請求
0
Wiki
目錄樹:
2648512b7c
分支列表
標籤列表
main
oivo
v2.1.0-upstream
v2.1.0
v2.0.1
v2.0.0
v1.1.6
v1.1.5
v1.1.2
v1.1.1
v1.0.7
v1.0.6
v1.0.5
v1.0.0
v0.9.0
提交歷史
查找
作者
SHA1
備註
提交日期
Tobi Lutke
f96766cce8
Fix GRPO model loading to use SFT base first
4 月之前
Tobi Lutke
f6a6716c44
Refactor evals into separate run and score scripts
4 月之前
Tobi Lutke
6062dc769f
Add named entity extraction to GRPO reward function
4 月之前
Tobi Lutke
994a094546
Update README with final evaluation results
4 月之前
Tobi Lutke
7cca164dd9
Add query expansion model finetuning infrastructure
4 月之前