suby/qmd

Autor	SHA1 Zpráva	Datum
Tobias Lütke	55c951b15e Merge pull request #349 from byheaven/fix/qwen3-embedding-model-filename-case	před 2 měsíci
Tobi Lutke	55f16460d0 fix(ci): guard LLM calls in CI and increase test timeouts	před 2 měsíci
Tobi Lutke	c68904fe08 refactor: move CLI and MCP to subdirectories, MCP consumes SDK	před 2 měsíci
YuBai	740b17b485 docs: fix Qwen3-Embedding GGUF filename case in README and llm.ts	před 2 měsíci
Tobi Lutke	ad38c1f698 feat: add intent parameter for query disambiguation	před 2 měsíci
Tobi Lutke	e3549dab1a perf(rerank): cap parallelism, deduplicate chunks, cache by content	před 2 měsíci
Tobias Lütke	7904ab9a9d Merge pull request #273 from daocoding/feature/configurable-embed-model	před 2 měsíci
Tobias Lütke	ee08997f23 Merge pull request #313 from 0xble/fix/expand-context-size-config	před 2 měsíci
Brian Le	0dec1df047 fix(llm): make expansion context size configurable	před 2 měsíci
Gilad S.	3095041e0f feat: use `build: "autoAttempt"` on `getLlama`	před 2 měsíci
Big (daocoding)	b71649b12d feat: add QMD_EMBED_MODEL env var for multilingual embedding support	před 2 měsíci
Tobi Lütke	5233e676d9 fix(rerank): truncate documents exceeding 2048-token context size	před 3 měsíci
Tobias Lütke	67e2aab18c Merge pull request #206 from tobi/liquidai-query-expansion	před 3 měsíci
Tobi Lütke	57f7caa93b feat: add LiquidAI LFM2 support for query expansion	před 3 měsíci
Tobi Lutke	09803a75b7 feat: compile to JS for npm, release system, full changelog	před 3 měsíci
Tobi Lütke	392934e78a perf: CPU parallelism via multi-context thread splitting	před 3 měsíci
Tobi Lütke	0a941c442f perf: flash attention, right-sized contexts, cleaner GPU detection	před 3 měsíci
Tobi Lütke	4ac95b5e26 perf: adaptive parallel contexts for embed + rerank, fix VRAM waste	před 3 měsíci
Tobi Lütke	0a0e1e6f29 perf: parallel reranking with multiple contexts (2.7x speedup)	před 3 měsíci
Tobi Lütke	ee86bba45e feat: auto-detect GPU acceleration + device info in status	před 3 měsíci
Tobi Lütke	102ff861d3 fix: use Qwen3 recommended sampling params to prevent repetition loops	před 3 měsíci
Tobi Lütke	479b68bbf1 add qmd model pull and refresh logic	před 3 měsíci
Tobi Lutke	7de18ee066 Merge main into finetune	před 3 měsíci
Tobi Lutke	785620467a refactor: reorder output format to put hyde line first	před 3 měsíci
Tobi Lütke	32d313ad6b Add LLM session management for lifecycle safety	před 3 měsíci
Christopher Jones	6d9871d2f5 Fix DisposedError during slow batch embedding (#41)	před 3 měsíci
Tobias Lütke	eb1b77c8cb Deploy fine-tuned GRPO model as default query expansion (#67)	před 3 měsíci
Tobi Lutke	8572c2fd94 Deploy fine-tuned GRPO model as default for query expansion	před 3 měsíci
Freeman Jiang	bfb0eebc3e fix: use sequential embedding on CPU-only systems to avoid race condition (#54)	před 3 měsíci
Sergey Gavrilyuk	bebee61bec Fix case sensitivity in Qwen3-1.7B model filename	před 4 měsíci

Novější Starší

Historie revizí Hledat

Historie revizí