vor 4 Monaten · 55c951b15e
--- a/README.md
+++ b/README.md
@@ -500,7 +500,7 @@ This is useful for multilingual corpora (e.g. Chinese, Japanese, Korean) where
 
				 
			
 
				 ```sh
			
 
				 # Use Qwen3-Embedding-0.6B for better multilingual (CJK) support
			
 
				-export QMD_EMBED_MODEL="hf:Qwen/Qwen3-Embedding-0.6B-GGUF/qwen3-embedding-0.6b-q8_0.gguf"
			
 
				+export QMD_EMBED_MODEL="hf:Qwen/Qwen3-Embedding-0.6B-GGUF/Qwen3-Embedding-0.6B-Q8_0.gguf"
			
 
				 
			
 
				 # After changing the model, re-embed all collections:
			
 
				 qmd embed -f
			
--- a/src/llm.ts
+++ b/src/llm.ts
@@ -192,7 +192,7 @@ export type RerankDocument = {
 
				 
			
 
				 // HuggingFace model URIs for node-llama-cpp
			
 
				 // Format: hf:<user>/<repo>/<file>
			
 
				-// Override via QMD_EMBED_MODEL env var (e.g. hf:Qwen/Qwen3-Embedding-0.6B-GGUF/qwen3-embedding-0.6b-q8_0.gguf)
			
 
				+// Override via QMD_EMBED_MODEL env var (e.g. hf:Qwen/Qwen3-Embedding-0.6B-GGUF/Qwen3-Embedding-0.6B-Q8_0.gguf)
			
 
				 const DEFAULT_EMBED_MODEL = process.env.QMD_EMBED_MODEL ?? "hf:ggml-org/embeddinggemma-300M-GGUF/embeddinggemma-300M-Q8_0.gguf";
			
 
				 const DEFAULT_RERANK_MODEL = "hf:ggml-org/Qwen3-Reranker-0.6B-Q8_0-GGUF/qwen3-reranker-0.6b-q8_0.gguf";
			
 
				 // const DEFAULT_GENERATE_MODEL = "hf:ggml-org/Qwen3-0.6B-GGUF/Qwen3-0.6B-Q8_0.gguf";