25-09-12 09:52 微博认证:HuggingFace官方微博

📱 手机也能跑的 SOTA 向量模型来了!谷歌正式发布 EmbeddingGemma 🚀
它仅有 3.08 亿参数,量化后内存不到 200MB,却能支持 100+ 语言,并在 MTEB 榜单上斩获 500M 以下最佳成绩 🏆。

✨ 模型亮点:
轻量高效:适合手机和边缘设备本地部署
长上下文:支持 2K Token 输入,完美适配 RAG 和智能体
灵活维度:支持 MRL,可按需压缩向量至 512/256/128 维
开源生态:兼容 Sentence Transformers、LangChain、LlamaIndex、Haystack、txtai、Transformers.js、TEI、ONNX 等主流框架

🔬 实测中,EmbeddingGemma 在医学文献检索任务中,微调后甚至超过了参数量翻倍的模型!这意味着无论是搜索、推荐还是问答,它都能为你的应用带来高效支持。

🤗 马上来 Hugging Face 体验 EmbeddingGemma吧,欢迎加入我们的中文社区:Chinese LLMs on Hugging Face,一起探索更多生成式 AI 应用!
#HuggingFace##向量检索##多语言模型#

发布于 美国