HuggingFace的微博

HuggingFace

2026-05-19 10:41来自微博网页版

DeepSeek 发布 V4 了。这次最值得关注的，不只是参数规模，而是：它终于开始认真解决 AI 智能体（Agent）长上下文里的真实工程问题。这代模型有两个版本： - DeepSeek-V4-Pro：1.6T 总参数，49B 激活 - DeepSeek-V4-Flash：284B 总参数，13B 激活两者都支持 100 万 Token 上下文。但文章里最重

35

6

33

HuggingFace

2026-05-08 10:57来自微博网页版

AI 代码智能体越来越会写代码了，但开源社区真正需要的，不是“更多 PR”，而是“更高质量、可审查、可维护的 PR”。我们为 transformers → mlx-lm 模型移植构建了一套 Skill 和测试工具。目标很明确：当一个新语言模型加入 transformers 后，能更快、更可靠地出现在 MLX 生态里，服务 Apple Silico

6

2

13

HuggingFace

2026-05-06 11:12来自微博网页版

Sentence Transformers v5.4 已支持多模态能力 🔍 现在，你可以用同一套 API，同时处理文本、图片、音频、视频的 embedding 与 rerank 了。这意味着什么？以前 Sentence Transformers 更多用于文本语义搜索、RAG 和相似度匹配；现在它已经扩展到多模态检索场景： 🖼️ 用文字搜索图片 🎬

3

1

14

HuggingFace

2026-04-15 10:07来自微博网页版

Gemma 4 来了，而且这次真的很强 🚀 Google DeepMind 的 Gemma 4 模型家族现已登陆 Hugging Face。它最大的特点可以概括为一句话：开放、多模态、可设备端运行，而且生态首日就很完整。为什么值得关注？首先，它是真正开放的。Gemma 4 采用 Apache 2.0 许可，对研究和产品开发都更友好。其次，它

3

0

9

HuggingFace

2026-03-26 12:57来自微博网页版

为什么大语言模型参数越来越多，速度却反而更快了？🤔 答案是：MoE（Mixture of Experts，专家混合模型）正在改变游戏规则。过去几年，大语言模型的发展路径很直接：参数越多，效果越好。但问题也随之而来——训练成本高、推理变慢、部署困难。于是，一种更“聪明”的扩展方式出现了：MoE。简

35

2

32

HuggingFace

2026-03-21 10:00来自微博网页版

AI 训练每天都会产生大量文件：checkpoint、日志、数据分片、Agent 轨迹……这些文件更新频繁，但又不太适合用 Git 做版本管理。现在，Hugging Face Hub 推出了一个新功能来解决这个问题：Storage Buckets 🪣 简单来说，Storage Buckets 是一种类似 S3 的对象存储，专门用于存放 AI 工作流中的“中

7

0

10

HuggingFace

2026-03-11 09:24来自微博网页版

机器人 AI 再迎来一次大升级 🤖🔥 Hugging Face 开源机器人框架 LeRobot v0.5.0 发布！这是目前最大的一次版本更新：200+ PR、50+ 新贡献者加入，硬件、模型、数据、模拟环境和代码架构几乎全面扩展。一句话总结：更多机器人、更强 VLA 模型、更快数据管线、更开放生态。首先是硬件层面的重大

9

1

6

HuggingFace

2026-03-02 22:43来自微博网页版

重磅消息 🔥 GGML 与 llama.cpp 团队正式加入 Hugging Face，共同推动 Local AI 的长期发展，让开放人工智能继续向前！ GGML 是 llama.cpp 的核心团队，而 llama.cpp 已成为“本地推理”的基石项目之一。现在，Georgi Gerganov 及团队将加入 Hugging Face，在保持 100% 开源和社区驱动的前提下，

4

1

10

HuggingFace

2026-02-26 09:39来自微博网页版

还在为调试 10 步 AI 工作流而崩溃吗？😫 当你的应用串联多个模型或 API 时，只要第 7 步出错，就得全部重跑一次。现在，Daggr 来了！这是一个全新的开源 Python 库，让你用“写代码”的方式构建 AI 工作流，同时自动生成可视化画布，随时查看中间结果、单步重跑、管理状态，几行代码就能跑起完整流

7

0

8

HuggingFace

2026-02-18 07:40来自微博网页版

🚀 让 Claude 教会开源模型写 CUDA 内核，这事真的成了。很多人一提 Agent 技能，第一反应是：直接用最强的 SOTA 模型不就好了？但这篇文章讲的是另一条更“工程化”的路：用最强的模型当老师，把高难度、强领域的能力，教给能在你本地跑、成本更低的开源模型。这次 Hugging Face 团队选了一个“

7

0

9

HuggingFace

2026-02-06 11:44来自微博网页版

🚀 Open Responses 来了：这是为 AI 智能体时代准备的“开放推理接口标准”。当下的推理负载，早就不只是聊天了。真正的主流正在变成：能思考、能规划、能调用工具、能自主完成任务的 AI 智能体。但现实是，很多系统还被卡在为“轮次对话”设计的 Chat Completion 接口里，和智能体的需求严重不匹

4

0

5

HuggingFace

2026-01-22 10:05来自微博网页版

🤖 CES 2026 上，NVIDIA 把 “AI 智能体” 从屏幕里拽到了现实桌面：DGX Spark + Reachy Mini，直接组装一个能看、能说、还能动的小伙伴！这次 NVIDIA 一口气放出了多块“造智能体的关键积木”：推理大语言模型 NVIDIA Nemotron、新的推理型视觉语言动作模型 Isaac GR00T N1.6（VLA），以及 Cosmos

1

0

2

HuggingFace

2026-01-06 11:10来自微博网页版

🍎 在 Apple 平台接 LLM，一直这么痛苦吗？本地模型、云模型、系统模型 API 各不相同，试个 Demo 都能把人劝退。现在，这件事终于有人认真“抹平”了。 AnyLanguageModel 是一个全新的 Swift 包，目标非常直接：用同一套 API，同时支持本地和远程大语言模型，让 Apple 开发者低成本试错、自由切换模

5

1

21

HuggingFace

2025-12-31 13:00来自微博网页版

🌍 Hugging Face × Google Cloud 官宣深化合作：一起把“开放模型”这条路走得更远！ Hugging Face 宣布与 Google Cloud 建立更深入的战略合作，目标只有一个：让每一家公司都能基于开放模型，构建、定制并掌控自己的 AI🚀 这次合作并不是简单的“上云”，而是围绕真实使用场景，把 Hugging Face

3

0

8

HuggingFace

2025-12-24 10:31来自微博网页版

😵‍💫 你以为 Tokenizer 就是“把字切一切”？Transformers v5 直接把 Tokenization 体系重做了：更简单、更清晰、更模块化！这次的核心变化是把“Tokenizer 的结构”和“训练出来的词表”解耦，让 Tokenizer 不再是黑盒，而是能被检查、定制、甚至从零训练的组件化系统 🤗 先补个基础：大语言

12

0

17

HuggingFace

2025-12-17 11:58来自微博网页版

🚀 Claude 现在真的能训练大模型了！一句话搞定微调流程！ Hugging Face 推出全新工具 Hugging Face Skills，让 AI 编程助手 Claude 首次具备完整微调能力：不仅能写训练脚本，还能自动选择 GPU、提交任务、实时监控进度，并自动上传模型到 Hub 🎯！ 📌 你只需要一句自然语言指令，比如： “Fin

9

0

11

HuggingFace

2025-12-13 12:13来自微博网页版

Transformers v5 正式发布啦🚀！这一次的更新，是 Transformers 五年来最大规模的演进。每天超过 300 万次安装、累计 12 亿次使用，从 40 种模型架构扩展到 400 多种，它已经成为全球人工智能开发者的基础设施级工具。 v5 围绕“互操作性”进行了全面升级：从模型定义到训练、推理、本地部署与量化

7

0

8

HuggingFace

2025-12-04 19:43来自微博直播平台

http://t.cn/AXyxbOBV

1

0

3

HuggingFace

2025-12-04 19:00来自微博直播平台

转发微博

http://t.cn/AXycvEnI http://t.cn/AXycvEEN

0

HuggingFace

2025-12-04 10:54来自微博网页版

🚀 Diffusers 家族迎来新成员：FLUX.2！来自 Black Forest Labs 的全新开源图像生成模型，从架构到训练全线重构，不是升级，而是重生🔥 📌 三大亮点： 1️⃣ 单文本编码器 + 新架构：采用 Mistral Small 3.1，一次处理文本，嵌入更精准，理解力更强。 2️⃣ 改进版 DiT：融合双流与单流 Transfo

2

0

7

HuggingFace

2025-12-03 18:45来自微博直播平台

http://t.cn/AXycvEnI http://t.cn/AXycvEEN

1

0

HuggingFace

2025-11-29 11:07来自微博网页版

💡 你有没有发现，用 ChatGPT、Claude 时，第一句话加载慢，后面却像打字机一样飞快？背后核心原因之一，就是大模型推理中的关键优化技术：Continuous Batching（连续批处理）⚙️ 要支撑数千人同时使用，光靠模型本身还不够。需要从底层机制开始优化 👇 1️⃣ KV 缓存：避免重复计算历史每次生

8

0

11

HuggingFace

2025-11-20 09:55来自微博网页版

🎉 5 年磨一剑，Hugging Face 正式发布 huggingface_hub v1.0！这个 Python 库已经成为连接整个机器学习世界的基础设施：支持访问 200 万模型、50 万数据集和 100 万个 Spaces，月下载超 1.1 亿次，是超 20 万开源项目的关键依赖 🚀 📦 什么是 huggingface_hub？它是连接本地开发环境与 Huggin

67

5

41

HuggingFace

2025-11-18 10:05来自微博直播平台

http://t.cn/AX2gKBVb

4

0

3

HuggingFace

2025-11-17 18:09来自微博直播平台

随着 AI 模型从多模态向全模态体系演进，一个能够同时理解文字、图像、音频、视频、3D 等多种信息模态的新时代正在加速到来。相比主要围绕“图 + 文”的传统多模态模型，全模态模型采用相对更统一的建模架构，通过共享或对齐的语义表征来整合多种信息模态，并能够执行跨模态的组合推理与生成任务。本次

0

3

HuggingFace

2025-11-13 21:47来自微博网页版

小而强！🔥 微博开源 VibeThinker-1.5B，仅 15 亿参数挑战百亿大模型。 📍Hugging Face 模型页：http://t.cn/AX2ioUHH 🤗 欢迎加入中文社区：Chinese LLMs on Hugging Face，一起探索小模型的大可能！ #微博发布首个开源大模型# #AI前沿速递#

【#微博发布首个开源大模型#】微博AI开源 VibeThinker-1.5B：小模型也可以有大智慧目前业界最强大模型参数量大都超过了1T，甚至出现了2T规模的模型，是否只有巨量参数模型才有高度的智能？是否只有少量科技巨头才有能力做大模型？ VibeThinker-1.5B，正是微博AI对此问题给出的否定答案，它证明了小

3

0

4

HuggingFace

2025-11-06 04:58来自微博网页版

🌍 智能体开发迈入新纪元！Meta 携手 Hugging Face 推出全新开源平台 —— OpenEnv Hub，专为构建、共享和部署智能体环境而设计，为 AI 智能体生态注入强劲动力 🔥 OpenEnv 是什么？一句话总结：这是为智能体打造的任务执行“沙盒环境”标准和社区平台，定义智能体在执行任务时可使用的工具、API

6

0

7

HuggingFace

2025-10-30 03:37来自微博网页版

🚀 热门开源项目 Sentence Transformers 正式加入 Hugging Face 啦！这个由德国达姆施塔特工业大学 UKP Lab 孵化的项目，如今正式迁移至 Hugging Face，由 HF 的 Tom Aarsen 继续领导维护。在新的“家”中，Sentence Transformers 将借助 🤗 更强大的基础设施，实现更快速的版本迭代和更稳定的集

7

0

4

HuggingFace

2025-10-23 21:03来自微博网页版

📄 开源 OCR 全面起飞！这篇指南带你用开源模型打造高性价比、隐私友好的文档 AI：看清模型能力、何时微调/开箱即用、如何评测选型，以及如何把 OCR 升级为检索与问答。🚀 要点速览：能力与格式：识别印刷体/手写/公式/化学式，解析表格/图表/图片与位置锚点；输出 DocTags/HTML/Markdown/JS

10

3

11

HuggingFace

2025-10-16 10:10来自微博网页版

🌍 mmBERT 发布：ModernBERT 的多语言版，覆盖 1800+ 语言、用 3T+ Token 训练，在准确率与速度上双升级，首次全面超越 XLM-R！亮点速读：强性能：GLUE、XTREME、MTEB v2 等基准全面提升，代码检索同样出色。会学低资源：逐步纳入语言＋退火采样＋动态掩码＋模型合并，让低资源语言在后

4

0

6

HuggingFace

2025-10-08 09:45来自微博网页版

📣 新标准来了！RTEB（beta）正式发布：一个更贴近真实应用的向量检索评测基准 🚀 为什么需要 RTEB？很多模型在公开数据上“考得高”，到真实业务里却“用得差”。RTEB 采用“公开数据集＋私有数据集”的混合策略：公开集可复现，私有集由 MTEB 统一评测，直测真泛化；若两者分差大＝潜在过拟合预

8

0

8

HuggingFace

2025-10-02 08:49来自微博网页版

🖱️ 小模型也能学会“用电脑”！Smol2Operator 让轻量级视觉语言模型进化为可操作 GUI 的智能体 🚀 这项工作把 SmolVLM2-2.2B-Instruct 从“无落地感”的 VLM，训练成会看懂界面并执行点击/输入/拖拽等操作的 GUI 代理，完整开放训练配方、数据工具、模型与数据集，可一键复现 🫡 亮点速读：

4

1

6

HuggingFace

2025-09-25 09:20来自微博网页版

🧪 新基准来了！Gaia2 与 ARE 把 AI 智能体评测搬进“真实世界”🚀 从只读检索到读写交互，加入工具失效、时延与噪声，全面考察规划、执行、适应与容错。亮点速读：现实任务集：执行、检索、歧义、适应、时间/时序、协作、抗噪等 7 大能力，覆盖 1000 个全新人工场景。真实环境建模：

1

0

3

HuggingFace

2025-09-17 23:52来自微博网页版

🚀 模型更快，显存更省！OpenAI 的 GPT-OSS 黑科技已全面集成进 Transformers！现在你不仅能跑 GPT-OSS，几乎所有 Transformers 模型都能直接享受到这些优化👇 ✨ 核心升级：零编译内核：从 Hugging Face Hub 一键下载即用 MXFP4 量化：4bit 精度，20B 模型也能单卡跑并行优化：张量并行 + 专

3

0

12

HuggingFace

2025-09-12 09:52来自微博网页版

📱 手机也能跑的 SOTA 向量模型来了！谷歌正式发布 EmbeddingGemma 🚀 它仅有 3.08 亿参数，量化后内存不到 200MB，却能支持 100+ 语言，并在 MTEB 榜单上斩获 500M 以下最佳成绩 🏆。 ✨ 模型亮点：轻量高效：适合手机和边缘设备本地部署长上下文：支持 2K Token 输入，完美适配 RAG 和智能

5

1

7

HuggingFace

2025-09-04 10:29来自微博网页版

🔥 从零开始构建高性能 CUDA Kernel，不再是“专家专属”！你是否也被 CUDA 开发的高门槛劝退过？Hugging Face 最新开源工具 kernel-builder 来了，帮你从开发、构建到部署，一站式完成自定义 GPU Kernel 的全流程！在这篇教程中，官方带你实战打造一个将彩色图像转换为灰度图的 PyTorch 自定义 C

9

1

8

HuggingFace

2025-08-27 21:51来自微博网页版

🚀 全新发布！零代码也能玩转大语言模型的神器来了 —— AI Sheets 🎉 有没有想过，用像 Excel 一样的表格界面，就能驱动成千上万的开源 AI 模型？Hugging Face 最新推出的开源工具 AI Sheets，让你无需写一行代码，就能构建、处理、增强数据集！ 🧠 AI Sheets 是什么？这是一个可视化的 AI 数

34

1

14

HuggingFace

2025-08-21 20:00来自微博直播平台

转发微博

由 Hugging Face × OpenMMLab × ModelScope × 知乎 × 机智流等联合发起的【AI Insight Talk】系列直播活动第四场 - 多模态专场，即将开播！ http://t.cn/AXvZWqW4 http://t.cn/AXvZWq0F

2

0

2

HuggingFace

2025-08-21 03:01来自微博直播平台

由 Hugging Face × OpenMMLab × ModelScope × 知乎 × 机智流等联合发起的【AI Insight Talk】系列直播活动第四场 - 多模态专场，即将开播！ http://t.cn/AXvZWqW4 http://t.cn/AXvZWq0F

5

0

5

HuggingFace

2025-08-20 22:20来自微博网页版

HF Papers 直播｜多模态专场由 Hugging Face × OpenMMLab × ModelScope × 知乎 × 机智流等联合发起的【AI Insight Talk】系列直播活动第四场 - 多模态专场，即将开播！ 📅 直播时间：2025 年 8 月 21 日（周四）20:00 - 22:00（北京时间）近期各家多模态大模型纷纷开源，在开源社区引发了热

5

0

4

HuggingFace

2025-08-20 04:09来自微博网页版

⚡️ TRL 再升级，多模态对齐进入新阶段！现在，视觉语言模型 (VLM) 不仅能用 SFT 和 DPO 微调，还新增三种强力方法 —— MPO、GRPO、GSPO，让模型看图说话更聪明、推理更稳。 🔍 三大新方法 MPO：在 DPO 基础上加“质量评分”和“生成”两种额外损失，像给模型加了三重指南针，减少胡言乱语，Math

3

0

8

HuggingFace

2025-08-14 10:17来自微博网页版

✨ 命令行党福利！Hugging Face CLI 正式更名为 hf，更快、更简洁、更易用！🚀 长期用 huggingface-cli 打命令是不是觉得又长又乱？这次升级不仅省下键盘工夫，还彻底重构命令结构，采用 hf <资源> <操作> 的统一语法，让功能更清晰、更好找。 🔹 新结构亮点资源分组：如 hf auth（认证）、hf re

1

0

HuggingFace

2025-08-06 21:47来自微博网页版

🚀 OpenAI 重磅开源！GPT OSS —— 面向推理、AI 智能体与多样化开发场景的全新开源模型家族，已在 Hugging Face 上线！本次发布带来两款混合专家（MoE）模型： gpt-oss-120b：117B 参数，5.1B 激活参数，MXFP4 量化（4 位混合精度，速度快、占用低），单张 H100 可跑 gpt-oss-20b：21B 参数，3.6B

3

0

5

HuggingFace

2025-08-06 09:32来自微博网页版

📊 训练时想实时看曲线，还能一键分享给队友？Hugging Face 推出轻量级实验追踪库 —— Trackio！🚀 Trackio 是一个免费、开源、本地优先的 Python 库： 🪄 一行替换 wandb：兼容 wandb 常用 API，迁移零成本 💻 本地可视化：内置 Gradio 仪表盘，loss、accuracy 等训练曲线即刻可见 🌐 无

8

2

13

HuggingFace

2025-07-29 22:17来自微博网页版

🧬 不懂生物也能参加的挑战！Arc Institute 发布的 Virtual Cell Challenge，Hugging Face 帮你一文看懂！🧪 挑战目标：训练一个模型，预测在一个细胞中“沉默”某个基因后会发生什么变化。📉 这其实是一个纯数据驱动的机器学习任务，Arc 提供了约 30 万条单细胞 RNA 测序数据，模拟 CRISPR 敲除

4

0

8

HuggingFace

2025-07-25 09:21来自微博网页版

🧠 编码器 vs 解码器，谁才是通用模型架构之王？Hugging Face 推出全新开源模型套件 —— Ettin Suite，让你真正公平地对比二者能力！⚔️ Ettin 是首个基于相同架构、相同数据（2 万亿 Token）、相同训练配方，同时训练编码器（MLM）和解码器（CLM）的大模型套件，参数量覆盖从 17M 到 1B，真正实现

9

1

8

HuggingFace

2025-07-22 09:51来自微博网页版

🔥 Hugging Face 最新开源项目 ScreenEnv，让你轻松打造全栈桌面 AI 智能体！🖥️🤖 还在为部署桌面 GUI 智能体发愁？ScreenEnv 用 Docker 打包了完整的 Ubuntu 桌面环境，不用虚拟机，10 秒内就能搞定一个「能看、能点、能打字、还能录屏」的智能体实验室！💻 支持直接用 Python API 控制，

15

2

18

HuggingFace

2025-07-17 23:20来自微博网页版

🚀 想让 AI 助手一键连接 Hugging Face Hub，轻松调用上千个 AI 应用？官方 MCP Server（hf.co/mcp）了解一下！🌐 Hugging Face 官方推出的 MCP Server，基于 Model Context Protocol（MCP，AI 助手与外部世界连接的标准协议），只需一个 URL，就能远程调用 Hugging Face Hub 上的模型、工具和 Gra

12

2

9

HuggingFace

2025-07-17 19:30来自微博直播平台

转发微博

📢 AI for Science：科学智能体前沿解密 7月17日（周四）19:30-21:30，不见不散！ 💡 重磅嘉宾 & 议题亮点： ✨ 孙秋实：发布 ScienceBoard，真实交互环境+169项科研任务，测智能体科学探索力，揭示瓶颈。 ✨ 周宇浩：介绍 Scientists' First Exam (SFE)，五大领域、66项任务，探索多模态模型科学

0

HuggingFace

2025-07-17 11:45来自微博直播平台

📢 AI for Science：科学智能体前沿解密 7月17日（周四）19:30-21:30，不见不散！ 💡 重磅嘉宾 & 议题亮点： ✨ 孙秋实：发布 ScienceBoard，真实交互环境+169项科研任务，测智能体科学探索力，揭示瓶颈。 ✨ 周宇浩：介绍 Scientists' First Exam (SFE)，五大领域、66项任务，探索多模态模型科学

8

HuggingFace

2025-07-11 21:00来自微博网页版

📣 全开源、多语言、长上下文推理模型来了！SmolLM3 正式发布 🎉 SmolLM3 是 Hugging Face 推出的全新 3B 级别轻量模型，不仅在性能上超越同体积 LLaMA3-3B、Qwen2.5-3B，更可与 4B 模型正面对抗，在效率与能力之间达成理想平衡 🧠 🌍 多语言、长文本、推理能力全覆盖：支持英文、法文、西班

7

1

14

HuggingFace

2025-07-11 00:30来自微博网页版

🧠 你准备好了模型、数据和 GPU，满怀期待点击“运行”……但 GPU 却闲着没事干，训练速度感人 💸 这是我们在训练 nanoVLM 多模态模型过程中遇到的真实问题。不是模型不行，不是硬件不给力，而是数据管道“卡脖子”了！在这篇博客中，Hugging Face 团队用 5 个阶段构建出一条高效的数据管道，让训

10

1

21

HuggingFace

2025-07-09 23:23来自微博网页版

🦾 桌面级开源机器人 Reachy Mini 来啦！售价仅 $299 起，支持语音识别、视觉理解，还能摇头摆动、互动交流，小小身体里藏着无限可能 🤖✨ 由 Hugging Face 与 Pollen Robotics 联合打造，Reachy Mini 是一款面向开发者、研究者、教育者乃至孩子们的多功能开源机器人。开箱即可使用 Python 编程，

5

3

9

HuggingFace

2025-07-08 23:24来自微博网页版

🔥 Sentence Transformers v5 发布重磅更新！现在不仅支持 Dense 和 Reranker 模型训练，还原生支持「稀疏向量模型（Sparse Embedding Models）」的微调训练啦！相比传统 dense 向量，稀疏向量维度更高但多数为 0，不仅节省存储，还更具可解释性。你甚至能清晰看到哪些词在匹配中起了作用，非常适

5

3

9

HuggingFace

2025-07-03 19:30来自微博直播平台

转发微博

19:30 不见不散 http://t.cn/A6DRIaDF http://t.cn/A6DRIagc

0

1

HuggingFace

2025-07-03 18:56来自微博直播平台

19:30 不见不散 http://t.cn/A6DRIaDF http://t.cn/A6DRIagc

12

0

5

HuggingFace

2025-07-02 21:33来自微博网页版

🔥 Google 发布的多模态模型 Gemma 3n 正式全面开源啦！ Gemma 3n 最早在 Google I/O 上以“可本地运行的多模态模型”亮相，引发了社区的广泛关注。现在，这款模型已经全面登陆 Hugging Face 平台，并集成进多个主流开源库：包括 🤗 Transformers、timm、MLX、llama.cpp、Transformers.js、Ollama

23

1

31

HuggingFace

2025-07-01 08:19来自微博网页版

🚀 大模型开发者看过来！SGLang 现在正式支持 Hugging Face Transformers 作为后端啦！ Transformers 一直是最受欢迎的大语言模型开发工具，但部署时经常踩坑：推理慢、延迟高、上线难。而现在，SGLang 带来了真正“即插即用”的解决方案 ✨ 🎯 核心亮点：支持运行 Hugging Face 上的绝大多数 Tr

22

1

26

HuggingFace

2025-06-26 12:47来自微博网页版

🎨 想在消费级显卡上训练属于你自己的扩散模型风格？现在可以了！ Hugging Face 最新实测：使用 QLoRA 技术在 RTX 4090 上微调 FLUX.1-dev，仅需不到 10 GB 显存，就能快速学习出 Alphonse Mucha 的新艺术风格 ✨。更棒的是，整套流程可在 Google Colab 免费运行（约 4 小时）！ 🌟 关键优化技巧

28

1

19

HuggingFace

2025-06-25 05:45来自微博网页版

🏎️ 5 分钟上手 Hugging Face Kernel Hub，让你的模型飞起来！⚡️ 还在为 CUDA 编译、优化算子发愁？现在你只需一行代码，就能加载社区提供的高性能 GPU 核心函数（Kernel）！ 🔥 Kernel Hub 是什么？ Hugging Face 最新推出的 Kernel Hub 类似于“模型库”，但它收录的是预编译、跨平台的高性

24

1

22

HuggingFace

2025-06-24 02:07来自微博网页版

🚀 Groq 正式加入 Hugging Face 推理服务提供商大家庭！🔥 我们很高兴宣布：超快推理引擎 Groq 现已接入 Hugging Face Hub，成为官方支持的推理服务提供商！用户现在可以在模型页面中直接选择使用 Groq，享受超低延迟、高吞吐量的 LLM 推理体验。 💡 Groq 是什么？ Groq 推出的 LPU™（语言处理

3

1

9

HuggingFace

2025-06-14 09:24来自微博直播平台

由 Hugging Face × OpenMMLab × ModelScope × 知乎 × 机智流联合发起的【AI Insight Talk】系列活动重磅来袭！本期我们将聚焦强化学习（RL）与推理能力的前沿交汇，邀请多位在 Hugging Face Daily Papers 中热门论文的作者，共同探讨 RL 在推理中的技术挑战与未来潜力。 http://t.cn/A6eHRzn2

7

0

29

HuggingFace

2025-06-12 08:30来自微博网页版

🚀 Hugging Face 与 NVIDIA 合作推出 Training Cluster as a Service！ 🤝 在 GTC Paris 大会上，我们激动地宣布 Training Cluster as a Service（训练集群即服务），与 NVIDIA 合作，旨在让全球研究机构更轻松地访问大规模 GPU 集群，推动各领域的基础模型训练！为什么需要 Training Cluster as

2

0

10

HuggingFace

2025-06-11 20:28来自微博网页版

🖥️ Hugging Face 发布 ScreenSuite：史上最全 GUI 智能体评测套件！🤯 什么是 GUI Agent？简单说，就是“能像人一样操作屏幕”的 AI！它能识别界面内容、点击按钮、输入文字、滚动页面……实现真实的“虚拟助手”体验。现在，我们推出了全新的开源工具 —— ScreenSuite，帮助开发者和研究者评

40

7

42

HuggingFace

2025-06-08 10:56来自微博网页版

🚀 用 PyTorch 手撸 KV Cache，推理提速 38%！💡 想搞懂大语言模型推理如何加速？Hugging Face 的 nanoVLM 团队从 0 实现了 KV Cache，在纯 PyTorch 小代码库里做到了推理加速 38%，而且适配所有自回归模型！🔥 🤔 什么是 KV Cache？大语言模型每生成一个新 token，都要重新处理整个序列，

66

2

67

HuggingFace

2025-06-07 10:53来自微博网页版

🚀 SmolVLA：高效的视觉-语言-行动模型，让机器人变得更智能！ 🤖 今天我们为大家介绍 SmolVLA，一个紧凑的视觉-语言-行动（VLA）模型，专为机器人而设计，并且能够在普通硬件上运行！💻💡 SmolVLA 的特点：仅需 450M 参数，支持在消费者硬件上训练和部署（甚至可以在 MacBook 上运行！）预

7

1

13

HuggingFace

2025-06-06 10:16来自微博网页版

🚀 GPU 利用率提升 40%，无需额外硬件：Co-located vLLM + TRL 让训练更高效！在训练大型语言模型时，生成与训练的频繁切换会导致GPU空闲，造成资源浪费。传统的做法是将生成与训练分配到不同的GPU上，导致“乒乓”效应（训练与生成互相等待）：训练时生成GPU空闲生成时训练GPU空闲 💡 解决方

15

1

9

HuggingFace

2025-06-05 11:08来自微博网页版

🤖 让 AI 智能体更聪明、更稳定的新方法来了！我们将 CodeAgent 的代码执行能力与结构化输出的可靠性结合，提出一种更优的智能体行为生成方式——Structured CodeAgent，在多个推理与多步骤任务中表现出显著提升📈 🧠 传统 Agent 工具调用有这些局限：只能选用预定义工具，缺乏灵活性不支

5

2

5

HuggingFace

2025-05-31 20:10来自微博网页版

🐯 Liger GRPO 助力 TRL，实现强化学习微调新突破！强化学习微调大语言模型（LLM）通常资源消耗巨大，尤其是经典的 PPO 方法。现在，Liger 与 TRL 携手推出 Group Relative Policy Optimization (GRPO) 优化方案，通过“分块计算损失”技术，峰值显存最高减少 40%，且无精度损失⚡。 ✨ 亮点速览：

6

0

6

HuggingFace

2025-05-30 19:42来自微博网页版

🤖 Tiny Agents 上线 Python 版本啦！让 LLM 真正动起来，只需 70 行代码！ Tiny Agents 是基于 MCP（Model Context Protocol）构建的轻量级智能体框架，现已支持 Python，并集成进 huggingface_hub，开发者可以轻松构建能“自动调用工具”的 LLM 应用⚙️ ✨ 有哪些亮点？ 🧠 基于开放协议 MCP，

41

2

27

HuggingFace

2025-05-29 19:44来自微博网页版

👀+🧠=nanoVLM！打造你自己的视觉语言模型，从未如此简单！我们正式推出 nanoVLM：一个用纯 PyTorch 实现的超简洁 Vision Language Model（VLM）训练工具包 🎯。灵感来源于 Karpathy 的 nanoGPT，它是图文多模态世界的“极简入门门票”！ ✨ 主要亮点： 📦 开箱即用：支持在免费 Colab Noteb

17

3

27

HuggingFace

2025-05-21 08:50来自微博网页版

🌟 Transformers 库再升级，成就 AI 模型定义新标准！自 2019 年诞生以来，Transformers 一直是大语言模型（LLM）和多模态模型（VLM）领域的核心工具。如今，它支持超过 300 种模型架构，每周新增约 3 个新模型，涵盖自然语言处理、计算机视觉与音频领域。 🔗 标准化模型定义 Transformers 现已

9

1

13

HuggingFace

2025-05-19 20:13来自微博网页版

🎉 重磅联动上线！Kaggle 与 Hugging Face 模型正式打通！ AI 开发者的两个最活跃社区，终于连上了同一根数据线！现在你可以直接在 Kaggle Notebook 中一键调用 Hugging Face 模型，无需手动配置或复制链接，体验更加丝滑流畅 🚀 📍主要新特性：在 Hugging Face 模型页点击“Use this model”

12

3

21

HuggingFace

2025-05-18 21:57来自微博网页版

🎙️ Whisper 转录提速 8 倍！Hugging Face 推出全新极速部署方案！ OpenAI 的 Whisper 模型迎来史上最快部署方式：我们将其集成到了 Hugging Face 的 Inference Endpoints 中，单击即可部署专属 ASR 模型，适配长音频转写、实时字幕、会议记录等场景 🎧 ✨ 主要亮点： 🚀 最多提升 8 倍推理速

12

1

15

HuggingFace

2025-05-08 20:09来自微博网页版

🎛️ 用 5 行 Python，让你的应用秒变 LLM 工具！ Gradio 现已支持构建 MCP（Model Context Protocol）服务器，只需添加一个参数，就能让你的应用被大语言模型（如 Claude Desktop、Cursor 等）直接调用🔌。无论是图像生成、语音合成，还是计算器、翻译器，你的 Python 函数都能变成可被 LLM 使用

41

3

33

HuggingFace

2025-05-02 10:44来自微博网页版

🛡️ 模型也要“守门员”！Meta 推出多模态安全模型 Llama Guard 4，已在 Hugging Face 上线！这是一个 dense 架构（非 MoE）的 120 亿参数多模态安全模型，支持图像+文本风险检测，适配生产场景中对输入 Prompt 和模型输出内容的审查过滤，帮助构建更健壮的 AI 安全系统。 📌 Llama Guard 4

4

1

8

HuggingFace

2025-05-01 10:48来自微博网页版

🚀 低比特量化新突破！Intel 推出超强量化工具 AutoRound！面对越来越庞大的大语言模型（LLMs）和多模态视觉语言模型（VLMs），部署效率成了新挑战。Intel 最新推出的量化工具 AutoRound，不仅轻量高效，还能在 INT2～INT8 低比特量化下保持极高准确率，可谓在精度与性能之间找到了理想平衡 ⚖️

7

1

10

HuggingFace

2025-04-17 10:04来自微博网页版

🔒 Hugging Face × Protect AI：6 个月扫描 447 万模型，AI 安全全面升级！ 🚨 自 2024 年 10 月合作以来，Hugging Face 与 Protect AI 持续为开源模型构建安全“护城河”，如今已在 Hugging Face Hub 上实现了 447 万模型版本的深度扫描，共识别出 35 万+ 潜在风险！ 🛡️ 新增 4 大高级威胁检

0

6

HuggingFace

2025-04-10 04:42来自微博网页版

📢 Arabic Leaderboards 全面升级！新增 Arabic Instruction Following、AraGen 03-25 更新等内容上线！🤖 为了推动阿拉伯语大语言模型的发展与评估，Inception 联合 MBZUAI 推出了全新的 Arabic-Leaderboards Space，集中发布并持续更新阿语 LLM 的多维评估榜单。 🌟 1. 全新统一评估平台上线

2

0

4

HuggingFace

2025-04-06 10:28来自微博网页版

📚 Hugging Face 的 NLP 课程正式升级为 LLM 课程啦！ 🚀 在过去 3 年中，NLP 课程一直是开源 AI 社区的热门学习资源。随着大语言模型（LLM）技术的快速发展，我们也迎来了全新升级：NLP 课程正式更名为 LLM 课程！ ✨ 为什么更名？课程内容已扩展至 LLM 微调、推理、多模态模型等，更贴合当前 A

50

3

41

HuggingFace

2025-04-05 10:20来自微博网页版

🔐 Hugging Face 如何在多云 AI 基础设施中重构 Secrets 管理？🚀 随着平台用户突破 400 万，Hugging Face 面临如何在多云环境中安全、高效地管理密钥的挑战。最终，他们选择将 Secrets 管理平台全面迁移到 Infisical，实现了跨环境、跨团队的一致性与自动化配置。 💡 背景挑战：密钥蔓延风险

0

4

HuggingFace

2025-04-04 10:30来自微博网页版

🚀 加速 LLM 推理：TGI 与 Intel Gaudi 的原生集成 🤖 我们很高兴宣布，Intel Gaudi 硬件现已原生集成到 Text Generation Inference (TGI) 中，这意味着你将拥有更多强大的部署选项！🎉 ✨ 新特性亮点通过 PR #3091 完全支持 Gaudi 硬件，告别之前需要维护的单独仓库，TGI 特性更全面！支持 I

0

HuggingFace

2025-04-03 01:38来自微博网页版

🔍 训练与微调 Sentence Transformers v4 版的 Reranker 模型 🚀 想要让你的模型在特定数据集上表现更好？微调 Reranker（排序）模型是一个有效的选择！通过利用 Sentence Transformers v4 版本，你可以在自己的数据上训练和微调 Reranker 模型，取得超越现有通用模型的效果。🎯 为什么微调至

4

0

3

HuggingFace

2025-03-27 20:32来自微博网页版

为什么 AI 模型离科学革命还差得很远？作者：Thomas Wolf, Hugging Face 联合创始人和首席科学家几天前，我在一个活动上分享了一个略显争议的观点，后来我决定把它写下来：我担心人工智能无法带来所谓的“压缩的 21 世纪”。这个“压缩的 21 世纪”概念来自 Dario 的文章《Machine of Loving Grace

8

1

10

HuggingFace

2025-03-27 07:38来自微博网页版

🤗 LeRobot开源机器人如何降低技术门槛特斯拉人形机器人Optimus的核心开发者Rémi Cadene 从硅谷回到法国，坚信机器人技术正迎来ChatGPT般的革命。他加入了 Hugging Face 并创立了开源项目Le Robot，仅用110欧元和3D打印机制作出具备智能潜力的钓鱼线机械臂，试图突破当前机器人无法完成基础任务的技

6

0

4

HuggingFace

2025-03-21 20:33来自微博网页版

💻 开源编程助手来了！比肩 GPT-4o 和 Claude 的代码模型 OlympicCoder，现在可以本地跑了！🚀 还在依赖云端大模型写代码？试试开源新星 OlympicCoder 7B，在最新 LiveCodeBench 测评中，它甚至超过了 Claude 3.7 Sonnet 和 GPT-4o！本文教你如何在本地部署这个强大的模型，打造属于自己的 AI 编

98

14

64

HuggingFace

2025-03-19 22:30来自微博网页版

NVIDIA 在 GTC 2025 上带来了重磅 AI 机器人技术更新！🤖✨ 本次发布的三大开源项目，让物理人工智能（Physical AI）开发迈上新台阶： 🚀 Cosmos Transfer：全新的世界基础模型（World Foundation Model，WFM），支持多模态控制，可基于 3D 边界框、深度图、轨迹等输入生成高精度虚拟世界场景，

6

1

11

HuggingFace

2025-03-14 11:13来自微博网页版

🎙️ 让 AI 和你实时对话！Hugging Face Speech-to-Speech (S2S) 来了！ 🚀 Hugging Face 推出的 Speech-to-Speech (S2S)，整合多个强大模型，实现流畅的语音交互：你说话，AI 立刻用合成语音回复你！🤯 💡 核心技术： 🔹 语音活动检测 (VAD) —— 识别何时开始 / 停止说话 🔹 语音转文

7

1

6

HuggingFace

2025-03-12 10:54来自微博网页版

🚀 Self-Speculative Decoding 让大语言模型 (LLM) 推理更快、更高效！ Hugging Face 研究推出早退出推测解码 (Self-Speculative Decoding)，让同一个模型既能生成 Token，又能自我验证，无需额外的草稿模型，大幅提升文本生成速度，同时降低计算开销。 ✨ 相比传统推测解码的优势： ✅ 推理速

11

2

18

HuggingFace

2025-03-05 11:22来自微博网页版

🤗 Hugging Face 存储升级！从文件到块，提高效率 🚀 Hugging Face 目前存储了 30 PB 以上的模型、数据集和 Spaces，但由于 Git LFS 采用文件级存储和版本控制，每次修改都可能导致整文件重新上传，带来高昂的存储和传输成本。特别是 GGUF（8 GB+）、Safetensor（1 GB）、Parquet/CSV（200-300 MB

35

3

53

HuggingFace

2025-02-25 21:33来自微博网页版

🤗 AI 创意工具新动态，第一期来啦！ 🎉 过去一年，AI 艺术工具发展飞速，我们终于告别了“五指神教”😂，进入了更精细化、个性化的时代。从文本生成图像、个性化风格化，到视频和音频生成，开源模型正在迅速缩小与闭源模型的差距。2025 年，创意 AI 还会有哪些突破？一起来看看吧！👇 🔥

3

0

6

HuggingFace

2025-01-15 10:31来自微博网页版

🚀 模型评测的革命性工具：Judge 模型，让评估更智能！ Judge 模型是专为评估神经网络生成输出而设计的强大工具，尤其适合文本生成任务。无论是评估流畅性、毒性还是相似性，Judge 模型都能提供高效、低成本的解决方案！✨ 什么是 Judge 模型评测？ Judge 模型可执行以下关键任务： 1️⃣ 文本评分

2

0

4

HuggingFace

2025-01-14 09:06来自微博网页版

🚀 AI 模型评估新工具！最新数据集资源全解析无论你专注数学推理、语言理解还是代码生成，这些数据集能帮你全面测试和优化模型性能👇 核心推荐数据集数学推理： GSM8K: 提供 8.5K 道小学数学题，适合评估模型的逻辑推理能力。 MATH: 收录奥数级别问题，支持按难度分类测试，挑战高阶数学能力。

11

0

5

HuggingFace

2025-01-13 07:30来自微博网页版

🚀 Google 全新发布 PaliGemma 2！视觉语言模型的新高峰！ PaliGemma 2 是 Google 最新推出的视觉语言模型，它结合了强大的 SigLIP 图像编码器和升级版 Gemma 2 文本解码器，在性能和灵活性上实现了显著提升。✨ PaliGemma 2 的亮点多参数规模：提供 3B、10B 和 28B 参数模型，满足从轻量到大规

6

0

11

HuggingFace

2024-12-17 21:38来自微博网页版

🤖 人工标注指南：提升数据质量的秘密武器！无论是优化模型表现，还是构建高质量数据集，人工标注都是关键一步！掌握这些技巧，让你的标注更高效👇 核心步骤💡 挑选优秀标注者确保标注者符合任务要求，例如：母语能力、高学历或领域专业知识。检查答案是否由 LLM 生成，筛选掉低质量的标注

5

0

15

HuggingFace

2024-12-17 06:14来自微博网页版

🤖 人类评估：让 AI 更贴近人类偏好！ AI 模型再强大，也需要人类评价来验证能力！通过人类评估，我们可以直接了解模型输出是否符合预期，并快速优化性能。这些方法简单易懂，快来了解👇 系统化评估：严谨又专业探索模型能力：如果没有数据集，设计任务并明确评分规则（如：生成有害语言得 0 分

2

0

2

HuggingFace

2024-11-28 11:34来自微博网页版

🚀 重磅发布：GGUF-my-LoRA，让 LoRA 转换更简单！ LoRA（Low-Rank Adaptation）是一种高效微调大语言模型的技术，让你可以快速为模型添加新技能！比如，将一个通用聊天机器人改造成客服助手、法律顾问或医疗专家，轻松实现高效适配。💡 通过 GGUF-my-LoRA，你可以将 Hugging Face 的 PEFT LoRA

3

0

2

HuggingFace

2024-11-26 03:31来自微博网页版

近年来，可穿戴设备领域快速发展，健康追踪成为了热门趋势，但许多消费级设备却是“黑箱”操作，用户根本不了解自己的数据是如何被采集和处理的。💭 为此，Halo 项目提出了一种全新的开源健康追踪解决方案！它以透明和可定制的方式，带你从零开始构建自己的智能设备，同时深入了解背后的技术逻辑。

3

0

7

HuggingFace

2024-11-03 11:53来自微博网页版

📢 Hugging Face 推出数据集 SQL 控制台！💥 随着 Hugging Face 上的数据集数量不断攀升，如何便捷地查询、过滤和发现数据集成为用户的新需求。为此，我们推出了全新的 SQL 控制台，让用户可以直接在 Hugging Face Hub 上使用 SQL 查询数据集！ SQL 控制台亮点💡 本地化操作：SQL 控制台通过 D

3

0

3

HuggingFace

2024-11-02 11:42来自微博网页版

📢 Hugging Face 与 TruffleHog 合作，共同增强平台安全性！🔒🤝 为了帮助开发者更好地防止敏感信息泄露，Hugging Face 正式引入了 TruffleHog 的秘密扫描功能！TruffleHog 是一款开源工具，能够检测代码中的密码、令牌等敏感信息，特别适用于 SaaS 和云服务平台的认证凭证。此合作旨在帮助开发

4

2

9