HuggingFace
HuggingFace
HuggingFace
The AI community building the future. https://hf.co
HuggingFace官方微博 海南 2023.08 加入
15关注
8.6万粉丝
142微博
HuggingFace
2026-05-19 10:41来自 微博网页版
DeepSeek 发布 V4 了。 这次最值得关注的,不只是参数规模,而是:它终于开始认真解决 AI 智能体(Agent)长上下文里的真实工程问题。 这代模型有两个版本: - DeepSeek-V4-Pro:1.6T 总参数,49B 激活 - DeepSeek-V4-Flash:284B 总参数,13B 激活 两者都支持 100 万 Token 上下文。 但文章里最重 ​
35
6
33
HuggingFace
2026-05-08 10:57来自 微博网页版
AI 代码智能体越来越会写代码了,但开源社区真正需要的,不是“更多 PR”,而是“更高质量、可审查、可维护的 PR”。 我们为 transformers → mlx-lm 模型移植构建了一套 Skill 和测试工具。目标很明确:当一个新语言模型加入 transformers 后,能更快、更可靠地出现在 MLX 生态里,服务 Apple Silico ​
6
2
13
HuggingFace
2026-05-06 11:12来自 微博网页版
Sentence Transformers v5.4 已支持多模态能力 🔍 现在,你可以用同一套 API,同时处理文本、图片、音频、视频的 embedding 与 rerank 了。 这意味着什么? 以前 Sentence Transformers 更多用于文本语义搜索、RAG 和相似度匹配;现在它已经扩展到多模态检索场景: 🖼️ 用文字搜索图片 🎬 ​
3
1
14
HuggingFace
2026-04-15 10:07来自 微博网页版
Gemma 4 来了,而且这次真的很强 🚀 Google DeepMind 的 Gemma 4 模型家族现已登陆 Hugging Face。它最大的特点可以概括为一句话:开放、多模态、可设备端运行,而且生态首日就很完整。 为什么值得关注? 首先,它是真正开放的。Gemma 4 采用 Apache 2.0 许可,对研究和产品开发都更友好。 其次,它 ​
3
0
9
HuggingFace
2026-03-26 12:57来自 微博网页版
为什么大语言模型参数越来越多,速度却反而更快了?🤔 答案是:MoE(Mixture of Experts,专家混合模型)正在改变游戏规则。 过去几年,大语言模型的发展路径很直接:参数越多,效果越好。但问题也随之而来——训练成本高、推理变慢、部署困难。于是,一种更“聪明”的扩展方式出现了:MoE。 简 ​
35
2
32
HuggingFace
2026-03-21 10:00来自 微博网页版
AI 训练每天都会产生大量文件:checkpoint、日志、数据分片、Agent 轨迹……这些文件更新频繁,但又不太适合用 Git 做版本管理。现在,Hugging Face Hub 推出了一个新功能来解决这个问题:Storage Buckets 🪣 简单来说,Storage Buckets 是一种类似 S3 的对象存储,专门用于存放 AI 工作流中的“中 ​
7
0
10
HuggingFace
2026-03-11 09:24来自 微博网页版
机器人 AI 再迎来一次大升级 🤖🔥 Hugging Face 开源机器人框架 LeRobot v0.5.0 发布!这是目前最大的一次版本更新:200+ PR、50+ 新贡献者加入,硬件、模型、数据、模拟环境和代码架构几乎全面扩展。 一句话总结:更多机器人、更强 VLA 模型、更快数据管线、更开放生态。 首先是硬件层面的重大 ​
9
1
6
HuggingFace
2026-03-02 22:43来自 微博网页版
重磅消息 🔥 GGML 与 llama.cpp 团队正式加入 Hugging Face,共同推动 Local AI 的长期发展,让开放 人工智能 继续向前! GGML 是 llama.cpp 的核心团队,而 llama.cpp 已成为“本地推理”的基石项目之一。现在,Georgi Gerganov 及团队将加入 Hugging Face,在保持 100% 开源和社区驱动的前提下, ​
4
1
10
HuggingFace
2026-02-26 09:39来自 微博网页版
还在为调试 10 步 AI 工作流而崩溃吗?😫 当你的应用串联多个模型或 API 时,只要第 7 步出错,就得全部重跑一次。现在,Daggr 来了!这是一个全新的开源 Python 库,让你用“写代码”的方式构建 AI 工作流,同时自动生成可视化画布,随时查看中间结果、单步重跑、管理状态,几行代码就能跑起完整流 ​
7
0
8
HuggingFace
2026-02-18 07:40来自 微博网页版
🚀 让 Claude 教会开源模型写 CUDA 内核,这事真的成了。 很多人一提 Agent 技能,第一反应是:直接用最强的 SOTA 模型不就好了?但这篇文章讲的是另一条更“工程化”的路:用最强的模型当老师,把高难度、强领域的能力,教给能在你本地跑、成本更低的开源模型。 这次 Hugging Face 团队选了一个“ ​
7
0
9
HuggingFace
2026-02-06 11:44来自 微博网页版
🚀 Open Responses 来了:这是为 AI 智能体时代准备的“开放推理接口标准”。 当下的推理负载,早就不只是聊天了。真正的主流正在变成:能思考、能规划、能调用工具、能自主完成任务的 AI 智能体。但现实是,很多系统还被卡在为“轮次对话”设计的 Chat Completion 接口里,和智能体的需求严重不匹 ​
4
0
5
HuggingFace
2026-01-22 10:05来自 微博网页版
🤖 CES 2026 上,NVIDIA 把 “AI 智能体” 从屏幕里拽到了现实桌面:DGX Spark + Reachy Mini,直接组装一个能看、能说、还能动的小伙伴! 这次 NVIDIA 一口气放出了多块“造智能体的关键积木”:推理大语言模型 NVIDIA Nemotron、新的推理型视觉语言动作模型 Isaac GR00T N1.6(VLA),以及 Cosmos ​
1
0
2
HuggingFace
2026-01-06 11:10来自 微博网页版
🍎 在 Apple 平台接 LLM,一直这么痛苦吗?本地模型、云模型、系统模型 API 各不相同,试个 Demo 都能把人劝退。现在,这件事终于有人认真“抹平”了。 AnyLanguageModel 是一个全新的 Swift 包,目标非常直接:用同一套 API,同时支持本地和远程大语言模型,让 Apple 开发者低成本试错、自由切换模 ​
5
1
21
HuggingFace
2025-12-31 13:00来自 微博网页版
🌍 Hugging Face × Google Cloud 官宣深化合作:一起把“开放模型”这条路走得更远! Hugging Face 宣布与 Google Cloud 建立更深入的战略合作,目标只有一个:让每一家公司都能基于开放模型,构建、定制并掌控自己的 AI🚀 这次合作并不是简单的“上云”,而是围绕真实使用场景,把 Hugging Face ​
3
0
8
HuggingFace
2025-12-24 10:31来自 微博网页版
😵‍💫 你以为 Tokenizer 就是“把字切一切”?Transformers v5 直接把 Tokenization 体系重做了:更简单、更清晰、更模块化!这次的核心变化是把“Tokenizer 的结构”和“训练出来的词表”解耦,让 Tokenizer 不再是黑盒,而是能被检查、定制、甚至从零训练的组件化系统 🤗 先补个基础:大语言 ​
12
0
17
HuggingFace
2025-12-17 11:58来自 微博网页版
🚀 Claude 现在真的能训练大模型了!一句话搞定微调流程! Hugging Face 推出全新工具 Hugging Face Skills,让 AI 编程助手 Claude 首次具备完整微调能力:不仅能写训练脚本,还能自动选择 GPU、提交任务、实时监控进度,并自动上传模型到 Hub 🎯! 📌 你只需要一句自然语言指令,比如: “Fin ​
9
0
11
HuggingFace
2025-12-13 12:13来自 微博网页版
Transformers v5 正式发布啦🚀!这一次的更新,是 Transformers 五年来最大规模的演进。每天超过 300 万次安装、累计 12 亿次使用,从 40 种模型架构扩展到 400 多种,它已经成为全球人工智能开发者的基础设施级工具。 v5 围绕“互操作性”进行了全面升级:从模型定义到训练、推理、本地部署与量化 ​
7
0
8
HuggingFace
2025-12-04 19:43来自 微博直播平台
http://t.cn/AXyxbOBV ​
1
0
3
HuggingFace
2025-12-04 19:00来自 微博直播平台
转发微博
http://t.cn/AXycvEnI http://t.cn/AXycvEEN ​
0
0
0
HuggingFace
2025-12-04 10:54来自 微博网页版
🚀 Diffusers 家族迎来新成员:FLUX.2!来自 Black Forest Labs 的全新开源图像生成模型,从架构到训练全线重构,不是升级,而是重生🔥 📌 三大亮点: 1️⃣ 单文本编码器 + 新架构:采用 Mistral Small 3.1,一次处理文本,嵌入更精准,理解力更强。 2️⃣ 改进版 DiT:融合双流与单流 Transfo ​
2
0
7
HuggingFace
2025-12-03 18:45来自 微博直播平台
http://t.cn/AXycvEnI http://t.cn/AXycvEEN ​
1
0
0
HuggingFace
2025-11-29 11:07来自 微博网页版
💡 你有没有发现,用 ChatGPT、Claude 时,第一句话加载慢,后面却像打字机一样飞快?背后核心原因之一,就是大模型推理中的关键优化技术:Continuous Batching(连续批处理)⚙️ 要支撑数千人同时使用,光靠模型本身还不够。需要从底层机制开始优化 👇 1️⃣ KV 缓存:避免重复计算历史 每次生 ​
8
0
11
HuggingFace
2025-11-20 09:55来自 微博网页版
🎉 5 年磨一剑,Hugging Face 正式发布 huggingface_hub v1.0!这个 Python 库已经成为连接整个机器学习世界的基础设施:支持访问 200 万模型、50 万数据集和 100 万个 Spaces,月下载超 1.1 亿次,是超 20 万开源项目的关键依赖 🚀 📦 什么是 huggingface_hub? 它是连接本地开发环境与 Huggin ​
67
5
41
HuggingFace
2025-11-18 10:05来自 微博直播平台
http://t.cn/AX2gKBVb ​
4
0
3
HuggingFace
2025-11-17 18:09来自 微博直播平台
随着 AI 模型从多模态向全模态体系演进,一个能够同时理解文字、图像、音频、视频、3D 等多种信息模态的新时代正在加速到来。相比主要围绕“图 + 文”的传统多模态模型,全模态模型采用相对更统一的建模架构,通过共享或对齐的语义表征来整合多种信息模态,并能够执行跨模态的组合推理与生成任务。本次 ​
0
0
3
HuggingFace
2025-11-13 21:47来自 微博网页版
小而强!🔥 微博开源 VibeThinker-1.5B,仅 15 亿参数挑战百亿大模型。 📍Hugging Face 模型页:http://t.cn/AX2ioUHH 🤗 欢迎加入中文社区:Chinese LLMs on Hugging Face,一起探索小模型的大可能! #微博发布首个开源大模型# #AI前沿速递#
【#微博发布首个开源大模型#】 微博AI开源 VibeThinker-1.5B:小模型也可以有大智慧 目前业界最强大模型参数量大都超过了1T,甚至出现了2T规模的模型,是否只有巨量参数模型才有高度的智能?是否只有少量科技巨头才有能力做大模型? VibeThinker-1.5B,正是微博AI对此问题给出的否定答案,它证明了小 ​
3
0
4
HuggingFace
2025-11-06 04:58来自 微博网页版
🌍 智能体开发迈入新纪元!Meta 携手 Hugging Face 推出全新开源平台 —— OpenEnv Hub,专为构建、共享和部署智能体环境而设计,为 AI 智能体生态注入强劲动力 🔥 OpenEnv 是什么?一句话总结:这是为智能体打造的任务执行“沙盒环境”标准和社区平台,定义智能体在执行任务时可使用的工具、API ​
6
0
7
HuggingFace
2025-10-30 03:37来自 微博网页版
🚀 热门开源项目 Sentence Transformers 正式加入 Hugging Face 啦! 这个由德国达姆施塔特工业大学 UKP Lab 孵化的项目,如今正式迁移至 Hugging Face,由 HF 的 Tom Aarsen 继续领导维护。在新的“家”中,Sentence Transformers 将借助 🤗 更强大的基础设施,实现更快速的版本迭代和更稳定的集 ​
7
0
4
HuggingFace
2025-10-23 21:03来自 微博网页版
📄 开源 OCR 全面起飞!这篇指南带你用开源模型打造高性价比、隐私友好的文档 AI:看清模型能力、何时微调/开箱即用、如何评测选型,以及如何把 OCR 升级为检索与问答。🚀 要点速览: 能力与格式:识别印刷体/手写/公式/化学式,解析表格/图表/图片与位置锚点;输出 DocTags/HTML/Markdown/JS ​
10
3
11
HuggingFace
2025-10-16 10:10来自 微博网页版
🌍 mmBERT 发布:ModernBERT 的多语言版,覆盖 1800+ 语言、用 3T+ Token 训练,在准确率与速度上双升级,首次全面超越 XLM-R! 亮点速读: 强性能:GLUE、XTREME、MTEB v2 等基准全面提升,代码检索同样出色。 会学低资源:逐步纳入语言+退火采样+动态掩码+模型合并,让低资源语言在后 ​
4
0
6
HuggingFace
2025-10-08 09:45来自 微博网页版
📣 新标准来了!RTEB(beta)正式发布:一个更贴近真实应用的向量检索评测基准 🚀 为什么需要 RTEB?很多模型在公开数据上“考得高”,到真实业务里却“用得差”。RTEB 采用“公开数据集+私有数据集”的混合策略:公开集可复现,私有集由 MTEB 统一评测,直测真泛化;若两者分差大=潜在过拟合预 ​
8
0
8
HuggingFace
2025-10-02 08:49来自 微博网页版
🖱️ 小模型也能学会“用电脑”!Smol2Operator 让轻量级视觉语言模型进化为可操作 GUI 的智能体 🚀 这项工作把 SmolVLM2-2.2B-Instruct 从“无落地感”的 VLM,训练成会看懂界面并执行点击/输入/拖拽等操作的 GUI 代理,完整开放训练配方、数据工具、模型与数据集,可一键复现 🫡 亮点速读: ​
4
1
6
HuggingFace
2025-09-25 09:20来自 微博网页版
🧪 新基准来了!Gaia2 与 ARE 把 AI 智能体评测搬进“真实世界”🚀 从只读检索到读写交互,加入工具失效、时延与噪声,全面考察规划、执行、适应与容错。 亮点速读: 现实任务集:执行、检索、歧义、适应、时间/时序、协作、抗噪等 7 大能力,覆盖 1000 个全新人工场景。 真实环境建模: ​
1
0
3
HuggingFace
2025-09-17 23:52来自 微博网页版
🚀 模型更快,显存更省!OpenAI 的 GPT-OSS 黑科技 已全面集成进 Transformers! 现在你不仅能跑 GPT-OSS,几乎所有 Transformers 模型都能直接享受到这些优化👇 ✨ 核心升级: 零编译内核:从 Hugging Face Hub 一键下载即用 MXFP4 量化:4bit 精度,20B 模型也能单卡跑 并行优化:张量并行 + 专 ​
3
0
12
HuggingFace
2025-09-12 09:52来自 微博网页版
📱 手机也能跑的 SOTA 向量模型来了!谷歌正式发布 EmbeddingGemma 🚀 它仅有 3.08 亿参数,量化后内存不到 200MB,却能支持 100+ 语言,并在 MTEB 榜单上斩获 500M 以下最佳成绩 🏆。 ✨ 模型亮点: 轻量高效:适合手机和边缘设备本地部署 长上下文:支持 2K Token 输入,完美适配 RAG 和智能 ​
5
1
7
HuggingFace
2025-09-04 10:29来自 微博网页版
🔥 从零开始构建高性能 CUDA Kernel,不再是“专家专属”! 你是否也被 CUDA 开发的高门槛劝退过?Hugging Face 最新开源工具 kernel-builder 来了,帮你从开发、构建到部署,一站式完成自定义 GPU Kernel 的全流程! 在这篇教程中,官方带你实战打造一个将彩色图像转换为灰度图的 PyTorch 自定义 C ​
9
1
8
HuggingFace
2025-08-27 21:51来自 微博网页版
🚀 全新发布!零代码也能玩转大语言模型的神器来了 —— AI Sheets 🎉 有没有想过,用像 Excel 一样的表格界面,就能驱动成千上万的开源 AI 模型?Hugging Face 最新推出的开源工具 AI Sheets,让你无需写一行代码,就能构建、处理、增强数据集! 🧠 AI Sheets 是什么? 这是一个可视化的 AI 数 ​
34
1
14
HuggingFace
2025-08-21 20:00来自 微博直播平台
转发微博
由 Hugging Face × OpenMMLab × ModelScope × 知乎 × 机智流 等联合发起的【AI Insight Talk】系列直播活动第四场 - 多模态专场,即将开播! http://t.cn/AXvZWqW4 http://t.cn/AXvZWq0F ​
2
0
2
HuggingFace
2025-08-21 03:01来自 微博直播平台
由 Hugging Face × OpenMMLab × ModelScope × 知乎 × 机智流 等联合发起的【AI Insight Talk】系列直播活动第四场 - 多模态专场,即将开播! http://t.cn/AXvZWqW4 http://t.cn/AXvZWq0F ​
5
0
5
HuggingFace
2025-08-20 22:20来自 微博网页版
HF Papers 直播| 多模态专场 由 Hugging Face × OpenMMLab × ModelScope × 知乎 × 机智流 等联合发起的【AI Insight Talk】系列直播活动第四场 - 多模态专场,即将开播! 📅 直播时间:2025 年 8 月 21 日( 周四 )20:00 - 22:00(北京时间) 近期各家多模态大模型纷纷开源,在开源社区引发了热 ​
5
0
4
HuggingFace
2025-08-20 04:09来自 微博网页版
⚡️ TRL 再升级,多模态对齐进入新阶段! 现在,视觉语言模型 (VLM) 不仅能用 SFT 和 DPO 微调,还新增三种强力方法 —— MPO、GRPO、GSPO,让模型看图说话更聪明、推理更稳。 🔍 三大新方法 MPO:在 DPO 基础上加“质量评分”和“生成”两种额外损失,像给模型加了三重指南针,减少胡言乱语,Math ​
3
0
8
HuggingFace
2025-08-14 10:17来自 微博网页版
✨ 命令行党福利!Hugging Face CLI 正式更名为 hf,更快、更简洁、更易用!🚀 长期用 huggingface-cli 打命令是不是觉得又长又乱?这次升级不仅省下键盘工夫,还彻底重构命令结构,采用 hf <资源> <操作> 的统一语法,让功能更清晰、更好找。 🔹 新结构亮点 资源分组:如 hf auth(认证)、hf re ​
1
1
0
HuggingFace
2025-08-06 21:47来自 微博网页版
🚀 OpenAI 重磅开源!GPT OSS —— 面向推理、AI 智能体与多样化开发场景的全新开源模型家族,已在 Hugging Face 上线! 本次发布带来两款混合专家(MoE)模型: gpt-oss-120b:117B 参数,5.1B 激活参数,MXFP4 量化(4 位混合精度,速度快、占用低),单张 H100 可跑 gpt-oss-20b:21B 参数,3.6B ​
3
0
5
HuggingFace
2025-08-06 09:32来自 微博网页版
📊 训练时想实时看曲线,还能一键分享给队友?Hugging Face 推出轻量级实验追踪库 —— Trackio!🚀 Trackio 是一个免费、开源、本地优先的 Python 库: 🪄 一行替换 wandb:兼容 wandb 常用 API,迁移零成本 💻 本地可视化:内置 Gradio 仪表盘,loss、accuracy 等训练曲线即刻可见 🌐 无 ​
8
2
13
HuggingFace
2025-07-29 22:17来自 微博网页版
🧬 不懂生物也能参加的挑战!Arc Institute 发布的 Virtual Cell Challenge,Hugging Face 帮你一文看懂!🧪 挑战目标:训练一个模型,预测在一个细胞中“沉默”某个基因后会发生什么变化。📉 这其实是一个纯数据驱动的机器学习任务,Arc 提供了约 30 万条单细胞 RNA 测序数据,模拟 CRISPR 敲除 ​
4
0
8
HuggingFace
2025-07-25 09:21来自 微博网页版
🧠 编码器 vs 解码器,谁才是通用模型架构之王?Hugging Face 推出全新开源模型套件 —— Ettin Suite,让你真正公平地对比二者能力!⚔️ Ettin 是首个基于相同架构、相同数据(2 万亿 Token)、相同训练配方,同时训练编码器(MLM)和解码器(CLM)的大模型套件,参数量覆盖从 17M 到 1B,真正实现 ​
9
1
8
HuggingFace
2025-07-22 09:51来自 微博网页版
🔥 Hugging Face 最新开源项目 ScreenEnv,让你轻松打造全栈桌面 AI 智能体!🖥️🤖 还在为部署桌面 GUI 智能体发愁?ScreenEnv 用 Docker 打包了完整的 Ubuntu 桌面环境,不用虚拟机,10 秒内就能搞定一个「能看、能点、能打字、还能录屏」的智能体实验室!💻 支持直接用 Python API 控制, ​
15
2
18
HuggingFace
2025-07-17 23:20来自 微博网页版
🚀 想让 AI 助手一键连接 Hugging Face Hub,轻松调用上千个 AI 应用?官方 MCP Server(hf.co/mcp)了解一下!🌐 Hugging Face 官方推出的 MCP Server,基于 Model Context Protocol(MCP,AI 助手与外部世界连接的标准协议),只需一个 URL,就能远程调用 Hugging Face Hub 上的模型、工具和 Gra ​
12
2
9
HuggingFace
2025-07-17 19:30来自 微博直播平台
转发微博
📢 AI for Science:科学智能体前沿解密 7月17日(周四)19:30-21:30,不见不散! 💡 重磅嘉宾 & 议题亮点: ✨ 孙秋实:发布 ScienceBoard,真实交互环境+169项科研任务,测智能体科学探索力,揭示瓶颈。 ✨ 周宇浩:介绍 Scientists' First Exam (SFE),五大领域、66项任务,探索多模态模型科学 ​
0
0
0
HuggingFace
2025-07-17 11:45来自 微博直播平台
📢 AI for Science:科学智能体前沿解密 7月17日(周四)19:30-21:30,不见不散! 💡 重磅嘉宾 & 议题亮点: ✨ 孙秋实:发布 ScienceBoard,真实交互环境+169项科研任务,测智能体科学探索力,揭示瓶颈。 ✨ 周宇浩:介绍 Scientists' First Exam (SFE),五大领域、66项任务,探索多模态模型科学 ​
8
8
8
HuggingFace
2025-07-11 21:00来自 微博网页版
📣 全开源、多语言、长上下文推理模型来了!SmolLM3 正式发布 🎉 SmolLM3 是 Hugging Face 推出的全新 3B 级别轻量模型,不仅在性能上超越同体积 LLaMA3-3B、Qwen2.5-3B,更可与 4B 模型正面对抗,在效率与能力之间达成理想平衡 🧠 🌍 多语言、长文本、推理能力全覆盖: 支持英文、法文、西班 ​
7
1
14
HuggingFace
2025-07-11 00:30来自 微博网页版
🧠 你准备好了模型、数据和 GPU,满怀期待点击“运行”……但 GPU 却闲着没事干,训练速度感人 💸 这是我们在训练 nanoVLM 多模态模型过程中遇到的真实问题。不是模型不行,不是硬件不给力,而是数据管道“卡脖子”了!在这篇博客中,Hugging Face 团队用 5 个阶段构建出一条高效的数据管道,让训 ​
10
1
21
HuggingFace
2025-07-09 23:23来自 微博网页版
🦾 桌面级开源机器人 Reachy Mini 来啦!售价仅 $299 起,支持语音识别、视觉理解,还能摇头摆动、互动交流,小小身体里藏着无限可能 🤖✨ 由 Hugging Face 与 Pollen Robotics 联合打造,Reachy Mini 是一款面向开发者、研究者、教育者乃至孩子们的多功能开源机器人。开箱即可使用 Python 编程, ​
5
3
9
HuggingFace
2025-07-08 23:24来自 微博网页版
🔥 Sentence Transformers v5 发布重磅更新!现在不仅支持 Dense 和 Reranker 模型训练,还原生支持「稀疏向量模型(Sparse Embedding Models)」的微调训练啦! 相比传统 dense 向量,稀疏向量维度更高但多数为 0,不仅节省存储,还更具可解释性。你甚至能清晰看到哪些词在匹配中起了作用,非常适 ​
5
3
9
HuggingFace
2025-07-03 19:30来自 微博直播平台
转发微博
19:30 不见不散 http://t.cn/A6DRIaDF http://t.cn/A6DRIagc ​
0
0
1
HuggingFace
2025-07-03 18:56来自 微博直播平台
19:30 不见不散 http://t.cn/A6DRIaDF http://t.cn/A6DRIagc ​
12
0
5
HuggingFace
2025-07-02 21:33来自 微博网页版
🔥 Google 发布的多模态模型 Gemma 3n 正式全面开源啦! Gemma 3n 最早在 Google I/O 上以“可本地运行的多模态模型”亮相,引发了社区的广泛关注。现在,这款模型已经全面登陆 Hugging Face 平台,并集成进多个主流开源库:包括 🤗 Transformers、timm、MLX、llama.cpp、Transformers.js、Ollama ​
23
1
31
HuggingFace
2025-07-01 08:19来自 微博网页版
🚀 大模型开发者看过来!SGLang 现在正式支持 Hugging Face Transformers 作为后端啦! Transformers 一直是最受欢迎的大语言模型开发工具,但部署时经常踩坑:推理慢、延迟高、上线难。而现在,SGLang 带来了真正“即插即用”的解决方案 ✨ 🎯 核心亮点: 支持运行 Hugging Face 上的绝大多数 Tr ​
22
1
26
HuggingFace
2025-06-26 12:47来自 微博网页版
🎨 想在消费级显卡上训练属于你自己的扩散模型风格?现在可以了! Hugging Face 最新实测:使用 QLoRA 技术在 RTX 4090 上微调 FLUX.1-dev,仅需不到 10 GB 显存,就能快速学习出 Alphonse Mucha 的新艺术风格 ✨。更棒的是,整套流程可在 Google Colab 免费运行(约 4 小时)! 🌟 关键优化技巧 ​
28
1
19
HuggingFace
2025-06-25 05:45来自 微博网页版
🏎️ 5 分钟上手 Hugging Face Kernel Hub,让你的模型飞起来!⚡️ 还在为 CUDA 编译、优化算子发愁?现在你只需一行代码,就能加载社区提供的高性能 GPU 核心函数(Kernel)! 🔥 Kernel Hub 是什么? Hugging Face 最新推出的 Kernel Hub 类似于“模型库”,但它收录的是 预编译、跨平台的高性 ​
24
1
22
HuggingFace
2025-06-24 02:07来自 微博网页版
🚀 Groq 正式加入 Hugging Face 推理服务提供商大家庭!🔥 我们很高兴宣布:超快推理引擎 Groq 现已接入 Hugging Face Hub,成为官方支持的推理服务提供商!用户现在可以在模型页面中直接选择使用 Groq,享受超低延迟、高吞吐量的 LLM 推理体验。 💡 Groq 是什么? Groq 推出的 LPU™(语言处理 ​
3
1
9
HuggingFace
2025-06-14 09:24来自 微博直播平台
由 Hugging Face × OpenMMLab × ModelScope × 知乎 × 机智流 联合发起的【AI Insight Talk】系列活动重磅来袭!本期我们将聚焦 强化学习(RL)与推理能力的前沿交汇,邀请多位在 Hugging Face Daily Papers 中热门论文的作者,共同探讨 RL 在推理中的技术挑战与未来潜力。 http://t.cn/A6eHRzn2 ​
7
0
29
HuggingFace
2025-06-12 08:30来自 微博网页版
🚀 Hugging Face 与 NVIDIA 合作推出 Training Cluster as a Service! 🤝 在 GTC Paris 大会上,我们激动地宣布 Training Cluster as a Service(训练集群即服务),与 NVIDIA 合作,旨在让全球研究机构更轻松地访问大规模 GPU 集群,推动各领域的基础模型训练! 为什么需要 Training Cluster as ​
2
0
10
HuggingFace
2025-06-11 20:28来自 微博网页版
🖥️ Hugging Face 发布 ScreenSuite:史上最全 GUI 智能体评测套件!🤯 什么是 GUI Agent?简单说,就是“能像人一样操作屏幕”的 AI!它能识别界面内容、点击按钮、输入文字、滚动页面……实现真实的“虚拟助手”体验。 现在,我们推出了全新的开源工具 —— ScreenSuite,帮助开发者和研究者评 ​
40
7
42
HuggingFace
2025-06-08 10:56来自 微博网页版
🚀 用 PyTorch 手撸 KV Cache,推理提速 38%!💡 想搞懂大语言模型推理如何加速?Hugging Face 的 nanoVLM 团队从 0 实现了 KV Cache,在纯 PyTorch 小代码库里做到了 推理加速 38%,而且适配所有自回归模型!🔥 🤔 什么是 KV Cache? 大语言模型每生成一个新 token,都要重新处理整个序列, ​
66
2
67
HuggingFace
2025-06-07 10:53来自 微博网页版
🚀 SmolVLA:高效的视觉-语言-行动模型,让机器人变得更智能! 🤖 今天我们为大家介绍 SmolVLA,一个紧凑的视觉-语言-行动(VLA)模型,专为机器人而设计,并且能够在普通硬件上运行!💻💡 SmolVLA 的特点: 仅需 450M 参数,支持在消费者硬件上训练和部署(甚至可以在 MacBook 上运行!) 预 ​
7
1
13
HuggingFace
2025-06-06 10:16来自 微博网页版
🚀 GPU 利用率提升 40%,无需额外硬件:Co-located vLLM + TRL 让训练更高效! 在训练大型语言模型时,生成与训练的频繁切换会导致GPU空闲,造成资源浪费。传统的做法是将生成与训练分配到不同的GPU上,导致“乒乓”效应(训练与生成互相等待): 训练时生成GPU空闲 生成时训练GPU空闲 💡 解决方 ​
15
1
9
HuggingFace
2025-06-05 11:08来自 微博网页版
🤖 让 AI 智能体更聪明、更稳定的新方法来了! 我们将 CodeAgent 的代码执行能力 与 结构化输出的可靠性 结合,提出一种更优的智能体行为生成方式——Structured CodeAgent,在多个推理与多步骤任务中表现出显著提升📈 🧠 传统 Agent 工具调用有这些局限: 只能选用预定义工具,缺乏灵活性 不支 ​
5
2
5
HuggingFace
2025-05-31 20:10来自 微博网页版
🐯 Liger GRPO 助力 TRL,实现强化学习微调新突破! 强化学习微调大语言模型(LLM)通常资源消耗巨大,尤其是经典的 PPO 方法。现在,Liger 与 TRL 携手推出 Group Relative Policy Optimization (GRPO) 优化方案,通过“分块计算损失”技术,峰值显存最高减少 40%,且无精度损失⚡。 ✨ 亮点速览: ​
6
0
6
HuggingFace
2025-05-30 19:42来自 微博网页版
🤖 Tiny Agents 上线 Python 版本啦!让 LLM 真正动起来,只需 70 行代码! Tiny Agents 是基于 MCP(Model Context Protocol)构建的轻量级智能体框架,现已支持 Python,并集成进 huggingface_hub,开发者可以轻松构建能“自动调用工具”的 LLM 应用⚙️ ✨ 有哪些亮点? 🧠 基于开放协议 MCP, ​
41
2
27
HuggingFace
2025-05-29 19:44来自 微博网页版
👀+🧠=nanoVLM!打造你自己的视觉语言模型,从未如此简单! 我们正式推出 nanoVLM:一个用纯 PyTorch 实现的超简洁 Vision Language Model(VLM)训练工具包 🎯。灵感来源于 Karpathy 的 nanoGPT,它是图文多模态世界的“极简入门门票”! ✨ 主要亮点: 📦 开箱即用:支持在免费 Colab Noteb ​
17
3
27
HuggingFace
2025-05-21 08:50来自 微博网页版
🌟 Transformers 库再升级,成就 AI 模型定义新标准! 自 2019 年诞生以来,Transformers 一直是大语言模型(LLM)和多模态模型(VLM)领域的核心工具。如今,它支持超过 300 种模型架构,每周新增约 3 个新模型,涵盖自然语言处理、计算机视觉与音频领域。 🔗 标准化模型定义 Transformers 现已 ​
9
1
13
HuggingFace
2025-05-19 20:13来自 微博网页版
🎉 重磅联动上线!Kaggle 与 Hugging Face 模型正式打通! AI 开发者的两个最活跃社区,终于连上了同一根数据线!现在你可以直接在 Kaggle Notebook 中一键调用 Hugging Face 模型,无需手动配置或复制链接,体验更加丝滑流畅 🚀 📍主要新特性: 在 Hugging Face 模型页点击“Use this model” ​
12
3
21
HuggingFace
2025-05-18 21:57来自 微博网页版
🎙️ Whisper 转录提速 8 倍!Hugging Face 推出全新极速部署方案! OpenAI 的 Whisper 模型迎来史上最快部署方式:我们将其集成到了 Hugging Face 的 Inference Endpoints 中,单击即可部署专属 ASR 模型,适配长音频转写、实时字幕、会议记录等场景 🎧 ✨ 主要亮点: 🚀 最多提升 8 倍推理速 ​
12
1
15
HuggingFace
2025-05-08 20:09来自 微博网页版
🎛️ 用 5 行 Python,让你的应用秒变 LLM 工具! Gradio 现已支持构建 MCP(Model Context Protocol)服务器,只需添加一个参数,就能让你的应用被大语言模型(如 Claude Desktop、Cursor 等)直接调用🔌。无论是图像生成、语音合成,还是计算器、翻译器,你的 Python 函数都能变成可被 LLM 使用 ​
41
3
33
HuggingFace
2025-05-02 10:44来自 微博网页版
🛡️ 模型也要“守门员”!Meta 推出多模态安全模型 Llama Guard 4,已在 Hugging Face 上线! 这是一个 dense 架构(非 MoE) 的 120 亿参数多模态安全模型,支持 图像+文本 风险检测,适配生产场景中对输入 Prompt 和模型输出内容的审查过滤,帮助构建更健壮的 AI 安全系统。 📌 Llama Guard 4 ​
4
1
8
HuggingFace
2025-05-01 10:48来自 微博网页版
🚀 低比特量化新突破!Intel 推出超强量化工具 AutoRound! 面对越来越庞大的大语言模型(LLMs)和多模态视觉语言模型(VLMs),部署效率成了新挑战。Intel 最新推出的量化工具 AutoRound,不仅轻量高效,还能在 INT2~INT8 低比特量化下保持极高准确率,可谓在精度与性能之间找到了理想平衡 ⚖️ ​
7
1
10
HuggingFace
2025-04-17 10:04来自 微博网页版
🔒 Hugging Face × Protect AI:6 个月扫描 447 万模型,AI 安全全面升级! 🚨 自 2024 年 10 月合作以来,Hugging Face 与 Protect AI 持续为开源模型构建安全“护城河”,如今已在 Hugging Face Hub 上实现了 447 万模型版本的深度扫描,共识别出 35 万+ 潜在风险! 🛡️ 新增 4 大高级威胁检 ​
0
0
6
HuggingFace
2025-04-10 04:42来自 微博网页版
📢 Arabic Leaderboards 全面升级!新增 Arabic Instruction Following、AraGen 03-25 更新等内容上线!🤖 为了推动阿拉伯语大语言模型的发展与评估,Inception 联合 MBZUAI 推出了全新的 Arabic-Leaderboards Space,集中发布并持续更新阿语 LLM 的多维评估榜单。 🌟 1. 全新统一评估平台上线 ​
2
0
4
HuggingFace
2025-04-06 10:28来自 微博网页版
📚 Hugging Face 的 NLP 课程正式升级为 LLM 课程啦! 🚀 在过去 3 年中,NLP 课程一直是开源 AI 社区的热门学习资源。随着大语言模型(LLM)技术的快速发展,我们也迎来了全新升级:NLP 课程正式更名为 LLM 课程! ✨ 为什么更名? 课程内容已扩展至 LLM 微调、推理、多模态模型等,更贴合当前 A ​
50
3
41
HuggingFace
2025-04-05 10:20来自 微博网页版
🔐 Hugging Face 如何在多云 AI 基础设施中重构 Secrets 管理?🚀 随着平台用户突破 400 万,Hugging Face 面临如何在多云环境中安全、高效地管理密钥的挑战。最终,他们选择将 Secrets 管理平台全面迁移到 Infisical,实现了跨环境、跨团队的一致性与自动化配置。 💡 背景挑战: 密钥蔓延风险 ​
0
0
4
HuggingFace
2025-04-04 10:30来自 微博网页版
🚀 加速 LLM 推理:TGI 与 Intel Gaudi 的原生集成 🤖 我们很高兴宣布,Intel Gaudi 硬件现已原生集成到 Text Generation Inference (TGI) 中,这意味着你将拥有更多强大的部署选项!🎉 ✨ 新特性亮点 通过 PR #3091 完全支持 Gaudi 硬件,告别之前需要维护的单独仓库,TGI 特性更全面! 支持 I ​
0
0
0
HuggingFace
2025-04-03 01:38来自 微博网页版
🔍 训练与微调 Sentence Transformers v4 版的 Reranker 模型 🚀 想要让你的模型在特定数据集上表现更好?微调 Reranker(排序)模型是一个有效的选择!通过利用 Sentence Transformers v4 版本,你可以在自己的数据上训练和微调 Reranker 模型,取得超越现有通用模型的效果。🎯 为什么微调至 ​
4
0
3
HuggingFace
2025-03-27 20:32来自 微博网页版
为什么 AI 模型离科学革命还差得很远? 作者:Thomas Wolf, Hugging Face 联合创始人和首席科学家 几天前,我在一个活动上分享了一个略显争议的观点,后来我决定把它写下来:我担心人工智能无法带来所谓的“压缩的 21 世纪”。 这个“压缩的 21 世纪”概念来自 Dario 的文章《Machine of Loving Grace ​
8
1
10
HuggingFace
2025-03-27 07:38来自 微博网页版
🤗 LeRobot开源机器人如何降低技术门槛 特斯拉人形机器人Optimus的核心开发者Rémi Cadene 从硅谷回到法国,坚信机器人技术正迎来ChatGPT般的革命。他加入了 Hugging Face 并创立了开源项目Le Robot,仅用110欧元和3D打印机制作出具备智能潜力的钓鱼线机械臂,试图突破当前机器人无法完成基础任务的技 ​
6
0
4
HuggingFace
2025-03-21 20:33来自 微博网页版
💻 开源编程助手来了!比肩 GPT-4o 和 Claude 的代码模型 OlympicCoder,现在可以本地跑了!🚀 还在依赖云端大模型写代码?试试开源新星 OlympicCoder 7B,在最新 LiveCodeBench 测评中,它甚至超过了 Claude 3.7 Sonnet 和 GPT-4o!本文教你如何在本地部署这个强大的模型,打造属于自己的 AI 编 ​
98
14
64
HuggingFace
2025-03-19 22:30来自 微博网页版
NVIDIA 在 GTC 2025 上带来了重磅 AI 机器人技术更新!🤖✨ 本次发布的三大开源项目,让物理人工智能(Physical AI)开发迈上新台阶: 🚀 Cosmos Transfer:全新的世界基础模型(World Foundation Model,WFM),支持多模态控制,可基于 3D 边界框、深度图、轨迹等输入生成高精度虚拟世界场景, ​
6
1
11
HuggingFace
2025-03-14 11:13来自 微博网页版
🎙️ 让 AI 和你实时对话!Hugging Face Speech-to-Speech (S2S) 来了! 🚀 Hugging Face 推出的 Speech-to-Speech (S2S),整合多个强大模型,实现流畅的语音交互:你说话,AI 立刻用合成语音回复你!🤯 💡 核心技术: 🔹 语音活动检测 (VAD) —— 识别何时开始 / 停止说话 🔹 语音转文 ​
7
1
6
HuggingFace
2025-03-12 10:54来自 微博网页版
🚀 Self-Speculative Decoding 让大语言模型 (LLM) 推理更快、更高效! Hugging Face 研究推出 早退出推测解码 (Self-Speculative Decoding),让 同一个模型 既能生成 Token,又能自我验证,无需额外的草稿模型,大幅提升文本生成速度,同时降低计算开销。 ✨ 相比传统推测解码的优势: ✅ 推理速 ​
11
2
18
HuggingFace
2025-03-05 11:22来自 微博网页版
🤗 Hugging Face 存储升级!从文件到块,提高效率 🚀 Hugging Face 目前存储了 30 PB 以上的模型、数据集和 Spaces,但由于 Git LFS 采用文件级存储和版本控制,每次修改都可能导致整文件重新上传,带来高昂的存储和传输成本。特别是 GGUF(8 GB+)、Safetensor(1 GB)、Parquet/CSV(200-300 MB ​
35
3
53
HuggingFace
2025-02-25 21:33来自 微博网页版
🤗 AI 创意工具新动态,第一期来啦! 🎉 过去一年,AI 艺术工具发展飞速,我们终于告别了“五指神教”😂,进入了更精细化、个性化的时代。从文本生成图像、个性化风格化,到视频和音频生成,开源模型正在迅速缩小与闭源模型的差距。2025 年,创意 AI 还会有哪些突破?一起来看看吧!👇 🔥 ​
3
0
6
HuggingFace
2025-01-15 10:31来自 微博网页版
🚀 模型评测的革命性工具:Judge 模型,让评估更智能! Judge 模型是专为评估神经网络生成输出而设计的强大工具,尤其适合文本生成任务。无论是评估流畅性、毒性还是相似性,Judge 模型都能提供高效、低成本的解决方案!✨ 什么是 Judge 模型评测? Judge 模型可执行以下关键任务: 1️⃣ 文本评分 ​
2
0
4
HuggingFace
2025-01-14 09:06来自 微博网页版
🚀 AI 模型评估新工具!最新数据集资源全解析 无论你专注数学推理、语言理解还是代码生成,这些数据集能帮你全面测试和优化模型性能👇 核心推荐数据集 数学推理: GSM8K: 提供 8.5K 道小学数学题,适合评估模型的逻辑推理能力。 MATH: 收录奥数级别问题,支持按难度分类测试,挑战高阶数学能力。 ​
11
0
5
HuggingFace
2025-01-13 07:30来自 微博网页版
🚀 Google 全新发布 PaliGemma 2!视觉语言模型的新高峰! PaliGemma 2 是 Google 最新推出的视觉语言模型,它结合了强大的 SigLIP 图像编码器和升级版 Gemma 2 文本解码器,在性能和灵活性上实现了显著提升。✨ PaliGemma 2 的亮点 多参数规模: 提供 3B、10B 和 28B 参数模型,满足从轻量到大规 ​
6
0
11
HuggingFace
2024-12-17 21:38来自 微博网页版
🤖 人工标注指南:提升数据质量的秘密武器! 无论是优化模型表现,还是构建高质量数据集,人工标注都是关键一步!掌握这些技巧,让你的标注更高效👇 核心步骤💡 挑选优秀标注者 确保标注者符合任务要求,例如:母语能力、高学历或领域专业知识。 检查答案是否由 LLM 生成,筛选掉低质量的标注 ​
5
0
15
HuggingFace
2024-12-17 06:14来自 微博网页版
🤖 人类评估:让 AI 更贴近人类偏好! AI 模型再强大,也需要人类评价来验证能力!通过人类评估,我们可以直接了解模型输出是否符合预期,并快速优化性能。这些方法简单易懂,快来了解👇 系统化评估:严谨又专业 探索模型能力: 如果没有数据集,设计任务并明确评分规则(如:生成有害语言得 0 分 ​
2
0
2
HuggingFace
2024-11-28 11:34来自 微博网页版
🚀 重磅发布:GGUF-my-LoRA,让 LoRA 转换更简单! LoRA(Low-Rank Adaptation)是一种高效微调大语言模型的技术,让你可以快速为模型添加新技能!比如,将一个通用聊天机器人改造成客服助手、法律顾问或医疗专家,轻松实现高效适配。💡 通过 GGUF-my-LoRA,你可以将 Hugging Face 的 PEFT LoRA ​
3
0
2
HuggingFace
2024-11-26 03:31来自 微博网页版
近年来,可穿戴设备领域快速发展,健康追踪成为了热门趋势,但许多消费级设备却是“黑箱”操作,用户根本不了解自己的数据是如何被采集和处理的。💭 为此,Halo 项目提出了一种全新的开源健康追踪解决方案!它以透明和可定制的方式,带你从零开始构建自己的智能设备,同时深入了解背后的技术逻辑。 ​
3
0
7
HuggingFace
2024-11-03 11:53来自 微博网页版
📢 Hugging Face 推出数据集 SQL 控制台!💥 随着 Hugging Face 上的数据集数量不断攀升,如何便捷地查询、过滤和发现数据集成为用户的新需求。为此,我们推出了全新的 SQL 控制台,让用户可以直接在 Hugging Face Hub 上使用 SQL 查询数据集! SQL 控制台亮点💡 本地化操作:SQL 控制台通过 D ​
3
0
3
HuggingFace
2024-11-02 11:42来自 微博网页版
📢 Hugging Face 与 TruffleHog 合作,共同增强平台安全性!🔒🤝 为了帮助开发者更好地防止敏感信息泄露,Hugging Face 正式引入了 TruffleHog 的秘密扫描功能!TruffleHog 是一款开源工具,能够检测代码中的密码、令牌等敏感信息,特别适用于 SaaS 和云服务平台的认证凭证。此合作旨在帮助开发 ​
4
2
9
没有更多微博了