🚀 Claude 现在真的能训练大模型了!一句话搞定微调流程!
Hugging Face 推出全新工具 Hugging Face Skills,让 AI 编程助手 Claude 首次具备完整微调能力:不仅能写训练脚本,还能自动选择 GPU、提交任务、实时监控进度,并自动上传模型到 Hub 🎯!
📌 你只需要一句自然语言指令,比如:
“Fine-tune Qwen3-0.6B on open-r1/codeforces-cots”
Claude 就会自动完成:
验证数据集格式 ✅
选择合适硬件(如 t4-small)💡
配置训练脚本并启用 Trackio 监控 📊
提交任务到 Hugging Face Jobs ☁️
返回 Job ID 和成本估算 💸
实时汇报进度或协助调试问题 🔧
训练完成后自动发布模型 🎉
🧠 支持三种主流训练方式:
监督微调(SFT):适用于有清晰输入输出对的数据
偏好优化(DPO):用“更好 vs 更差”响应对训练人类偏好
强化学习(GRPO):适用于数学、编程等有明确评价标准的任务
💰 Claude 会根据模型大小自动分配合适 GPU,例如:
0.6B 模型使用 t4-small,训练约 20 分钟,仅需约 $0.30
大模型自动启用 LoRA,可在单卡上高效训练 🔥
👀 全流程用自然语言控制,简单易用:
想快速测试训练流程?你只需说:“做一次包含 100 条样本的 SFT 测试训练。”
想查看训练进度?问 Claude:“我的训练任务现在怎么样了?”
想本地部署?告诉 Claude:“把我训练好的模型转换成 GGUF 并使用 Q4_K_M 量化。”
✨ 支持 Claude Code、OpenAI Codex、Gemini CLI 等平台,未来还将拓展更多 AI 编程助手。你可以从微调、到对齐、再到强化学习,构建完整的多阶段训练流水线!
🤗 欢迎加入我们的中文社区:Chinese LLMs on Hugging Face,一起交流模型训练与应用实践!
#HuggingFace##Claude##AI微调#
