🚀 Claude 现在真的能训练大模型了！一句话搞定微调流程！Hugging Face 推出全新工具 Hugging Face Skills，让 AI 编程助手 Claude 首次具备完整微调能力：不仅能写训练脚本，还能自动选择 GPU、提交任务、实时监控进度，并自动上传模型到 Hub 🎯！📌 你只需要一句自然语言指令，比如：“Fin

🚀 Claude 现在真的能训练大模型了！一句话搞定微调流程！
Hugging Face 推出全新工具 Hugging Face Skills，让 AI 编程助手 Claude 首次具备完整微调能力：不仅能写训练脚本，还能自动选择 GPU、提交任务、实时监控进度，并自动上传模型到 Hub 🎯！

📌 你只需要一句自然语言指令，比如：
“Fine-tune Qwen3-0.6B on open-r1/codeforces-cots”

Claude 就会自动完成：
验证数据集格式 ✅
选择合适硬件（如 t4-small）💡
配置训练脚本并启用 Trackio 监控 📊
提交任务到 Hugging Face Jobs ☁️
返回 Job ID 和成本估算 💸
实时汇报进度或协助调试问题 🔧
训练完成后自动发布模型 🎉

🧠 支持三种主流训练方式：
监督微调（SFT）：适用于有清晰输入输出对的数据
偏好优化（DPO）：用“更好 vs 更差”响应对训练人类偏好
强化学习（GRPO）：适用于数学、编程等有明确评价标准的任务

💰 Claude 会根据模型大小自动分配合适 GPU，例如：
0.6B 模型使用 t4-small，训练约 20 分钟，仅需约 $0.30
大模型自动启用 LoRA，可在单卡上高效训练 🔥

👀 全流程用自然语言控制，简单易用：
想快速测试训练流程？你只需说：“做一次包含 100 条样本的 SFT 测试训练。”
想查看训练进度？问 Claude：“我的训练任务现在怎么样了？”
想本地部署？告诉 Claude：“把我训练好的模型转换成 GGUF 并使用 Q4_K_M 量化。”

✨ 支持 Claude Code、OpenAI Codex、Gemini CLI 等平台，未来还将拓展更多 AI 编程助手。你可以从微调、到对齐、再到强化学习，构建完整的多阶段训练流水线！

🤗 欢迎加入我们的中文社区：Chinese LLMs on Hugging Face，一起交流模型训练与应用实践！
#HuggingFace##Claude##AI微调#

发布于美国