26-07-03 17:03 微博认证:微博公益合伙人 科技博主 微博原创视频博主

#如何看待AI模型蒸馏#Claude Code从2.1.91版本起就内置了检测机制,通过识别时区和域名来标记中国用户。被扒出来之后Anthropic说是"实验性"措施——这话说得挺轻巧。国内已经有企业直接把它列为高风险软件,禁止员工在办公环境使用。

有意思的是同一家公司,一边自己的工具里埋后门,一边指控中国AI实验室搞"工业级模型蒸馏攻击",说是利用大量账号进行了数千万次对话。后门算不算安全威胁,蒸馏算不算偷,其实都是同一个问题:当裁判兼球员的时候,规则怎么写就变得特别微妙了。

发布于 河北