26-06-25 20:06 微博认证:数码博主

通了!
利用一台128GB内存的AI MAX+ 395主机作为服务器,给局域网内其他机器的Claude Code提供DeepSeek V4 Flash(Q2量化)的Anthropic API服务

下一步:
在两台128GB RAM AI MAX+ 395机器上使用USB 4网桥+SGLang部署多节点集群,运行官方发布的FP4精度DeepSeek V4 Flash

理论上应该是能这么干的? ​

发布于 上海