通了!
利用一台128GB内存的AI MAX+ 395主机作为服务器,给局域网内其他机器的Claude Code提供DeepSeek V4 Flash(Q2量化)的Anthropic API服务
下一步:
在两台128GB RAM AI MAX+ 395机器上使用USB 4网桥+SGLang部署多节点集群,运行官方发布的FP4精度DeepSeek V4 Flash
理论上应该是能这么干的?
发布于 上海
通了!
利用一台128GB内存的AI MAX+ 395主机作为服务器,给局域网内其他机器的Claude Code提供DeepSeek V4 Flash(Q2量化)的Anthropic API服务
下一步:
在两台128GB RAM AI MAX+ 395机器上使用USB 4网桥+SGLang部署多节点集群,运行官方发布的FP4精度DeepSeek V4 Flash
理论上应该是能这么干的?