转发微博
根据我们公司内部庞大的软件测试集的结果,Google 最新的 Gemini 3.5 Flash 模型相比之前的更小更便宜的 Gemini 3.1 Flash Lite 确实有明显的退步,而这两个 Google 的小模型也明显比 Claude Haiku 4.5 要更好。
当然,这里比较的都是较小的 LLM 模型了。较大的模型,比如 GPT-5.5,明显要贵很多。
0
0
0