26-06-24 15:41

中国 AI 模型有一个巨大的优势: 它们的训练数据主要用中文,而且单个汉字所承载的意义远超英文单个字母。 这意味着它们每个 token 能压缩更多的数据。 这赋予了它们高达 4 倍的 token 压缩效率——这是基于英文的美国模型根本无法复制的固有优势。 这正是为什么 GLM 这个仅有 750B 的模型能够与 2T 级别的前沿模型竞争。
这个说法对吗?

发布于 广东