中国 AI 模型有一个巨大的优势：它们的训练数据主要用中文，而且单个汉字所承载的意义远超英文单个字母。这意味着它们每个 token 能压缩更多的数据。这赋予了它们高达 4 倍的 token 压缩效率——这是基于英文的美国模型根本无法复制的固有优势。这正是为什么 GLM 这个仅有 750B 的模型能够与 2T 级

中国 AI 模型有一个巨大的优势：它们的训练数据主要用中文，而且单个汉字所承载的意义远超英文单个字母。这意味着它们每个 token 能压缩更多的数据。这赋予了它们高达 4 倍的 token 压缩效率——这是基于英文的美国模型根本无法复制的固有优势。这正是为什么 GLM 这个仅有 750B 的模型能够与 2T 级别的前沿模型竞争。
这个说法对吗？

发布于广东