算力战争新物种:词元如何成为AI时代的“原油”

2019年,Transformer架构横空出世时,没有人会想到,七年后会出现一个叫“词元”的计量单位,让整个AI产业链为之疯狂。 算力战争新物种:词元如何成为AI时代的“原油” IT技术

时间回溯:从实验室到工厂的蜕变

词元(Token)的概念其实并不复杂。在AI模型眼里,任何输入都要被切分成最小的处理单元——一个汉字、一个英文字母、一张图片的某个区域,都可以是词元。你让ChatGPT写一篇文章,或者让国产大模型识别一张发票,每次处理都在消耗这个词元。 算力战争新物种:词元如何成为AI时代的“原油” IT技术

真正让人震惊的是用量变化的幅度。2024年初,全国AI日均词元消耗不过1000亿。而到了今天,这个数字已经飙升到140万亿。两年时间,1400倍的增速,这在任何工业品的历史上都极为罕见。 算力战争新物种:词元如何成为AI时代的“原油” IT技术

关键节点:数据背后的博弈

最近一周的全球大模型词元调用统计显示,中国达到了12.96万亿,美国是3.03万亿。中国是美国的四倍还多,而且这已经是连续第五周领先。全球调用量前六的模型,全部来自中国公司,阿里通义千问稳居榜首。

美国人当然不服气。第三方测评机构的数据摆在那里:美国模型编程能力得分80.8%,中国模型80.2%,差距仅0.6个百分点。但价格呢?国产API每百万词元2元人民币,美国同级别产品高达60元。三十倍的价差,换来几乎可以忽略不计的性能差距。

这就是为什么2025年中国开源模型的全球下载量已经超越美国。硅谷投资人私下透露,超过一半的AI创业公司在使用中国开源模型。开发者用脚投票的结果,比任何宣传都有说服力。

算力瓶颈:繁荣背后的结构性困境

问题随之而来。应用端需求爆炸,但底层算力的供给却捉襟见肘。高端GPU的租赁价格从去年下半年开始疯涨。英伟达H100从1.7美元/小时涨到2.35美元,涨幅接近40%。更高端的H200更是上架即售罄,根本抢不到货。

产业链上游同样在涨价。DDR5内存同比涨了四倍,NAND闪存涨了五倍。一台配置H200的服务器,成本从190万跳到230万。需求端的火爆和供给端的紧张,形成了当前算力市场最魔幻的景象。

这种矛盾的本质在于推理需求的爆发。以前的AI应用多是简单对话,单次消耗词元有限。现在的智能体、多模态模型,一次请求的词元消耗是过去的5到10倍。推理负载已经占据AI算力总需求的60%以上。

防骗指南:词元本质再定义

国家安全部近期专门发声,提醒公众警惕“囤词元暴富”的骗局。这背后的逻辑很清楚:词元本质上是一个计费单位,类似手机流量或电费度数。任何号称可以囤积、炒作、增值的“词元理财产品”,都是彻头彻尾的骗局,底层可能还存在数据窃取的风险。

摩根大通的预测显示,到2030年,中国AI推理词元消耗量将达到3900千万亿。从现在的140万亿到那个数字,五年内还要翻几百倍。这个趋势不可逆转。

作为技术人员或投资者,需要清醒认识到:词元是AI时代的生产资料消耗指标,而非可炒作的金融标的。真正的机会,在于如何利用低成本的AI能力创造实际价值,而非参与一场注定崩盘的零和游戏。