两年前,绝大多数人还不知道词元(Token)是什么。如今,它已悄然成为全球人工智能(AI)产业最基本的计价单位。这个从技术术语中走出来的概念,没有经过公众讨论,没有经过社会准备,就突然地摆在每一个使用大语言模型的人面前。
词元是大语言模型处理文本的最小单元。一段文字被模型拆解成若干个小段,每个小段就是一个词元。一个英文单词可能对应一个或多个词元,一个汉字通常对应一到两个词元。真正让词元从实验室走进公共视野的,是它成为AI服务的主流计价方式。OpenAI的GPT-4o每百万输入词元收费2.5美元(约3.2新元),每百万输出词元收费10美元。无形的智能能力,正在被量化为词元的流通。
理解词元,是理解当前AI产业变革的起点。因为它改变的不仅仅是计价方式,而是整个商业模式的基础逻辑。在此之前,AI服务要么以项目制打包报价,要么以订阅制按人头收费,服务质量与成本之间缺乏透明的对应关系。词元计价打破这种黑箱,让算力消耗、模型能力与商业成本之间,建立精确的映射。这也解释为什么中国日均词元调用量,可以在一年多时间内,从1000亿增长到140万亿,以及为什么单词元推理成本累计下降超过99%后,全球总调用量反而爆发式增长。
但仅仅理解词元是不够的,真正考验的是如何计量。目前全球词元计量处于混乱状态,不同模型的分词方式互不兼容,同一段文字在不同平台上的词元计数,可能相差20%以上。对个人用户而言,这或许可以容忍,但对跨国企业而言,这意味着成本核算的混乱和技术采购的障碍。
英伟达近期提出的“每瓦词元数”指标,试图将能效纳入计量体系,这是一个积极信号。然而,更基础的工作仍然缺失——建立跨平台、跨模型兼容的词元计量标准。从全球竞争格局来看,谁能在这个领域率先形成事实标准,谁就能在智能经济的规则制定中占据先机。
据OpenRouter统计,今年5月最后一周,全球AI大模型总调用量为31.8万亿词元,其中中国模型调用量为11.13万亿,连续六周位居首位,美国同期为4.24万亿。必须说明的是,OpenRouter的用户中,中国开发者仅占约6%,这意味着中国模型的调用量,主要来自全球开发者市场的实际使用。调用量的领先固然重要,但若不能在计量标准上拥有话语权,这种领先就缺乏制度保障。
从计量再往前走一步,就到治理。词元的大规模流通,带来三个层面的治理难题:数据隐私、公平竞争和可持续性。每一次词元运算都伴随数据的输入与输出,这些数据可能包含商业机密或个人隐私。大型科技公司掌握着词元的定价权和计量规则,中小企业处于被动接受的位置。大规模词元运算消耗惊人的电力,“每瓦词元数”的提出,正是对这一问题的回应。
新加坡在这三个环节中处于一个特殊位置。摩根士丹利2025年底发布的报告显示,借助AI带来的创新与生产率提升,新加坡可维持3%的国内生产总值(GDP)增长率,有望成为全球增长最快的发达经济体之一。目前超过70%的新加坡企业已采用AI技术,活跃的AI研究机构超过80家,AI初创企业超过1000家。新电信持续扩容数据中心,Salesforce承诺10年内投资10亿美元,甲骨文设立AI卓越中心。这些投资表明,跨国企业将新加坡视为词元经济的重要节点。但作为节点还不够,领英一项调查显示,在本地中小企业中,仅26%的员工将AI用于战略制定或数据分析等核心任务,超过一半的员工在日常工作中基本不使用AI。这意味着,从“理解词元”到“有效使用词元”,中间还存在明显的断层。
这个断层恰恰是新加坡可以着力填补的地方。词元计价模式理论上对中小企业友好——按需付费,不必自建模型或购买算力。但现实中,大多数企业尚未跨越从“可用”到“会用”的障碍,原因不在词元本身,而在于工具链、数据清洗、流程适配等配套能力的缺失。如果能在标准制定、工具链完善、中小企业赋能等环节,形成不可替代的节点价值,新加坡就不必在中美之间比拼词元总量,却依然可以在智能经济的新分工格局中,占据主动。
词元正在将AI从一种技术能力,转化为一种可计量、可交易、可流通的数码生产资料。对于新加坡而言,跟上词元的脚步,意味着在理解、计量、治理这三个层次上,依次展开行动。它们不是彼此割裂的步骤,而是一个相互支撑的整体:没有准确的理解,计量就无从谈起;没有统一的计量,治理就会失去依据;没有有效的治理,词元经济的可持续性就会受到质疑。词元的脚步声已经响起,跟上它需要的不只是意愿,而是一整套从认知到规则的系统性准备。
作者是财经媒体专栏作家