Coinbase率先采用中国开源AI模型GLM与Kimi，大幅降低AI运营成本

美国科技企业正悄然将中国开源AI模型纳入其生产基础设施。面对顶级美国AI模型服务成本持续攀升的压力，加密货币交易平台Coinbase率先行动，将中国开源大模型作为默认选项，以在不压制使用量的前提下显著压缩AI开支。

Coinbase首席执行官Brian Armstrong于上周五晚间在X平台发文披露，公司已通过内部LLM网关，将智谱（Zhipu AI）最新发布的GLM 5.2以及北京月之暗面（Moonshot AI）推出的Kimi 2.7设为工程师的默认模型。Armstrong表示，在结合智能路由、缓存优化与上下文精简等措施后，Coinbase的AI支出已削减“近一半”，而token使用量仍在以指数级速度增长。

Armstrong指出，91%的工程师从未触及原有的AI使用上限，因此公司并未选择限制用量或增设消费提醒，而是转向“更便宜的默认模型”。GLM 5.2与Kimi 2.7均为开源权重模型，适用于常规任务场景；对于需要复杂推理或规划的任务，工程师仍可自由选用前沿商业模型。他认为，在执行层面使用顶级模型往往是“大材小用”。

在代码审查等关键环节，Coinbase采用多模型并行策略，让不同模型相互校验输出结果，以维持高质量标准。

此次成本优化依托三层基础设施重构：

智能路由：在自定义调度框架中，系统对提示词进行预处理，综合缓存命中率与模型定价，自动将任务分发至最经济高效的模型。Armstrong强调，最终目标是让AI自主完成模型选择。
积极缓存：所有请求均具备缓存感知能力，最大限度复用已有结果。以LibreChat为例，正确实施缓存机制后，缓存命中率从5%跃升至60%。
精简上下文：建议工程师在切换任务时开启新会话，缩小文件上下文范围，并断开未使用的工具连接，旨在减少“被浪费的token”，而非限制总用量。

Armstrong强调，此次调整的核心逻辑是“效率优先，而非压制使用”。工程师仍可自由使用任意数量的token和任意模型，但公司已将用量数据可视化，并将使用量与业务影响挂钩——“花得越多，我们期望的影响也越大”。

尽管未披露具体支出金额，但从结构上看，在AI使用量指数增长的同时实现支出近半削减，表明Coinbase已在一定程度上实现了AI消耗与成本的解耦。Armstrong总结称，这套方法论具有普适性，任何企业均可借鉴，以在不将成本设为天花板的前提下，实现AI使用规模的可持续扩张。