导航菜单
首页
排名 涨幅榜 跌幅榜 24h成交额 新币榜
快讯 机构 观点 人物 专题

Coinbase率先采用中国开源AI模型GLM与Kimi,大幅降低AI运营成本

美国科技企业正悄然将中国开源AI模型纳入其生产基础设施。面对顶级美国AI模型服务成本持续攀升的压力,加密货币交易平台Coinbase率先行动,将中国开源大模型作为默认选项,以在不压制使用量的前提下显著压缩AI开支。

Coinbase首席执行官Brian Armstrong于上周五晚间在X平台发文披露,公司已通过内部LLM网关,将智谱(Zhipu AI)最新发布的GLM 5.2以及北京月之暗面(Moonshot AI)推出的Kimi 2.7设为工程师的默认模型。Armstrong表示,在结合智能路由、缓存优化与上下文精简等措施后,Coinbase的AI支出已削减“近一半”,而token使用量仍在以指数级速度增长。

美国科技企业悄然转向中国AI模型 Coinbase带头用上GLM与Kimi

Armstrong指出,91%的工程师从未触及原有的AI使用上限,因此公司并未选择限制用量或增设消费提醒,而是转向“更便宜的默认模型”。GLM 5.2与Kimi 2.7均为开源权重模型,适用于常规任务场景;对于需要复杂推理或规划的任务,工程师仍可自由选用前沿商业模型。他认为,在执行层面使用顶级模型往往是“大材小用”。

在代码审查等关键环节,Coinbase采用多模型并行策略,让不同模型相互校验输出结果,以维持高质量标准。

此次成本优化依托三层基础设施重构:

  1. 智能路由:在自定义调度框架中,系统对提示词进行预处理,综合缓存命中率与模型定价,自动将任务分发至最经济高效的模型。Armstrong强调,最终目标是让AI自主完成模型选择。
  2. 积极缓存:所有请求均具备缓存感知能力,最大限度复用已有结果。以LibreChat为例,正确实施缓存机制后,缓存命中率从5%跃升至60%。
  3. 精简上下文:建议工程师在切换任务时开启新会话,缩小文件上下文范围,并断开未使用的工具连接,旨在减少“被浪费的token”,而非限制总用量。

Armstrong强调,此次调整的核心逻辑是“效率优先,而非压制使用”。工程师仍可自由使用任意数量的token和任意模型,但公司已将用量数据可视化,并将使用量与业务影响挂钩——“花得越多,我们期望的影响也越大”。

尽管未披露具体支出金额,但从结构上看,在AI使用量指数增长的同时实现支出近半削减,表明Coinbase已在一定程度上实现了AI消耗与成本的解耦。Armstrong总结称,这套方法论具有普适性,任何企业均可借鉴,以在不将成本设为天花板的前提下,实现AI使用规模的可持续扩张。