好消息接踵而至:Snowflake与AWS签署60亿美元AI芯片协议

Snowflake刚刚与AWS承诺在五年内投入60亿美元用于AI CPU芯片。这一宣布标志着企业对AI基础设施思维方式的地震级转变,也是亚洲开发者应该理解的转变。

Share
Editorial illustration: A sleek server rack or data center corridor photographed head-on, with dramatic side lighting castin — MonstarX

Snowflake刚刚与亚马逊云服务(AWS)承诺在五年内投入60亿美元用于AI CPU芯片——这笔交易几乎相当于这家云数据巨头自2012年以来在AWS上的全部支出。这一宣布标志着企业对AI基础设施思维方式的地震级转变,也是亚洲开发者应该理解的转变。虽然关于亚洲AI开发工具的讨论通常集中在GPU和训练模型上,但这笔交易突显了接下来会发生什么:大规模运行AI代理和生产工作负载的CPU密集型工作。

对于在AI原生开发平台上构建应用的开发者来说,Snowflake-AWS合作伙伴关系揭示了行业的发展方向。随着AI从实验性笔记本转向每天处理数百万请求的生产系统,基础设施需求发生了巨大变化。这不仅仅是关于训练更大的模型——而是关于在真实应用中高效运行这些模型。

Snowflake-AWS交易对AI基础设施意味着什么

这份60亿美元的协议围绕亚马逊的Graviton芯片展开——这是专为云工作负载设计的基于ARM的CPU。根据两家公司的声明,Snowflake在2025年的AWS支出翻倍增至20亿美元,几乎完全由其Cortex AI平台的AI工作负载驱动。

技术原因很重要:虽然GPU擅长模型训练和推理的并行处理,但CPU处理编排层。当AI代理查询数据库、处理结果、做出决策并触发工作流时,这些操作在CPU上运行。随着企业部署越来越多的AI代理——这些系统自主行动而不仅仅是响应提示——CPU需求会急剧增加。

亚马逊首席执行官Andy Jassy上月声称AWS自主研发的芯片比英伟达的产品提供"更好的性价比"。无论这是营销还是事实,战略信息很清楚:云服务提供商正在摆脱对单一芯片的依赖。对于东南亚的开发者来说,云成本可能决定创业公司的单位经济学,这种竞争降低了价格并增加了选择。

Snowflake对Graviton的押注也验证了ARM架构在企业AI工作负载中的应用。从历史上看,来自英特尔和AMD的x86芯片主导了数据中心,但ARM的功率效率和成本优势正在重塑这一格局。构建AI应用的开发者应该在其工具链中考虑ARM兼容性——性能特征在大规模应用中差异足够大。

亚洲开发者应如何看待AI开发工具

Snowflake交易强调了一个更广泛的真理:2026年的AI开发不是关于在工具之间选择,而是关于选择基础设施策略。亚洲开发者面临独特的约束——到美国云区域的延迟、印度尼西亚和越南等市场的数据主权要求,以及使每一美元计算成本都至关重要的预算限制。

这种环境下最好的AI开发工具具有三个特点。首先,它们在不完全隐藏复杂性的情况下抽象基础设施复杂性。你需要了解什么在哪里运行,特别是在调试生产问题或优化成本时。其次,它们支持多云部署模式。锁定在单个提供商的生态系统中可能适合拥有无限资本的硅谷独角兽,但亚洲创业公司需要灵活性。第三,它们优先考虑开发者速度而不是配置选项——快速交付比调整每个参数更重要。

这是为AI原生开发而构建的平台与传统开发工具的区别所在。一个附加了AI自动完成功能的常规IDE无法解决编排问题。你仍然需要手动连接数据库、API、身份验证和部署管道。从一开始就为AI工作流设计的平台本地处理这些集成,让开发者专注于业务逻辑而不是基础设施胶水代码。

一些人所谓的vibe coding的兴起——开发者用自然语言描述他们想要的东西,平台生成可工作的代码——代表了这一转变。这不是关于替代开发者;而是关于消除每个项目在构建有趣的20%之前需要的繁琐80%的工作。

CPU优先的AI:对生产工作负载意味着什么

Snowflake的Cortex AI平台说明了为什么CPU容量比大多数开发者意识到的更重要。当用户提出关于其数据的自然语言问题时,系统执行多个操作:解析查询、将其转换为SQL、执行数据库调用、处理结果、生成摘要并格式化响应。通常只有摘要生成步骤在GPU上运行——其他一切都是CPU绑定的。

将其乘以数千个并发用户,你就会理解为什么Snowflake需要60亿美元的CPU容量。同样的模式适用于任何生产AI系统:聊天机器人、推荐引擎、文档处理管道或自动化工作流。GPU处理"智能"部分,但CPU处理周围的一切。

对于在现代平台上构建应用的开发者来说,这种架构大多是看不见的。该平台处理资源分配,根据工作负载模式自动扩展CPU和GPU容量。但理解基础经济学有助于你做出更好的设计决策。如果你的应用每个用户会话进行一次AI调用,GPU成本占主导。如果它围绕单个AI调用进行数十次API调用、数据库查询和数据转换,CPU成本占主导。

亚洲开发者还应考虑区域可用性。AWS Graviton实例在所有区域都不统一可用,到最近GPU集群的延迟差异很大。新加坡提供了出色的连接性,但在雅加达、马尼拉或曼谷的开发者可能会看到50-100毫秒的额外延迟。对于交互式应用,该延迟会随着每个往返而累加。

为亚洲市场选择AI开发工具

亚洲分散的云格局需要与美国开发者可能使用的不同的工具策略。印度尼西亚的数据驻留法律要求某些数据保留在国内。中国的监管环境造成了独特的约束。印度的价格敏感性意味着每一卢比的计算成本都很重要。

首先审计你的基础设施需求。你需要GPU访问来进行训练,还是仅用于推理?你能否批量推理请求以在多个用户之间分摊GPU成本?量化模型在CPU上运行是否能以极低的成本满足你的性能要求?这些问题比功能清单更能决定你的工具需求。

接下来,评估集成模式。最好的平台提供与常见服务的预构建连接器——数据库、身份验证提供商、支付网关、消息系统。从头开始构建这些集成需要花费数周的开发时间并引入维护负担。本地处理此连接性的平台让你能够更快地交付并更自信地迭代。

最后,考虑部署模型。某些工具要求你管理Kubernetes集群、容器注册表和CI/CD管道。其他工具则将所有这些抽象化,让你通过单个命令进行部署。两种方法都不是普遍更好的——这取决于你的团队专业知识和应用的需求。但对于构建AI应用的小团队,托管平台通常比自托管解决方案提供更好的速度。

云竞争的更广泛影响

Snowflake-AWS交易