AI 世界正在变得'循环化'
AI 循环代表了 AI 系统工作方式的下一个重大架构转变。对于在亚洲构建应用的开发者来说,这种转变具有特定的意义,值得深入探讨。
AI 世界正在变得'循环化'
在 Meta 上周五举办的 @Scale 大会上,观众中有人问 Claude Code 的创造者 Boris Cherny,AI 循环是下一个炒作周期还是真实存在的技术。他的回答很直接:真实存在,其重要性不亚于从手写代码到智能体 AI 的转变。这次对话为全球开发者一直在默默实验的东西取了一个名字,它重新定义了我们应该如何思考 AI 系统的真正能力。AI 世界正在变得'循环化',对于在亚洲构建应用的开发者来说,这种转变具有特定的意义,值得深入探讨。
发生了什么
Anthropic 公司 Claude Code 负责人 Boris Cherny 在 Meta 的 @Scale 大会上表示,"循环"代表了 AI 系统工作方式的下一个重大架构转变。他描述的进展过程值得直接引用:"两年前,我们手写源代码。我们开始过渡到由智能体编写代码。现在我们正在过渡到智能体提示其他智能体然后编写代码的阶段。" 他辩称,从智能体 AI 到循环 AI 的飞跃与从手动编码到智能体的飞跃一样重要。
循环在实践中究竟是什么样的?Cherny 在演讲中描述了他自己的设置 :一个智能体持续扫描改进代码架构的方式,另一个寻找可以统一的重复抽象。两者都像任何人类贡献者一样提交拉取请求。由于代码库不断变化,两个智能体都永不停止运行。没有终点线——只有持续的后台改进。
这并不是完全陌生的领域。递归循环自计算机科学诞生以来就一直是主要内容——函数调用自身直到满足条件。这里的不同之处在于停止条件不是确定性的。子智能体决定循环何时完成足够的工作,而不是硬编码的规则。这种非确定性使其感觉真正新颖。
一个已经在开发者社区中流行的实现是 Ralph Loop——以 Ralph Wiggum 的名字命名,非常聪慧——它通过总结模型迄今为止完成的一切并询问目标是否已达成来工作。这是一种简单但有效的方法,可以防止 AI 模型在长期运行时偏离,本质上是在动作和自我评估之间反复传递模型,直到任务完成。
还有与更广泛的测试时间计算推动的联系——这是一个观点,即模型可以通过花费更多时间进行推理而不是简单地扩展参数来产生更好的输出。循环完美地融入了这个框架:与其进行一次大的推理传递,不如随时间进行连续的迭代改进。
为什么它对亚洲很重要
亚洲的开发者生态一直在采用上行动迅速,但这里的结构条件使循环范式特别相关。东南亚、印度和东亚的工程人才快速增长,但相对于需要构建的软件规模,高级工程师时间仍然昂贵且稀缺。一个在后台持续重构代码库、捕捉重复抽象并提交 PR 的智能体——这不是生产力倍增器,而是小团队可以维护的东西的结构性改变。
考虑一个在雅加达或胡志明市的五人初创公司发布金融科技产品。他们处理的代码库增长速度超过了团队审查的能力。技术债不是因为任何人粗心而积累,而是因为根本没有足够的时间。在后台运行的持久重构智能体——Cherny 描述的那种——恰好解决了这个约束。它不会替代工程师;它处理工程师总是推迟的工作类别。
还有一个语言维度特别对亚洲很重要。AI 智能体生态中的大部分工具和文档都是英文优先的。循环本质上更抽象——它们在代码级别运行,语言障碍关系较少。改进你的 TypeScript 或 Python 架构的智能体不需要理解印度尼西亚语或普通话来完成其工作。这使得循环智能体对亚洲开发团队的可访问性比许多依赖于细微自然语言理解的其他 AI 功能更高。
亚洲科技界在多智能体架构实验方面也比大多数地区更快,特别是在企业自动化中。在 MonstarX 等平台上构建的公司已经在考虑彼此协调的智能体,而不仅仅是单一模型推理。循环概念自然地融入了这种思维模式——对于已经使用智能体工作流的团队来说,这不是一个概念上的飞跃。
当然,风险在于没有充分监督的循环运行可以像改进一样轻松地复合错误。一个对什么构成良好抽象有错误认识的智能体将永远保持错误,大规模地。这个治理挑战是真实的,亚洲团队在采用这些模式时需要刻意思考。
这对开发者意味着什么
如果你今天正在使用 AI 构建,循环会改变你对系统正在做什么的心理模型。你不再是发送提示并等待响应。你在配置一个持久过程——一个有目标、做决定并持续产生输出的过程。这更接近于雇用承包商而不是运行查询。
实际上,这对你的构建方式意味着什么:
- 严格限定你的智能体范围。 Cherny 的智能体各有狭窄、明确定义的任务——一个寻找架构改进,另一个寻找重复的抽象。它们不做所有事情。范围越紧,循环偏离到造成损害的领域的可能性就越小。
- 将评估构建到循环中。 Ralph Loop 之所以有效是因为它强制模型检查自己的进度。你运行的任何循环都应该有一个评估步骤——无论是子智能体、测试套件还是超过特定复杂性阈值的 PR 的人工审查门。
- 将循环输出视为贡献者 PR。 Cherny 的智能体提交拉取请求。这是正确的抽象。不要自动合并。像审查初级开发者的工作一样审查循环输出——注意变更是否正确,而不仅仅是它是否编译。
- 从只读循环开始。 在你让智能体写入和提交之前,在观察模式下运行它。让它标记它会改变的内容而不实际改变任何东西。这让你了解其判断在你交付写入权限之前是否值得信赖。
- 监控随时间的偏离。 运行数天或数周的循环可以积累复合的小错误。设置日志记录,让你审计循环做了什么,而不仅仅是它目前在做什么。
这方面的工具仍在成熟。大多数开发者今天手动拼接循环——使用编排框架、自定义评估脚本和大量提示工程。但原语变得越来越清晰,支持具有适当状态管理的持久智能体执行的平台将随着这种模式的传播而变得更有价值。
对于使用 MonstarX 的团队来说,这种转变特别相关。