Anthropic创建了代理间商务测试市场

Anthropic刚刚进行了一项实验,展示了AI开发的发展方向。该公司建立了一个分类市场,AI代理使用真实资金为真实商品进行谈判。这对亚洲地区使用AI开发工具的开发者都很重要,因为它证明了代理可以处理复杂的多步交易。

Share
Editorial illustration: A minimalist marketplace stall or trading post—perhaps a simple wooden counter or exchange booth—pho — MonstarX

Anthropic创建了代理间商务测试市场

Anthropic刚刚进行了一项实验,展示了AI开发的发展方向——这与回答支持工单的聊天机器人无关。该公司建立了一个分类市场,AI代理使用真实资金为真实商品进行真实交易谈判,人类只在一旁观看。这对亚洲地区使用AI开发工具的每位开发者都很重要,因为它证明了代理可以在没有持续人工监督的情况下处理复杂的多步交易。未来不是AI辅助开发——而是AI原生商务,而你今天选择的工具决定了你是否为此做好了准备。

Project Deal中,69名Anthropic员工获得了100美元的预算(通过礼卡)来通过AI代理买卖物品。没有直接的人工谈判——只是代理代表双方,讨价还价,达成交易。结果呢?186笔完成的交易,总价值超过4,000美元。但真正的洞察不在于成功率。而在于当用户由不同模型版本代表时发生的情况:拥有更先进代理的人获得了客观上更好的结果,但大多数用户甚至没有意识到他们处于劣势。这就是"代理质量差距"——它即将来到你构建的每个市场、每个API、每个集成。

什么是AI开发工具?

AI开发工具是允许开发者将机器学习功能集成到应用程序中而无需从头构建模型的平台、框架和API。它们的范围从简单的情感分析API到处理从数据摄入到模型部署的全栈平台。该术语涵盖代码补全工具(如GitHub Copilot)、低代码平台、向量数据库和协调多个AI模型的编排框架。氛围编码的转变——开发者用自然语言描述他们想要什么,AI生成可工作的代码——模糊了"开发者"和"构建者"之间的界限。你不再需要计算机科学学位来交付AI驱动的应用。你需要的是正确的平台和系统思维能力。传统工具要求你理解Transformers、微调和张量形状。现代AI开发工具抽象了这种复杂性,让你可以专注于解决实际的业务问题。

对于亚洲开发者来说,这很重要,因为该地区的开发者生态一直优先考虑速度和实用性而非学术纯粹性。亚洲最好的AI开发工具不是功能最多的工具——而是让你快速交付、更快迭代、在用户基数爆炸时无需重写所有内容就能扩展的工具。MonstarX正是为这一现实而构建的:针对常见用例的预构建模板、对地区支付网关和数据库的原生支持,以及假设你在构建业务而非研究论文的文档。

Anthropic的市场实验揭示了关于AI平台的什么

Project Deal不仅仅是一个有趣的内部实验。它揭示了每个开发者都需要理解的关于使用AI代理构建的三个关键真理。首先,模型质量创造了无形的优势。当Anthropic运行四个具有不同模型版本的并行市场时,由先进模型代表的用户始终获得了更好的交易——但大多数参与者没有意识到他们被超越了。这不是抽象理论。如果你正在构建一个AI代理相互交互的平台(市场、谈判工具、自动化采购),你底层模型的质量就成为了竞争护城河。

其次,初始指令的重要性不如你想的那么大。Anthropic发现改变给代理的提示并不会显著影响结果。这与充斥LinkedIn的"提示工程"课程产业相矛盾。真正重要的是模型的推理能力及其在对话中进行调整的能力。对于开发者来说,这意味着投资更好的基础模型和编排层,而不是无休止地调整系统提示。

第三,代理间商务已经可行。凭借186笔成功交易和100%的交易完成率(因为员工必须履行交易),Anthropic证明了自主代理可以处理完整的谈判生命周期。这对B2B平台、供应链自动化和任何交易量比交易复杂性更重要的市场都有直接影响。瓶颈不在技术——而在于围绕自主代理花费真实预算的监管和信任基础设施。

对于亚洲的开发者来说,这个实验是一个蓝图。该地区的电子商务基础设施已经对代理友好:数字支付无处不在、API文档完善、消费者对自动化交易很习惯。机会在于构建中间件层——编排工具、代理身份系统、审计跟踪,让企业可以信任拥有真实预算的自主代理。这是下一波AI平台公司将出现的地方。

如何为你的技术栈选择合适的AI开发工具

在2026年选择AI平台意味着评估五个三年前不存在的维度。从模型访问开始:该平台是否将你锁定在单一供应商,还是你可以在不重写代码的情况下在OpenAI、Anthropic和开源模型之间切换?供应商锁定是真实的,模型格局每个季度都在变化。接下来,检查连接器深度。该平台是否可以与你的数据库、支付处理器、认证系统本地集成?你必须构建的每个自定义集成都是会拖累你的技术债务。

延迟和地区部署比营销页面承认的更重要。如果你的用户在东南亚,而你的AI平台将每个请求路由到美国东部,你就为每个交互增加了200毫秒以上。这是工具感觉即时和感觉迟缓之间的区别。寻找支持边缘部署或地区模型托管的平台。第四,评估成本可预测性。基于令牌的定价很好,直到你扩展并意识到你的AI功能吞噬了40%的收入。最好的平台提供基于使用情况的定价,具有明确的成本控制和优化工具。

最后,评估开发者体验。你能在一个下午从想法到部署的原型,还是该平台需要一周的文档阅读和基础设施配置?MonstarX为此进行了优化:你获得了常见模式的预构建模板(聊天机器人、数据分析、工作流自动化)、对流行连接器的原生支持,以及镜像生产的本地开发环境。目标不是给你无限的灵活性——而是消除所有项目中相同的80%的样板工作,这样你就可以专注于你的业务独有的20%。

MonstarX平台概览:为亚洲开发者而构建

MonstarX不是OpenAI API的另一个包装器。它是一个为在亚洲构建的特定约束和机会而设计的全栈AI平台。这意味着对地区数据库(Supabase、PlanetScale)、支付网关(Stripe、Xendit、Omise)和亚洲用户实际使用的身份验证提供商的一流支持。这意味着为常见用例预配置的模板:理解地区语言的电子商务聊天机器人、从本地数据库提取数据的数据仪表板。