Anthropic Tạo Sàn Giao Dịch Thử Nghiệm Cho Thương Mại Giữa Các Agent AI

Anthropic vừa thực hiện một thí nghiệm cho thấy hướng phát triển của AI — và nó không phải về chatbot trả lời ticket hỗ trợ. Công ty đã xây dựng một sàn giao dịch phân loại nơi các agent AI đàm phán các thỏa thuận thực tế cho hàng hóa thực tế bằng tiền thực, với con người chỉ…

Share
Editorial illustration: A minimalist marketplace stall or trading post—perhaps a simple wooden counter or exchange booth—pho — MonstarX

Anthropic Tạo Sàn Giao Dịch Thử Nghiệm Cho Thương Mại Giữa Các Agent AI

Anthropic vừa thực hiện một thí nghiệm cho thấy hướng phát triển của AI — và nó không phải về chatbot trả lời ticket hỗ trợ. Công ty đã xây dựng một sàn giao dịch phân loại nơi các agent AI đàm phán các thỏa thuận thực tế cho hàng hóa thực tế bằng tiền thực, với con người chỉ quan sát từ bên lề. Điều này quan trọng đối với mọi nhà phát triển xây dựng với các công cụ phát triển AI trên toàn châu Á vì nó chứng minh rằng các agent có thể xử lý các giao dịch phức tạp, đa bước mà không cần giám sát liên tục từ con người. Tương lai không phải là phát triển hỗ trợ bởi AI — nó là thương mại AI-native, và các công cụ bạn chọn hôm nay sẽ quyết định liệu bạn có sẵn sàng cho nó hay không.

Trong Project Deal, 69 nhân viên Anthropic nhận được ngân sách $100 (thông qua thẻ quà tặng) để mua và bán các mặt hàng thông qua các agent AI. Không có đàm phán trực tiếp từ con người — chỉ các agent đại diện cho cả hai bên, thương lượng về giá cả và đóng các thỏa thuận. Kết quả? 186 giao dịch hoàn thành với tổng giá trị hơn $4.000. Nhưng cái nhìn sâu sắc thực sự không phải là tỷ lệ thành công. Nó là những gì xảy ra khi người dùng được đại diện bởi các phiên bản mô hình khác nhau: những người có các agent nâng cao hơn đã nhận được kết quả tốt hơn một cách khách quan, nhưng hầu hết người dùng không thể nhận ra rằng họ đang ở bất lợi. Đó là "khoảng cách chất lượng agent" — và nó sắp đến với mọi sàn giao dịch, mọi API, mọi tích hợp bạn xây dựng.

Công Cụ Phát Triển AI Là Gì?

Công cụ phát triển AI là các nền tảng, framework và API cho phép các nhà phát triển tích hợp khả năng machine learning vào ứng dụng mà không cần xây dựng mô hình từ đầu. Chúng bao gồm từ các API phân tích cảm xúc đơn giản đến các nền tảng toàn diện xử lý mọi thứ từ nhập dữ liệu đến triển khai mô hình. Thuật ngữ này bao gồm các công cụ hoàn thành mã như GitHub Copilot, các nền tảng low-code, cơ sở dữ liệu vector và các framework điều phối phối hợp nhiều mô hình AI.

Sự chuyển dịch sang vibe coding — nơi các nhà phát triển mô tả những gì họ muốn bằng ngôn ngữ tự nhiên và AI tạo mã hoạt động — đã làm mờ ranh giới giữa "nhà phát triển" và "người xây dựng". Bạn không cần bằng cấp CS để triển khai một ứng dụng hỗ trợ AI nữa. Bạn cần nền tảng phù hợp và khả năng tư duy theo hệ thống. Các công cụ truyền thống yêu cầu bạn hiểu về transformer, fine-tuning và tensor shape. Các công cụ phát triển AI hiện đại trừu tượng hóa độ phức tạp đó để bạn có thể tập trung vào giải quyết các vấn đề kinh doanh thực tế.

Đối với các nhà phát triển châu Á, điều này quan trọng vì hệ sinh thái nhà phát triển của khu vực luôn ưu tiên tốc độ và thực dụng hơn tính chính xác học thuật. Các công cụ phát triển AI tốt nhất cho châu Á không phải là những công cụ có nhiều tính năng nhất — chúng là những công cụ cho phép bạn triển khai nhanh, lặp lại nhanh hơn và mở rộng mà không cần viết lại mọi thứ khi cơ sở người dùng của bạn phát nổ. MonstarX được xây dựng đặc biệt cho thực tế này: template được xây dựng sẵn cho các trường hợp sử dụng phổ biến, hỗ trợ gốc cho các cổng thanh toán và cơ sở dữ liệu khu vực, và tài liệu giả định rằng bạn đang xây dựng một doanh nghiệp, không phải một bài báo nghiên cứu.

Thí Nghiệm Sàn Giao Dịch Của Anthropic Tiết Lộ Điều Gì Về Các Nền Tảng AI

Project Deal không chỉ là một thí nghiệm nội bộ vui vẻ. Nó đã phơi bày ba sự thật quan trọng về xây dựng với các agent AI mà mọi nhà phát triển cần hiểu. Thứ nhất, chất lượng mô hình tạo ra những lợi thế vô hình. Khi Anthropic chạy bốn sàn giao dịch song song với các phiên bản mô hình khác nhau, những người dùng được đại diện bởi các mô hình nâng cao liên tục nhận được các thỏa thuận tốt hơn — nhưng hầu hết những người tham gia không nhận ra rằng họ đang bị vượt trội. Đây không phải là lý thuyết trừu tượng. Nếu bạn đang xây dựng một nền tảng nơi các agent AI tương tác với nhau (sàn giao dịch, công cụ đàm phán, mua hàng tự động), chất lượng của mô hình cơ bản của bạn trở thành một rào cản cạnh tranh.

Thứ hai, hướng dẫn ban đầu quan trọng ít hơn bạn nghĩ. Anthropic phát hiện ra rằng thay đổi các prompt được cung cấp cho các agent không ảnh hưởng đáng kể đến kết quả. Điều này mâu thuẫn với ngành công nghiệp nhỏ của các khóa học "prompt engineering" ngập tràn trên LinkedIn. Những gì thực sự quan trọng là khả năng suy luận của mô hình và khả năng thích ứng của nó trong cuộc trò chuyện. Đối với các nhà phát triển, điều này có nghĩa là đầu tư vào các mô hình cơ bản tốt hơn và các lớp điều phối, không phải liên tục điều chỉnh system prompt.

Thứ ba, thương mại agent-to-agent đã khả thi. Với 186 thỏa thuận thành công và tỷ lệ hoàn thành giao dịch 100% (vì nhân viên phải tôn trọng các thỏa thuận), Anthropic đã chứng minh rằng các agent tự chủ có thể xử lý toàn bộ vòng đời đàm phán. Điều này có ý nghĩa ngay lập tức đối với các nền tảng B2B, tự động hóa chuỗi cung ứng và bất kỳ sàn giao dịch nào mà khối lượng giao dịch quan trọng hơn độ phức tạp giao dịch. Nút cổ chai không phải là công nghệ — nó là cơ sở hạ tầng quy định và tin tưởng xung quanh các agent tự chủ chi tiêu tiền.

Đối với các nhà phát triển ở châu Á, thí nghiệm này là một bản thiết kế. Cơ sở hạ tầng thương mại điện tử của khu vực đã thân thiện với agent: thanh toán kỹ thuật số phổ biến, API được ghi chép tốt và người tiêu dùng thoải mái với các giao dịch tự động. Cơ hội là xây dựng lớp middleware — các công cụ điều phối, các hệ thống nhận dạng agent, các dấu vết kiểm toán cho phép các doanh nghiệp tin tưởng các agent tự chủ với ngân sách thực. Đó là nơi mà làn sóng tiếp theo của các công ty nền tảng AI sẽ xuất hiện.

Cách Chọn Công Cụ Phát Triển AI Phù Hợp Cho Stack Của Bạn

Chọn một nền tảng AI vào năm 2026 có nghĩa là đánh giá năm chiều không tồn tại ba năm trước. Bắt đầu với truy cập mô hình: nền tảng có khóa bạn vào một nhà cung cấp duy nhất hay bạn có thể hoán đổi giữa OpenAI, Anthropic và các mô hình mã nguồn mở mà không cần viết lại mã? Khóa nhà cung cấp là thực tế, và bảng cảnh quan mô hình thay đổi mỗi quý. Tiếp theo, kiểm tra độ sâu kết nối. Nền tảng có thể tích hợp gốc với cơ sở dữ liệu, bộ xử lý thanh toán, hệ thống xác thực của bạn không? Mỗi tích hợp tùy chỉnh bạn phải xây dựng là nợ kỹ thuật làm chậm bạn.

Độ trễ và triển khai khu vực quan trọng hơn những gì các trang tiếp thị thừa nhận. Nếu người dùng của bạn ở Đông Nam Á và nền tảng AI của bạn định tuyến mọi yêu cầu qua US-East, bạn đang thêm 200ms+ vào mỗi tương tác. Đó là sự khác biệt giữa một công cụ cảm thấy tức thì và một công cụ cảm thấy chậm. Tìm kiếm các nền tảng có triển khai edge hoặc lưu trữ mô hình khu vực. Thứ tư, đánh giá khả năng dự đoán chi phí. Giá dựa trên token là tốt cho đến khi bạn mở rộng quy mô và nhận ra rằng các tính năng AI của bạn đang tiêu thụ 40% doanh thu. Các nền tảng tốt nhất cung cấp giá dựa trên mức sử dụng với các kiểm soát chi phí rõ ràng và công cụ tối ưu hóa.

Cuối cùng, đánh giá trải nghiệm nhà phát triển. Bạn có thể đi từ ý tưởng đến nguyên mẫu được triển khai trong một buổi chiều hay nền tảng yêu cầu một tuần đọc tài liệu và cấu hình cơ sở hạ tầng? MonstarX tối ưu hóa cho điều này: bạn nhận được các template được xây dựng sẵn cho các mẫu phổ biến (chatbot, phân tích dữ liệu, tự động hóa quy trình), hỗ trợ gốc cho các kết nối phổ biến và một môi trường phát triển cục bộ phản ánh sản xuất. Mục tiêu không phải là cung cấp cho bạn tính linh hoạt vô hạn — nó là loại bỏ 80% công việc boilerplate giống nhau trên các dự án để bạn có thể tập trung vào 20% duy nhất cho doanh nghiệp của bạn.

Tổng Quan Nền Tảng MonstarX: Được Xây Dựng Cho Các Nhà Phát Triển Châu Á

MonstarX không phải là một wrapper khác xung quanh API của OpenAI. Nó là một nền tảng AI toàn diện được thiết kế cho các ràng buộc và cơ hội cụ thể của việc xây dựng ở châu Á. Điều đó có nghĩa là hỗ trợ hạng nhất cho các cơ sở dữ liệu khu vực (Supabase, PlanetScale), cổng thanh toán (Stripe, Xendit, Omise) và các nhà cung cấp xác thực mà người dùng châu Á thực sự sử dụng. Nó có nghĩa là các template được cấu hình sẵn cho các trường hợp sử dụng phổ biến: chatbot thương mại điện tử hiểu các ngôn ngữ khu vực, bảng điều khiển dữ liệu kéo từ ER cục bộ