Anthropic이 에이전트 간 상거래 테스트 마켓플레이스를 구축하다

Anthropic이 방금 실행한 실험은 AI 개발의 미래 방향을 보여준다. 이 회사는 AI 에이전트들이 실제 돈으로 실제 상품에 대한 거래를 협상하는 마켓플레이스를 구축했다. 이것은 아시아 전역에서 AI 개발 도구로 구축하는 모든 개발자에게 중요하다.

Share
Editorial illustration: A minimalist marketplace stall or trading post—perhaps a simple wooden counter or exchange booth—pho — MonstarX

Anthropic이 에이전트 간 상거래 테스트 마켓플레이스를 구축하다

Anthropic이 방금 실행한 실험은 AI 개발의 미래 방향을 보여준다 — 그리고 그것은 고객 지원 챗봇에 관한 것이 아니다. 이 회사는 AI 에이전트들이 실제 돈으로 실제 상품에 대한 실제 거래를 협상하는 분류 마켓플레이스를 구축했으며, 인간은 옆에서만 지켜봤다. 이것은 아시아 전역에서 AI 개발 도구로 구축하는 모든 개발자에게 중요하다. 왜냐하면 에이전트가 지속적인 인간의 감시 없이 복잡한 다단계 거래를 처리할 수 있음을 증명하기 때문이다. 미래는 AI 보조 개발이 아니라 AI 네이티브 상거래이며, 오늘 선택하는 도구가 당신이 그에 준비되어 있는지를 결정한다.

Project Deal에서 Anthropic 직원 69명은 $100 예산(기프트카드를 통해)을 받아 AI 에이전트를 통해 상품을 사고팔았다. 직접적인 인간의 협상은 없었다 — 양쪽을 대표하는 에이전트들이 가격을 놓고 흥정하고 거래를 성사시켰을 뿐이다. 결과는? 186건의 완료된 거래로 총 $4,000 이상의 가치를 기록했다. 하지만 진정한 통찰력은 성공률이 아니었다. 사용자가 서로 다른 모델 버전으로 대표될 때 무엇이 일어났는지였다: 더 고급 에이전트를 가진 사람들은 객관적으로 더 나은 결과를 얻었지만, 대부분의 사용자는 자신이 불리한 위치에 있다는 것을 알지 못했다. 이것이 "에이전트 품질 격차"이며, 당신이 구축하는 모든 마켓플레이스, 모든 API, 모든 통합에 다가오고 있다.

AI 개발 도구란 무엇인가?

AI 개발 도구는 개발자가 처음부터 모델을 구축하지 않고도 애플리케이션에 머신러닝 기능을 통합할 수 있게 해주는 플랫폼, 프레임워크, API이다. 간단한 감정 분석 API부터 데이터 수집에서 모델 배포까지 모든 것을 처리하는 풀스택 플랫폼까지 다양하다. 이 용어는 GitHub Copilot 같은 코드 완성 도구, 로우코드 플랫폼, 벡터 데이터베이스, 여러 AI 모델을 조율하는 오케스트레이션 프레임워크를 포함한다.

바이브 코딩으로의 전환 — 개발자가 자연어로 원하는 것을 설명하고 AI가 작동하는 코드를 생성하는 방식 — 은 "개발자"와 "빌더" 사이의 경계를 모호하게 만들었다. 더 이상 AI 기반 앱을 출시하기 위해 컴퓨터공학 학위가 필요하지 않다. 올바른 플랫폼과 시스템적으로 생각할 수 있는 능력이 필요할 뿐이다. 기존 도구는 트랜스포머, 파인튜닝, 텐서 형태를 이해해야 했다. 현대의 AI 개발 도구는 이러한 복잡성을 추상화하여 실제 비즈니스 문제 해결에 집중할 수 있게 해준다.

아시아 개발자에게 이것이 중요한 이유는 이 지역의 개발자 생태계가 항상 학문적 순수성보다 속도와 실용성을 우선시했기 때문이다. 아시아를 위한 최고의 AI 개발 도구는 가장 많은 기능을 가진 것이 아니라 빠르게 출시하고, 더 빠르게 반복하고, 사용자 기반이 폭발할 때 모든 것을 다시 작성하지 않고 확장할 수 있게 해주는 것들이다. MonstarX는 이 현실을 위해 특별히 구축되었다: 일반적인 사용 사례를 위한 사전 구축 템플릿, 지역 결제 게이트웨이 및 데이터베이스에 대한 기본 지원, 그리고 당신이 연구 논문이 아닌 비즈니스를 구축하고 있다고 가정하는 문서.

Anthropic의 마켓플레이스 실험이 AI 플랫폼에 대해 드러내는 것

Project Deal은 단순한 재미있는 내부 실험이 아니었다. 이것은 모든 개발자가 이해해야 할 AI 에이전트로 구축하는 것에 대한 세 가지 중요한 진실을 노출했다. 첫째, 모델 품질은 보이지 않는 이점을 만든다. Anthropic이 서로 다른 모델 버전으로 네 개의 병렬 마켓플레이스를 실행했을 때, 고급 모델로 대표된 사용자들은 지속적으로 더 나은 거래를 얻었다 — 하지만 대부분의 참가자는 자신이 능가당하고 있다는 것을 깨닫지 못했다. 이것은 추상적인 이론이 아니다. AI 에이전트들이 서로 상호작용하는 플랫폼을 구축하고 있다면(마켓플레이스, 협상 도구, 자동화된 조달), 기본 모델의 품질은 경쟁 우위가 된다.

둘째, 초기 지시사항은 당신이 생각하는 것보다 덜 중요하다. Anthropic은 에이전트에 주어진 프롬프트를 변경해도 결과에 크게 영향을 미치지 않는다는 것을 발견했다. 이것은 LinkedIn에 넘쳐나는 "프롬프트 엔지니어링" 강좌 산업과 모순된다. 실제로 중요한 것은 모델의 추론 능력과 대화 중간에 적응할 수 있는 능력이다. 개발자에게 이것은 시스템 프롬프트를 끝없이 조정하는 것이 아니라 더 나은 기본 모델과 오케스트레이션 레이어에 투자해야 한다는 것을 의미한다.

셋째, 에이전트 간 상거래는 이미 실행 가능하다. 186건의 성공적인 거래와 100% 거래 완료율(직원들이 거래를 이행해야 했으므로)로 Anthropic은 자율 에이전트가 전체 협상 생명주기를 처리할 수 있음을 증명했다. 이것은 B2B 플랫폼, 공급망 자동화, 거래 복잡성보다 거래량이 더 중요한 모든 마켓플레이스에 즉각적인 영향을 미친다. 병목은 기술이 아니라 자율 에이전트가 실제 예산을 사용하도록 신뢰할 수 있는 규제 및 신뢰 인프라이다.

아시아의 개발자에게 이 실험은 청사진이다. 이 지역의 전자상거래 인프라는 이미 에이전트 친화적이다: 디지털 결제가 보편적이고, API가 잘 문서화되어 있으며, 소비자는 자동화된 거래에 익숙하다. 기회는 미들웨어 레이어를 구축하는 것이다 — 오케스트레이션 도구, 에이전트 신원 시스템, 비즈니스가 자율 에이전트를 실제 예산으로 신뢰할 수 있게 해주는 감사 추적. 이것이 다음 세대 AI 플랫폼 회사들이 등장할 곳이다.

스택에 맞는 올바른 AI 개발 도구를 선택하는 방법

2026년에 AI 플랫폼을 선택하는 것은 3년 전에는 존재하지 않았던 5가지 차원을 평가하는 것을 의미한다. 모델 접근성부터 시작하라: 플랫폼이 당신을 단일 제공자에게 묶어두는가, 아니면 코드를 다시 작성하지 않고 OpenAI, Anthropic, 오픈소스 모델 사이를 전환할 수 있는가? 벤더 종속은 실제이며, 모델 환경은 매 분기마다 변한다. 다음으로 커넥터 깊이를 확인하라. 플랫폼이 당신의 데이터베이스, 결제 처리기, 인증 시스템과 기본적으로 통합될 수 있는가? 당신이 구축해야 하는 모든 커스텀 통합은 당신을 느리게 하는 기술 부채이다.

지연 시간과 지역 배포는 마케팅 페이지가 인정하는 것보다 더 중요하다. 사용자가 동남아시아에 있고 AI 플랫폼이 모든 요청을 US-East를 통해 라우팅한다면, 모든 상호작용에 200ms 이상을 추가하는 것이다. 이것이 즉시 느껴지는 도구와 느린 도구의 차이이다. 엣지 배포 또는 지역 모델 호스팅이 있는 플랫폼을 찾아라. 넷째, 비용 예측 가능성을 평가하라. 토큰 기반 가격은 괜찮지만 확장할 때까지는 AI 기능이 수익의 40%를 먹어치우고 있다는 것을 깨닫는다. 최고의 플랫폼은 명확한 비용 제어 및 최적화 도구가 있는 사용량 기반 가격을 제공한다.

마지막으로 개발자 경험을 평가하라. 오후에 아이디어에서 배포된 프로토타입으로 갈 수 있는가, 아니면 플랫폼이 일주일의 문서 읽기와 인프라 구성을 요구하는가? MonstarX는 이것을 최적화한다: 일반적인 패턴(챗봇, 데이터 분석, 워크플로우 자동화)을 위한 사전 구축 템플릿, 인기 있는 커넥터에 대한 기본 지원, 프로덕션을 반영하는 로컬 개발 환경을 얻는다. 목표는 당신에게 무한한 유연성을 제공하는 것이 아니라 프로젝트 전반에 동일한 80%의 보일러플레이트 작업을 제거하여 당신의 비즈니스에 고유한 20%에 집중할 수 있게 하는 것이다.

MonstarX 플랫폼 개요: 아시아 개발자를 위해 구축됨

MonstarX는 OpenAI API의 또 다른 래퍼가 아니다. 이것은 아시아에서 구축하는 것의 특정 제약과 기회를 위해 설계된 풀스택 AI 플랫폼이다. 이것은 지역 데이터베이스(Supabase, PlanetScale), 결제 게이트웨이(Stripe, Xendit, Omise), 아시아 사용자가 실제로 사용하는 인증 제공자에 대한 일급 지원을 의미한다. 이것은 일반적인 사용 사례를 위해 사전 구성된 템플릿을 의미한다: 지역 언어를 이해하는 전자상거래 챗봇, 로컬 ER에서 데이터를 가져오는 데이터 대시보드