AI 추론 스타트업 Baseten, 지난 대규모 펀딩 후 5개월 만에 15억 달러 추가 자금 조성 추진

AI 추론 스타트업 Baseten이 130억 달러 밸류에이션으로 15억 달러를 조성하고 있으며, 이는 5개월 전 50억 달러 밸류에이션에서 3억 달러를 조성한 지 불과 5개월 후입니다. 아시아 개발자와 창업자들에게 이는 AI 인프라에서 실질적인 영향력이 어디에 축적되고 있는지를 보여주는 신호입니다.

Share
Editorial illustration: A sleek server rack or data center corridor bathed in cool overhead light, with cables converging to — MonstarX

AI 추론 스타트업 Baseten, 지난 대규모 펀딩 후 5개월 만에 15억 달러 추가 자금 조성 추진

5개월. 160% 밸류에이션 상승. 15억 달러. 이 세 가지 숫자는 AI 인프라 경쟁이 어디로 향하고 있는지, 그리고 얼마나 빠르게 진행되고 있는지를 모두 보여줍니다. AI 추론 스타트업 Baseten이 월스트리트저널 보도에 따르면 130억 달러 밸류에이션으로 15억 달러를 조성하고 있으며, 이는 5개월 전 50억 달러 밸류에이션에서 3억 달러 시리즈 E를 마감한 지 불과 5개월 후입니다. 글로벌 AI 인프라 스택이 형성되는 것을 지켜보고 있는 아시아의 개발자와 창업자들에게 이는 단순한 펀딩 뉴스가 아니라 AI에서 실질적인 영향력이 어디에 축적되고 있는지를 보여주는 신호입니다.

무엇이 일어났는가

2019년 설립된 Baseten은 회사 밸류에이션을 130억 달러로 평가하는 15억 달러 펀딩 라운드를 마무리하고 있습니다. TechCrunch의 WSJ 보도 분석에 따르면 이 라운드는 Spark Capital, Sands Capital, Altimeter Capital, Wellington Management가 공동으로 주도하고 있습니다.

그 성장 궤적은 놀랍습니다. 2025년 9월 Baseten은 1억 5천만 달러 시리즈 D를 조성했습니다. 9개월 후 50억 달러 밸류에이션에서 3억 달러 시리즈 E를 마감했습니다. 그리고 불과 5개월 후, 밸류에이션을 두 배 이상 높이는 거래를 최종 진행 중입니다. 계산해보면 18개월 미만 동안 세 라운드에 걸쳐 약 19억 5천만 달러를 조성한 것입니다.

보도에 숨겨진 중요한 구조적 세부사항이 있습니다. 이번 라운드는 보도에 따르면 분할 가격 라운드입니다. 이는 서로 다른 투자자들이 동일한 펀딩에 서로 다른 밸류에이션으로 투자하는 메커니즘입니다. 일부 투자자는 130억 달러 공시 수치로 참여하고, 다른 투자자는 110억 달러로 참여합니다. 이는 AI 스타트업 펀딩에서 점점 더 흔해지는 전술로, 주요 투자자는 종이상 더 높은 밸류에이션을 주장할 수 있고 2차 참여자는 위험 보상으로 할인을 받습니다. 이는 공시 수치를 부풀리고 거래를 실제보다 더 깔끔해 보이게 만듭니다.

이러한 주의사항을 제외하고, 기본적인 비즈니스 로직은 실제입니다. Baseten의 핵심 제안은 추론 요청을 주어진 작업에 가장 적합한 모델로 라우팅하는 것입니다. 여기에는 GPT-4o나 Claude 같은 최첨단 모델을 통해 모든 것을 실행하는 것보다 훨씬 저렴한 오픈소스 대안도 포함됩니다. 회사는 사용자의 요청과 실제로 답변하는 모델 사이의 전환 계층을 구축하고 있습니다. 추론 비용이 프로덕션 AI 애플리케이션을 구축하는 모든 사람의 주요 관심사가 되면서 이는 매우 가치 있는 위치입니다.

더 넓은 맥락에서 보면, The Next Wave가 "추론 골드러시"라고 부르는 현상이 본격화하고 있습니다. 벤처캐피탈이 원본 모델과 최종 사용자 사이에 위치한 회사들로 쏟아지고 있습니다. 지연시간을 최적화하고, 컴퓨팅 비용을 관리하며, 규모에 맞춰 AI를 실행하는 운영 복잡성을 처리하는 회사들입니다. Baseten은 이 추세의 가장 명확한 수혜자 중 하나입니다.

아시아에 중요한 이유

아시아의 AI 생태계는 추론 인프라와 복잡한 관계를 가지고 있습니다. 이 지역은 AI 야망이 부족하지 않습니다. 싱가포르의 국가 AI 전략부터 한국의 반도체 지배력, 인도의 빠르게 성장하는 개발자 커뮤니티까지 말입니다. 하지만 추론 계층 구체적으로 말하면, 아시아 창업자와 개발자들은 대체로 서방 시장을 위해 구축되고 가격이 책정된 인프라에 의존해왔습니다.

이는 실질적인 비용 문제를 야기합니다. 추론은 일회성 비용이 아닙니다. 모든 사용자 쿼리, 모든 API 호출, 프로덕션 애플리케이션의 모든 실시간 응답은 컴퓨팅을 소비합니다. 자카르타나 호찌민시의 스타트업이 현지 통화로 운영되고 현지 가격 기대치를 가지고 있을 때, 프리미엄 서방 클라우드 인프라에서 추론을 실행하는 경제학은 가혹할 수 있습니다. Baseten의 모델(가장 비싼 최첨단 모델을 기본값으로 하지 않고 더 저렴하고 유능한 오픈소스 대안으로 라우팅)은 가격에 민감한 아시아 시장에서 엄청나게 중요한 비용 차익거래의 정확한 예입니다.

지연시간 측면도 있습니다. US-East 데이터센터에 최적화된 추론 인프라는 동남아시아 사용자에게 의미 있는 지연을 초래합니다. 추론이 실제로 실행되는 위치(지리적으로)라는 질문은 아시아 개발자들이 지속적으로 다루는 것입니다. Baseten 같은 회사들이 이러한 밸류에이션으로 자금을 조성할 때, 개발자 커뮤니티의 기대는 아시아태평양 지역을 포함한 글로벌 인프라 커버리지가 사후 생각이 아닌 제품 우선순위가 되어야 한다는 것입니다.

투자 관점에서 Baseten 라운드는 아시아 벤처캐피탈에 대한 신호이기도 합니다. 추론 계층은 AI 인프라에서 반복 수익이 발생하는 곳입니다. 학습은 한 번(또는 몇 번) 실행됩니다. 추론은 프로덕션 애플리케이션의 수명 동안 하루에 수십억 번 발생합니다. 이를 이해하는 투자자들은 빠르게 움직이고 있으며, Spark Capital, Altimeter, Wellington 컨소시엄이 Baseten을 지원하는 것은 단순한 AI 과대광고 추격이 아닌 정교한 기관 확신을 반영합니다.

AI 네이티브 제품을 구축하는 아시아 창업자들을 위한 교훈은 전략적입니다. 구축할 모델의 선택보다 실행할 추론 아키텍처의 선택이 더 중요합니다. 추론 계층의 유연성(모델을 교체하고, 지능적으로 라우팅하며, 비용을 제어할 수 있는 능력)은 점점 더 인프라 세부사항이 아닌 경쟁 우위입니다.

개발자에게 의미하는 바

개발자들은 AI를 모델 관점에서 생각하는 경향이 있습니다. 어느 것이 가장 똑똑한지, 어느 것이 자신의 사용 사례를 가장 잘 처리하는지, 어느 것이 최고의 API를 가지고 있는지입니다. 하지만 Baseten의 부상과 추론 인프라 전반에 흐르는 수십억 달러는 모델이 훨씬 더 큰 방정식의 한 가지 변수일 뿐이라는 상기입니다.

실질적인 함의는 지금 프로덕션 AI 애플리케이션을 구축하고 있다면, 추론 전략은 모델 선택과 동일한 엔지니어링 주의를 받을 자격이 있다는 것입니다. 실제로 이것이 어떤 모습인지 살펴보겠습니다:

  • 작업에 적합한 라우팅: 모든 쿼리가 GPT-4o를 필요로 하지는 않습니다. 분류 작업, 요약 작업 또는 구조화된 데이터 추출 단계는 비용의 일부로 더 작은 오픈소스 모델에서 똑같이 잘 실행될 수 있습니다. Baseten의 핵심 가치 제안은 이 라우팅 결정을 자동화하는 것입니다. 개발자는 모델 벤치마크와 비용 계산기를 사용하여 이 로직의 더 간단한 버전을 수동으로 구현할 수 있습니다.
  • 지연시간 예산 책정: 애플리케이션의 다양한 부분은 서로 다른 지연시간 허용도를 가집니다. 실시간 채팅 인터페이스는 500ms 미만의 응답이 필요합니다. 백그라운드 문서 처리 작업은 몇 초를 허용할 수 있습니다. 추론 호출을 적절한 지연시간 계층에 매핑하고 그에 따라 인프라를 선택하면 사용자 경험과 비용에 직접 영향을 미칩니다.
  • 오픈소스 모델 평가: 최첨단 상용 모델과 유능한 오픈소스 대안 사이의 격차는 극적으로 좁혀졌습니다. Llama 3, Mistral, Qwen(특히 아시아 언어 작업에 관련)과 같은 모델은 이제 광범위한 프로덕션 사용 사례를 능숙하게 처리합니다. 모든 진지한 추론 전략에는 오픈소스 대안에 대한 정기적인 평가 주기가 포함되어야 합니다.
  • 비용 모니터링을 최우선 관심사로: 추론 비용은 저용량으로 구축하고 테스트한 팀을 놀라게 할 수 있는 방식으로 사용량에 따라 확장됩니다. 사후 생각이 아닌 첫날부터 비용 추적으로 추론 호출을 계측하는 것은 깔끔하게 확장하는 팀과 벽에 부딪히는 팀을 구분하는 규율입니다.

MonstarX와 같은 플랫폼에서 구축하는 개발자들을 위해, 아시아의 AI 네이티브 개발 플랫폼인 추론 계층 질문은 점점 더 중요해지고 있습니다.