AI inference startup Baseten ay reportedly nagtataas ng $1.5B ilang buwan pagkatapos ng huling mega round
Limang buwan. 160% pagtaas ng valuation. $1.5 bilyong dolyar. Ang tatlong numerong ito ay nagsasabi sa iyo ng lahat tungkol sa kung saan papunta ang AI infrastructure race — at gaano kabilis.
AI inference startup Baseten ay reportedly nagtataas ng $1.5B ilang buwan pagkatapos ng huling mega round
Limang buwan. 160% pagtaas ng valuation. $1.5 bilyong dolyar. Ang tatlong numerong ito ay nagsasabi sa iyo ng lahat tungkol sa kung saan papunta ang AI infrastructure race — at gaano kabilis. AI inference startup Baseten ay reportedly nagtataas ng $1.5B sa $13 bilyong valuation, ayon sa isang Wall Street Journal report, lamang limang buwan pagkatapos magsara ng $300 milyong Series E sa $5 bilyong valuation. Para sa mga developers at founders sa Asia na sumusubaybay sa pandaigdigang AI infrastructure stack na nabubuo, ito ay isang signal na karapat-dapat na i-dissect — hindi lamang bilang isang fundraising headline, kundi bilang isang mapa kung saan ang tunay na leverage sa AI ay nag-iipon.
Ano ang Nangyari
Baseten, na itinayo noong 2019, ay papalapit sa isang $1.5 bilyong funding round na magbibigay sa kumpanya ng $13 bilyong valuation, ayon sa TechCrunch's coverage ng WSJ report. Ang round ay co-led ng Spark Capital, Sands Capital, Altimeter Capital, at Wellington Management.
Ang trajectory ay nakakamangha. Noong Septyembre 2025, nagtaas ang Baseten ng $150 milyong Series D. Siyam na buwan mamaya, nagsara ito ng $300 milyong Series E sa $5 bilyong valuation. Ngayon, lamang limang buwan pagkatapos nito, ay reportedly fininalizing ang isang deal na higit sa doble ang valuation nito. Kung ikaw ay sumusubaybay: iyan ay humigit-kumulang $1.95 bilyong nakolekta sa tatlong rounds sa loob ng mas mababa sa 18 buwan.
May isang mahalagang structural detail na nakabaon sa reporting. Ang latest round na ito ay reportedly isang split-priced round — isang mekanismo kung saan ang iba't ibang investors ay bumibili sa parehong raise sa iba't ibang valuations. Ang ilang investors ay pumapasok sa headline $13 bilyong figure; iba ay sa $11 bilyong. Ito ay isang tactic na naging mas common sa AI startup financing, kung saan ang lead investors ay maaaring mag-claim ng mas mataas na valuation sa papel habang ang secondary participants ay nakakakuha ng discount upang magbayad para sa risk. Ito ay nagpapataas ng headline number at ginagawang mas malinis ang deal kaysa sa kung ano ito talaga.
Bukod sa caveat na iyon, ang underlying business logic ay tunay. Ang core pitch ng Baseten ay pag-route ng inference requests sa best-fit model para sa isang ibinigay na task — kasama ang open-source alternatives na nagkakahalaga ng significantly less kaysa sa pagpapatakbo ng lahat sa pamamagitan ng frontier models tulad ng GPT-4o o Claude. Ang kumpanya ay bumubuo ng switching layer sa pagitan ng kung ano ang itinatanong ng users at aling model ang tunay na sumasagot. Iyan ay isang valuable position na dapat sakupin habang ang inference costs ay nagiging primary concern para sa sinuman na bumubuo ng production AI applications.
Ang mas malawak na konteksto: kung ano ang The Next Wave ay tinawag na "inference gold rush" ay nasa full swing. Ang venture capital ay umuusbong sa mga kumpanyang nakaupo sa pagitan ng raw model at ng end user — pag-optimize ng latency, pag-manage ng compute costs, at pag-handle ng operational complexity ng pagpapatakbo ng AI sa scale. Baseten ay isa sa mga pinaka-clear na beneficiaries ng trend na iyon.
Bakit Ito Mahalaga para sa Asia
Ang AI ecosystem ng Asia ay may komplikadong relasyon sa inference infrastructure. Ang rehiyon ay walang kakulangan ng AI ambition — mula sa Singapore's national AI strategy hanggang sa South Korea's semiconductor dominance hanggang sa India's rapidly scaling developer community. Ngunit pagdating sa inference layer specifically, ang Asian founders at developers ay largely dependent sa infrastructure na itinayo at priced para sa Western markets.
Iyon ay lumilikha ng tunay na cost problem. Ang inference ay hindi isang one-time expense. Bawat user query, bawat API call, bawat real-time response sa isang production application ay gumagamit ng compute. Para sa isang startup sa Jakarta o Ho Chi Minh City na gumagana sa local currency na may local pricing expectations, ang economics ng pagpapatakbo ng inference sa premium Western cloud infrastructure ay maaaring maging brutal. Ang model ng Baseten — pag-route sa mas murang, competent open-source alternatives sa halip na default sa pinaka-expensive frontier model — ay eksaktong uri ng cost arbitrage na napakahalaga sa price-sensitive Asian markets.
May latency dimension din. Ang inference infrastructure na naka-optimize para sa US-East data centers ay nagdadala ng meaningful lag para sa users sa Southeast Asia. Ang tanong kung saan ang inference ay tunay na tumatakbo — geographically — ay isa na patuloy na hinaharap ng Asian developers. Habang ang mga kumpanyang tulad ng Baseten ay nagtataas sa mga valuations na ito, ang expectation mula sa developer community ay dapat na ang global infrastructure coverage, kasama ang Asia-Pacific regions, ay nagiging product priority sa halip na isang afterthought.
Mula sa investment lens, ang Baseten round ay isa ring signal sa Asian venture capital. Ang inference layer ay kung saan ang recurring revenue ay nabubuhay sa AI infrastructure. Ang training runs ay nangyayari minsan (o ilang beses). Ang inference ay nangyayari billions ng beses bawat araw sa buong lifetime ng isang production application. Ang mga investors na nakakaintindi nito ay mabilis na gumagalaw — at ang Spark Capital, Altimeter, at Wellington consortium na sumusuporta sa Baseten ay sumasalamin sa sophisticated institutional conviction, hindi lamang AI hype chasing.
Para sa Asian founders na bumubuo ng AI-native products, ang takeaway ay strategic: ang model na pipiliin mong bumuo ay mas kaunti ang halaga kaysa sa inference architecture na pipiliin mong patakbuhin. Ang flexibility sa inference layer — ang kakayahang magswap ng models, mag-route nang matalino, at kontrolin ang costs — ay mas lalo nang nagiging competitive advantage, hindi lamang isang infrastructure detail.
Ano Ang Ibig Sabihin Nito para sa Mga Developers
Ang mga developers ay may tendency na mag-isip tungkol sa AI sa mga tuntunin ng models: aling isa ang pinakamatalino, aling isa ang best na humawak sa kanilang use case, aling isa ang may best API. Ngunit ang pagtaas ng Baseten — at ang billions na umuusbong sa inference infrastructure broadly — ay isang reminder na ang model ay isa lamang na variable sa isang mas malaking equation.
Ang practical implication: kung ikaw ay bumubuo ng isang production AI application ngayon, ang inference strategy ay karapat-dapat na makatanggap ng parehong engineering attention tulad ng iyong model selection. Narito kung ano ang tunay na hitsura nito sa practice:
- Task-appropriate routing: Hindi bawat query ay kailangan ng GPT-4o. Ang isang classification task, isang summarization job, o isang structured data extraction step ay maaaring tumakbo nang kasing-ganda sa isang mas maliit na open-source model sa isang fraction ng cost. Ang core value proposition ng Baseten ay pag-automate ng routing decision na ito. Ang mga developers ay maaaring mag-implement ng mas simpleng bersyon ng logic na ito nang manual gamit ang model benchmarks at cost calculators.
- Latency budgeting: Ang iba't ibang bahagi ng iyong application ay may iba't ibang latency tolerances. Ang isang real-time chat interface ay kailangan ng sub-500ms responses. Ang isang background document processing job ay maaaring tumanggap ng ilang segundo. Ang pag-map ng iyong inference calls sa appropriate latency tiers — at pagpili ng infrastructure accordingly — ay direktang nakakaapekto sa user experience at cost.
- Open-source model evaluation: Ang gap sa pagitan ng frontier commercial models at capable open-source alternatives ay dramatically na nagsara. Ang mga models tulad ng Llama 3, Mistral, at Qwen (particularly relevant para sa Asian language tasks) ay ngayon ay humahawak ng malawak na hanay ng production use cases nang competent. Ang anumang seryosong inference strategy ay dapat magsama ng regular evaluation cycle para sa open-source alternatives.
- Cost monitoring bilang isang first-class concern: Ang inference costs ay sumusukat kasama ang usage sa mga paraan na maaaring magulat sa mga teams na bumuo at nagsuri sa mababang volume. Ang pag-instrument ng iyong inference calls gamit ang cost tracking mula sa unang araw — hindi bilang isang afterthought — ay isang disiplina na naghihiwalay sa mga teams na nag-scale nang malinis mula sa mga tumama sa isang pader.
Para sa mga developers na bumubuo sa mga platforms tulad ng MonstarX, ang AI-native dev platform ng Asia, ang inference layer question ay mas lalo nang naging front