Startup AI inference Baseten dilaporkan mengumpulkan $1.5B beberapa bulan setelah putaran pendanaan mega sebelumnya

Startup AI inference Baseten dilaporkan mengumpulkan $1.5B dengan valuasi $13 miliar, hanya lima bulan setelah menutup Series E senilai $300 juta. Untuk developer dan founder di Asia, ini adalah sinyal penting tentang ke mana perlombaan infrastruktur AI menuju.

Share
Editorial illustration: A sleek server rack or data center corridor bathed in cool overhead light, with cables converging to — MonstarX

Startup AI inference Baseten dilaporkan mengumpulkan $1.5B beberapa bulan setelah putaran pendanaan mega sebelumnya

Lima bulan. Peningkatan valuasi 160%. $1.5 miliar. Ketiga angka tersebut menceritakan segalanya tentang ke mana perlombaan infrastruktur AI menuju — dan seberapa cepat. Startup AI inference Baseten dilaporkan mengumpulkan $1.5B dengan valuasi $13 miliar, menurut laporan Wall Street Journal, hanya lima bulan setelah menutup Series E senilai $300 juta dengan valuasi $5 miliar. Bagi para developer dan founder di Asia yang mengamati stack infrastruktur AI global terbentuk, ini adalah sinyal yang layak dianalisis — bukan hanya sebagai berita pendanaan, tetapi sebagai peta di mana leverage sebenarnya dalam AI terakumulasi.

Apa yang Terjadi

Baseten, yang didirikan pada 2019, sedang menutup putaran pendanaan $1.5 miliar yang akan menilai perusahaan pada $13 miliar, menurut liputan TechCrunch tentang laporan WSJ. Putaran ini dipimpin bersama oleh Spark Capital, Sands Capital, Altimeter Capital, dan Wellington Management.

Trajektorinya sangat menakjubkan. Pada September 2025, Baseten mengumpulkan Series D senilai $150 juta. Sembilan bulan kemudian, ia menutup Series E senilai $300 juta dengan valuasi $5 miliar. Sekarang, hanya lima bulan setelah itu, dilaporkan sedang menyelesaikan kesepakatan yang lebih dari dua kali lipat valuasinya lagi. Jika Anda menghitung: itu kira-kira $1.95 miliar yang dikumpulkan di tiga putaran dalam waktu kurang dari 18 bulan.

Ada detail struktural penting yang tersembunyi dalam pelaporan. Putaran terbaru ini dilaporkan sebagai putaran dengan harga terpisah — mekanisme di mana investor berbeda membeli ke dalam penggalangan dana yang sama dengan valuasi berbeda. Beberapa investor masuk pada angka headline $13 miliar; yang lain pada $11 miliar. Ini adalah taktik yang semakin umum dalam pembiayaan startup AI, di mana investor utama dapat mengklaim valuasi lebih tinggi di atas kertas sementara peserta sekunder mendapat diskon untuk mengkompensasi risiko. Ini menginflasi angka headline dan membuat kesepakatan terlihat lebih bersih daripada yang sebenarnya.

Terlepas dari peringatan itu, logika bisnis yang mendasar adalah nyata. Proposisi inti Baseten adalah merutekan permintaan inference ke model yang paling sesuai untuk tugas tertentu — termasuk alternatif open-source yang biayanya jauh lebih rendah daripada menjalankan semuanya melalui model frontier seperti GPT-4o atau Claude. Perusahaan sedang membangun lapisan switching antara apa yang diminta pengguna dan model mana yang sebenarnya menjawab. Itu adalah posisi berharga untuk ditempati karena biaya inference menjadi kekhawatiran utama bagi siapa pun yang membangun aplikasi AI produksi.

Konteks yang lebih luas: apa yang The Next Wave sebut sebagai "inference gold rush" sedang berlangsung penuh. Modal ventura membanjiri perusahaan yang berada di antara model mentah dan pengguna akhir — mengoptimalkan latensi, mengelola biaya komputasi, dan menangani kompleksitas operasional menjalankan AI dalam skala besar. Baseten adalah salah satu penerima manfaat paling jelas dari tren tersebut.

Mengapa Hal Ini Penting untuk Asia

Ekosistem AI Asia memiliki hubungan yang rumit dengan infrastruktur inference. Wilayah ini tidak kekurangan ambisi AI — dari strategi AI nasional Singapura hingga dominasi semikonduktor Korea Selatan hingga komunitas developer India yang berkembang pesat. Tetapi ketika datang ke lapisan inference secara khusus, founder dan developer Asia sebagian besar telah bergantung pada infrastruktur yang dibangun dan dihargai untuk pasar Barat.

Itu menciptakan masalah biaya nyata. Inference bukan pengeluaran satu kali. Setiap kueri pengguna, setiap panggilan API, setiap respons real-time dalam aplikasi produksi membakar komputasi. Bagi startup di Jakarta atau Ho Chi Minh City yang beroperasi dalam mata uang lokal dengan ekspektasi harga lokal, ekonomi menjalankan inference pada infrastruktur cloud Barat premium bisa sangat berat. Model Baseten — merutekan ke alternatif open-source yang lebih murah dan kompeten daripada default ke model frontier paling mahal — adalah persis jenis arbitrase biaya yang sangat penting di pasar Asia yang sensitif terhadap harga.

Ada juga dimensi latensi. Infrastruktur inference yang dioptimalkan untuk pusat data US-East memperkenalkan lag yang berarti bagi pengguna di Asia Tenggara. Pertanyaan tentang di mana inference sebenarnya berjalan — secara geografis — adalah pertanyaan yang terus-menerus dihadapi oleh developer Asia. Ketika perusahaan seperti Baseten mengumpulkan dengan valuasi ini, ekspektasi dari komunitas developer seharusnya adalah bahwa cakupan infrastruktur global, termasuk wilayah Asia-Pasifik, menjadi prioritas produk daripada pemikiran kedua.

Dari perspektif investasi, putaran Baseten juga merupakan sinyal untuk modal ventura Asia. Lapisan inference adalah di mana pendapatan berulang hidup dalam infrastruktur AI. Pelatihan berjalan sekali (atau beberapa kali). Inference terjadi miliaran kali per hari di seluruh masa hidup aplikasi produksi. Investor yang memahami ini bergerak cepat — dan konsorsium Spark Capital, Altimeter, dan Wellington yang mendukung Baseten mencerminkan keyakinan institusional yang canggih, bukan hanya pengejar hype AI.

Bagi founder Asia yang membangun produk AI-native, pengambilan kunci adalah strategis: model yang Anda pilih untuk dibangun di atasnya penting lebih sedikit daripada arsitektur inference yang Anda pilih untuk menjalankannya. Fleksibilitas di lapisan inference — kemampuan untuk menukar model, merutekan secara cerdas, dan mengendalikan biaya — semakin menjadi keunggulan kompetitif, bukan hanya detail infrastruktur.

Apa Artinya Ini untuk Developer

Developer cenderung berpikir tentang AI dalam hal model: mana yang paling pintar, mana yang menangani kasus penggunaan mereka dengan baik, mana yang memiliki API terbaik. Tetapi kebangkitan Baseten — dan miliaran yang mengalir ke infrastruktur inference secara luas — adalah pengingat bahwa model hanyalah satu variabel dalam persamaan yang jauh lebih besar.

Implikasi praktis: jika Anda membangun aplikasi AI produksi sekarang, strategi inference layak mendapat perhatian engineering yang sama dengan pemilihan model Anda. Berikut adalah apa yang sebenarnya terlihat seperti dalam praktik:

  • Perutean yang sesuai dengan tugas: Tidak setiap kueri membutuhkan GPT-4o. Tugas klasifikasi, pekerjaan peringkasan, atau langkah ekstraksi data terstruktur mungkin berjalan sama baiknya pada model open-source yang lebih kecil dengan sebagian kecil dari biaya. Proposisi nilai inti Baseten adalah mengotomatisasi keputusan perutean ini. Developer dapat menerapkan versi logika ini secara manual menggunakan benchmark model dan kalkulator biaya.
  • Anggaran latensi: Bagian berbeda dari aplikasi Anda memiliki toleransi latensi berbeda. Antarmuka obrolan real-time membutuhkan respons sub-500ms. Pekerjaan pemrosesan dokumen latar belakang dapat mentoleransi beberapa detik. Memetakan panggilan inference Anda ke tingkat latensi yang sesuai — dan memilih infrastruktur sesuai — secara langsung mempengaruhi pengalaman pengguna dan biaya.
  • Evaluasi model open-source: Kesenjangan antara model komersial frontier dan alternatif open-source yang mampu telah menutup secara dramatis. Model seperti Llama 3, Mistral, dan Qwen (terutama relevan untuk tugas bahasa Asia) sekarang menangani berbagai kasus penggunaan produksi dengan kompeten. Setiap strategi inference yang serius harus mencakup siklus evaluasi reguler untuk alternatif open-source.
  • Pemantauan biaya sebagai kekhawatiran kelas satu: Biaya inference skala dengan penggunaan dengan cara yang dapat mengejutkan tim yang membangun dan menguji pada volume rendah. Menginstrumentasi panggilan inference Anda dengan pelacakan biaya dari hari pertama — bukan sebagai pemikiran kedua — adalah disiplin yang memisahkan tim yang skala dengan bersih dari mereka yang memukul dinding.

Bagi developer yang membangun di platform seperti MonstarX, platform dev AI-native Asia, pertanyaan lapisan inference semakin menjadi depan