Syarikat permulaan AI inference Baseten dilaporkan mengumpul $1.5B beberapa bulan selepas pusingan mega terakhirnya

Lima bulan. Peningkatan penilaian 160%. $1.5 bilion. Syarikat permulaan AI inference Baseten dilaporkan mengumpul $1.5B pada penilaian $13 bilion, hanya lima bulan selepas menutup Series E $300 juta pada penilaian $5 bilion.

Share
Editorial illustration: A sleek server rack or data center corridor bathed in cool overhead light, with cables converging to — MonstarX

Syarikat permulaan AI inference Baseten dilaporkan mengumpul $1.5B beberapa bulan selepas pusingan mega terakhirnya

Lima bulan. Peningkatan penilaian 160%. $1.5 bilion. Ketiga-tiga angka itu memberitahu anda segalanya tentang ke mana perlumbaan infrastruktur AI menuju — dan seberapa cepat. Syarikat permulaan AI inference Baseten dilaporkan mengumpul $1.5B pada penilaian $13 bilion, menurut laporan Wall Street Journal, hanya lima bulan selepas menutup Series E $300 juta pada penilaian $5 bilion. Bagi pembangun dan pengasas di Asia yang memantau tindanan infrastruktur AI global terbentuk, ini adalah isyarat yang patut dianalisis — bukan hanya sebagai tajuk pengumpulan dana, tetapi sebagai peta tempat leverage sebenar dalam AI terkumpul.

Apa Yang Berlaku

Baseten, yang diasaskan pada 2019, sedang menutup pusingan pendanaan $1.5 bilion yang akan menilai syarikat pada $13 bilion, menurut liputan TechCrunch tentang laporan WSJ. Pusingan ini dipimpin bersama oleh Spark Capital, Sands Capital, Altimeter Capital, dan Wellington Management.

Trajektorinya sangat menakjubkan. Pada September 2025, Baseten mengumpul Series D $150 juta. Sembilan bulan kemudian, ia menutup Series E $300 juta pada penilaian $5 bilion. Sekarang, hanya lima bulan selepas itu, ia dilaporkan memuktamadkan perjanjian yang lebih daripada menggandakan penilaiannya sekali lagi. Jika anda mengira: itu kira-kira $1.95 bilion yang dikumpul merentasi tiga pusingan dalam kurang daripada 18 bulan.

Ada butiran struktur penting yang tersembunyi dalam pelaporan. Pusingan terbaru ini dilaporkan sebagai pusingan berharga berpecah — mekanisme di mana pelabur berbeza membeli ke dalam pengumpulan yang sama pada penilaian berbeza. Sesetengah pelabur datang pada angka tajuk $13 bilion; yang lain pada $11 bilion. Ini adalah taktik yang telah menjadi semakin biasa dalam pembiayaan syarikat permulaan AI, di mana pelabur utama boleh menuntut penilaian lebih tinggi di atas kertas sementara peserta sekunder mendapat diskaun untuk mengimbangi risiko. Ia meningkatkan angka tajuk dan membuat perjanjian kelihatan lebih bersih daripada yang mungkin sebenarnya.

Dengan kaveat itu, logik perniagaan asas adalah nyata. Cadangan teras Baseten adalah mengarahkan permintaan inference ke model yang paling sesuai untuk tugas tertentu — termasuk alternatif sumber terbuka yang kos jauh lebih rendah daripada menjalankan semuanya melalui model sempadan seperti GPT-4o atau Claude. Syarikat ini membina lapisan pensuisan antara apa yang diminta pengguna dan model mana yang sebenarnya menjawab. Itu adalah kedudukan berharga untuk diduduki apabila kos inference menjadi kebimbangan utama bagi sesiapa yang membina aplikasi AI pengeluaran.

Konteks yang lebih luas: apa yang The Next Wave telah panggil "kegilaan emas inference" sedang berlangsung penuh. Modal teroka membanjiri syarikat yang duduk antara model mentah dan pengguna akhir — mengoptimalkan latensi, menguruskan kos pengiraan, dan mengendalikan kerumitan operasional menjalankan AI pada skala. Baseten adalah salah satu penerima manfaat paling jelas bagi aliran itu.

Mengapa Ia Penting untuk Asia

Ekosistem AI Asia mempunyai hubungan yang rumit dengan infrastruktur inference. Rantau ini tidak kekurangan ambisi AI — daripada strategi AI nasional Singapura kepada penguasaan semikonduktor Korea Selatan hingga kepada komuniti pembangun India yang berkembang pesat. Tetapi apabila ia datang kepada lapisan inference khususnya, pengasas dan pembangun Asia sebahagian besarnya bergantung pada infrastruktur yang dibina dan berharga untuk pasaran Barat.

Itu mewujudkan masalah kos sebenar. Inference bukan perbelanjaan sekali sahaja. Setiap pertanyaan pengguna, setiap panggilan API, setiap respons masa nyata dalam aplikasi pengeluaran membakar pengiraan. Bagi syarikat permulaan di Jakarta atau Ho Chi Minh City beroperasi dalam mata wang tempatan dengan jangkaan harga tempatan, ekonomi menjalankan inference pada infrastruktur awan Barat premium boleh menjadi kejam. Model Baseten — mengarahkan ke alternatif sumber terbuka yang lebih murah dan cekap daripada lalai kepada model sempadan paling mahal — adalah tepat jenis arbitraj kos yang penting sangat dalam pasaran Asia yang sensitif harga.

Ada juga dimensi latensi. Infrastruktur inference yang dioptimalkan untuk pusat data US-East memperkenalkan ketinggalan bermakna bagi pengguna di Asia Tenggara. Soalan di mana inference sebenarnya berjalan — dari segi geografi — adalah soalan yang pembangun Asia berurusan dengan secara berterusan. Apabila syarikat seperti Baseten mengumpul pada penilaian ini, jangkaan daripada komuniti pembangun harus menjadi bahawa liputan infrastruktur global, termasuk wilayah Asia-Pasifik, menjadi keutamaan produk daripada pemikiran kemudian.

Dari perspektif pelaburan, pusingan Baseten juga merupakan isyarat kepada modal teroka Asia. Lapisan inference adalah tempat hasil berulang hidup dalam infrastruktur AI. Latihan berjalan sekali (atau beberapa kali). Inference berlaku berbilion kali sehari merentasi seumur hidup aplikasi pengeluaran. Pelabur yang memahami ini bergerak cepat — dan konsortium Spark Capital, Altimeter, dan Wellington yang menyokong Baseten mencerminkan keyakinan institusional yang canggih, bukan hanya pengejaran hype AI.

Bagi pengasas Asia yang membina produk asli AI, pengambilan adalah strategik: model yang anda pilih untuk dibina di atasnya kurang penting daripada seni bina inference yang anda pilih untuk menjalankannya. Fleksibiliti pada lapisan inference — keupayaan untuk menukar model, mengarahkan dengan bijak, dan mengawal kos — semakin menjadi kelebihan kompetitif, bukan hanya butiran infrastruktur.

Apa Ini Bermakna untuk Pembangun

Pembangun cenderung berfikir tentang AI dari segi model: yang mana paling pintar, yang mana mengendalikan kes penggunaan mereka terbaik, yang mana mempunyai API terbaik. Tetapi kebangkitan Baseten — dan berbilion yang mengalir ke infrastruktur inference secara meluas — adalah pengingat bahawa model hanya satu pemboleh ubah dalam persamaan yang jauh lebih besar.

Implikasi praktikal: jika anda membina aplikasi AI pengeluaran sekarang, strategi inference layak mendapat perhatian kejuruteraan yang sama seperti pemilihan model anda. Inilah yang sebenarnya kelihatan dalam amalan:

  • Pengarahan yang sesuai dengan tugas: Bukan setiap pertanyaan memerlukan GPT-4o. Tugas klasifikasi, pekerjaan ringkasan, atau langkah pengekstrakan data berstruktur mungkin berjalan sama baiknya pada model sumber terbuka yang lebih kecil pada sebahagian kecil daripada kos. Cadangan nilai teras Baseten adalah mengotomatikkan keputusan pengarahan ini. Pembangun boleh melaksanakan versi logik ini yang lebih mudah secara manual menggunakan penanda aras model dan kalkulator kos.
  • Belanjawan latensi: Bahagian berbeza aplikasi anda mempunyai toleransi latensi berbeza. Antarmuka sembang masa nyata memerlukan respons sub-500ms. Pekerjaan pemprosesan dokumen latar belakang boleh bertolak ansur beberapa saat. Memetakan panggilan inference anda ke peringkat latensi yang sesuai — dan memilih infrastruktur sewajarnya — secara langsung mempengaruhi pengalaman pengguna dan kos.
  • Penilaian model sumber terbuka: Jurang antara model komersial sempadan dan alternatif sumber terbuka yang cekap telah ditutup secara dramatik. Model seperti Llama 3, Mistral, dan Qwen (terutama relevan untuk tugas bahasa Asia) kini mengendalikan pelbagai kes penggunaan pengeluaran dengan cekap. Sebarang strategi inference yang serius harus memasukkan kitaran penilaian biasa untuk alternatif sumber terbuka.
  • Pemantauan kos sebagai kebimbangan kelas pertama: Kos inference berskala dengan penggunaan dengan cara yang boleh mengejutkan pasukan yang membina dan menguji pada volum rendah. Menginstrumenkan panggilan inference anda dengan penjejakan kos dari hari pertama — bukan sebagai pemikiran kemudian — adalah disiplin yang memisahkan pasukan yang berskala bersih daripada mereka yang mencapai dinding.

Bagi pembangun yang membina pada platform seperti MonstarX, platform dev asli AI Asia, soalan lapisan inference semakin menjadi hadapan