Startup AI inference Baseten được cho là đang huy động 1,5 tỷ USD chỉ vài tháng sau vòng gọi vốn khủng trước đó
Năm tháng. Tăng định giá 160%. 1,5 tỷ USD. Ba con số này nói lên tất cả về hướng đi của cuộc đua cơ sở hạ tầng AI — và tốc độ của nó. Startup AI inference Baseten được cho là đang huy động 1,5 tỷ USD với định giá 13 tỷ USD, chỉ năm tháng sau khi đóng vòng Series E trị giá 300…
Startup AI inference Baseten được cho là đang huy động 1,5 tỷ USD chỉ vài tháng sau vòng gọi vốn khủng trước đó
Năm tháng. Tăng định giá 160%. 1,5 tỷ USD. Ba con số này nói lên tất cả về hướng đi của cuộc đua cơ sở hạ tầng AI — và tốc độ của nó. Startup AI inference Baseten được cho là đang huy động 1,5 tỷ USD với định giá 13 tỷ USD, theo báo cáo của Wall Street Journal, chỉ năm tháng sau khi đóng vòng Series E trị giá 300 triệu USD với định giá 5 tỷ USD. Đối với các nhà phát triển và nhà sáng lập ở châu Á theo dõi ngăn xếp cơ sở hạ tầng AI toàn cầu hình thành, đây là một tín hiệu đáng phân tích — không chỉ như một tiêu đề gọi vốn, mà như một bản đồ nơi sức mạnh thực sự trong AI đang tích lũy.
Điều Gì Đã Xảy Ra
Baseten, được thành lập năm 2019, đang tiến gần đến vòng gọi vốn 1,5 tỷ USD sẽ định giá công ty ở mức 13 tỷ USD, theo báo cáo của TechCrunch về bài viết của WSJ. Vòng gọi vốn này được dẫn dắt chung bởi Spark Capital, Sands Capital, Altimeter Capital và Wellington Management.
Quỹ đạo tăng trưởng là đáng kinh ngạc. Vào tháng 9 năm 2025, Baseten huy động được 150 triệu USD Series D. Chín tháng sau đó, công ty đóng vòng Series E trị giá 300 triệu USD với định giá 5 tỷ USD. Bây giờ, chỉ năm tháng sau đó, công ty được cho là đang hoàn tất một thỏa thuận sẽ tăng định giá của nó gấp đôi lần nữa. Nếu bạn đang theo dõi: đó là khoảng 1,95 tỷ USD huy động được qua ba vòng trong chưa đầy 18 tháng.
Có một chi tiết cấu trúc quan trọng bị chôn vùi trong các báo cáo. Vòng gọi vốn mới nhất này được cho là một vòng định giá tách biệt — một cơ chế trong đó các nhà đầu tư khác nhau mua vào cùng một vòng gọi vốn ở các định giá khác nhau. Một số nhà đầu tư đến với con số tiêu đề 13 tỷ USD; những người khác ở mức 11 tỷ USD. Đây là một chiến thuật đã trở nên ngày càng phổ biến trong tài chính startup AI, nơi các nhà đầu tư chính có thể tuyên bố định giá cao hơn trên giấy trong khi những người tham gia thứ cấp nhận được chiết khấu để bù đắp rủi ro. Nó làm tăng con số tiêu đề và làm cho thỏa thuận trông sạch hơn so với thực tế.
Bỏ qua cảnh báo đó, logic kinh doanh cơ bản là thực tế. Đề xuất cốt lõi của Baseten là định tuyến các yêu cầu suy luận đến mô hình phù hợp nhất cho một nhiệm vụ nhất định — bao gồm các lựa chọn mã nguồn mở có chi phí thấp hơn đáng kể so với chạy mọi thứ thông qua các mô hình biên giới như GPT-4o hoặc Claude. Công ty đang xây dựng lớp chuyển đổi giữa những gì người dùng yêu cầu và mô hình nào thực sự trả lời. Đó là một vị trí có giá trị để chiếm giữ khi chi phí suy luận trở thành mối quan tâm chính cho bất kỳ ai xây dựng các ứng dụng AI sản xuất.
Bối cảnh rộng hơn: cái mà The Next Wave gọi là "cuộc đua vàng suy luận" đang diễn ra đầy đủ. Vốn mạo hiểm đang chảy vào các công ty nằm giữa mô hình thô và người dùng cuối — tối ưu hóa độ trễ, quản lý chi phí tính toán và xử lý độ phức tạp hoạt động của việc chạy AI quy mô lớn. Baseten là một trong những người hưởi lợi rõ ràng nhất từ xu hướng đó.
Tại Sao Điều Này Quan Trọng Đối Với Châu Á
Hệ sinh thái AI của châu Á có mối quan hệ phức tạp với cơ sở hạ tầng suy luận. Khu vực này không thiếu tham vọng AI — từ chiến lược AI quốc gia của Singapore đến sự thống trị bán dẫn của Hàn Quốc đến cộng đồng nhà phát triển đang phát triển nhanh chóng của Ấn Độ. Nhưng khi nói đến lớp suy luận cụ thể, các nhà sáng lập và nhà phát triển châu Á phần lớn phụ thuộc vào cơ sở hạ tầng được xây dựng và định giá cho các thị trường phương Tây.
Điều đó tạo ra một vấn đề chi phí thực sự. Suy luận không phải là một khoản chi phí một lần. Mỗi truy vấn của người dùng, mỗi lệnh gọi API, mỗi phản hồi thời gian thực trong một ứng dụng sản xuất đều tiêu tốn tài nguyên tính toán. Đối với một startup ở Jakarta hoặc Thành phố Hồ Chí Minh hoạt động bằng tiền tệ địa phương với kỳ vọng định giá địa phương, kinh tế học của việc chạy suy luận trên cơ sở hạ tầng đám mây phương Tây cao cấp có thể rất khắc nghiệt. Mô hình của Baseten — định tuyến đến các lựa chọn mã nguồn mở rẻ hơn và có khả năng thay vì mặc định sử dụng mô hình biên giới đắt nhất — chính xác là loại chênh lệch chi phí quan trọng trong các thị trường châu Á nhạy cảm với giá cả.
Cũng có một khía cạnh độ trễ. Cơ sở hạ tầng suy luận được tối ưu hóa cho các trung tâm dữ liệu US-East giới thiệu độ trễ đáng kể cho người dùng ở Đông Nam Á. Câu hỏi về nơi suy luận thực sự chạy — về mặt địa lý — là một câu hỏi mà các nhà phát triển châu Á liên tục phải đối mặt. Khi các công ty như Baseten huy động với những định giá này, kỳ vọng từ cộng đồng nhà phát triển nên là phạm vi cơ sở hạ tầng toàn cầu, bao gồm các khu vực châu Á-Thái Bình Dương, trở thành ưu tiên sản phẩm chứ không phải là suy nghĩ sau cùng.
Từ góc độ đầu tư, vòng gọi vốn Baseten cũng là một tín hiệu cho vốn mạo hiểm châu Á. Lớp suy luận là nơi doanh thu định kỳ sống trong cơ sở hạ tầng AI. Các vòng đào tạo xảy ra một lần (hoặc một vài lần). Suy luận xảy ra hàng tỷ lần mỗi ngày trên toàn bộ vòng đời của ứng dụng sản xuất. Các nhà đầu tư hiểu điều này đang di chuyển nhanh — và tập đoàn Spark Capital, Altimeter và Wellington hỗ trợ Baseten phản ánh niềm tin thể chế tinh vi, không chỉ là đuổi theo hype AI.
Đối với các nhà sáng lập châu Á xây dựng các sản phẩm AI-native, bài học rút ra là chiến lược: mô hình bạn chọn để xây dựng trên đó ít quan trọng hơn kiến trúc suy luận bạn chọn để chạy nó. Tính linh hoạt ở lớp suy luận — khả năng hoán đổi mô hình, định tuyến thông minh và kiểm soát chi phí — ngày càng trở thành một lợi thế cạnh tranh, không chỉ là một chi tiết cơ sở hạ tầng.
Điều Này Có Nghĩa Gì Đối Với Các Nhà Phát Triển
Các nhà phát triển có xu hướng suy nghĩ về AI theo các mô hình: cái nào thông minh nhất, cái nào xử lý trường hợp sử dụng của họ tốt nhất, cái nào có API tốt nhất. Nhưng sự trỗi dậy của Baseten — và hàng tỷ USD chảy vào cơ sở hạ tầng suy luận nói chung — là một lời nhắc nhở rằng mô hình chỉ là một biến trong một phương trình lớn hơn nhiều.
Hàm ý thực tế: nếu bạn đang xây dựng một ứng dụng AI sản xuất ngay bây giờ, chiến lược suy luận xứng đáng nhận được sự chú ý kỹ thuật tương tự như lựa chọn mô hình của bạn. Đây là những gì nó thực sự trông như thế nào trong thực tế:
- Định tuyến phù hợp với nhiệm vụ: Không phải mọi truy vấn đều cần GPT-4o. Một nhiệm vụ phân loại, một công việc tóm tắt hoặc một bước trích xuất dữ liệu có cấu trúc có thể chạy tốt trên một mô hình mã nguồn mở nhỏ hơn với chi phí chỉ là một phần nhỏ. Đề xuất giá trị cốt lõi của Baseten là tự động hóa quyết định định tuyến này. Các nhà phát triển có thể triển khai một phiên bản đơn giản hơn của logic này theo cách thủ công bằng cách sử dụng các điểm chuẩn mô hình và máy tính chi phí.
- Ngân sách độ trễ: Các phần khác nhau của ứng dụng của bạn có độ chịu đựng độ trễ khác nhau. Giao diện trò chuyện thời gian thực cần phản hồi dưới 500ms. Một công việc xử lý tài liệu nền có thể chịu được vài giây. Ánh xạ các lệnh gọi suy luận của bạn đến các tầng độ trễ thích hợp — và chọn cơ sở hạ tầng tương ứng — trực tiếp ảnh hưởng đến trải nghiệm người dùng và chi phí.
- Đánh giá mô hình mã nguồn mở: Khoảng cách giữa các mô hình thương mại biên giới và các lựa chọn mã nguồn mở có khả năng đã giảm đáng kể. Các mô hình như Llama 3, Mistral và Qwen (đặc biệt phù hợp cho các nhiệm vụ ngôn ngữ châu Á) hiện xử lý một loạt các trường hợp sử dụng sản xuất một cách có khả năng. Bất kỳ chiến lược suy luận nghiêm túc nào cũng nên bao gồm một chu kỳ đánh giá thường xuyên cho các lựa chọn mã nguồn mở.
- Giám sát chi phí như một mối quan tâm hạng nhất: Chi phí suy luận tăng theo mức sử dụng theo những cách có thể làm cho các đội ngạc nhiên những người xây dựng và kiểm tra ở mức thấp. Công cụ các lệnh gọi suy luận của bạn với theo dõi chi phí từ ngày đầu tiên — không phải như một suy nghĩ sau cùng — là một kỷ luật phân biệt các đội mở rộng sạch sẽ với những đội gặp tường.
Đối với các nhà phát triển xây dựng trên các nền tảng như MonstarX, nền tảng phát triển AI-native của châu Á, câu hỏi lớp suy luận ngày càng trở nên phía trước