Baseten สตาร์ทอัพ AI inference เพิ่มทุน $1.5 พันล้านเหรียญ เพียงไม่กี่เดือนหลังจากรอบการระดมทุนครั้งก่อน
Baseten สตาร์ทอัพ AI inference เพิ่มทุน $1.5 พันล้านเหรียญด้วยมูลค่า $13 พันล้านเหรียญ เพียงห้าเดือนหลังจากปิดรอบ Series E มูลค่า $300 ล้านเหรียญ สัญญาณนี้บ่งบอกถึงการแข่งขัน AI infrastructure ที่เร็วขึ้นและความสำคัญของการกำหนดเส้นทาง inference ที่ชาญฉลาด
Baseten สตาร์ทอัพ AI inference เพิ่มทุน $1.5 พันล้านเหรียญ เพียงไม่กี่เดือนหลังจากรอบการระดมทุนครั้งก่อน
ห้าเดือน การเพิ่มมูลค่า 160% มูลค่า $1.5 พันล้านเหรียญ ตัวเลขสามตัวนี้บอกคุณทุกอย่างเกี่ยวกับทิศทางของการแข่งขัน AI infrastructure — และความเร็วของมัน Baseten สตาร์ทอัพ AI inference ที่เพิ่มทุน $1.5 พันล้านเหรียญด้วยมูลค่า $13 พันล้านเหรียญ ตามรายงานของ Wall Street Journal เพียงห้าเดือนหลังจากปิดรอบ Series E มูลค่า $300 ล้านเหรียญด้วยมูลค่า $5 พันล้านเหรียญ สำหรับนักพัฒนาและผู้ก่อตั้งในเอเชียที่ติดตามการพัฒนา AI infrastructure ทั่วโลก นี่คือสัญญาณที่คุ้มค่าที่จะวิเคราะห์ — ไม่เพียงแค่เป็นข่าวการระดมทุน แต่เป็นแผนที่ของสถานที่ที่ leverage ที่แท้จริงในด้าน AI กำลังสะสมตัวอยู่
เกิดอะไรขึ้น
Baseten ที่ก่อตั้งในปี 2019 กำลังปิดรอบการระดมทุน $1.5 พันล้านเหรียญที่จะให้มูลค่าบริษัทที่ $13 พันล้านเหรียญ ตามรายงานของ TechCrunch เกี่ยวกับรายงาน WSJ รอบนี้นำโดย Spark Capital, Sands Capital, Altimeter Capital และ Wellington Management
วิถีการเติบโตนั้นน่าตกใจ ในเดือนกันยายน 2025 Baseten เพิ่มทุน $150 ล้านเหรียญในรอบ Series D เก้าเดือนต่อมา มันปิดรอบ Series E มูลค่า $300 ล้านเหรียญด้วยมูลค่า $5 พันล้านเหรียญ ตอนนี้ เพียงห้าเดือนหลังจากนั้น มันกำลังจะปิดดีลที่เพิ่มมูลค่าเป็นสองเท่าอีกครั้ง หากคุณกำลังนับคะแนน: นั่นคือประมาณ $1.95 พันล้านเหรียญที่เพิ่มทุนในสามรอบในเวลาน้อยกว่า 18 เดือน
มีรายละเอียดโครงสร้างที่สำคัญซ่อนอยู่ในรายงาน รอบล่าสุดนี้เป็น split-priced round — กลไกที่นักลงทุนคนต่างๆ ซื้อเข้าไปในการระดมทุนเดียวกันด้วยมูลค่าต่างกัน นักลงทุนบางคนเข้ามาด้วยตัวเลขหลัก $13 พันล้านเหรียญ บางคนด้วย $11 พันล้านเหรียญ นี่คือกลวิธีที่กลายมาเป็นเรื่องปกติมากขึ้นในการระดมทุนสตาร์ทอัพ AI ที่นักลงทุนนำหน้าสามารถอ้างมูลค่าที่สูงขึ้นบนกระดาษในขณะที่ผู้เข้าร่วมรองได้รับส่วนลดเพื่อชดเชยความเสี่ยง มันทำให้ตัวเลขหลักพองตัวขึ้นและทำให้ดีลดูสะอาดกว่าที่มันอาจจะเป็น
นอกเหนือจากข้อเตือนนั้น ตรรมชาติทางธุรกิจพื้นฐานนั้นเป็นจริง ข้อเสนอหลักของ Baseten คือการกำหนดเส้นทางคำขอ inference ไปยังโมเดลที่เหมาะสมที่สุดสำหรับงานที่กำหนด — รวมถึงทางเลือก open-source ที่มีค่าใช้จ่ายต่ำกว่าการรันทุกอย่างผ่านโมเดลชั้นนำเช่น GPT-4o หรือ Claude บริษัทกำลังสร้างชั้นสวิตชิ่งระหว่างสิ่งที่ผู้ใช้ถาม และโมเดลใดที่ตอบจริง นั่นคือตำแหน่งที่มีค่าที่จะครอบครอง เมื่อต้นทุน inference กลายเป็นข้อกังวลหลักสำหรับใครก็ตามที่สร้างแอปพลิเคชัน AI ในการผลิต
บริบทที่กว้างขึ้น: สิ่งที่ The Next Wave เรียกว่า "inference gold rush" อยู่ในช่วงเต็มที่ ทุนเสี่ยงหมุนเวียนเข้าไปในบริษัทที่นั่งอยู่ระหว่างโมเดลดิบและผู้ใช้ปลายทาง — เพิ่มประสิทธิภาพ latency จัดการต้นทุนการคำนวณ และจัดการความซับซ้อนในการดำเนินการของการรัน AI ในระดับขนาดใหญ่ Baseten เป็นหนึ่งในผู้ได้รับประโยชน์ที่ชัดเจนที่สุดของแนวโน้มนั้น
ทำไมมันจึงสำคัญสำหรับเอเชีย
ระบบนิเวศ AI ของเอเชียมีความสัมพันธ์ที่ซับซ้อนกับ inference infrastructure บริเวณนี้ไม่ขาดความทะเยอทะยานด้าน AI — จากกลยุทธ์ AI แห่งชาติของสิงคโปร์ไปจนถึงความเหนือกว่าด้านเซมิคอนดักเตอร์ของเกาหลีใต้ไปจนถึงชุมชนนักพัฒนาที่ขยายตัวอย่างรวดเร็วของอินเดีย แต่เมื่อพูดถึงชั้น inference โดยเฉพาะ ผู้ก่อตั้งและนักพัฒนาเอเชียส่วนใหญ่ขึ้นอยู่กับ infrastructure ที่สร้างและกำหนดราคาสำหรับตลาดตะวันตก
นั่นสร้างปัญหาต้นทุนที่แท้จริง Inference ไม่ใช่ค่าใช้จ่ายครั้งเดียว ทุกคำขอของผู้ใช้ ทุกการเรียก API ทุกการตอบสนองแบบเรียลไทม์ในแอปพลิเคชันการผลิตจะใช้การคำนวณ สำหรับสตาร์ทอัพในจาการ์ตา หรือโฮจิมินห์ซิตี้ที่ดำเนินการในสกุลเงินท้องถิ่นด้วยความคาดหวังด้านราคาท้องถิ่น เศรษฐศาสตร์ของการรัน inference บน infrastructure ระบบคลาวด์ตะวันตกพรีเมียมสามารถเป็นสิ่งที่โหดร้าย โมเดล Baseten — การกำหนดเส้นทางไปยังทางเลือก open-source ที่ถูกกว่าและมีความสามารถ แทนที่จะเริ่มต้นด้วยโมเดลชั้นนำที่แพงที่สุด — เป็นการ arbitrage ต้นทุนที่เป็นประเภทที่สำคัญมากในตลาดเอเชียที่มีความไวต่อราคา
นอกจากนี้ยังมีมิติ latency Inference infrastructure ที่ปรับให้เหมาะสมสำหรับ data center US-East นำเสนอความล่าช้าที่มีความหมายสำหรับผู้ใช้ในเอเชียตะวันออกเฉียงใต้ คำถามว่า inference จริงๆ แล้วรันที่ไหน — ทางภูมิศาสตร์ — เป็นคำถามที่นักพัฒนาเอเชียจัดการอยู่ตลอดเวลา เมื่อบริษัทเช่น Baseten เพิ่มทุนด้วยมูลค่าเหล่านี้ ความคาดหวังจากชุมชนนักพัฒนาควรเป็นว่า coverage infrastructure ทั่วโลก รวมถึงภูมิภาค Asia-Pacific กลายเป็นลำดับความสำคัญของผลิตภัณฑ์ แทนที่จะเป็นสิ่งที่คิดหลัง
จากมุมมองการลงทุน รอบ Baseten ยังเป็นสัญญาณให้กับทุนเสี่ยงเอเชีย ชั้น inference คือสถานที่ที่รายได้ที่เกิดขึ้นซ้ำๆ อยู่ใน AI infrastructure การฝึกอบรมเกิดขึ้นครั้งเดียว (หรือสองสามครั้ง) Inference เกิดขึ้นหลายพันล้านครั้งต่อวันในอายุการใช้งานของแอปพลิเคชันการผลิต นักลงทุนที่เข้าใจสิ่งนี้กำลังเคลื่อนไหวอย่างรวดเร็ว — และ联盟 Spark Capital, Altimeter และ Wellington ที่สนับสนุน Baseten สะท้อนให้เห็นความเชื่อมั่นของสถาบันที่ซับซ้อน ไม่ใช่แค่การไล่ตามความวิกวกของ AI
สำหรับผู้ก่อตั้งเอเชียที่สร้างผลิตภัณฑ์ที่เป็น AI-native ข้อสรุปเชิงกลยุทธ์คือ: โมเดลที่คุณเลือกสร้างบนนั้นมีความสำคัญน้อยกว่า inference architecture ที่คุณเลือกรันผ่านมัน ความยืดหยุ่นที่ชั้น inference — ความสามารถในการสลับโมเดล กำหนดเส้นทางอย่างชาญฉลาด และควบคุมต้นทุน — เป็นข้อได้เปรียบที่มีการแข่งขันมากขึ้น ไม่ใช่แค่รายละเอียด infrastructure
นี่หมายถึงอะไรสำหรับนักพัฒนา
นักพัฒนามักจะคิดเกี่ยวกับ AI ในแง่ของโมเดล: อันไหนฉลาดที่สุด อันไหนจัดการกรณีการใช้งานของพวกเขาได้ดีที่สุด อันไหนมี API ที่ดีที่สุด แต่การเพิ่มขึ้นของ Baseten — และหลายพันล้านเหรียญที่ไหลเข้าไปใน inference infrastructure โดยทั่วไป — เป็นการเตือนใจว่าโมเดลนั้นเป็นเพียงตัวแปรหนึ่งในสมการที่ใหญ่กว่ามาก
ผลกระทบในทางปฏิบัติ: หากคุณกำลังสร้างแอปพลิเคชัน AI ในการผลิตตอนนี้ กลยุทธ์ inference ควรได้รับความสนใจทางวิศวกรรมเดียวกันกับการเลือกโมเดลของคุณ นี่คือสิ่งที่มันดูเหมือนในทางปฏิบัติ:
- การกำหนดเส้นทางที่เหมาะสมกับงาน: ไม่ใช่ทุกคำขอที่ต้องการ GPT-4o งานการจำแนกประเภท งานสรุป หรือขั้นตอนการแยกข้อมูลที่มีโครงสร้างอาจรันได้ดีเท่าๆ กันบนโมเดล open-source ที่เล็กกว่าด้วยค่าใช้จ่ายเพียงเศษส่วน ข้อเสนอมูลค่าหลักของ Baseten คือการทำให้การตัดสินใจการกำหนดเส้นทางนี้เป็นอัตโนมัติ นักพัฒนาสามารถใช้เวอร์ชันที่ง่ายกว่าของตรรมชาตินี้ด้วยตนเองโดยใช้เกณฑ์มาตรฐานโมเดลและเครื่องคิดเลขต้นทุน
- การจัดงบประมาณ latency: ส่วนต่างๆ ของแอปพลิเคชันของคุณมีความอดทนต่อ latency ที่แตกต่างกัน อินเตอร์เฟซแชทแบบเรียลไทม์ต้องการการตอบสนองที่น้อยกว่า 500ms งานประมวลผลเอกสารในพื้นหลังสามารถทนต่อหลายวินาที การแมปการเรียก inference ของคุณไปยังชั้น latency ที่เหมาะสม — และเลือก infrastructure ตามนั้น — ส่งผลโดยตรงต่อประสบการณ์ผู้ใช้และต้นทุน
- การประเมินโมเดล open-source: ช่องว่างระหว่างโมเดลเชิงพาณิชย์ชั้นนำและทางเลือก open-source ที่มีความสามารถได้ปิดลงอย่างมาก โมเดลเช่น Llama 3, Mistral และ Qwen (เกี่ยวข้องโดยเฉพาะสำหรับงานภาษาเอเชีย) ตอนนี้จัดการกรณีการใช้งานการผลิตที่หลากหลายได้อย่างมีความสามารถ กลยุทธ์ inference ที่จริงจังใดๆ ควรรวมถึงรอบการประเมินเป็นระยะสำหรับทางเลือก open-source
- การติดตามต้นทุนเป็นข้อกังวลชั้นหนึ่ง: ต้นทุน inference ขยายตัวตามการใช้งานในลักษณะที่อาจทำให้ทีมที่สร้างและทดสอบด้วยปริมาณต่ำประหลาดใจ การติดตั้งเครื่องมือการเรียก inference ของคุณด้วยการติดตามต้นทุนตั้งแต่วันแรก — ไม่ใช่เป็นสิ่งที่คิดหลัง — เป็นวินัยที่แยกทีมที่ขยายตัวอย่างสะอาดจากทีมที่ชนกำแพง
สำหรับนักพัฒนาที่สร้างบนแพลตฟอร์มเช่น MonstarX แพลตฟอร์มการพัฒนา AI-native ของเอเชีย คำถามเกี่ยวกับชั้น inference กำลังกลายเป็นสิ่งสำคัญมากขึ้น