AI انفرنس اسٹارٹ اپ Baseten کی اپنی آخری بڑی فنڈنگ کے محض چند ماہ بعد $1.5 بلین کی فنڈنگ کی رپورٹ
پانچ ماہ۔ 160% ویلیویشن میں اضافہ۔ $1.5 بلین۔ یہ تینوں اعداد و شمار آپ کو بتاتے ہیں کہ AI انفراسٹرکچر کی دوڑ کہاں جا رہی ہے — اور کتنی تیزی سے۔ Baseten کی رپورٹ کے مطابق $13 بلین کی ویلیویشن پر $1.5 بلین کی فنڈنگ ہو رہی ہے، محض پانچ ماہ پہلے $5 بلین کی ویلیویشن پر $300 ملین کی…
AI انفرنس اسٹارٹ اپ Baseten کی اپنی آخری بڑی فنڈنگ کے محض چند ماہ بعد $1.5 بلین کی فنڈنگ کی رپورٹ
پانچ ماہ۔ 160% ویلیویشن میں اضافہ۔ $1.5 بلین۔ یہ تینوں اعداد و شمار آپ کو بتاتے ہیں کہ AI انفراسٹرکچر کی دوڑ کہاں جا رہی ہے — اور کتنی تیزی سے۔ AI انفرنس اسٹارٹ اپ Baseten کی رپورٹ کے مطابق $13 بلین کی ویلیویشن پر $1.5 بلین کی فنڈنگ ہو رہی ہے، Wall Street Journal کی رپورٹ کے مطابق، محض پانچ ماہ پہلے $5 بلین کی ویلیویشن پر $300 ملین کی Series E بند کرنے کے بعد۔ ایشیا میں ڈیولپرز اور بانیوں کے لیے جو عالمی AI انفراسٹرکچر اسٹیک کی تشکیل دیکھ رہے ہیں، یہ ایک اہم اشارہ ہے — نہ صرف فنڈنگ کی سرخی کے طور پر، بلکہ ایک نقشہ کے طور پر جہاں AI میں حقیقی اثر و رسوخ جمع ہو رہا ہے۔
کیا ہوا
Baseten، جو 2019 میں قائم ہوا، $1.5 بلین کی فنڈنگ راؤنڈ کے قریب ہے جو کمپنی کو $13 بلین پر ویلیو کرے گی، TechCrunch کی WSJ رپورٹ کی کوریج کے مطابق۔ یہ راؤنڈ Spark Capital، Sands Capital، Altimeter Capital، اور Wellington Management کے ذریعے مشترکہ طور پر لیڈ کیا جا رہا ہے۔
یہ رفتار حیران کن ہے۔ ستمبر 2025 میں، Baseten نے $150 ملین کی Series D فنڈنگ حاصل کی۔ نو ماہ بعد، اس نے $5 بلین کی ویلیویشن پر $300 ملین کی Series E بند کی۔ اب، محض پانچ ماہ بعد، یہ کمپنی ایک ایسے ڈیل کو حتمی شکل دے رہی ہے جو اس کی ویلیویشن کو دوبارہ دگنا کر دے۔ اگر آپ گنتی رکھ رہے ہیں: یہ 18 ماہ سے کم عرصے میں تین راؤنڈز میں تقریباً $1.95 بلین کی فنڈنگ ہے۔
رپورٹنگ میں ایک اہم ساختی تفصیل چھپی ہوئی ہے۔ یہ تازہ ترین راؤنڈ کی رپورٹ کے مطابق ایک split-priced round ہے — ایک میکانزم جہاں مختلف سرمایہ کار ایک ہی فنڈنگ میں مختلف ویلیویشنز پر خریداری کرتے ہیں۔ کچھ سرمایہ کار $13 بلین کی سرخی والی تعداد پر آ رہے ہیں؛ دوسرے $11 بلین پر۔ یہ ایک حکمت عملی ہے جو AI اسٹارٹ اپ فنڈنگ میں تیزی سے عام ہو گئی ہے، جہاں لیڈ سرمایہ کار کاغذ پر زیادہ ویلیویشن کا دعویٰ کر سکتے ہیں جبکہ ثانوی شرکاء کو خطرے کی تلافی کے لیے ڈسکاؤنٹ ملتا ہے۔ یہ سرخی کی تعداد کو بڑھاتا ہے اور ڈیل کو اس سے صاف ستھرا بناتا ہے جتنا وہ اصل میں ہو سکتا ہے۔
اس انتباہ کے علاوہ، بنیادی کاروباری منطق حقیقی ہے۔ Baseten کی بنیادی پیشکش انفرنس درخواستوں کو کسی دیے گئے کام کے لیے بہترین فٹ والے ماڈل تک روٹ کرنا ہے — بشمول اوپن سورس متبادل جو GPT-4o یا Claude جیسے frontier ماڈلز کے ذریعے سب کچھ چلانے سے نمایاں طور پر سستے ہیں۔ کمپنی اس کے درمیان سوئچنگ لیئر بنا رہی ہے کہ صارفین کیا مانگتے ہیں اور کون سا ماڈل اصل میں جواب دیتا ہے۔ یہ ایک قیمتی مقام ہے جب انفرنس کی لاگتیں پروڈکشن AI ایپلیکیشنز بنانے والے کسی کے لیے بھی ایک بنیادی تشویش بن جاتی ہیں۔
وسیع تر تناظر: جسے The Next Wave نے "انفرنس گولڈ رش" کہا ہے وہ مکمل طور پر جاری ہے۔ وینچر کیپیٹل ان کمپنیوں میں بہہ رہا ہے جو خام ماڈل اور آخری صارف کے درمیان بیٹھی ہیں — latency کو بہتر بناتے ہوئے، compute کی لاگتوں کو منظم کرتے ہوئے، اور AI کو بڑے پیمانے پر چلانے کی آپریشنل پیچیدگی کو سنبھالتے ہوئے۔ Baseten اس رجحان کے سب سے واضح فائدہ مند میں سے ایک ہے۔
ایشیا کے لیے یہ کیوں اہم ہے
ایشیا کے AI ایکوسسٹم کا انفرنس انفراسٹرکچر کے ساتھ ایک پیچیدہ رشتہ ہے۔ اس خطے میں AI کے خواہشات کی کوئی کمی نہیں ہے — سنگاپور کی قومی AI حکمت عملی سے لے کر جنوبی کوریا کے سیمی کنڈکٹر کی غلبہ سے لے کر ہندوستان کی تیزی سے بڑھتی ہوئی ڈیولپر کمیونٹی تک۔ لیکن جب انفرنس لیئر کی بات آتی ہے، تو ایشیائی بانیوں اور ڈیولپرز بڑی حد تک مغربی بازاروں کے لیے بنائے اور قیمت کے لحاظ سے تیار کیے گئے انفراسٹرکچر پر منحصر رہے ہیں۔
یہ ایک حقیقی لاگت کا مسئلہ پیدا کرتا ہے۔ انفرنس ایک بار کی لاگت نہیں ہے۔ ہر صارف کی درخواست، ہر API کال، پروڈکشن ایپلیکیشن میں ہر حقیقی وقت کا جواب compute کو جلاتا ہے۔ جکارتہ یا ہو چی منہ سٹی میں ایک اسٹارٹ اپ کے لیے جو مقامی کرنسی میں کام کر رہا ہے اور مقامی قیمت کی توقعات رکھتا ہے، premium مغربی کلاؤڈ انفراسٹرکچر پر انفرنس چلانے کی معیشت سخت ہو سکتی ہے۔ Baseten کا ماڈل — سب سے مہنگے frontier ماڈل کو ڈیفالٹ کرنے کی بجائے سستے، قابل اعتماد اوپن سورس متبادل تک روٹ کرنا — بالکل یہی قسم کی لاگت کی arbitrage ہے جو قیمت کے لحاظ سے حساس ایشیائی بازاروں میں بہت اہم ہے۔
ایک latency کا پہلو بھی ہے۔ US-East ڈیٹا سینٹرز کے لیے بہتر بنایا گیا انفرنس انفراسٹرکچر جنوب مشرقی ایشیا میں صارفین کے لیے معنی خیز تاخیر متعارف کراتا ہے۔ انفرنس اصل میں کہاں چلتا ہے — جغرافیائی طور پر — یہ سوال ہے جو ایشیائی ڈیولپرز مسلسل سے نمٹتے ہیں۔ جیسے جیسے Baseten جیسی کمپنیاں ان ویلیویشنز پر فنڈنگ حاصل کرتی ہیں، ڈیولپر کمیونٹی کی طرف سے توقع یہ ہونی چاہیے کہ عالمی انفراسٹرکچر کوریج، بشمول ایشیا پیسیفک علاقوں کے، ایک پروڈکٹ کی ترجیح بن جائے نہ کہ ایک بعد میں سوچا جانے والا معاملہ۔
سرمایہ کاری کے لحاظ سے، Baseten راؤنڈ ایشیائی وینچر کیپیٹل کے لیے ایک اشارہ بھی ہے۔ انفرنس لیئر وہ جگہ ہے جہاں AI انفراسٹرکچر میں recurring revenue رہتا ہے۔ تربیت ایک بار چلتی ہے (یا کچھ بار)۔ انفرنس ایک پروڈکشن ایپلیکیشن کی زندگی بھر فی دن اربوں بار ہوتا ہے۔ سرمایہ کار جو اسے سمجھتے ہیں وہ تیزی سے آگے بڑھ رہے ہیں — اور Spark Capital، Altimeter، اور Wellington کنسورشیم جو Baseten کو سپورٹ کر رہے ہیں وہ sophisticated institutional conviction کو ظاہر کرتے ہیں، نہ کہ محض AI hype کا پیچھا۔
AI-native پروڈکٹس بنانے والے ایشیائی بانیوں کے لیے، نکتہ نکال لینے والی بات یہ ہے: جس ماڈل پر آپ بنانے کا انتخاب کرتے ہیں وہ اس انفرنس آرکیٹیکچر سے کم اہم ہے جو آپ اسے چلانے کے لیے منتخب کرتے ہیں۔ انفرنس لیئر پر لچک — ماڈلز کو سوئچ کرنے، ذہین طریقے سے روٹ کرنے، اور لاگتوں کو کنٹرول کرنے کی صلاحیت — تیزی سے ایک مسابقتی فائدہ بن رہی ہے، نہ کہ صرف ایک انفراسٹرکچر کی تفصیل۔
ڈیولپرز کے لیے اس کا مطلب
ڈیولپرز عام طور پر AI کے بارے میں ماڈلز کے لحاظ سے سوچتے ہیں: کون سا سب سے ذہین ہے، کون سا ان کے استعمال کے معاملے کو بہترین طریقے سے سنبھالتا ہے، کون سا بہترین API ہے۔ لیکن Baseten کا عروج — اور انفرنس انفراسٹرکچر میں بڑی حد تک بہہ رہے اربوں — یہ یاد دہانی ہے کہ ماڈل ایک بہت بڑی مساوات میں صرف ایک متغیر ہے۔
عملی مطلب: اگر آپ ابھی ایک پروڈکشن AI ایپلیکیشن بنا رہے ہیں، تو انفرنس حکمت عملی اپنی ماڈل کے انتخاب جیسی ہی انجینئرنگ توجہ کے قابل ہے۔ یہاں یہ عملی طور پر کیسا لگتا ہے:
- کام کے لیے موزوں روٹنگ: ہر درخواست کو GPT-4o کی ضرورت نہیں ہے۔ ایک درجہ بندی کا کام، ایک خلاصہ کی نوکری، یا ایک ساختی ڈیٹا نکالنے کا مرحلہ ایک چھوٹے اوپن سورس ماڈل پر ایک حصے کی لاگت پر بالکل اسی طرح چل سکتا ہے۔ Baseten کی بنیادی قیمتی تجویز یہ روٹنگ فیصلہ کو خودکار کرنا ہے۔ ڈیولپرز ماڈل بینچ مارکس اور لاگت کیلکولیٹرز استعمال کرتے ہوئے اس منطق کا ایک سادہ ورژن دستی طور پر نافذ کر سکتے ہیں۔
- Latency بجٹنگ: آپ کی ایپلیکیشن کے مختلف حصوں میں مختلف latency کی رواداری ہے۔ ایک حقیقی وقت کی چیٹ انٹرفیس کو 500ms سے کم جوابات کی ضرورت ہے۔ ایک پس منظر میں دستاویز کی پروسیسنگ کی نوکری کئی سیکنڈ کی رواداری کر سکتی ہے۔ اپنی انفرنس کالز کو مناسب latency tiers سے نقشہ بنانا — اور اس کے مطابق انفراسٹرکچر کا انتخاب کرنا — براہ راست صارف کے تجربے اور لاگت کو متاثر کرتا ہے۔
- اوپن سورس ماڈل کی تشخیص: frontier تجارتی ماڈلز اور قابل اعتماد اوپن سورس متبادل کے درمیان فاصلہ ڈرامائی طور پر بند ہو گیا ہے۔ Llama 3، Mistral، اور Qwen (خاص طور پر ایشیائی زبان کے کاموں کے لیے متعلقہ) جیسے ماڈلز اب پروڈکشن کے استعمال کی ایک وسیع رینج کو قابل اعتماد طریقے سے سنبھالتے ہیں۔ کوئی بھی سنجیدہ انفرنس حکمت عملی میں اوپن سورس متبادل کے لیے ایک باقاعدہ تشخیص کا سائیکل شامل ہونا چاہیے۔
- لاگت کی نگرانی ایک first-class تشویش کے طور پر: انفرنس کی لاگتیں استعمال کے ساتھ اس طریقے سے بڑھتی ہیں جو کم حجم میں بنائے اور ٹیسٹ کیے گئے ٹیموں کو حیران کر سکتی ہے۔ دن کے پہلے سے اپنی انفرنس کالز کو لاگت کی نگرانی کے ساتھ instrument کرنا — بعد میں سوچے جانے والے معاملے کے طور پر نہیں — ایک نظم و ضبط ہے جو ان ٹیموں کو الگ کرتا ہے جو صاف طریقے سے بڑھتے ہیں ان سے جو ایک دیوار سے ٹکراتے ہیں۔
MonstarX جیسے platforms پر بنانے والے ڈیولپرز کے لیے، ایشیا کا AI-native dev platform، انفرنس لیئر کا سوال تیزی سے سامنے آ رہا ہے