lang-ta

AI inference startup Baseten $1.5B நிதி திரட்டுவதாக தகவல் - சில மாதங்களுக்கு முன் மெகா சுற்றுக்குப் பிறகு

ஐந்து மாதங்கள். 160% மதிப்பீட்டு அதிகரிப்பு. $1.5 பில்லியன். இந்த மூன்று எண்கள் AI உள்கட்டமைப்பு பந்தயம் எங்கு செல்கிறது என்பதையும் எவ்வளவு வேகமாக செல்கிறது என்பதையும் உங்களுக்குச் சொல்கிறது.

AI inference startup Baseten $1.5B நிதி திரட்டுவதாக தகவல் - சில மாதங்களுக்கு முன் மெகா சுற்றுக்குப் பிறகு

ஐந்து மாதங்கள். 160% மதிப்பீட்டு அதிகரிப்பு. $1.5 பில்லியன். இந்த மூன்று எண்கள் AI உள்கட்டமைப்பு பந்தயம் எங்கு செல்கிறது என்பதையும் எவ்வளவு வேகமாக செல்கிறது என்பதையும் உங்களுக்குச் சொல்கிறது. AI inference startup Baseten $13 பில்லியன் மதிப்பீட்டில் $1.5B நிதி திரட்டுவதாக தகவல் உள்ளது, Wall Street Journal அறிக்கையின் படி, $5 பில்லியன் மதிப்பீட்டில் $300 மில்லியன் Series E மூடிய ஐந்து மாதங்களுக்குப் பிறகு. ஆசியாவில் உள்ள டெவலப்பர்கள் மற்றும் நிறுவனர்கள் உலகளாவிய AI உள்கட்டமைப்பு அடுக்கு உருவாகிறதைக் கவனித்துக் கொண்டிருக்கிறார்கள், இது ஒரு நிதி திரட்டுதல் செய்திக்கு மட்டுமல்ல, AI-ல் உண்மையான நன்மை எங்கு திரட்டப்படுகிறது என்பதற்கான வரைபடமாக பிரிக்கப்பட வேண்டிய சமிக்ஞை.

என்ன நடந்தது

2019 இல் நிறுவப்பட்ட Baseten, $1.5 பில்லியன் நிதி சுற்றை நிறைவு செய்ய வருகிறது, இது நிறுவனத்தை $13 பில்லியனாக மதிப்பிடும், TechCrunch இன் WSJ அறிக்கையின் கவரேஜ் படி. இந்த சுற்று Spark Capital, Sands Capital, Altimeter Capital மற்றும் Wellington Management ஆல் இணை-தலைமை வகிக்கப்படுகிறது.

பாதை அசாதாரணமாக உள்ளது. செப்டம்பர் 2025 இல், Baseten $150 மில்லியன் Series D திரட்டியது. ஒன்பது மாதங்களுக்குப் பிறகு, இது $5 பில்லியன் மதிப்பீட்டில் $300 மில்லியன் Series E மூடியது. இப்போது, அதற்குப் பிறகு ஐந்து மாதங்களுக்கு, இது அதன் மதிப்பீட்டை மீண்டும் இரட்டிப்பாக்கும் ஒரு ஒப்பந்தத்தை முடிக்க வருகிறது. நீங்கள் கணக்கை வைத்திருந்தால்: 18 மாதங்களுக்குள் மூன்று சுற்றுகளில் சுமார் $1.95 பில்லியன் திரட்டப்பட்டுள்ளது.

அறிக்கையில் புதைந்திருக்கும் ஒரு முக்கியமான கட்டமைப்பு விவரம் உள்ளது. இந்த சமீபத்திய சுற்று ஒரு பிரிந்த-விலை சுற்று என்று தகவல் உள்ளது - வெவ்வேறு முதலீட்டாளர்கள் வெவ்வேறு மதிப்பீடுகளில் ஒரே நிதி சுற்றுக்குள் வாங்கும் ஒரு பொறிமுறை. சில முதலீட்டாளர்கள் $13 பில்லியன் தலைப்பு எண்ணில் வருகிறார்கள்; மற்றவர்கள் $11 பில்லியனில். AI startup நிதியாக்கத்தில் இந்த தந்திரம் பெருகிய முறையில் பொதுவாக உள்ளது, அங்கு முன்னணி முதலீட்டாளர்கள் কাগজে அதிக மதிப்பீட்டைக் கூறலாம் அதே சமயம் இரண்டாம் நிலை பங்கேற்பாளர்கள் ঝுக்கியை ஈடுசெய்ய ছাড் பெறுகிறார்கள். இது தலைப்பு எண்ணை ফুলாய்ப்பு செய்கிறது மற்றும் ஒப்பந்தத்தை உண்மையில் இருக்கும் விட சுத்தமாக தோற்றமளிக்கிறது.

அந்த எச்சரிக்கை தவிர, அடிப்படை ব்যবসায়িக் தர্க்கம் உண்மையானது. Baseten இன் முக்கிய முன்மொழிவு inference கோரிக்கைகளை கொடுக்கப்பட்ட பணிக்கான சிறந்த-பொருத்தம் மாதிரிக்கு வழிமாற்றம் செய்வது - GPT-4o அல்லது Claude போன்ற frontier மாதिरிகளின் மூலம் எல்லாவற்றையும் இயக்குவதை விட கணிசமாக குறைவான செலவில் திறந்த-மூல மாற்றுகளை உள்ளடக்கியது. நிறுவனம் பயனர்கள் கேட்பது மற்றும் எந்த மாதிரி உண்மையில் பதிலளிக்கிறது என்பதற்கு இடையே மாறுதல் அடுக்கு கட்டுமிக்கிறது. Inference செலவுகள் உற்பத்தி AI பயன்பாடுகளை கட்டுமிக்கும் யாருக்கும் முதன்மை கவலையாக மாறும்போது அது ஆக்கிரமிக்க ஒரு மதிப்புள்ள நிலை.

பரந்த சூழல்: The Next Wave "inference தங்க சுரண்டல்" என்று அழைத்ததை முழுவதுமாக உள்ளது. Venture capital கச்சா மாதிரி மற்றும் இறுதி பயனர் இடையே உட்கார்ந்திருக்கும் நிறுவனங்களுக்குள் வெள்ளம் வருகிறது - latency உகந்தকরணம், compute செலவுகளை நிர்வகித்தல் மற்றும் AI அளவில் இயக்குவதன் செயல்பாட்டு சிக்கலை கையாளுதல். Baseten அந்த போக்கின் தெளிவான நன்மை பெறுபவர்களில் ஒன்று.

ஆசியாவுக்கு இது ஏன் முக்கியம்

ஆசியாவின் AI சுற்றுச்சூழல் inference உள்கட்டமைப்புடன் சிக்கலான உறவு உள்ளது. பகுதிக்கு AI野心 பற்றாக்குறை இல்லை - சிங்கப்பூரின் தேசிய AI கৌশல் முதல் தென் கொரியாவின் அரைக்கடத்தா আধிபத்யம் முதல் இந்தியாவின் வேகமாக அளவிடும் டெவலப்பர் சமூதாயம் வரை. ஆனால் inference அடுக்கு குறிப்பாக வரும்போது, ஆசிய நிறுவனர்கள் மற்றும் டெவலப்பர்கள் பெரும்பாலும் மேற்கத்திய சந்தைகளுக்கு கட்டப்பட்ட மற்றும் விலை நির்ধारணம் செய்யப்பட்ட உள்கட்டமைப்பில் சார்பு உள்ளது.

அது உண்மையான செலவு சிக்கல் உருவாக்குகிறது. Inference ஒரு ஒரு-முறை செலவு அல்ல. ஒவ்வொரு பயனர் வினவல், ஒவ்வொரு API அழைப்பு, உற்பத்தி பயன்பாட்டில் ஒவ்வொரு உண்மையான-நேர பதிலளிப்பு compute எரிக்கிறது. ஜகார்த்தா அல்லது ஹோ சி மின் நகரத்தில் ஒரு startup உள்ளூர் நாணயத்தில் இயங்கும் மற்றும் உள்ளூர் விலை நிர்ধாரணம் எதிர்பார்ப்புகளுடன், premium மேற்கத்திய cloud உள்கட்டமைப்பில் inference இயக்குவதன் பொருளாதாரம் கடுமையாக இருக்கலாம். Baseten இன் மாதிரி - மிகவும் விலையுயர்ந்த frontier மாதிரிக்கு இயல்பாக இயக்குவதற்கு பதிலாக குறைவான, திறமையான திறந்த-மூல மாற்றுகளுக்கு வழிமாற்றம் - விலை-உணர்வுள்ள ஆசிய சந்தைகளில் மிகவும் முக்கியமான செலவு arbitrage வகை.

ஒரு latency பரிமாணம் உள்ளது. US-East data centers க்கு உகந்தகரணம் செய்யப்பட்ட Inference உள்கட்டமைப்பு Southeast Asia இல் பயனர்களுக்கு அর்த்தமுள்ள தாமதத்தை அறிமுகப்படுத்துகிறது. Inference உண்மையில் இயங்கும் இடம் - புவியியல்ரீதியாக - ஆசிய டெவலப்பர்கள் தொடர்ந்து கையாளும் ஒரு கேள்வி. Baseten போன்ற நிறுவனங்கள் இந்த மதிப்பீடுகளில் திரட்டும்போது, டெவலப்பர் சமூதாயத்திலிருந்து எதிர்பார்ப்பு உலகளாவிய உள்கட்டமைப்பு கவரேஜ், Asia-Pacific பகுதிகளை உள்ளடக்கியது, ஒரு பொருள் முன்னுரிமை ஆக வேண்டும் ஒரு afterthought அல்ல.

ஒரு முதலீட்டு லென்ஸ் இருந்து, Baseten சுற்று ஆசிய venture capital க்கு ஒரு சமிக்ஞை உள்ளது. Inference அடுக்கு AI உள்கட்டமைப்பு மீண்டும் வருவாய் வாழ்கிறது. பயிற்சி ஒரு முறை (அல்லது சில முறை) இயங்குகிறது. Inference ஒரு உற்பத்தி பயன்பாட்டின் lifetime முழুவதும் ஒரு நாளுக்கு பில்லியன் முறை நடக்கிறது. முதலீட்டாளர்கள் இதை புரிந்துகொள்கிறார்கள் வேகமாக நகர்ந்து கொண்டிருக்கிறார்கள் - மற்றும் Spark Capital, Altimeter மற்றும் Wellington consortium Baseten ஆதரவு AI hype chasing அல்ல, sophisticated institutional நம்பிக்கை பிரதிফலிக்கிறது.

AI-native பொருட்களை கட்டுமிக்கும் ஆசிய நிறுவனர்களுக்கு, takeaway strategic: நீங்கள் மேல் கட்டுமிக்க தேர்வு செய்யும் மாதிரி அதை இயக்க நீங்கள் தேர்வு செய்யும் inference architecture விட குறைவு முக்கியம். Inference அடுக்கு இல் flexibility - மாதிரிகளை மாற்ற, intelligently வழிமாற்றம் மற்றும் செலவுகளை கட்டுப்படுத்த திறன் - பெருகிய முறையில் ஒரு competitive advantage, ஒரு உள்கட்டமைப்பு விவரம் அல்ல.

டெவலப்பர்களுக்கு இது என்ன அர்த்தம்

டெவலப்பர்கள் AI பற்றி மாதிரிகளின் அடிப்படையில் சிந்திக்க வேண்டும்: எந்தொன்று புத்திமான், எந்தொன்று அவர்களின் பயன்பாட்டு வழக்கு சிறந்தாக கையாளுகிறது, எந்தொன்று சிறந்த API உள்ளது. ஆனால் Baseten இன் உயர்வு - மற்றும் பரந்த inference உள்கட்டமைப்பு மீது வெள்ளம் வரும் பில்லியன்கள் - மாதிரி ஒரு பெரிய சமன்பாட்டில் ஒரு மாறி மட்டுமே என்பதை ஒரு நினைவூட்டல்.

நடைமுறை உள்ளடக்கம்: நீங்கள் உற்பத்தி AI பயன்பாட்டு சரியாக கட்டுமிக்கும் என்றால், inference strategy உங்கள் மாதிரி தேர்வு போல் ஒரே பொறியியல் கவனம் தகுதி. இங்கே என்ன உண்மையில் நடைமுறை இல் தோற்றமளிக்கிறது:

பணி-பொருத்தமான வழிமாற்றம்: ஒவ்வொரு வினவல் GPT-4o தேவை இல்லை. ஒரு வகைப்பாடு பணி, ஒரு summarization வேலை, அல்லது ஒரு structured data extraction படி ஒரு சிறிய திறந்த-மூல மாதிரி மீது செலவு ஒரு பகுதி இல் போல் நன்றாக இயங்கலாம். Baseten இன் முக்கிய மূல்य proposition இந்த வழிமாற்றம் முடிவு automating. டெவலப்பர்கள் மாதிரி benchmarks மற்றும் செலவு calculators ஐ பயன்படுத்தி இந்த தர্க்கம் ஒரு எளிய பதிப்பு கையாளலாம்.
Latency budgeting: உங்கள் பயன்பாட்டின் வெவ்வேறு பகுதிகள் வெவ்வேறு latency tolerances உள்ளன. ஒரு உண்மையான-நேர chat இடைமுகம் sub-500ms பதிலளிப்பு தேவை. ஒரு background document processing வேலை பல விநாடிகள் tolerate முடியும். உங்கள் inference அழைப்புகளை பொருத்தமான latency tiers க்கு mapping - மற்றும் அதன்படி உள்கட்டமைப்பு தேர்வு - நேரடியாக பயனர் அভিজ்ஞதை மற்றும் செலவு பாதிக்கிறது.
திறந்த-மூல மாதிரி மதிப்பீடு: Frontier வணிக மாதிரிகள் மற்றும் திறமையான திறந்த-மூல மாற்றுகளுக்கு இடையே இடைவெளி வியத்தகு முறையில் மூடப்பட்டுள்ளது. Llama 3, Mistral மற்றும் Qwen (ஆசிய மொழி பணிகளுக்கு குறிப்பாக பொருத்தமான) போன்ற மாதிரிகள் இப்போது உற்பத்தி பயன்பாட்டு பரந்த வரம்பு திறமையாக கையாளுகிறது. எந்த தீவிர inference strategy திறந்த-மூல மாற்றுகளுக்கு ஒரு வழக்கமான மதிப்பீடு சுழற்சி உள்ளடக்க வேண்டும்.
செலவு கண்காணிப்பு ஒரு முதல்-வகுப்பு கவலை: Inference செலவுகள் பயன்பாட்டு உடன் அளவு குறைந்த volume இல் கட்டப்பட்ட மற்றும் சோதிக்கப்பட்ட குழுக்கள் ஆச்சரியம் செய்யலாம் வழிகளில் அளவு. நாள் ஒன்று இருந்து செலவு கண்காணிப்பு உடன் உங்கள் inference அழைப்புகளை instrumenting - ஒரு afterthought அல்ல - ஒரு குழுக்கள் சுத்தமாக அளவு பிரிக்கும் மற்றும் ஒரு சுவர் hit அந்த பிரிக்கும் ஒரு விசை.

MonstarX போன்ற தளங்களில் கட்டுமிக்கும் டெவலப்பர்களுக்கு, ஆசியாவின் AI-native dev தளம், inference அடுக்கு கேள்வி பெருகிய முறையில் முன்