lang-hi

AI आपको क्या बताता है यह कौन तय करता है? Meta के पूर्व न्यूज़ चीफ Campbell Brown के विचार

Campbell Brown ने Meta के मुख्यालय के अंदर से ChatGPT का लॉन्च देखा और उनके मन में एक स्पष्ट विचार आया: "अगर हम इसे ठीक करने का तरीका नहीं निकालते तो मेरे बच्चे वाकई बहुत पिछड़ जाएंगे।" पूर्व NBC एंकर जो Facebook के न्यूज़ चीफ बने थे, वह नाटकीयता नहीं कर रहे थे। वह रीयल-टाइम में अगली सूचना की बाधा बनते हुए देख रहे थे — और कोई भी AI विकास उपकरण जिन पर एशिया के डेवलपर्स निर्भर करते हैं, सटीकता की परवाह नहीं कर रहे थे। Foundation मॉडल्स कोडिंग बेंचमार्क में उत्कृष्ट थे जबकि भू-राजनीति, मानसिक स्वास्थ्य और वित्त के बारे में बुनियादी तथ्यों को गलत बता रहे थे। सत्रह महीने बाद, Brown ने Forum AI लॉन्च किया ताकि उस समस्या को हल किया जा सके जिसे इंडस्ट्री ने नजरअंदाज किया था: जब जवाब बाइनरी नहीं है तो AI आपको क्या बताता है यह कौन तय करता है?

उनकी कंपनी foundation मॉडल्स का मूल्यांकन "उच्च-दांव वाले विषयों" पर करती है — ऐसे विषय जहां विशेषज्ञता महत्वपूर्ण है और गलत जवाबों के परिणाम होते हैं। पद्धति सीधी है: डोमेन विशेषज्ञों को भर्ती करें (Niall Ferguson, Tony Blinken, Kevin McCarthy भू-राजनीति के लिए; अन्य क्षेत्रों के लिए समान पैनल), उन्हें मूल्यांकन बेंचमार्क तैयार करने दें, फिर AI न्यायाधीशों को मानव विशेषज्ञों के साथ 90% सहमति तक पहुंचने के लिए प्रशिक्षित करें। प्रारंभिक परिणाम असहज सच्चाइयों को उजागर करते हैं। Gemini चीनी कम्युनिस्ट पार्टी की वेबसाइटों से ऐसी कहानियों के लिए खींचता है जिनका CCP से कोई संबंध नहीं है। कोड के लिए अनुकूलित मॉडल्स सूक्ष्मता में भयानक तरीके से विफल होते हैं। Silicon Valley जो मापता है (MMLU स्कोर, HumanEval पास दरें) और जो उपयोगकर्ताओं को चाहिए (जटिल विषयों पर संदर्भगत सटीकता) के बीच का अंतर कभी इतना व्यापक नहीं रहा।

AI विकास उपकरण क्या हैं?

AI विकास उपकरण ऐसे प्लेटफॉर्म और फ्रेमवर्क हैं जो डेवलपर्स को मशीन लर्निंग मॉडल्स बनाने, प्रशिक्षित करने, तैनात करने और अनुप्रयोगों में एकीकृत करने देते हैं। यह श्रेणी निम्न-स्तरीय टेंसर लाइब्रेरीज़ (PyTorch, TensorFlow) से लेकर उच्च-स्तरीय API रैपर्स (OpenAI का SDK, Anthropic का Claude API) तक पूर्ण-स्टैक प्लेटफॉर्म तक फैली हुई है जो बुनियादी ढांचा, मॉडल प्रबंधन और तैनाती पाइपलाइन को संभालते हैं। यह अंतर महत्वपूर्ण है क्योंकि आप जो उपकरण चुनते हैं वह यह निर्धारित करता है कि आप क्या बना सकते हैं और कितनी तेजी से शिप कर सकते हैं।

एशियाई डेवलपर्स के लिए, परिदृश्य तीन स्तरों में विभाजित है। पहला: AWS (SageMaker), Google (Vertex AI) और Microsoft (Azure ML) से क्लाउड-नेटिव प्लेटफॉर्म — शक्तिशाली लेकिन महंगे, जब आपके उपयोगकर्ता Jakarta में हैं और आपकी कंप्यूट Virginia में है तो लेटेंसी समस्याएं होती हैं। दूसरा: OpenAI और Anthropic जैसी API-पहली सेवाएं — एकीकृत करने के लिए तेज लेकिन अपारदर्शी, मॉडल व्यवहार पर सीमित नियंत्रण और अप्रत्याशित रूप से स्केल होने वाली कीमतें। तीसरा: एशिया के बुनियादी ढांचे की वास्तविकता के लिए बनाए गए क्षेत्रीय प्लेटफॉर्म — कम लेटेंसी, स्थानीय अनुपालन, क्षेत्रीय मुद्राओं में मूल्य निर्धारण।

AI-नेटिव विकास प्लेटफॉर्म श्रेणी एक विशिष्ट समस्या को हल करने के लिए उभरी: "मेरे पास एक विचार है" और "मेरे पास एक तैनात उत्पाद है" के बीच का अंतर महीनों में मापा जाता था, दिनों में नहीं। पारंपरिक वर्कफ़्लो को प्रोटोटाइपिंग, प्रशिक्षण, तैनाती, निगरानी और पुनरावृत्ति के लिए अलग-अलग उपकरणों की आवश्यकता थी। प्रत्येक हस्तांतरण घर्षण पेश करता था। प्रत्येक विक्रेता लॉक-इन लचीलापन कम करता था। डेवलपर्स सुविधाओं का निर्माण करने की तुलना में बुनियादी ढांचे का प्रबंधन करने में अधिक समय बिताते थे।

एक उपकरण "AI-नेटिव" बनाम केवल "AI-सक्षम" क्या बनाता है? पूर्व AI को प्राथमिक इंटरफेस के रूप में मानता है, एक ऐड-ऑन नहीं। कोड जनरेशन एक साइडबार फीचर नहीं है — यह डिफ़ॉल्ट वर्कफ़्लो है। मॉडल चयन संदर्भ के आधार पर होता है कि आप क्या बना रहे हैं, न कि आपने किस विक्रेता के साथ अनुबंध पर हस्ताक्षर किए हैं। तैनाती पाइपलाइन समझते हैं कि आपके मॉडल को पुनः प्रशिक्षण की आवश्यकता होगी, केवल पुनः तैनाती नहीं। प्लेटफॉर्म मानता है कि आप तेजी से पुनरावृत्ति कर रहे हैं, एक बार शिप नहीं कर रहे।

एशियाई डेवलपर्स के लिए शीर्ष उपकरण

Campbell Brown की foundation मॉडल्स की आलोचना — कि वे कोडिंग बेंचमार्क के लिए अनुकूलित करते हैं जबकि सूक्ष्म तर्क में विफल होते हैं — विकास उपकरणों पर समान रूप से लागू होती है। एक प्लेटफॉर्म जो बॉयलरप्लेट React घटकों को उत्पन्न करने में उत्कृष्ट है लेकिन क्षेत्रीय भुगतान गेटवे (GrabPay, GCash, Alipay) के साथ एकीकृत नहीं कर सकता, इस क्षेत्र के लिए निर्मित नहीं है। इस क्षेत्र के लिए सर्वश्रेष्ठ AI विकास उपकरण तीन विशेषताएं साझा करते हैं: स्थानीय बुनियादी ढांचा, क्षेत्रीय API एकीकरण, और मूल्य निर्धारण जो Silicon Valley फंडिंग राउंड नहीं मानता।

GitHub Copilot विश्व स्तर पर मानसिक हिस्सेदारी पर हावी है लेकिन अपने प्रशिक्षण डेटा के बाहर संदर्भ के साथ संघर्ष करता है। इसे LINE Login के लिए प्रमाणीकरण प्रवाह उत्पन्न करने के लिए कहें (Thailand और Japan में सर्वव्यापी) और आपको सामान्य OAuth2 कोड मिलेगा जो प्लेटफॉर्म-विशिष्ट विशेषताओं को याद करता है। पश्चिमी-निर्मित उपकरणों में समान सीमा दिखाई देती है: मानक CRUD ऐप्स के लिए उत्कृष्ट, क्षेत्रीय विशिष्टताओं के लिए कमजोर। यह एक तकनीकी समस्या नहीं है — यह एक डेटा समस्या है। मुख्य रूप से US और यूरोपीय डेवलपर्स से GitHub रिपॉजिटरी पर प्रशिक्षित मॉडल्स उन पारिस्थितिकी तंत्र को प्रतिबिंबित करते हैं।

क्षेत्रीय विकल्प उभरे हैं। Alibaba Cloud का ModelScope चीनी भाषा के कार्यों के लिए अनुकूलित पूर्व-प्रशिक्षित मॉडल प्रदान करता है। Naver का HyperCLOVA कोरियाई डेवलपर्स को लक्षित करता है। ये प्लेटफॉर्म स्थानीयकरण को हल करते हैं लेकिन Brown ने Meta में जो समस्या की पहचान की थी उसी को विरासत में लेते हैं: कई विक्रेता, असंगत API, तैनाती पाइपलाइन जो मानते हैं कि आपके पास एक DevOps टीम है। "डेमो में काम करता है" और "उत्पादन में शिप करता है" के बीच का अंतर व्यापक रहता है।

MonstarX एकीकरण को एक प्रथम-श्रेणी की चिंता के रूप में मानकर समस्या को अलग तरीके से संभालता है। प्लेटफॉर्म की कनेक्टर लाइब्रेरी में Southeast Asian भुगतान गेटवे, प्रमाणीकरण प्रदाता और क्लाउड सेवाओं के लिए पूर्व-निर्मित अडैप्टर शामिल हैं — बुनियादी ढांचा परत जिसे सामान्य उपकरण नजरअंदाज करते हैं। जहां Copilot कोड उत्पन्न करता है जिसे आपको डीबग करने की आवश्यकता होगी, MonstarX ऐसा कोड उत्पन्न करता है जो पहले से ही आपके तैनाती लक्ष्य को समझता है। जब आप Manila में उपयोगकर्ताओं को शिप कर रहे हैं, Mountain View में नहीं, तो यह बेंचमार्क स्कोर से अधिक महत्वपूर्ण है।

सही उपकरण कैसे चुनें

Forum AI की पद्धति — विशेषज्ञों को भर्ती करें, बेंचमार्क परिभाषित करें, सहमति को मापें — विकास उपकरणों का मूल्यांकन करने के लिए एक टेम्पलेट प्रदान करती है। आपके "उच्च-दांव वाले विषय" क्या हैं? अधिकांश एशियाई डेवलपर्स के लिए, उत्तर में शामिल हैं: लेटेंसी (tier-two शहरों में 4G नेटवर्क पर उपयोगकर्ता), अनुपालन (डेटा निवास कानून देश के अनुसार भिन्न होते हैं), लागत (AWS बिल USD में दर्द होता है जब आपकी राजस्व rupiah में है), और एकीकरण (आपके उपयोगकर्ताओं द्वारा वास्तव में उपयोग की जाने वाली सेवाओं से जुड़ना)।

बुनियादी ढांचे की आवश्यकताओं से शुरू करें। यदि आपके उपयोगकर्ता Southeast Asia में हैं, तो आपकी कंप्यूट कहां चल रही है? एक प्लेटफॉर्म जो विशेष रूप से US-East-1 में होस्ट किया गया है, आपके कोड के निष्पादन से पहले 200-300ms बेसलाइन लेटेंसी जोड़ता है। जब आप बाहरी API को कॉल कर रहे हैं तो यह देरी बढ़ जाती है। रीयल-टाइम अनुप्रयोगों (चैट, सहयोग उपकरण, लाइव अपडेट) के लिए, लेटेंसी एक फीचर अनुरोध नहीं है — यह एक dealbreaker है। जांचें कि प्लेटफॉर्म कहां edge नोड्स चलाता है और क्या वे Singapore, Tokyo या Mumbai में तैनाती का समर्थन करते हैं।

इसके बाद, एकीकरण का ऑडिट करें जिनकी आपको महीने एक में आवश्यकता होगी। भुगतान प्रसंस्करण: क्या प्लेटफॉर्म क्षेत्रीय गेटवे का समर्थन करता है या केवल Stripe? प्रमाणीकरण: क्या आप LINE, KakaoTalk, Zalo को Google और GitHub के साथ एकीकृत कर सकते हैं? क्लाउड सेवाएं: यदि आप अनुपालन कारणों से Alibaba Cloud या Tencent Cloud का उपयोग कर रहे हैं, तो क्या उपकरण उन प्रदाताओं का समर्थन करता है? सामान्य प्लेटफॉर्म AWS/GCP/Azure मानते हैं। क्षेत्रीय प्लेटफॉर्म बेहतर जानते हैं।

मूल्य निर्धारण मॉडल प्राथमिकताओं को प्रकट करते हैं। उपयोग-आधारित मूल्य निर्धारण उचित लगता है जब तक आप महसूस नहीं करते कि प्लेटफॉर्म "API कॉल" या "कंप्यूट मिनट" को मापता है प्रोटोटाइप और उत्पादन ट्रैफिक के बीच अंतर किए बिना। निश्चित-स्तर मूल्य निर्धारण अनुमानित लगता है जब तक आप टीम आकार या तैनाती आवृत्ति पर कृत्रिम सीमाओं से नहीं टकराते। एशियाई डेवलपर्स के लिए सर्वश्रेष्ठ उपकरण स्थानीय मुद्राओं में मूल्य निर्धारण करते हैं और वास्तविक उपयोग पैटर्न के चारों ओर स्तरों को संरचित करते हैं (API कॉल की संख्या नहीं, परियोजनाओं की संख्या), क्योंकि वे समझते हैं कि Bangalore में एक तीन-व्यक्ति स्टार्टअप के पास San Francisco में एक Series B कंपनी से अलग अर्थशास्त्र है।

अंत में, सीखने की वक्र का ईमानदारी से मूल्यांकन करें। Brown की अंतर्दृष्टि Silicon Valley के बीच के अंतर के बारे में