lang-hi

AI की दुनिया 'लूपी' हो रही है

Meta के @Scale सम्मेलन में, Boris Cherny ने तर्क दिया कि AI लूप्स अगला प्रमुख आर्किटेक्चरल बदलाव हैं। एशिया के डेवलपर्स के लिए, यह बदलाव विशिष्ट निहितार्थ रखता है।

AI की दुनिया 'लूपी' हो रही है

Meta के @Scale सम्मेलन में पिछले शुक्रवार, दर्शकों में से किसी ने Boris Cherny — Claude Code के निर्माता — से पूछा कि क्या AI लूप्स अगला हाइप साइकल हैं या कुछ वास्तविक। उनका जवाब तुरंत था: वास्तविक, और हाथ से लिखे गए कोड से एजेंटिक AI में बदलाव जितना महत्वपूर्ण। उस आदान-प्रदान ने उस चीज़ को नाम दिया जिसके साथ दुनिया भर के डेवलपर्स चुप-चाप प्रयोग कर रहे हैं, और यह फिर से परिभाषित करता है कि हमें AI सिस्टम वास्तव में क्या करने में सक्षम हैं। AI की दुनिया 'लूपी' हो रही है, और एशिया में निर्माण करने वाली टीमों के लिए, यह बदलाव विशिष्ट निहितार्थ रखता है जो विचार करने योग्य है।

क्या हुआ

Boris Cherny, Anthropic में Claude Code के प्रमुख, Meta के @Scale सम्मेलन में दिखाई दिए और तर्क दिया कि "लूप्स" AI सिस्टम कैसे काम करते हैं इसमें अगला प्रमुख आर्किटेक्चरल बदलाव दर्शाते हैं। उन्होंने जो प्रगति का वर्णन किया वह सीधे उद्धृत करने के लायक है: "दो साल पहले, हमने स्रोत कोड हाथ से लिखा। हम संक्रमण करने लगे ताकि एजेंट कोड लिखें। और अब हम उस बिंदु पर संक्रमण कर रहे हैं जहां एजेंट अन्य एजेंट्स को प्रॉम्प्ट कर रहे हैं जो फिर कोड लिखते हैं।" उन्होंने तर्क दिया कि एजेंटिक AI से लूपिंग AI में छलांग मैनुअल कोडिंग से एजेंट्स में छलांग जितनी महत्वपूर्ण है।

व्यावहारिक रूप से एक लूप वास्तव में कैसा दिखता है? Cherny ने बातचीत में अपना सेटअप वर्णित किया: एक एजेंट लगातार कोड आर्किटेक्चर में सुधार के तरीके खोजता है, दूसरा डुप्लिकेट किए गए एब्सट्रैक्शन्स को खोजता है जिन्हें एकीकृत किया जा सकता है। दोनों किसी भी मानव योगदानकर्ता की तरह पुल रिक्वेस्ट जमा करते हैं। क्योंकि कोडबेस हमेशा बदल रहा है, न ही एजेंट कभी चलना बंद करता है। कोई फिनिश लाइन नहीं है — बस निरंतर, पृष्ठभूमि सुधार।

यह पूरी तरह से नया क्षेत्र नहीं है। रिकर्सिव लूप्स कंप्यूटर विज्ञान की शुरुआत से एक मुख्य विशेषता रहे हैं — ऐसे फंक्शन्स जो अपने आप को तब तक कॉल करते हैं जब तक कोई शर्त पूरी न हो जाए। यहाँ क्या अलग है कि रोकने की शर्त निर्धारक नहीं है। एक सब-एजेंट तय करता है कि लूप ने पर्याप्त काम किया है, कोई हार्ड-कोडेड नियम नहीं। वह गैर-निर्धारकता यही है जो इसे वास्तव में नया महसूस कराता है।

डेवलपर कम्युनिटीज़ में पहले से ही प्रचलित एक लोकप्रिय कार्यान्वयन Ralph Loop है — शानदारी से Ralph Wiggum के नाम पर — जो सब कुछ सारांशित करके काम करता है जो मॉडल ने अब तक हासिल किया है और पूछता है कि क्या लक्ष्य पूरा हुआ है। यह AI मॉडल्स को लंबी अवधि के लिए चलने पर भटकने से रोकने का एक सरल लेकिन प्रभावी तरीका है, अनिवार्य रूप से मॉडल को कार्रवाई और आत्म-मूल्यांकन के बीच उछालता है जब तक कार्य पूरा न हो जाए।

अधिक परीक्षण-समय कंप्यूट के लिए व्यापक धक्का से भी एक संबंध है — यह विचार कि मॉडल्स केवल पैरामीटर्स को स्केल करने के बजाय अधिक समय तर्क देकर बेहतर आउटपुट्स उत्पन्न कर सकते हैं। लूप्स इस फ्रेमवर्क में अच्छी तरह फिट होते हैं: एक बड़े इनफरेंस पास के बजाय, आप समय के साथ निरंतर, पुनरावृत्तिमूलक परिशोधन प्राप्त करते हैं।

एशिया के लिए यह क्यों महत्वपूर्ण है

एशिया के डेवलपर इकोसिस्टम ने हमेशा अपनाने में तेजी दिखाई है, लेकिन यहाँ की संरचनात्मक स्थितियां लूपिंग पैराडाइम को विशेष रूप से प्रासंगिक बनाती हैं। दक्षिण पूर्व एशिया, भारत और पूर्व एशिया में इंजीनियरिंग प्रतिभा तेजी से बढ़ रही है, लेकिन निर्मित किए जाने वाले सॉफ्टवेयर के पैमाने के सापेक्ष वरिष्ठ इंजीनियरिंग घंटे महंगे और दुर्लभ रहते हैं। एक पृष्ठभूमि एजेंट जो लगातार आपके कोडबेस को रीफैक्टर करता है, डुप्लिकेट किए गए एब्सट्रैक्शन्स को पकड़ता है, और बिना कहे PR जमा करता है — यह उत्पादकता गुणक नहीं है, यह एक संरचनात्मक परिवर्तन है कि एक छोटी टीम क्या बनाए रख सकती है।

जकार्ता या हो ची मिन्ह सिटी में एक पाँच-व्यक्ति स्टार्टअप पर विचार करें जो एक फिनटेक उत्पाद शिप कर रहा है। वे एक कोडबेस से निपट रहे हैं जो उनकी टीम की समीक्षा कर सकती है उससे तेजी से बढ़ता है। तकनीकी ऋण जमा होता है न कि क्योंकि कोई लापरवाह है, बल्कि क्योंकि पर्याप्त घंटे नहीं हैं। एक निरंतर रीफैक्टरिंग एजेंट पृष्ठभूमि में चल रहा है — जैसा कि Cherny ने वर्णित किया — बिल्कुल उसी बाधा को संबोधित करता है। यह इंजीनियर्स को प्रतिस्थापित नहीं करता; यह काम की श्रेणी को संभालता है जिसे इंजीनियर्स हमेशा स्थगित करते हैं।

एक भाषा आयाम भी है जो विशेष रूप से एशिया के लिए महत्वपूर्ण है। AI एजेंट इकोसिस्टम में अधिकांश टूलिंग और दस्तावेज़ अंग्रेजी-प्रथम हैं। लूप्स, अपनी प्रकृति से, अधिक अमूर्त हैं — वे कोड स्तर पर काम करते हैं, जहाँ भाषा बाधाएं कम महत्वपूर्ण हैं। एक एजेंट जो आपके TypeScript या Python आर्किटेक्चर में सुधार करता है उसे Bahasa Indonesia या Mandarin को समझने की आवश्यकता नहीं है अपना काम करने के लिए। यह लूपिंग एजेंट्स को एशियाई विकास टीमों के लिए कई अन्य AI क्षमताओं की तुलना में अधिक तुरंत सुलभ बनाता है जो सूक्ष्म प्राकृतिक भाषा समझ पर निर्भर करते हैं।

एशिया टेक दृश्य भी अधिकांश की तुलना में बहु-एजेंट आर्किटेक्चर्स के साथ प्रयोग करने के लिए तेजी से रहा है, विशेष रूप से एंटरप्राइज ऑटोमेशन में। MonstarX जैसे प्लेटफॉर्म्स पर निर्माण करने वाली कंपनियां पहले से ही एजेंट्स के संदर्भ में सोच रही हैं जो एक-दूसरे के साथ समन्वय करते हैं, न कि केवल एकल-मॉडल इनफरेंस। लूप अवधारणा स्वाभाविक रूप से उस मानसिक मॉडल में फिट होती है — यह पहले से ही एजेंटिक वर्कफ्लो के साथ काम करने वाली टीमों के लिए एक वैचारिक छलांग कम है।

बेशक, जोखिम यह है कि पर्याप्त निरीक्षण के बिना चलने वाले लूप्स सुधार को जितना आसानी से बढ़ा सकते हैं उतनी ही आसानी से त्रुटियों को बढ़ा सकते हैं। एक एजेंट जो अच्छे एब्सट्रैक्शन के बारे में गलत है वह हमेशा गलत होगा, पैमाने पर, हमेशा के लिए। वह शासन चुनौती वास्तविक है, और यह एक है जिसे एशियाई टीमों को जानबूझकर सोचने की आवश्यकता होगी जब वे इन पैटर्न्स को अपनाते हैं।

डेवलपर्स के लिए इसका क्या मतलब है

यदि आप आज AI के साथ निर्माण कर रहे हैं, तो लूप्स सिस्टम क्या कर रहा है इसके आपके मानसिक मॉडल को बदलते हैं। आप अब एक प्रॉम्प्ट भेज रहे हैं और प्रतिक्रिया के लिए प्रतीक्षा नहीं कर रहे हैं। आप एक निरंतर प्रक्रिया को कॉन्फ़िगर कर रहे हैं — एक जिसके पास लक्ष्य हैं, निर्णय लेता है, और चल रहे आधार पर आउटपुट्स उत्पन्न करता है। यह एक क्वेरी चलाने की तुलना में एक ठेकेदार को नियुक्त करने के करीब है।

व्यावहारिक रूप से, यहाँ यह है कि इसका मतलब है कि आप कैसे निर्माण करते हैं:

अपने एजेंट्स को कसकर स्कोप करें। Cherny के एजेंट्स के पास प्रत्येक एक संकीर्ण, अच्छी तरह से परिभाषित जनादेश है — एक आर्किटेक्चर सुधार देखता है, दूसरा डुप्लिकेट किए गए एब्सट्रैक्शन्स के लिए। वे सब कुछ नहीं करते। जितना कसा हुआ स्कोप, उतना कम संभावना है कि एक लूप उस क्षेत्र में भटके जहाँ यह नुकसान पहुंचाता है।
लूप में मूल्यांकन बनाएं। Ralph Loop काम करता है क्योंकि यह मॉडल को अपनी प्रगति की जांच करने के लिए मजबूर करता है। किसी भी लूप को आप चलाते हैं उसमें एक मूल्यांकन चरण होना चाहिए — चाहे वह एक सब-एजेंट हो, एक परीक्षण सूट हो, या एक निश्चित जटिलता थ्रेसहोल्ड से ऊपर PR के लिए मानव समीक्षा गेट हो।
लूप आउटपुट्स को योगदानकर्ता PR की तरह मानें। Cherny के एजेंट्स पुल रिक्वेस्ट जमा करते हैं। यह सही एब्सट्रैक्शन है। ऑटो-मर्ज न करें। लूप आउटपुट्स की समीक्षा करें जैसे आप एक जूनियर डेवलपर के काम की समीक्षा करेंगे — इस पर ध्यान देते हुए कि क्या परिवर्तन सही है, न कि केवल क्या यह संकलित होता है।
केवल-पढ़ने वाले लूप्स के साथ शुरू करें। इससे पहले कि आप एक एजेंट को लिखने और जमा करने दें, इसे अवलोकन मोड में चलाएं। इसे झंडा लगाने दें कि यह क्या बदलेगा बिना वास्तव में कुछ भी बदले। यह आपको एक अर्थ देता है कि क्या इसका निर्णय विश्वसनीय है इससे पहले कि आप लेखन पहुंच सौंपें।
समय के साथ भटकाव के लिए निगरानी करें। एक लूप जो दिनों या हफ्तों के लिए चलता है छोटी त्रुटियों को जमा कर सकता है जो बढ़ते हैं। लॉगिंग सेट अप करें जो आपको ऑडिट करने देता है कि एक लूप ने क्या किया है, न कि केवल यह वर्तमान में क्या कर रहा है।

इसके लिए टूलिंग अभी भी परिपक्व हो रहा है। अधिकांश डेवलपर्स आज मैनुअल रूप से लूप्स को एक साथ सिल रहे हैं — ऑर्केस्ट्रेशन फ्रेमवर्क्स, कस्टम मूल्यांकन स्क्रिप्ट्स, और बहुत सारे प्रॉम्प्ट इंजीनियरिंग का उपयोग करते हुए। लेकिन प्राइमिटिव्स अधिक स्पष्ट हो रहे हैं, और प्लेटफॉर्म्स जो उचित स्टेट मैनेजमेंट के साथ निरंतर एजेंट निष्पादन का समर्थन करते हैं जब यह पैटर्न फैलता है तो महत्वपूर्ण रूप से अधिक मूल्यवान हो जाएंगे।

MonstarX का उपयोग करने वाली टीमों के लिए, निरंतर एजेंट निष्पादन के लिए बिल्ट-इन समर्थन का मतलब है कि आप लूप्स को तेजी से प्रोटोटाइप कर सकते हैं और उन्हें उत्पादन में स्केल कर सकते हैं।