एक विशिष्ट, आधुनिक प्रकार की झुंझलाहट तब होती है जब आपको पता चलता है कि आपके डिजिटल टूल्स की याददाश्त गोल्डफिश जैसी है। कल्पना कीजिए कि आप एक जटिल, बहु-शहरी व्यावसायिक यात्रा की योजना बनाने के लिए एक एआई एजेंट के साथ काम कर रहे हैं। आपने यात्रा कार्यक्रम को परिष्कृत करने, उड़ान की अवधि के साथ बजट की बाधाओं को संतुलित करने में बीस मिनट बिताए हैं, और जैसे ही एजेंट बुकिंग को अंतिम रूप देने वाला होता है—मौत का छोटा घूमता पहिया (spinning wheel of death) दिखाई देता है। एक नेटवर्क की गड़बड़ी होती है, या शायद आपका ब्राउज़र रिफ्रेश हो जाता है, और अचानक एजेंट आपका स्वागत एक हंसमुख, "नमस्ते! मैं आज आपकी क्या सहायता कर सकता हूँ?" के साथ करता है।
उपयोगकर्ता के इस नजरिए से, आर्टिफिशियल इंटेलिजेंस का गहरा जादू तुरंत गायब हो जाता है, और उसकी जगह डिजिटल घर्षण का भारी बोझ ले लेता है। आप वापस वहीं पहुँच जाते हैं जहाँ से शुरू किया था, एक खाली चैट बॉक्स को घूरते हुए, एक ऐसी मशीन को अपनी स्थिति फिर से समझाने के लिए मजबूर होते हैं जो पांच सेकंड पहले आपकी सबसे सक्षम सहयोगी थी। जेनरेटिव एआई के शुरुआती दिनों में, हम एक हाइकू लिखने या पीडीएफ को सारांशित करने की मशीन की क्षमता पर चकित थे; आज, हम मांग करते हैं कि यह तीन सप्ताह के सप्लाई चेन ऑडिट या क्रॉस-डिपार्टमेंटल हायरिंग वर्कफ़्लो का प्रबंधन करे—दांव नवीनता से आवश्यकता की ओर बढ़ गए हैं।
ऐतिहासिक रूप से, सॉफ्टवेयर के साथ हमारी बातचीत लेनदेन संबंधी और तत्काल थी: आप एक बटन क्लिक करते हैं, और सर्वर प्रतिक्रिया देता है। लेकिन एजेंटिक वर्कफ़्लो का नया युग अलग है। ये लंबे समय तक चलने वाले, बहुआयामी कार्य हैं जिन्हें पूरा होने में मिनट, घंटे या दिन भी लग सकते हैं। जब ये एजेंट सर्वर की मामूली खराबी या डेटा सेंटर में रूटीन पॉड रीस्टार्ट के कारण विफल हो जाते हैं, तो यह केवल एक बग नहीं है; यह विश्वास का टूटना है। यह वही विश्वसनीयता का अंतर है जिसे गूगल अपने नवीनतम रिलीज, ओपन-सोर्स एजेंट एक्ज़ीक्यूटर रनटाइम के साथ पाटने का लक्ष्य रखता है।
पिछले अठारह महीनों से, तकनीकी उद्योग एक उन्मत्त प्रोटोटाइपिंग चरण में फंसा हुआ है। डेवलपर्स ने प्रभावशाली डेमो बनाने के लिए लैंगचेन (LangChain) या ऑटोजेन (AutoGen) जैसे फ्रेमवर्क का उपयोग किया है जो नियंत्रित वातावरण में सहज दिखते हैं लेकिन उद्यम संचालन की अव्यवस्थित वास्तविकता के संपर्क में आने पर अक्सर बोझिल और नाजुक साबित होते हैं। एक प्रोटोटाइप में, यदि कोई एजेंट क्रैश हो जाता है, तो आप बस रिफ्रेश दबाते हैं; प्रोडक्शन में, यदि कोई एजेंट वित्तीय समाधान प्रक्रिया के बीच में क्रैश हो जाता है, तो आपके पास भ्रष्ट डेटा या ऑडिटिंग की समस्या हो सकती है।
तकनीकी रूप से कहें तो समस्या 'स्टेट' (state) की है। अधिकांश वर्तमान एजेंट फ्रेमवर्क स्टेटलेस होते हैं, जिसका अर्थ है कि यदि निष्पादन वातावरण बाधित होता है तो वे स्वाभाविक रूप से "याद" नहीं रखते कि वे कहाँ हैं। गूगल का एजेंट एक्ज़ीक्यूटर 'ड्यूरेबल एक्ज़ीक्यूशन' (durable execution) पेश करके इसे संबोधित करता है। दूसरे शब्दों में, यह एआई एजेंटों के लिए डिजिटल ब्लैक बॉक्स रिकॉर्डर के रूप में कार्य करता है। इवेंट लॉगिंग और स्नैपशॉटिंग का उपयोग करके, रनटाइम यह सुनिश्चित करता है कि यदि कोई सिस्टम विफल हो जाता है, तो एजेंट डिजिटल भूलने की बीमारी से पीड़ित होने के बजाय ठीक वहीं से शुरू कर सकता है जहाँ उसने छोड़ा था।
यह बदलाव एआई इंफ्रास्ट्रक्चर के बारे में हमारी सोच में एक व्यावहारिक विकास का प्रतिनिधित्व करता है। हम शुरुआती एलएलएम (LLM) प्रयोगों की "तेजी से आगे बढ़ें और चीजें तोड़ें" वाली मानसिकता से हटकर अधिक लचीले, औद्योगिक-ग्रेड दृष्टिकोण की ओर बढ़ रहे हैं। व्यवहार में, इसका मतलब है कि एक लंबे समय तक चलने वाला वर्कफ़्लो—जिसमें मानव प्रबंधक की स्वीकृति की प्रतीक्षा करने के लिए तीन दिनों तक रुकना शामिल हो सकता है—अनुक्रम में अपना स्थान खोए बिना जीवित रह सकता है। यह एक ऐसे वेटर के बीच का अंतर है जो रसोई में जाते ही आपका ऑर्डर भूल जाता है और एक ऐसा जिसके पास स्थायी, अटूट नोटपैड है।
साधारण याददाश्त से परे, एजेंट एक्ज़ीक्यूटर कई ऐसी विशेषताएं पेश करता है जो सॉफ्टवेयर विकास के "छिपे हुए" सिरदर्द को हल करती हैं। सबसे महत्वपूर्ण में से एक सुरक्षित सैंडबॉक्सिंग है। जब आप एक एआई एजेंट को कोड निष्पादित करने या आपकी कंपनी के आंतरिक डेटाबेस के साथ बातचीत करने की शक्ति देते हैं, तो आप अनिवार्य रूप से अपने घर की चाबियां एक बहुत ही स्मार्ट, फिर भी कभी-कभी अप्रत्याशित मेहमान को सौंप रहे होते हैं। यदि वह मेहमान एक दुष्ट स्क्रिप्ट चलाने का निर्णय लेता है, तो नुकसान विनाशकारी हो सकता है।
सैंडबॉक्स के भीतर एजेंट घटकों को अलग करके, गूगल सुरक्षा की एक परत प्रदान करता है जो खराब काम करने वाले एजेंट को व्यापक सिस्टम को प्रभावित करने से रोकता है। यह उस युग के लिए एक आवश्यक सुरक्षा जाल है जहाँ एजेंट अब केवल बात नहीं कर रहे हैं; वे काम कर रहे हैं। यह सत्र निरंतरता (session consistency) की अवधारणा के साथ परस्पर जुड़ा हुआ है, जो यह सुनिश्चित करता है कि एक वितरित क्लाउड वातावरण में भी—जहाँ एक एजेंट के कार्यों को अलग-अलग समय पर अलग-अलग सर्वरों द्वारा नियंत्रित किया जा सकता है—अनुभव एकीकृत रहता है और डेटा सटीक रहता है।
दिलचस्प बात यह है कि डेवलपर्स के लिए सबसे आकर्षक विशेषता "ट्रैजेक्टरी ब्रांचिंग" (trajectory branching) हो सकती है। मुझे वर्षों पहले बीटा सॉफ़्टवेयर का परीक्षण करना याद है जहाँ एक अलग परिणाम का परीक्षण करने का एकमात्र तरीका पूरे डेटाबेस को मिटाना और फिर से शुरू करना था। ट्रैजेक्टरी ब्रांचिंग एक डेवलपर को एजेंट के वर्कफ़्लो में एक चेकपॉइंट सहेजने और फिर उसी सटीक बिंदु से कई "क्या होगा अगर" परिदृश्यों का परीक्षण करने की अनुमति देता है। यह एंटरप्राइज लॉजिक के लिए वीडियो गेम सेव स्टेट की तरह है। नतीजतन, टीमें खरोंच से बीस घंटे के वर्कफ़्लो को फिर से चलाने के थकाऊ श्रम के बिना एजेंट के व्यवहार को अनुकूलित कर सकती हैं और विफलताओं का निवारण कर सकती हैं।
यदि यह रणनीति परिचित लगती है, तो ऐसा इसलिए है क्योंकि हमने इसे पहले भी देखा है। एक दशक पहले, गूगल ने कुबेरनेट्स को दुनिया के सामने जारी किया था, जिसने हमारे कंटेनरों को प्रबंधित करने के तरीके को बदल दिया और अनिवार्य रूप से आधुनिक क्लाउड के लिए वास्तविक ऑपरेटिंग सिस्टम बन गया। एजेंट एक्ज़ीक्यूटर को ओपन-सोर्स करके, गूगल इसी तरह का कदम उठा रहा है। वे इंजन मुफ्त में प्रदान कर रहे हैं, यह जानते हुए कि जैसे-जैसे उद्यम इस रनटाइम को अपनाएंगे, वे स्वाभाविक रूप से ईंधन के लिए गूगल क्लाउड की ओर देखेंगे: जेमिनी मॉडल, विशेष एआई चिप्स और प्रबंधित सेवाएं जो स्केलिंग को आसान बनाती हैं।
विरोधाभासी रूप से, एजेंट क्षेत्र में ओपन सोर्स की ओर कदम केवल परोपकार के बारे में नहीं है; यह अस्तित्व के बारे में है। जैसे-जैसे माइक्रोसॉफ्ट अपने ऑटोजेन फ्रेमवर्क को आगे बढ़ाता है और एडब्ल्यूएस बेडरॉक एजेंटकोर को बढ़ावा देता है, एआई की इंफ्रास्ट्रक्चर परत की लड़ाई पारिस्थितिकी तंत्र का युद्ध बन गई है। उद्यम उचित रूप से मालिकाना लॉक-इन (proprietary lock-in) से सावधान हैं। वे नहीं चाहते कि उनका सबसे संवेदनशील व्यावसायिक तर्क एकल प्रदाता के ब्लैक बॉक्स के अंदर फंस जाए। ओपन-सोर्स रनटाइम की पेशकश करके, गूगल संकेत दे रहा है कि वह इंटरऑपरेबिलिटी और पारदर्शिता को प्राथमिकता देता है—एक ऐसी रणनीति जिसे उन सीआईओ (CIO) का विश्वास जीतने के लिए डिज़ाइन किया गया है जो भारी, प्रतिबंधात्मक पुराने अनुबंधों से थक चुके हैं।
हालाँकि, हमें बेहतर इंजन को बेहतर ड्राइवर समझने की गलती नहीं करनी चाहिए। जबकि एजेंट एक्ज़ीक्यूटर विश्वसनीयता और स्टेट मैनेजमेंट की तकनीकी बाधाओं को हल करता है, यह जवाबदेही की मानवीय बाधाओं को हल नहीं करता है। जैसे-जैसे एआई एजेंट अधिक स्वायत्त होते जाते हैं, उनके "निर्णयों" के लिए कौन जिम्मेदार है, यह प्रश्न तेजी से अपारदर्शी होता जाता है। यदि कोई एजेंट सप्लाई चेन को अनुकूलित करता है लेकिन इस प्रक्रिया में अनजाने में पर्यावरणीय नियम का उल्लंघन करता है, तो एक टिकाऊ रनटाइम आपको बताएगा कि यह कैसे हुआ, लेकिन यह आपको यह नहीं बताएगा कि किसे दोष देना है।
इसके मूल में, आधुनिक नेतृत्व के लिए चुनौती इस मजबूत बुनियादी ढांचे के शीर्ष पर निरीक्षण की परतें बनाना है। हम एक ऐसे चरण में प्रवेश कर रहे हैं जहाँ तकनीकी ऋण की "अव्यवस्थित कोठरी" को साफ किया जा रहा है, लेकिन घर के नियम—नीतियां, नैतिक सुरक्षा रेल और कानूनी ढांचे—अभी भी लिखे जा रहे हैं। एक लचीला रनटाइम नेटवर्क की गड़बड़ी से उबर सकता है, लेकिन यह कॉर्पोरेट नैतिकता की विफलता या मानव-इन-द-लूप सामान्य ज्ञान की कमी से नहीं उबर सकता।
अंततः, एजेंट एक्ज़ीक्यूटर जैसे उपकरणों का आगमन संकेत देता है कि हम एआई-एक-खिलौने-के-रूप-में के युग को छोड़ रहे हैं और एआई-एक-बुनियादी ढांचे-के-रूप-में के युग में प्रवेश कर रहे हैं। औसत उपयोगकर्ता के लिए, इसका मतलब है कि जिस सॉफ़्टवेयर के साथ हम दैनिक बातचीत करते हैं वह अधिक सक्षम हो जाएगा, कष्टप्रद "रीसेट" के लिए कम प्रवण होगा, और हमारे पेशेवर जीवन के लंबे, जटिल कार्यों को संभालने में बेहतर होगा। हमारे डिजिटल शहर के अदृश्य पाइपों को मजबूत किया रहा है।
फिर भी, जैसे-जैसे ये एजेंट अधिक सर्वव्यापी और सुव्यवस्थित होते जाते हैं, हमें इस बात पर अत्यधिक ध्यान देना चाहिए कि हम कितनी एजेंसी को आउटसोर्स कर रहे हैं। हमारे ईमेल से लेकर हमारे निवेश पोर्टफोलियो तक सब कुछ संभालने के लिए पूरी तरह से विश्वसनीय, टिकाऊ एजेंट को अनुमति देना लुभावना है। लेकिन जैसा कि कोई भी सॉफ्टवेयर डेवलपर जिसने क्रैशिंग ऐप के साथ काम किया है, जानता है कि सबसे मजबूत सिस्टम को भी एक ऐसे वास्तुकार की आवश्यकता होती है जो समझता हो कि यह हुड के नीचे कैसे काम करता है।
हमें उस विश्वसनीयता का स्वागत करना चाहिए जिसका गूगल का नया रनटाइम वादा करता है, लेकिन हमें इस तकनीकी स्थिरीकरण के क्षण का उपयोग अपनी डिजिटल आदतों पर विचार करने के लिए भी करना चाहिए। क्या हम अपनी क्षमताओं को बढ़ाने के लिए इन एजेंटों का उपयोग कर रहे हैं, या हम अपने निर्णय को आउटसोर्स करने के लिए उनका उपयोग कर रहे हैं? जैसे-जैसे हमारी दुनिया को चलाने वाला कोड अधिक लचीला होता जाता है, उस कोड का मार्गदर्शन करने वाले मनुष्यों को अधिक विचारशील होना चाहिए। इंजन अब तैयार है; यह हम पर निर्भर है कि हम तय करें कि हम कहाँ जा रहे हैं।
स्रोत:



हमारा एंड-टू-एंड एन्क्रिप्टेड ईमेल और क्लाउड स्टोरेज समाधान सुरक्षित डेटा एक्सचेंज का सबसे शक्तिशाली माध्यम प्रदान करता है, जो आपके डेटा की सुरक्षा और गोपनीयता सुनिश्चित करता है।
/ एक नि: शुल्क खाता बनाएं