पिछले कुछ वर्षों से, तकनीकी दुनिया बातचीत की कला को लेकर जुनूनी रही है। हमने चैटबॉट को अधिक मानवीय बनाने, बेहतर ईमेल लिखने या लंबी मीटिंग को सारांशित करने के लिए सही प्रॉम्प्ट खोजने में अनगिनत घंटे बिताए हैं। हमें बताया गया था कि कंप्यूटिंग का भविष्य एक चैट बबल है। लेकिन जब दुनिया स्क्रीन से बात करने में व्यस्त थी, गूगल ने संकेत दिया है कि बातचीत करने वालों का युग समाप्त हो रहा है।
जेमिनी 3.5 फ्लैश (Gemini 3.5 Flash) के लॉन्च के साथ, कहानी मौलिक रूप से बदल गई है। यह कोई बेहतर चैटबॉट नहीं है; यह एक डिजिटल वर्कफोर्स की शुरुआत है। जबकि पिछले एआई मॉडल सर्च इंजन के अधिक परिष्कृत संस्करण की तरह महसूस होते थे, यह नई लहर 'एजेंटिक' (agentic) होने के लिए डिज़ाइन की गई है—एक ऐसा शब्द जिसका प्रभावी रूप से अर्थ है कि एआई बात करना बंद कर सकता है और काम करना शुरू कर सकता है। बड़ी तस्वीर को देखें तो, हम एआई के एक अथक इंटर्न (जो नोट्स लेता है) से एआई के डिजिटल निर्माण श्रमिकों के एक दल (जो आपके सोते समय घर बनाने में सक्षम है) में परिवर्तन देख रहे हैं।
यह क्यों महत्वपूर्ण है, इसे समझने के लिए हमें तकनीकी शब्दावली के पीछे देखना होगा। आज अधिकांश एआई इंटरैक्शन एक पूर्वानुमेय पैटर्न का पालन करते हैं: आप एक प्रश्न पूछते हैं, और एआई एक उत्तर प्रदान करता है। यदि उत्तर गलत है, तो आप उसे सुधारते हैं, और वह फिर से प्रयास करता है। यह एक रैखिक, उच्च-स्पर्श प्रक्रिया है जिसमें अभी भी मनुष्य को काम का प्राथमिक इंजन होने की आवश्यकता होती है।
इसके विपरीत, जेमिनी 3.5 फ्लैश जैसा एक एजेंटिक मॉडल न्यूनतम मानवीय इनपुट के साथ कार्य करने के लिए डिज़ाइन किया गया है। इसे "कोड का एक टुकड़ा लिखने" के लिए कहने के बजाय, आप इसे "एक मौसम एप्लिकेशन बनाएं जो तीन अलग-अलग स्रोतों से डेटा खींचता है, बग के लिए खुद का परीक्षण करता है, और इसे सर्वर पर तैनात करता है" जैसा लक्ष्य दे सकते हैं। एआई केवल आपको टेक्स्ट प्रतिक्रिया नहीं देता है; यह कार्य के प्रत्येक भाग को संभालने के लिए कई उप-एजेंट (sub-agents) पैदा करता है, उसे मिलने वाली गलतियों पर काम करता है, और एक तैयार उत्पाद प्रस्तुत करता है।
सरल शब्दों में, गूगल दांव लगा रहा है कि आप वास्तव में अपने कंप्यूटर से बात नहीं करना चाहते हैं; आप चाहते हैं कि आपका कंप्यूटर आपकी टू-डू लिस्ट पूरी करे। यह सॉफ्टवेयर को देखने के हमारे नजरिए में एक विघटनकारी बदलाव है। हम उन उपकरणों से हट रहे हैं जिन्हें एक पायलट की आवश्यकता होती है, उन प्रणालियों की ओर जो आपके डिजिटल जीवन के लिए ऑटोपायलट की तरह काम करती हैं।
I/O डेवलपर कॉन्फ्रेंस में घोषणा के दौरान, सबसे चौंकाने वाला आंकड़ा एआई का आईक्यू नहीं, बल्कि उसका वेग था। डीपमाइंड (DeepMind) के गूगल के मुख्य प्रौद्योगिकीविद्, कोराय कावुकुओग्लू (Koray Kavukcuoglu) ने उल्लेख किया कि जबकि मानक फ्लैश मॉडल पिछले लीडर्स की तुलना में चार गुना तेज है, उन्होंने एक अनुकूलित संस्करण विकसित किया है जो गुणवत्ता का त्याग किए बिना 12 गुना तेज है।
औसत उपयोगकर्ता के लिए, गति एक विलासिता की तरह लग सकती है—दो सेकंड के बजाय आधे सेकंड में उत्तर पाने का एक तरीका। लेकिन एक स्वायत्त एजेंट के लिए, गति एक बुनियादी आवश्यकता है। इसे दूसरे तरीके से कहें तो, यदि एक एआई एजेंट को एक जटिल परियोजना (जैसे बाजार के रुझान पर शोध करना, डेटा का क्रॉस-रेफरेंस करना और एक रिपोर्ट तैयार करना) को पूरा करने के लिए लगातार 50 छोटे कार्य करने की आवश्यकता है, तो एक धीमा मॉडल खत्म करने में एक घंटा लेगा। एक मॉडल जो 12 गुना तेज है, उसी विचार श्रृंखला को पांच मिनट में पूरा करता है।
यह गति "समानांतर प्रसंस्करण" (parallel processing) की अनुमति देती है। बाजार की तरफ, यही वह चीज़ है जो गूगल के नए प्लेटफॉर्म, एंटीग्रैविटी (Antigravity), को कार्य करने में सक्षम बनाती है। एक लाइव डेमो में, इंजीनियरों ने दिखाया कि एजेंट एक साथ ऑपरेटिंग सिस्टम के विभिन्न घटकों पर काम करने के लिए निकल रहे हैं। यह सिर्फ टाइप करने का तेज़ तरीका नहीं है; यह जटिल श्रम को निष्पादित करने का एक स्केलेबल तरीका है।
गूगल एक दो-स्तरीय पदानुक्रम पेश कर रहा है जो एक पारंपरिक कॉर्पोरेट संरचना की नकल करता है। जब जेमिनी 3.5 प्रो (Gemini 3.5 Pro) जारी होगा, तो यह "ऑर्केस्ट्रेटर" या वरिष्ठ प्रबंधक के रूप में कार्य करेगा। इसमें उच्च-स्तरीय लक्ष्यों को समझने और एक रणनीतिक योजना बनाने के लिए मजबूत तर्क शक्ति है।
एक बार योजना निर्धारित हो जाने के बाद, प्रो मॉडल वास्तविक "कठिन परिश्रम" वाले श्रम को जेमिनी 3.5 फ्लैश को सौंप देता है। यह सेटअप कई कारणों से व्यावहारिक है:
| विशेषता | जेमिनी 3.5 फ्लैश (कार्यकर्ता) | जेमिनी 3.5 प्रो (प्रबंधक) |
|---|---|---|
| प्राथमिक भूमिका | निष्पादन और उप-कार्य पूर्णता | रणनीतिक योजना और तर्क |
| गति | 12 गुना तेज (अनुकूलित) | गहरे विचार के लिए संतुलित |
| संदर्भ | लघु-से-मध्य सीमा, उच्च गति पुनरावृत्ति | लंबी दूरी की परियोजना प्रबंधन |
| सबसे अच्छा | कोडिंग, डेटा पुनर्प्राप्ति, 24/7 निगरानी | जटिल समस्या समाधान, रचनात्मक दिशा |
हालांकि इसमें से बहुत कुछ सॉफ्टवेयर इंजीनियरों के लिए लगता है, गूगल जेमिनी स्पार्क (Gemini Spark) नामक एक नई सेवा के माध्यम से इन एजेंटिक क्षमताओं को उपभोक्ता तक ला रहा है। यह एक व्यक्तिगत एआई एजेंट है जिसे 24/7 चलाने के लिए डिज़ाइन किया गया है।
औसत व्यक्ति के लिए, इसका मतलब "अलार्म सेट करें" जैसे सरल वॉयस कमांड से आगे बढ़ना है। फ्लैश द्वारा संचालित एक व्यक्तिगत एजेंट सैद्धांतिक रूप से उड़ान में देरी के लिए आपके ईमेल की निगरानी कर सकता है, ग्राहक सेवा बॉट के साथ स्वचालित रूप से धनवापसी (refund) के लिए बातचीत कर सकता है, और फिर कार रेंटल को फिर से बुक कर सकता है—यह सब आपके फोन चेक करने के लिए जागने से पहले ही।
ऐतिहासिक रूप से, तकनीक ने हमें इसके इंटरफ़ेस के अनुकूल होने की आवश्यकता दी है। हमें फोल्डर, फिर सर्च बार, फिर ऐप्स का उपयोग करना सीखना पड़ा। स्पार्क और सर्च में एजेंटिक एकीकरण के साथ, इंटरफ़ेस केवल आपका इरादा है। आप लक्ष्य प्रदान करते हैं, और एआई इसे प्राप्त करने के लिए इंटरनेट की अपारदर्शी परतों को नेविगेट करता है। यह भविष्य का एक सुव्यवस्थित दृष्टिकोण है, लेकिन यह प्रणालीगत जोखिमों के बिना नहीं आता है।
एक उपकरण जो सहायक है और एक उपकरण जो स्वायत्त है, के बीच एक अस्थिर तनाव है। गूगल वर्तमान में एक उपयोगकर्ता और उसके पिछले चैटबॉट मॉडल से जुड़ी एक दुखद घटना के बाद एक संवेदनशील कानूनी परिदृश्य को नेविगेट कर रहा है। जब एआई सवालों के जवाब देने से हटकर कार्यों को निष्पादित करने की ओर बढ़ता है, तो नुकसान की संभावना बढ़ जाती है।
क्या होता है जब एक स्वायत्त एजेंट को एक लक्ष्य दिया जाता है लेकिन वह उस लक्ष्य के मार्ग की व्याख्या इस तरह से करता है जो गोपनीयता या सुरक्षा का उल्लंघन करता है? गूगल का दावा है कि उसने अपने सुरक्षा उपायों को मजबूत किया है, विशेष रूप से साइबर सुरक्षा और संवेदनशील सामग्रियों के संबंध में। मॉडल को "निर्णय बिंदु" पर पहुंचने पर रुकने और अनुमति मांगने के लिए भी डिज़ाइन किया गया है।
हालांकि, उपभोक्ता के दृष्टिकोण से, पारदर्शिता के बारे में एक वैध चिंता है। यदि कोई एजेंट घंटों तक बैकग्राउंड में काम कर रहा है, तो हम उसके विकल्पों का ऑडिट कैसे करेंगे? इस बदलाव के लिए उस कंपनी में उच्च स्तर के विश्वास की आवश्यकता है जो अभी भी अपने सुरक्षा प्रोटोकॉल को परिष्कृत कर रही है। लब्बोलुआब यह है कि जैसे-जैसे एआई स्वतंत्र रूप से काम करके अधिक उपयोगी होता जाता है, यह एक "ब्लैक बॉक्स" भी बन जाता है जिसकी हम वास्तविक समय में आसानी से निगरानी नहीं कर सकते।
अंततः, जेमिनी 3.5 फ्लैश की रिलीज बताती है कि हम एक ऐसे दौर में प्रवेश कर रहे हैं जहां तकनीक के "कैसे" से ज्यादा "क्या" मायने रखता है। यहां बताया गया है कि आप इस बदलते परिदृश्य के लिए कैसे तैयारी कर सकते हैं:
हम उस युग से दूर जा रहे हैं जहां हम काम करने के लिए "कंप्यूटर पर जाते हैं"। जल्द ही, काम लगातार हो रहा होगा, उन डिजिटल एजेंटों द्वारा संचालित जिन्हें कॉफी ब्रेक या नींद की आवश्यकता नहीं होती है। जेमिनी 3.5 फ्लैश भविष्य की अर्थव्यवस्था की उस अथक रीढ़ की पहली वास्तविक झलक है। क्या हम ऐसी दुनिया के लिए तैयार हैं जहां मशीनें सिर्फ बात नहीं करतीं, बल्कि काम करती हैं, यह एक ऐसा सवाल है जिसका जवाब हमें बहुत जल्द देना होगा।
स्रोत:



हमारा एंड-टू-एंड एन्क्रिप्टेड ईमेल और क्लाउड स्टोरेज समाधान सुरक्षित डेटा एक्सचेंज का सबसे शक्तिशाली माध्यम प्रदान करता है, जो आपके डेटा की सुरक्षा और गोपनीयता सुनिश्चित करता है।
/ एक नि: शुल्क खाता बनाएं