सिलिकॉन वैली की किसी दिग्गज कंपनी के लिए उत्पाद में देरी आमतौर पर एक आपदा मानी जाती है। गूगल के लिए, जेमिनी 3.5 प्रो (Gemini 3.5 Pro) में एक महीने की देरी इस बात का संकेत है कि कंपनी आखिरकार अपनी रचनाओं की जटिलता का सम्मान कर रही है। जबकि कुछ लोग जून से जुलाई के बदलाव को समय सीमा पूरा करने में विफलता के रूप में देखते हैं, वास्तविकता अधिक व्यावहारिक है। उद्योग एक ऐसे बिंदु पर पहुँच गया है जहाँ कच्ची शक्ति (raw power) विश्वसनीयता की तुलना में कम मूल्यवान है। गूगल ने मई में अपने I/O डेवलपर सम्मेलन में जेमिनी 3.5 प्रो का वादा किया था। सीईओ सुंदर पिचाई ने कहा था कि मॉडल जून में आएगा। अब, महीने के अंत में, कंपनी शुरुआती परीक्षकों से अधिक फीडबैक लेने के लिए उस लक्ष्य को जुलाई तक बढ़ा रही है।
यह देरी बताती है कि टेक कंपनियां एआई की हथियारों की दौड़ को कैसे संभाल रही हैं, इसमें बदलाव आया है। पिछले वर्षों में, लक्ष्य जितनी जल्दी हो सके मॉडल को जारी करना था, भले ही वह अजीब या गलत परिणाम दे। आज, दांव ऊंचे हैं। उपयोगकर्ता उम्मीद करते हैं कि एआई एक अथक प्रशिक्षु (intern) के रूप में कार्य करे जो निरंतर पर्यवेक्षण के बिना जटिल कार्यों को प्रबंधित कर सके। यदि वह प्रशिक्षु कोडिंग प्रोजेक्ट या वित्तीय स्प्रेडशीट में गलती करता है, तो नुकसान वास्तविक होता है। अतिरिक्त चार सप्ताह लेकर, गूगल यह सुनिश्चित करने का प्रयास कर रहा है कि जेमिनी 3.5 प्रो एक खिलौने के बजाय एक उपकरण बने।
गूगल ने जेमिनी 3.5 प्रो को उस चीज़ में उत्कृष्टता प्राप्त करने के लिए डिज़ाइन किया है जिसे इंजीनियर 'लॉन्ग-होराइजन टास्क' (long-horizon tasks) कहते हैं। सरल शब्दों में, यह उन नौकरियों को संदर्भित करता है जिनमें लंबी अवधि में कई चरणों की आवश्यकता होती है। अधिकांश वर्तमान एआई मॉडल त्वरित उत्तर देने में अच्छे हैं। आप एक रेसिपी मांगते हैं, और वह आपको एक दे देता है। लॉन्ग-होराइजन टास्क अलग होते हैं। कल्पना कीजिए कि आप एक एआई से तीन सप्ताह की यात्रा की योजना बनाने, उड़ानें बुक करने, मौसम के आधार पर यात्रा कार्यक्रम को समायोजित करने और अपने दोस्तों को कैलेंडर आमंत्रण भेजने के लिए कह रहे हैं। इसके लिए मॉडल को भ्रमित हुए बिना अपनी सक्रिय मेमोरी में भारी मात्रा में जानकारी रखने की आवश्यकता होती है।
शब्दजाल के पीछे, यह एक मेमोरी की समस्या है। जब एक एआई मॉडल एक बड़े दस्तावेज़ या लंबी बातचीत को प्रोसेस करता है, तो वह 'कॉन्टेक्स्ट विंडो' (context window) नामक चीज़ का उपयोग करता है। जेमिनी ने ऐतिहासिक रूप से इस क्षेत्र में बाजार का नेतृत्व किया है। हालाँकि, बड़ी मेमोरी होना बेकार है यदि एआई उस विशिष्ट विवरण को नहीं ढूंढ पाता जिसकी उसे आवश्यकता है। देरी इंगित करती है कि गूगल इस बात को परिष्कृत कर रहा है कि मॉडल इन गहरे अभिलेखागार से जानकारी कैसे प्राप्त करता है। औसत उपयोगकर्ता के लिए, इसका मतलब है कि जब आप एआई से 500-पेज की पीडीएफ को सारांशित करने के लिए कहते हैं, तो उसके मतिभ्रम (hallucinate) करने या तथ्यों का आविष्कार करने की संभावना कम होती है।
व्यावहारिक रूप से, यह विश्वसनीयता एआई एजेंटों के लिए मूलभूत आवश्यकता है। एक एजेंट चैटबॉट से कहीं अधिक है। यह सॉफ्टवेयर का एक टुकड़ा है जो काम पूरा करने के लिए आपके कंप्यूटर या वेब को नेविगेट कर सकता है। यदि आप चाहते हैं कि एक एआई आपके टैक्स रिटर्न को व्यवस्थित करे, तो उसे सटीक होना चाहिए। परीक्षण के लिए एक महीने की देरी उस सिस्टम के लिए एक छोटी सी कीमत है जो गलत फाइलों को डिलीट नहीं करता है।
इस देरी के संदर्भ में एंथ्रोपिक (Anthropic) और ओपनएआई (OpenAI) जैसे प्रतिद्वंद्वियों का तीव्र दबाव शामिल है। जबकि गूगल के मॉडल ने पिछले साल अच्छा प्रदर्शन किया था, इसके प्रतिस्पर्धियों ने एक विशिष्ट क्षेत्र में बढ़त बना ली है: कंप्यूटर प्रोग्रामिंग। यह केवल सॉफ्टवेयर इंजीनियरों के लिए चिंता का विषय नहीं है। कोडिंग प्राथमिक तरीका है जिससे ये लैब एआई के तर्क और विचार करने की क्षमता का परीक्षण करती हैं। यदि कोई मॉडल जटिल कोड लिख सकता है, तो वह आमतौर पर अन्य तार्किक समस्याओं को भी उसी सटीकता के साथ हल कर सकता है।
बाजार के पक्ष में, कोडिंग पहला प्रमुख तरीका है जिससे कंपनियां एआई से पैसा कमा रही हैं। व्यवसाय उन उपकरणों के लिए भुगतान करते हैं जो उनके डेवलपर्स को तेजी से काम करने में मदद करते हैं। यदि गूगल कोडिंग में पीछे रह जाता है, तो वह एंटरप्राइज मार्केट का एक बड़ा हिस्सा खो देता है। शुरुआती परीक्षक एंटीग्रेविटी (Antigravity) जैसे प्लेटफॉर्म और बेंचमार्किंग साइट LMArena पर जेमिनी 3.5 प्रो का उपयोग कर रहे हैं। ये वातावरण एआई प्रदर्शन के लिए एक वैश्विक मूड रिंग प्रदान करते हैं। फीडबैक से संभवतः पता चला कि हालांकि जेमिनी 3.5 तेज था, लेकिन तार्किक निरंतरता में क्लाउड (Claude) या GPT-4o के नवीनतम संस्करणों को हराने के लिए इसे और अधिक निखार की आवश्यकता थी।
बड़ी तस्वीर को देखें तो, कोडिंग आधुनिक अर्थव्यवस्था का डिजिटल कच्चा तेल है। यह आपके बैंकिंग ऐप से लेकर आपकी कार के सेंसर तक सब कुछ संचालित करता है। जब गूगल कोडिंग में बेहतर होने के लिए अपने मॉडल में बदलाव करता है, तो वह अनिवार्य रूप से अपने सभी भविष्य के उत्पादों के अंतर्निहित तर्क को अधिक लचीला बना रहा होता है। परीक्षण का यह अतिरिक्त महीना कंपनी को मॉडल को और अधिक वास्तविक दुनिया के परिदृश्य देने की अनुमति देता है जहाँ पिछले संस्करण लड़खड़ा गए होंगे।
जुलाई की देरी के सबसे दिलचस्प कारणों में से एक जेमिनी 3.5 फ्लैश (Gemini 3.5 Flash) नामक एक छोटा मॉडल शामिल है। यह संस्करण गति और कम लागत के लिए डिज़ाइन किया गया है। हालाँकि, शुरुआती फीडबैक से पता चला कि फ्लैश ने टोकन की खपत बहुत तेजी से की। एआई की दुनिया में, एक टोकन एक डिजिटल शब्दांश (syllable) की तरह होता है। मॉडल टेक्स्ट को प्रोसेस करने और उत्पन्न करने के लिए टोकन का उपयोग करते हैं। यदि कोई मॉडल अक्षम है, तो वह किसी कार्य को पूरा करने के लिए आवश्यकता से अधिक टोकन का उपयोग करता है। यह एआई को डेवलपर्स के लिए अधिक महंगा और उपभोक्ताओं के लिए धीमा बनाता है।
इसका मतलब यह है कि गूगल जेमिनी 3.5 प्रो को 'गैस-गज़लर' (अधिक ऊर्जा खपत करने वाला) होने से बचाने की कोशिश कर रहा है। यदि कोई एआई एक साधारण अनुरोध के लिए बहुत अधिक प्रोसेसिंग पावर का उपयोग करता है, तो यह आपके लैपटॉप की बैटरी को खत्म कर देता है और डेटा केंद्रों पर भार बढ़ाता है। गूगल फ्लैश मॉडल से मिले सबक को प्रो मॉडल में शामिल कर रहा है ताकि इसे और अधिक सुव्यवस्थित बनाया जा सके। इसमें हुड के नीचे गणित को थोड़ा बदलना शामिल है ताकि मॉडल कम गणनात्मक ऊर्जा का उपयोग करके उसी निष्कर्ष पर पहुंच सके।
औसत उपयोगकर्ता के लिए, यह दक्षता विकेंद्रीकृत है। यह आपके फोन पर तेज़ प्रतिक्रिया या एआई सेवाओं के लिए कम मासिक सदस्यता शुल्क के रूप में दिखाई देती है। जब एक मॉडल को अनुकूलित किया जाता है, तो वह एक विशाल सर्वर फार्म के निरंतर कनेक्शन की आवश्यकता के बिना छोटे उपकरणों पर चल सकता है। गूगल संभवतः इस अतिरिक्त समय का उपयोग यह सुनिश्चित करने के लिए कर रहा है कि प्रो मॉडल बुद्धिमत्ता और संसाधन प्रबंधन का सबसे अच्छा संतुलन प्रदान करे।
जब जेमिनी 3.5 प्रो अंततः जुलाई में लॉन्च होगा, तो इसका प्रभाव अलग-थलग होने के बजाय व्यवस्थित होगा। आप संभवतः इन अपडेट को सबसे पहले गूगल वर्कस्पेस टूल्स जैसे डॉक्स और जीमेल में देखेंगे। लक्ष्य सरल टेक्स्ट जनरेशन से वास्तविक सहायता की ओर बढ़ना है।
| विशेषता | वर्तमान एआई क्षमता | जेमिनी 3.5 प्रो लक्ष्य |
|---|---|---|
| मेमोरी | चैट के हालिया हिस्सों को याद रखता है | विशाल दस्तावेज़ों में संदर्भ बनाए रखता है |
| तर्क | सरल A-से-B निर्देशों का पालन करता है | स्वतंत्र रूप से बहु-चरणीय समस्याओं को हल करता है |
| गति | तेज़ लेकिन अक्सर दोहराव वाला | कम विलंबता के लिए कुशल टोकन उपयोग |
| एजेंसी | आपके द्वारा की जाने वाली कार्रवाइयों का सुझाव देता है | कई ऐप्स में कार्रवाइयां निष्पादित करता है |
गूगल टूल्स का हर दिन उपयोग करने वाले किसी व्यक्ति के लिए, इसका मतलब है कि 'लिखने में मेरी मदद करें' बटन 'करने में मेरी मदद करें' बटन बन जाएगा। केवल ईमेल का मसौदा तैयार करने के बजाय, एआई आपकी स्प्रेडशीट को देखने, आपके शेष बजट की गणना करने और फिर आपके बॉस को ईमेल का मसौदा भेजने में सक्षम हो सकता है। इस बदलाव के लिए विश्वास के उस स्तर की आवश्यकता है जिसे तोड़ना गूगल बर्दाश्त नहीं कर सकता। यदि एआई बजट नंबर का मतिभ्रम करता है, तो उपयोगकर्ता का पूरे सिस्टम से विश्वास उठ जाता है।
अंततः, देरी एक परिपक्व होते उद्योग का संकेत है। एआई के लिए 'तेजी से आगे बढ़ें और चीजें तोड़ें' का युग समाप्त हो रहा है क्योंकि इसमें बहुत कुछ दांव पर लगा है। गूगल अब एक अस्थिर बाजार में प्रतिस्पर्धा कर रहा है जहाँ प्रतिष्ठा सबसे मूल्यवान मुद्रा है। जुलाई का लॉन्च उन्हें जनता को खोजने का मौका मिलने से पहले मॉडल में छोटी कमियों को ठीक करने की अनुमति देता है।
उपभोक्ता के दृष्टिकोण से, जेमिनी 3.5 प्रो की प्रतीक्षा को पारदर्शिता के नजरिए से देखा जाना चाहिए। अतीत में, टेक कंपनियां एक त्रुटिपूर्ण उत्पाद भेज सकती थीं और बाद में अपडेट के साथ उसे ठीक कर सकती थीं। फ्रंटियर एआई के साथ, मॉडल का मूलभूत प्रशिक्षण एक बार लाइव होने के बाद बदलना कठिन होता है। गूगल अभी जो बदलाव कर रहा है वे संभवतः न्यूरल नेटवर्क की गहराई में हैं। ये बदलाव प्रभावित करते हैं कि मॉडल विचारों के बीच संबंधों को कैसे समझता है।
दिलचस्प बात यह है कि यह देरी गूगल को अपने हार्डवेयर को तैयार करने के लिए अधिक समय भी दे सकती है। एआई मॉडल को चलाने के लिए भारी मात्रा में विशेष चिप्स की आवश्यकता होती है। लॉन्च को जुलाई तक बढ़ाकर, गूगल यह सुनिश्चित कर सकता है कि उसके डेटा सेंटर ट्रैफिक में अचानक होने वाली वृद्धि के लिए तैयार हैं जो एक नए मॉडल के लॉन्च से पैदा होती है। यह उन निराशाजनक 'सर्विस एट कैपेसिटी' संदेशों को रोकता है जो अक्सर नए एआई रिलीज को परेशान करते हैं।
जैसे-जैसे हम नई लॉन्च तिथि की ओर बढ़ रहे हैं, यह देखना सार्थक है कि आप वर्तमान में इन उपकरणों का उपयोग कैसे करते हैं। अधिकांश लोग एआई का उपयोग सर्च इंजन रिप्लेसमेंट के रूप में करते हैं। जेमिनी 3.5 प्रो को पूरी तरह से कुछ और होने के लिए डिज़ाइन किया गया है। यह एक लॉजिक इंजन है। जब यह आएगा, तो ध्यान इस बात पर नहीं होगा कि यह कितनी अच्छी कविता लिखता है, बल्कि इस पर होगा कि यह आपके डिजिटल जीवन के अदृश्य औद्योगिक तंत्र को कितनी अच्छी तरह संभालता है। देरी किसी संकट में फंसी कंपनी का संकेत नहीं है। यह उस कंपनी का संकेत है जो डेमो और टिकाऊ उत्पाद के बीच का अंतर जानती है।



हमारा एंड-टू-एंड एन्क्रिप्टेड ईमेल और क्लाउड स्टोरेज समाधान सुरक्षित डेटा एक्सचेंज का सबसे शक्तिशाली माध्यम प्रदान करता है, जो आपके डेटा की सुरक्षा और गोपनीयता सुनिश्चित करता है।
/ एक नि: शुल्क खाता बनाएं