AI सुरक्षा के लिए सबसे बड़ा खतरा वह सॉफ्टवेयर है जो खुद को बनाता है

एंथ्रोपिक के सह-संस्थापक जैक क्लार्क ने चेतावनी दी है कि पुनरावर्ती AI आत्म-सुधार से मानवीय नियंत्रण खो सकता है। यहाँ बताया गया है कि उद्योग को ब्रेक पेडल की आवश्यकता क्यों है।

Alwin Davies

वरिष्ठ प्रौद्योगिकी संवाददाता

5 जून 2026

AI सुरक्षा के लिए सबसे बड़ा खतरा वह सॉफ्टवेयर है जो खुद को बनाता है

जबकि कई उपयोगकर्ता कृत्रिम बुद्धिमत्ता को एक निष्क्रिय डिजिटल सहायक के रूप में देखते हैं जो कार्य करने के लिए संकेत (prompt) की प्रतीक्षा करता है, वास्तविकता यह है कि यह तकनीक तेजी से अपनी स्वयं की वास्तुकार (architect) बनती जा रही है। हम अक्सर एक मानवीय प्रोग्रामर की कल्पना करते हैं जो डेस्क पर बैठकर चैटबॉट को स्मार्ट बनाने के लिए कोड की पंक्तियाँ टाइप करता है। यह छवि तेजी से पुरानी होती जा रही है। एंथ्रोपिक के सह-संस्थापक जैक क्लार्क ने हाल ही में खुलासा किया कि उनके AI, क्लाउड (Claude) के लिए कोडिंग कार्य का 80% हिस्सा पहले से ही स्वयं AI द्वारा किया जा रहा है। दो साल के भीतर, यह संख्या 100% तक पहुँचने की उम्मीद है। यह बदलाव पुनरावर्ती आत्म-सुधार (recursive self-improvement) की शुरुआत का प्रतीक है, एक ऐसी प्रक्रिया जहाँ एक मशीन बिना किसी मानवीय हस्तक्षेप के अपना उत्तराधिकारी बनाती है।

मशीन द्वारा स्वयं में सुधार करने की अवधारणा दक्षता के लिए एक सपने जैसी लगती है, लेकिन यह सुरक्षा के लिए एक मौलिक समस्या पैदा करती है। सरल शब्दों में, AI उद्योग वर्तमान में पूरी तरह से गैस पेडल पर बना है। कंपनियां बाजार हिस्सेदारी हासिल करने के लिए मॉडल को तेज, बड़ा और अधिक सक्षम बनाने की होड़ में हैं। हालांकि, जैसा कि क्लार्क बताते हैं, कार में ब्रेक पेडल नहीं है। यदि कोई AI सिस्टम अपने अगले संस्करण को प्रशिक्षित करने में पर्याप्त सक्षम हो जाता है, तो मनुष्य नए मॉडल की सुरक्षा या तर्क को सत्यापित करने की क्षमता खो देते हैं। यह एक ऐसा चक्र बनाता है जहाँ तकनीक हमारी समझने या नियंत्रित करने की क्षमता से अधिक तेजी से आगे बढ़ती है।

व्यवहार में पुनरावर्ती आत्म-सुधार कैसे काम करता है

यह समझने के लिए कि यह एक बड़ा बदलाव क्यों है, हम AI को एक अथक इंटर्न के रूप में देख सकते हैं। पारंपरिक रूप से, यह इंटर्न एक प्रबंधक के विशिष्ट निर्देशों का पालन करता था। प्रबंधक काम की जाँच करता था, गलतियों को सुधारता था, और तय करता था कि इंटर्न अधिक जिम्मेदारी के लिए कब तैयार है। पुनरावर्ती आत्म-सुधार इस गतिशीलता को पूरी तरह से बदल देता है। इंटर्न अब ऑफिस हैंडबुक लिख रहा है, नियुक्तियों के अगले बैच को प्रशिक्षित कर रहा है, और प्रबंधक के कमरे से बाहर होने पर कंपनी के वर्कफ़्लो को फिर से डिजाइन कर रहा है।

एंथ्रोपिक ने पहले ही क्लाउड के साथ ऐसा होते देखा है। AI अब अपने स्वयं के शोध प्रयोग चलाने में सक्षम है। जब मॉडल पर्यवेक्षण के बारे में एक जटिल प्रश्न पूछा गया, तो AI ने केवल उत्तर प्रदान नहीं किया। इसने एक कार्यप्रणाली तैयार की, अपने सिद्धांतों का परीक्षण किया, और मानवीय मार्गदर्शन के बिना एक निष्कर्ष पर पहुँचा। साथ ही, पिछले एक साल में मानव कर्मचारियों द्वारा क्लाउड के कोड को सुधारने की दर में लगातार गिरावट आई है। सॉफ्टवेयर कम गलतियाँ कर रहा है क्योंकि वह अपने पिछले पुनरावृत्तियों से सीख रहा है।

एक पुनरावर्ती मॉडल में, AI एजेंट स्वायत्त श्रमिकों के रूप में कार्य करते हैं। ये एजेंट नए मॉडल बना और प्रशिक्षित कर सकते हैं, जिससे एक फीडबैक लूप बनता है जहाँ सॉफ्टवेयर घातीय दर से सुधरता है। व्यापक परिप्रेक्ष्य में देखें तो इसका मतलब है कि विकास प्रक्रिया के हर चरण में मानवीय भूमिका कम होती जा रही है। हम तकनीक के निर्माता होने से हटकर एक ऐसी प्रक्रिया के पर्यवेक्षक बनते जा रहे हैं जिसे हम अब पूरी तरह से ट्रैक नहीं कर सकते।

वैश्विक दौड़ में गायब ब्रेक पेडल

पुनरावर्ती AI के लिए अभियान विकास की भारी लागतों से प्रेरित है। एक शीर्ष स्तर के AI मॉडल को प्रशिक्षित करने के लिए हजारों विशेष चिप्स और अरबों डॉलर की बिजली की आवश्यकता होती है। यदि कोई कंपनी अगले मॉडल के प्रशिक्षण को स्वचालित करने के लिए मौजूदा AI का उपयोग कर सकती है, तो वे समय और धन की भारी बचत करते हैं। बाजार की दृष्टि से, पूरी तरह से आत्म-सुधार प्रणाली प्राप्त करने वाली पहली कंपनी के पास व्यापक प्रतिस्पर्धात्मक लाभ होता है। यह आर्थिक दबाव गैस पेडल को दबाए रखने के लिए एक प्रणालीगत प्रोत्साहन बनाता है।

एंथ्रोपिक ब्रेक पेडल बनाने के लिए एक सामूहिक समझौते का आह्वान कर रहा है। व्यावहारिक रूप से, इसमें यह निगरानी करने के लिए एक प्रणाली शामिल होगी कि क्या डेवलपर्स पूर्ण पुनरावृत्ति की ओर अपनी गति को धीमा कर रहे हैं। हालांकि, एक अकेली कंपनी अपने दम पर रुकने का विकल्प नहीं चुन सकती। यदि एक लैब ब्रेक लगाती है जबकि अन्य गति बढ़ाना जारी रखते हैं, तो रुकने वाली लैब अपनी प्रासंगिकता और उद्योग को प्रभावित करने की क्षमता खो देती है।

वास्तविक मंदी स्थापित करने के लिए कई देशों की कई संसाधन-संपन्न प्रयोगशालाओं को ठहराव के लिए समान शर्तों पर सहमत होने की आवश्यकता है। यह कठिन है क्योंकि AI उद्योग वर्तमान में एक विकेंद्रीकृत प्रतिस्पर्धा है। जिस तरह कोई भी देश उन्नत हथियारों का विकास रोकने वाला पहला देश नहीं बनना चाहता, उसी तरह कोई भी टेक दिग्गज अपने सॉफ्टवेयर विकास की गति को सीमित करने वाला पहला व्यक्ति नहीं बनना चाहता। इसका परिणाम एक अस्थिर वातावरण है जहाँ मानवीय निरीक्षण बनाए रखने की क्षमता के बजाय गति को प्राथमिकता दी जाती है।

औसत उपयोगकर्ता के लिए नियंत्रण का खोना क्यों मायने रखता है

रोजमर्रा के उपयोगकर्ता के लिए, खुद को बनाने वाले AI का विचार वैज्ञानिकों के लिए एक दूर की चिंता जैसा लग सकता है। हालांकि, पर्दे के पीछे, यह बदलाव तकनीक के साथ हमारे संवाद करने के तरीके पर ठोस प्रभाव डालता है। जब कोई इंसान कोड लिखता है, तो तर्क का एक निशान होता है जिसका दूसरा इंसान अनुसरण कर सकता है। यदि कोड गोपनीयता लीक या पक्षपाती निर्णय का कारण बनता है, तो एक डेवलपर कोड की विशिष्ट पंक्ति ढूंढ सकता है और उसे ठीक कर सकता है।

जब कोई AI अपना उत्तराधिकारी खुद बनाता है, तो वह तर्क अपारदर्शी हो जाता है। हम 'ब्लैक बॉक्स' समस्या में और गहराई से चले जाते हैं, जहाँ मशीन परिणाम देती है, लेकिन हमारे पास यह जानने का कोई तरीका नहीं होता कि वह उस निष्कर्ष तक कैसे पहुँची। यह एक बैंक द्वारा आपके क्रेडिट स्कोर के मूल्यांकन से लेकर एक मेडिकल AI द्वारा बीमारी के निदान तक सब कुछ प्रभावित करता है। यदि सिस्टम बिना निरीक्षण के आत्म-सुधार कर रहा है, तो हम इस बात की गारंटी नहीं दे सकते कि वह छिपे हुए पूर्वाग्रह या अप्रत्याशित व्यवहार विकसित नहीं कर रहा है जो उपयोगकर्ताओं को नुकसान पहुँचा सकते हैं।

सुरक्षा का मामला भी है। यदि कोई AI अपने उत्तराधिकारियों को पूरी तरह से बनाने में सक्षम है, तो इन प्रणालियों को सुरक्षित करने और उनकी निगरानी करने के हमारे तरीके और कठिन हो जाते हैं। एक आत्म-सुधार करने वाला AI सैद्धांतिक रूप से अपनी सुरक्षा में कमजोरियों को मानवीय टीम द्वारा उन्हें ठीक करने से पहले ही ढूंढ सकता है और उनका फायदा उठा सकता है। अनिवार्य रूप से, हम एक ऐसा डिजिटल पारिस्थितिकी तंत्र बना रहे हैं जो अपने आप विकसित हो सकता है, और संभावित रूप से हमारे द्वारा बनाए गए सुरक्षा जालों से आगे निकल सकता है।

निर्माता से पर्यवेक्षक की ओर बदलाव

ऐतिहासिक रूप से, औद्योगिक प्रगति में हमेशा मनुष्यों द्वारा उपकरणों का प्रबंधन शामिल रहा है। भाप के इंजन से लेकर असेंबली लाइन तक, मशीन के संचालन पर हमेशा एक व्यक्ति अंतिम अधिकार होता था। AI इस ऐतिहासिक कड़ी को तोड़ रहा है। जैसे-जैसे मानवीय भूमिका कम हो रही है, हमारा प्राथमिक काम सॉफ्टवेयर बनाने से हटकर सॉफ्टवेयर को खुद को बनाते हुए देखने में बदल रहा है।

इस संक्रमण के लिए पारदर्शिता के लिए उपकरणों के एक नए सेट की आवश्यकता है। एंथ्रोपिक का अपना शोध संस्थान पुनरावर्ती AI की प्रगति को सत्यापित करने के लिए प्रणालियों पर काम कर रहा है, लेकिन तकनीक नियमन (regulation) से तेज चल रही है। उपभोक्ता के दृष्टिकोण से, इसका मतलब है कि हम एक ऐसे युग में प्रवेश कर रहे हैं जहाँ हमारे द्वारा दैनिक उपयोग किए जाने वाले उत्पाद अब मानवीय सरलता का प्रत्यक्ष परिणाम नहीं हैं। वे मानवीय आवश्यकताओं के प्रति मशीन की व्याख्या का परिणाम हैं।

दिलचस्प बात यह है कि इसका मतलब यह नहीं है कि तकनीक कम उपयोगी हो जाएगी। वास्तव में, पुनरावर्ती AI स्वास्थ्य सेवा और विज्ञान में ऐसी सफलताओं की ओर ले जा सकता है जो पहले असंभव थीं। यह बैटरी के लिए नई सामग्री खोज सकता है या वैश्विक आपूर्ति श्रृंखलाओं को प्रबंधित करने के अधिक कुशल तरीके ढूंढ सकता है। लाभ अभूतपूर्व हैं, लेकिन वे एक प्रणालीगत जोखिम के साथ आते हैं जिसे उद्योग ने अभी संबोधित करना शुरू किया है।

आत्म-सुधार वाली डिजिटल दुनिया में नेविगेट करना

निष्कर्ष यह है कि AI उद्योग बिना वापसी के बिंदु (point of no return) की ओर बढ़ रहा है। एक बार जब तकनीक 100% आत्म-सुधार में सक्षम हो जाती है, तो हस्तक्षेप करने की मानवीय क्षमता सीमित हो जाती है। हम वर्तमान में एक संक्षिप्त समय सीमा में हैं जहाँ हम अभी भी तय कर सकते हैं कि हम कितना नियंत्रण बनाए रखना चाहते हैं।

औसत उपयोगकर्ता के लिए, आगे बढ़ने का सबसे अच्छा तरीका यह है कि हम अपने द्वारा उपयोग किए जाने वाले ऐप्स और सेवाओं को कितनी स्वायत्तता देते हैं, इस पर नज़र रखें। हमें उन कंपनियों की तलाश करनी चाहिए जो पारदर्शिता और अपने मॉडल के तीसरे पक्ष के ऑडिट को प्राथमिकता देती हैं। यह समझना कि आपका सॉफ्टवेयर अब अपनी पटकथा खुद लिख रहा है, उन लोगों से बेहतर निरीक्षण की मांग करने का पहला कदम है जिनके हाथ में गैस पेडल है।

अंततः, लक्ष्य प्रगति को रोकना नहीं है, बल्कि यह सुनिश्चित करना है कि प्रगति मानवीय सुरक्षा के अनुरूप बनी रहे। जैसे-जैसे AI, AI को प्रशिक्षित करना शुरू करता है, ब्रेक पेडल पर वैश्विक समझौते की आवश्यकता और अधिक जरूरी हो जाती है। हमें यह सुनिश्चित करना चाहिए कि भले ही मशीन काम कर रही हो, लेकिन कार कहाँ जा रही है, इसका निर्णय अभी भी एक इंसान ही करे।

Sources: Anthropic, BBC World News, Jack Clark Interview.

#एंथ्रोपिक #कृत्रिमबुद्धिमत्ता #जैकक्लार्क #तकनीकीशासन #पुनरावर्तीआत्मसुधार

आप दूसरी तरफ देखिए।

हमारा एंड-टू-एंड एन्क्रिप्टेड ईमेल और क्लाउड स्टोरेज समाधान सुरक्षित डेटा एक्सचेंज का सबसे शक्तिशाली माध्यम प्रदान करता है, जो आपके डेटा की सुरक्षा और गोपनीयता सुनिश्चित करता है।

/ एक नि: शुल्क खाता बनाएं

कस्टम डोमेन

1 TB तक संग्रहण

उन्नत साझाकरण

एंड-टू-एंड एन्क्रिप्शन

स्वयं नष्ट होने वाले ईमेल

कस्टम डोमेन

1 TB तक संग्रहण

उन्नत साझाकरण

एंड-टू-एंड एन्क्रिप्शन

स्वयं नष्ट होने वाले ईमेल

Beeble Mail

Beeble Drive

के बारे में Beeble

उद्देश्य

इतिहास

अधिमूल्य

सामान्य प्रश्न

दान करें

हमसे संपर्क करें