साइबर सुरक्षा

कैसे एक भरोसेमंद एरर मॉनिटरिंग टूल AI एजेंट हाइजैकिंग का प्रवेश द्वार बन गया

एजेंटजैकिंग (Agentjacking) नकली सेंट्री (Sentry) एरर रिपोर्ट के माध्यम से AI कोडिंग एजेंटों को दुर्भावनापूर्ण कोड चलाने के लिए धोखा देता है। जानें कि यह हमला कैसे काम करता है और अपने कोड को कैसे सुरक्षित रखें।

Alexey Drobyshev

साइबर सुरक्षा विश्लेषक

12 जून 2026

कैसे एक भरोसेमंद एरर मॉनिटरिंग टूल AI एजेंट हाइजैकिंग का प्रवेश द्वार बन गया

मुझे याद है वह पहला सप्ताह जब मैंने अपने स्थानीय विकास वातावरण (local development environment) में एक AI कोडिंग सहायक को एकीकृत किया था। यह मेरे वर्कफ़्लो के लिए एक शक्ति गुणक (force multiplier) जैसा महसूस हुआ। मैं इससे किसी उलझे हुए फंक्शन को रिफैक्टर करने या अपने लॉग्स से किसी रहस्यमयी स्टैक ट्रेस को समझाने के लिए कह सकता था। उत्पादकता में लाभ तत्काल था। मैंने कभी भी उस डेटा के ट्रस्ट मॉडल पर सवाल उठाने के लिए रुककर नहीं सोचा जिसे एजेंट उपभोग कर रहा था। कई सुरक्षा पेशेवरों की तरह, मैंने मान लिया था कि एजेंट एक सैंडबॉक्स के भीतर काम करता है जो मेरी मशीन की सीमाओं का सम्मान करता है। Tenet Security द्वारा एजेंटजैकिंग (Agentjacking) की खोज यह साबित करती है कि यह धारणा आधुनिक सॉफ्टवेयर इंजीनियरिंग में एक खतरनाक चूक है।

एजेंटजैकिंग हमले का एक नया वर्ग है जो बाहरी सेवाओं से जानकारी संसाधित करने के AI कोडिंग एजेंटों के तरीके का फायदा उठाता है। यह एक हमलावर को उन उपकरणों में दुर्भावनापूर्ण डेटा डालकर डेवलपर की मशीन पर मनमाना कोड निष्पादित करने की अनुमति देता है जिन पर एजेंट भरोसा करता है। इस विशिष्ट परिदृश्य में, शोधकर्ताओं ने Sentry का उपयोग किया, जो एक लोकप्रिय एरर-ट्रैकिंग प्लेटफॉर्म है। इस हमले के लिए Sentry के सर्वर या डेवलपर के बुनियादी ढांचे में सेंध लगाने की आवश्यकता नहीं होती है। यह पूरी तरह से इस वास्तुकला (architecture) पर निर्भर करता है कि AI एजेंट 'मॉडल कॉन्टेक्स्ट प्रोटोकॉल' (Model Context Protocol) के माध्यम से संरचित डेटा की व्याख्या कैसे करते हैं।

एजेंटजैकिंग के पीछे की वास्तुशिल्प खामी

इस भेद्यता के केंद्र में AI एजेंट डिजाइन में एक मौलिक विरोधाभास है। इन एजेंटों को सहायक, सक्रिय और तकनीकी संदर्भ के आधार पर कार्रवाई करने में सक्षम होने के लिए डिज़ाइन किया गया है। जब आप किसी AI से बग ठीक करने के लिए कहते हैं, तो वह अक्सर उन डेटा स्रोतों की तलाश करता है जो यह सुराग देते हैं कि क्या गलत हुआ। Sentry ऐसा ही एक स्रोत है। यह अनुप्रयोगों से त्रुटि रिपोर्ट एकत्र करता है और विश्लेषण के लिए उन्हें डेवलपर्स के सामने प्रस्तुत करता है। इसे आसान बनाने के लिए, कई AI एजेंट Sentry से क्वेरी करने और हालिया एरर इवेंट्स प्राप्त करने के लिए मॉडल कॉन्टेक्स्ट प्रोटोकॉल का उपयोग करते हैं।

जोखिम के दृष्टिकोण से, समस्या यह है कि AI एजेंट के पास त्रुटि रिपोर्ट के स्रोत को सत्यापित करने का कोई तरीका नहीं है। यह Sentry सर्वर द्वारा लौटाए गए प्रत्येक इवेंट को एक विश्वसनीय सिस्टम आउटपुट के रूप में मानता है। एक हमलावर सीधे कंपनी के Sentry एंडपॉइंट पर एक नकली त्रुटि रिपोर्ट भेजकर इसका फायदा उठा सकता है। यह इसलिए संभव है क्योंकि Sentry 'डेटा सोर्स नेम' या DSN का उपयोग करता है, जो एक सार्वजनिक, राइट-ओनली क्रेडेंशियल है। आप इन DSN को लाखों वेबसाइटों और क्लाइंट-साइड अनुप्रयोगों के सोर्स कोड में एम्बेडेड पा सकते हैं। चूंकि DSN सार्वजनिक होने के लिए होता है ताकि फ्रंटएंड ऐप्स त्रुटियों की रिपोर्ट कर सकें, इसलिए उस स्ट्रिंग वाला कोई भी व्यक्ति उस Sentry प्रोजेक्ट को डेटा भेज सकता है।

जब AI एजेंट प्रोटोकॉल के माध्यम से Sentry से क्वेरी करता है, तो उसे वैध रिपोर्टों के साथ हमलावर की दुर्भावनापूर्ण त्रुटि रिपोर्ट भी प्राप्त होती है। एजेंट उस नकली रिपोर्ट के अंदर के निर्देशों को नैदानिक चरणों या समाधान मार्गदर्शन के रूप में व्याख्या करता है। फिर वह उन निर्देशों को डेवलपर के पूर्ण विशेषाधिकारों के साथ निष्पादित करता है। यह CIA ट्रायड का उल्लंघन है, जो विशेष रूप से सिस्टम की अखंडता (integrity) और डेवलपर के डेटा की गोपनीयता (confidentiality) को प्रभावित करता है।

सार्वजनिक DSN से कोड निष्पादन तक के प्रवाह का पता लगाना

हमले की श्रृंखला को समझने के लिए, हमें यह देखना होगा कि डेटा सार्वजनिक इंटरनेट से डेवलपर के निजी टर्मिनल में कैसे जाता है। प्रक्रिया हमलावर द्वारा लक्ष्य के Sentry DSN का पता लगाने के साथ शुरू होती है। यह कोई कठिन कार्य नहीं है। कई संगठन अनजाने में इन कुंजियों को अपने प्रोडक्शन जावास्क्रिप्ट बंडल या सार्वजनिक रिपॉजिटरी में उजागर कर देते हैं। एक बार जब हमलावर के पास DSN आ जाता है, तो वे Sentry इनजेस्ट एंडपॉइंट पर एक तैयार किया गया एरर इवेंट भेजने के लिए एक मानक POST अनुरोध का उपयोग करते हैं।

यह इवेंट कोई साधारण स्ट्रिंग नहीं है। शोधकर्ताओं ने पाया कि संदेश फ़ील्ड और संदर्भ कुंजियों के भीतर विशिष्ट मार्कडाउन फ़ॉर्मेटिंग का उपयोग करना AI एजेंट को धोखा देने के लिए पर्याप्त है। हमलावर पेलोड को बिल्कुल वैध Sentry सिस्टम टेम्पलेट की तरह दिखने के लिए फ़ॉर्मेट करता है। जब कोई डेवलपर अपने AI सहायक से अनसुलझे Sentry मुद्दों को हल करने के लिए कहता है, तो सहायक इस दुर्भावनापूर्ण इवेंट को खींच लेता है।

AI एजेंट एक संदेश देखता है जो तकनीकी त्रुटि जैसा दिखता है और उसे ठीक करने के लिए निर्देशों का एक सेट देखता है। ये निर्देश एजेंट को एनवायरनमेंट वेरिएबल्स की जांच करने के लिए स्क्रिप्ट चलाने या कॉन्फ़िगरेशन फ़ाइल को अपडेट करने के लिए कह सकते हैं। चूंकि एजेंट का मानना है कि वह एक डायग्नोस्टिक टूल से एक विश्वसनीय समाधान चरण पढ़ रहा है, इसलिए वह कमांड निष्पादित करता है। पर्दे के पीछे, वह कमांड Git क्रेडेंशियल्स, निजी रिपॉजिटरी URL, या संवेदनशील एनवायरनमेंट वेरिएबल्स को चुरा सकता है। यह हमला गुप्त है क्योंकि डेवलपर एजेंट को वही करते हुए देखता है जो उसने करने के लिए कहा था: एक त्रुटि को ठीक करना।

पारंपरिक सुरक्षा उपाय इस पद्धति के विरुद्ध क्यों विफल हो जाते हैं

यह हमला विशेष रूप से समस्याग्रस्त है क्योंकि यह आधुनिक सुरक्षा स्टैक की लगभग हर परत को बायपास कर देता है। एक EDR या फ़ायरवॉल दुर्भावनापूर्ण हस्ताक्षरों या अनधिकृत कनेक्शनों की तलाश करता है। एजेंटजैकिंग परिदृश्य में, श्रृंखला की हर कार्रवाई अधिकृत होती है। Sentry सर्वर डेटा प्राप्त करने के लिए अधिकृत है। AI एजेंट Sentry से क्वेरी करने के लिए अधिकृत है। डेवलपर ने एजेंट को अपनी मशीन पर कोड चलाने के लिए अधिकृत किया है।

पारंपरिक अर्थों में पता लगाने के लिए कोई मैलवेयर नहीं है। दुर्भावनापूर्ण इरादा निर्देश के तर्क में छिपा होता है, न कि किसी फ़ाइल के बाइनरी में। हमले की सतह का आकलन करने से पता चलता है कि AI एजेंट स्वयं सबसे कमजोर कड़ी है। यह एक डिजिटल ट्रोजन हॉर्स के रूप में कार्य करता है, जो सार्वजनिक इंटरनेट से अविश्वसनीय डेटा को उच्च-विशेषाधिकार प्राप्त वातावरण में लाता है। सक्रिय रूप से कहें तो, वेब एप्लिकेशन फ़ायरवॉल या पहचान और पहुंच प्रबंधन (IAM) जैसे उपकरण इसे रोकने के लिए कुछ नहीं करते क्योंकि हमलावर कभी भी पीड़ित के आंतरिक बुनियादी ढांचे को नहीं छूता है। वे केवल एक सार्वजनिक इनजेस्ट पॉइंट के साथ बातचीत करते हैं जिसे दुनिया से डेटा स्वीकार करने के लिए डिज़ाइन किया गया है।

उद्योग की प्रतिक्रिया और अप्राप्य खामियों की वास्तविकता

जब Tenet Security ने इन निष्कर्षों की रिपोर्ट Sentry को दी, तो प्रतिक्रिया काफी कुछ बयां करने वाली थी। Sentry ने समस्या को स्वीकार किया लेकिन कहा कि यह तकनीकी रूप से बचाव योग्य नहीं है। API डिज़ाइन और सार्वजनिक इनजेस्ट पॉइंट की दुनिया में यह एक सामान्य स्थिति है। यदि कोई सेवा किसी भी क्लाइंट से डेटा स्वीकार करने के लिए डिज़ाइन की गई है, तो वह अपने प्राथमिक कार्य को तोड़े बिना वास्तविक क्रैश और दुर्भावनापूर्ण इंजेक्शन के बीच आसानी से अंतर नहीं कर सकती है। हालांकि Sentry ने विशिष्ट पेलोड स्ट्रिंग्स को ब्लॉक करने के लिए एक वैश्विक सामग्री फ़िल्टर लागू किया है, लेकिन यह एक प्रतिक्रियात्मक उपाय है। हमलावर संभवतः ऐसे फ़िल्टर को बायपास करने के लिए अपने मार्कडाउन को फ़ॉर्मेट करने के नए तरीके खोज सकते हैं।

शोधकर्ताओं ने 100 से अधिक संगठनों के खिलाफ इस हमले का परीक्षण किया और 85% सफलता दर हासिल की। उन्होंने उजागर और इंजेक्टेबल DSN वाले कम से कम 2,388 संगठन पाए। इससे पता चलता है कि यह भेद्यता पूरे उद्योग में व्याप्त है। यह किसी एक उपकरण या विशिष्ट AI मॉडल तक सीमित नहीं है। यह एक प्रणालीगत मुद्दा है कि हम बाहरी डेटा स्रोतों के साथ बातचीत करने वाले स्वायत्त एजेंटों का निर्माण कैसे कर रहे हैं। हम अनिवार्य रूप से इन एजेंटों को आईडी चेक करने के लिए दरवाजे पर बाउंसर के बिना अपने सबसे संवेदनशील सिस्टम के लिए वीआईपी पास दे रहे हैं।

AI एजेंट एकीकरण के जोखिमों को कम करना

एक जवाबी उपाय के रूप में, संगठनों को इस बात पर पुनर्विचार करना चाहिए कि वे AI एजेंटों को तीसरे पक्ष की सेवाओं के साथ बातचीत करने की अनुमति कैसे देते हैं। पैचिंग को छोड़कर, सबसे प्रभावी बचाव AI संदर्भ के लिए 'जीरो ट्रस्ट' मॉडल की ओर बदलाव है। सिर्फ इसलिए कि डेटा एक आधिकारिक API से आता है, इसका मतलब यह नहीं है कि वह डेटा निष्पादित करने के लिए सुरक्षित है।

डेवलपर्स को किसी भी ऐसे AI एजेंट से सावधान रहना चाहिए जो मैन्युअल निरीक्षण के बिना मनमाना कोड चलाने की अनुमति मांगता है। यदि आप Claude Code या Cursor जैसे टूल का उपयोग कर रहे हैं, तो आपको उच्च स्तर का स्वस्थ संदेह बनाए रखना चाहिए। एंटर कुंजी दबाने से पहले एजेंट द्वारा प्रस्तावित कमांड की समीक्षा करें। यदि कोई एजेंट Sentry त्रुटि के लिए ऐसा समाधान सुझाता है जिसमें आपके द्वारा नहीं लिखी गई शेल स्क्रिप्ट चलाना शामिल है, तो रुकें और पहले Sentry डैशबोर्ड में त्रुटि को सत्यापित करें।

संगठनों के लिए, प्राथमिकता उजागर DSN के लिए सार्वजनिक-सामना करने वाले कोड का ऑडिट करना है। जबकि Sentry DSN राइट-ओनली होते हैं, AI एजेंटों के शामिल होने पर वे स्पष्ट रूप से एक मिशन-क्रिटिकल जोखिम का प्रतिनिधित्व करते हैं। इन कुंजियों के साथ निजी API कुंजी के समान स्तर की सावधानी बरतना एक आवश्यक कदम है। नतीजतन, सुरक्षा टीमों को अपने खतरे के मॉडल को अपडेट करना चाहिए ताकि AI एजेंटों को बाहरी डेटा के लिए संभावित निष्पादन वेक्टर के रूप में शामिल किया जा सके।

सुरक्षित AI अपनाने के लिए मुख्य निष्कर्ष

अपने विकास वातावरण को एजेंटजैकिंग और इसी तरह के इंजेक्शन हमलों से बचाने के लिए, निम्नलिखित चरणों पर विचार करें:

उजागर Sentry DSN के लिए सभी सार्वजनिक रिपॉजिटरी और फ्रंटएंड परिनियोजन का ऑडिट करें और प्लेन टेक्स्ट में पाई गई किसी भी कुंजी को बदलें।
प्रत्येक शेल कमांड या फ़ाइल सिस्टम परिवर्तन के लिए स्पष्ट मैन्युअल अनुमोदन की आवश्यकता के लिए AI कोडिंग एजेंटों को कॉन्फ़िगर करें।
AI टूल में Sentry डेटा या अन्य बाहरी संदर्भ के स्वचालित अंतर्ग्रहण (ingestion) को तब तक अक्षम करें जब तक कि आप सक्रिय रूप से किसी ज्ञात समस्या को डीबग न कर रहे हों।
विश्वसनीय तृतीय-पक्ष एकीकरण के माध्यम से प्रॉम्प्ट इंजेक्शन और डेटा इंजेक्शन के जोखिमों पर डेवलपर्स को शिक्षित करें।
AI एजेंटों के लिए विस्तृत अनुमतियाँ लागू करें ताकि यह सुनिश्चित हो सके कि वे बिना किसी विशिष्ट कारण के .env या .git/config जैसी संवेदनशील फ़ाइलों तक नहीं पहुँच सकते।

हम तेजी से AI अपनाने के दौर में हैं जहाँ विकास की गति अक्सर सुरक्षा ढांचे के विकास से आगे निकल जाती है। एजेंटजैकिंग एक अनुस्मारक है कि प्रत्येक नया एकीकरण एक हमलावर के लिए एक नया रास्ता बनाता है। जिन एजेंटों पर हम अपना जीवन आसान बनाने के लिए भरोसा करते हैं, वे उतने ही सुरक्षित हैं जितना कि वह डेटा जो हम उन्हें खिलाते हैं।

स्रोत: Tenet Security Research Blog, Sentry Official Documentation, Model Context Protocol Specification, NIST AI Risk Management Framework.

अस्वीकरण: यह लेख केवल सूचनात्मक और शैक्षिक उद्देश्यों के लिए है और पेशेवर साइबर सुरक्षा ऑडिट या घटना प्रतिक्रिया सेवा का स्थान नहीं लेता है।

#AIकोडिंगएजेंट्स #एजेंटजैकिंग #मॉडलकॉन्टेक्स्टप्रोटोकॉल #साइबरसिक्योरिटीन्यूज़ #सेंट्रीसिक्योरिटी

आप दूसरी तरफ देखिए।

हमारा एंड-टू-एंड एन्क्रिप्टेड ईमेल और क्लाउड स्टोरेज समाधान सुरक्षित डेटा एक्सचेंज का सबसे शक्तिशाली माध्यम प्रदान करता है, जो आपके डेटा की सुरक्षा और गोपनीयता सुनिश्चित करता है।

/ एक नि: शुल्क खाता बनाएं

कस्टम डोमेन

1 TB तक संग्रहण

उन्नत साझाकरण

एंड-टू-एंड एन्क्रिप्शन

स्वयं नष्ट होने वाले ईमेल

कस्टम डोमेन

1 TB तक संग्रहण

उन्नत साझाकरण

एंड-टू-एंड एन्क्रिप्शन

स्वयं नष्ट होने वाले ईमेल

Beeble Mail

Beeble Drive

के बारे में Beeble

उद्देश्य

इतिहास

अधिमूल्य

सामान्य प्रश्न

दान करें

हमसे संपर्क करें