Ich erinnere mich an die erste Woche, in der ich einen KI-Codierungsassistenten in meine lokale Entwicklungsumgebung integriert habe. Es fühlte sich wie ein Kraftmultiplikator für meinen Workflow an. Ich konnte ihn bitten, eine unübersichtliche Funktion zu refaktorieren oder einen kryptischen Stack-Trace aus meinen Logs zu erklären. Die Produktivitätsgewinne stellten sich sofort ein. Ich hielt nie inne, um das Vertrauensmodell der Daten zu hinterfragen, die der Agent konsumierte. Wie viele Sicherheitsexperten ging ich davon aus, dass der Agent in einer Sandbox operiert, die die Grenzen meines Rechners respektiert. Die Entdeckung von Agentjacking durch Tenet Security beweist, dass diese Annahme ein gefährliches Versäumnis in der modernen Softwareentwicklung ist.
Agentjacking ist eine neue Klasse von Angriffen, die die Art und Weise ausnutzen, wie KI-Codierungsagenten Informationen von externen Diensten verarbeiten. Es ermöglicht einem Angreifer, beliebigen Code auf dem Rechner eines Entwicklers auszuführen, indem er bösartige Daten in Tools einspeist, denen der Agent vertraut. In diesem spezifischen Szenario nutzten die Forscher Sentry, eine beliebte Plattform zur Fehlerverfolgung. Der Exploit erfordert keinen Einbruch in die Server von Sentry oder die Infrastruktur des Entwicklers. Er beruht vollständig auf der Architektur, wie KI-Agenten strukturierte Daten über das Model Context Protocol interpretieren.
Im Zentrum dieser Schwachstelle steht ein grundlegendes Paradoxon im Design von KI-Agenten. Diese Agenten sind darauf ausgelegt, hilfreich und proaktiv zu sein und in der Lage zu sein, auf der Grundlage des technischen Kontexts Maßnahmen zu ergreifen. Wenn Sie eine KI bitten, einen Fehler zu beheben, sucht sie oft nach Datenquellen, die Hinweise darauf geben, was schiefgelaufen ist. Sentry ist eine solche Quelle. Es sammelt Fehlerberichte von Anwendungen und präsentiert sie Entwicklern zur Analyse. Um dies zu erleichtern, verwenden viele KI-Agenten das Model Context Protocol, um Sentry abzufragen und aktuelle Fehlerereignisse abzurufen.
Aus Risikoperspektive besteht das Problem darin, dass der KI-Agent keine Möglichkeit hat, die Quelle eines Fehlerberichts zu verifizieren. Er behandelt jedes vom Sentry-Server zurückgegebene Ereignis als vertrauenswürdige Systemausgabe. Ein Angreifer kann dies ausnutzen, indem er einen gefälschten Fehlerbericht direkt an den Sentry-Endpunkt eines Unternehmens sendet. Dies ist möglich, weil Sentry einen Data Source Name (DSN) verwendet, bei dem es sich um ein öffentliches Write-Only-Credential handelt. Sie finden diese DSNs eingebettet im Quellcode von Millionen von Websites und Client-seitigen Anwendungen. Da der DSN öffentlich sein muss, damit Frontend-Apps Fehler melden können, kann jeder, der die Zeichenfolge besitzt, Daten an dieses Sentry-Projekt senden.
Wenn der KI-Agent Sentry über das Protokoll abfragt, erhält er neben legitimen Berichten auch den bösartigen Fehlerbericht des Angreifers. Der Agent interpretiert die Anweisungen innerhalb dieses gefälschten Berichts als Diagnoseschritte oder Anleitung zur Fehlerbehebung. Er führt diese Anweisungen dann mit den vollen Privilegien des Entwicklers aus. Dies ist ein Zusammenbruch der CIA-Triade, der sich insbesondere auf die Integrität des Systems und die Vertraulichkeit der Daten des Entwicklers auswirkt.
Um die Angriffskette zu verstehen, müssen wir uns ansehen, wie sich Daten aus dem öffentlichen Internet in das private Terminal eines Entwicklers bewegen. Der Prozess beginnt damit, dass der Angreifer den Sentry-DSN eines Ziels ausfindig macht. Dies ist keine schwierige Aufgabe. Viele Organisationen legen diese Schlüssel versehentlich in ihren Produktions-JavaScript-Bundles oder öffentlichen Repositories offen. Sobald der Angreifer den DSN hat, verwendet er eine Standard-POST-Anfrage, um ein manipuliertes Fehlerereignis an den Sentry-Ingest-Endpunkt zu senden.
Dieses Ereignis ist keine einfache Zeichenfolge. Die Forscher fanden heraus, dass die Verwendung spezifischer Markdown-Formatierungen innerhalb der Nachrichtenfelder und Kontextschlüssel ausreicht, um den KI-Agenten auszutricksen. Der Angreifer formatiert die Payload so, dass sie exakt wie ein legitimes Sentry-System-Template aussieht. Wenn ein Entwickler seinen KI-Assistenten bittet, ungelöste Sentry-Probleme zu beheben, ruft der Assistent dieses bösartige Ereignis ab.
Der KI-Agent sieht eine Nachricht, die wie ein technischer Fehler aussieht, und eine Reihe von Anweisungen zu dessen Behebung. Diese Anweisungen könnten den Agenten anweisen, ein Skript auszuführen, um Umgebungsvariablen zu prüfen oder eine Konfigurationsdatei zu aktualisieren. Da der Agent glaubt, einen vertrauenswürdigen Lösungsschritt aus einem Diagnosetool zu lesen, führt er den Befehl aus. Hinter den Kulissen könnte dieser Befehl Git-Zugangsdaten, private Repository-URLs oder sensible Umgebungsvariablen exfiltrieren. Der Angriff ist unauffällig, weil der Entwickler sieht, dass der Agent genau das tut, was von ihm verlangt wurde: einen Fehler beheben.
Diese Angriffsfläche ist besonders problematisch, da sie fast jede Schicht des modernen Security-Stacks umgeht. Ein EDR oder eine Firewall sucht nach bösartigen Signaturen oder unbefugten Verbindungen. In einem Agentjacking-Szenario ist jede Aktion in der Kette autorisiert. Der Sentry-Server ist autorisiert, Daten zu empfangen. Der KI-Agent ist autorisiert, Sentry abzufragen. Der Entwickler hat den Agenten autorisiert, Code auf seinem Rechner auszuführen.
Es gibt keine Malware im herkömmlichen Sinne zu erkennen. Die bösartige Absicht ist in der Logik der Anweisung vergraben, nicht in der Binärdatei eines Files. Die Bewertung der Angriffsfläche zeigt, dass der KI-Agent selbst das schwächste Glied ist. Er fungiert als digitales Trojanisches Pferd, das unvertrauenswürdige Daten aus dem öffentlichen Internet in eine hochprivilegierte Umgebung bringt. Proaktiv gesprochen helfen Tools wie Web Application Firewalls oder Identity and Access Management hier nicht weiter, da der Angreifer niemals die interne Infrastruktur des Opfers berührt. Er interagiert lediglich mit einem öffentlichen Ingest-Punkt, der dafür ausgelegt ist, Daten von der ganzen Welt zu akzeptieren.
Als Tenet Security diese Ergebnisse an Sentry meldete, war die Reaktion vielsagend. Sentry erkannte das Problem an, erklärte jedoch, dass es technisch nicht vertretbar sei. Dies ist eine häufige Situation in der Welt des API-Designs und der öffentlichen Ingest-Punkte. Wenn ein Dienst darauf ausgelegt ist, Daten von jedem Client zu akzeptieren, kann er nicht einfach zwischen einem echten Absturz und einer bösartigen Injektion unterscheiden, ohne seine Hauptfunktion zu beeinträchtigen. Obwohl Sentry einen globalen Inhaltsfilter implementiert hat, um spezifische Payload-Strings zu blockieren, ist dies eine reaktive Maßnahme. Angreifer werden wahrscheinlich neue Wege finden, ihr Markdown zu formatieren, um solche Filter zu umgehen.
Die Forscher testeten diesen Angriff bei über 100 Organisationen und erzielten eine Erfolgsquote von 85 %. Sie fanden mindestens 2.388 Organisationen mit exponierten und injizierbaren DSNs. Dies deutet darauf hin, dass die Schwachstelle in der gesamten Branche verbreitet ist. Sie ist nicht auf ein einzelnes Tool oder ein spezifisches KI-Modell beschränkt. Es ist ein systemisches Problem damit, wie wir autonome Agenten bauen, die mit externen Datenquellen interagieren. Wir geben diesen Agenten im Wesentlichen einen VIP-Pass für unsere sensibelsten Systeme, ohne dass ein Türsteher am Eingang die Ausweise kontrolliert.
Als Gegenmaßnahme müssen Unternehmen neu überdenken, wie sie KI-Agenten die Interaktion mit Drittanbieterdiensten erlauben. Abgesehen von Patches ist die effektivste Verteidigung ein Wechsel zu einem Zero-Trust-Modell für den KI-Kontext. Nur weil Daten von einer offiziellen API kommen, bedeutet das nicht, dass diese Daten sicher für die Ausführung sind.
Entwickler sollten bei jedem KI-Agenten vorsichtig sein, der die Erlaubnis anfordert, beliebigen Code ohne manuelle Aufsicht auszuführen. Wenn Sie Tools wie Claude Code oder Cursor verwenden, müssen Sie ein hohes Maß an gesunder Paranoia bewahren. Überprüfen Sie die Befehle, die der Agent vorschlägt, bevor Sie die Eingabetaste drücken. Wenn ein Agent eine Lösung für einen Sentry-Fehler vorschlägt, die das Ausführen eines Shell-Skripts beinhaltet, das Sie nicht geschrieben haben, halten Sie inne und verifizieren Sie den Fehler zuerst im Sentry-Dashboard.
Für Unternehmen besteht die Priorität darin, öffentlich zugänglichen Code auf exponierte DSNs zu prüfen. Obwohl Sentry-DSNs nur für Schreibzugriffe gedacht sind, stellen sie eindeutig ein geschäftskritisches Risiko dar, wenn KI-Agenten im Spiel sind. Die Behandlung dieser Schlüssel mit der gleichen Sorgfalt wie ein privater API-Schlüssel ist ein notwendiger Schritt. Folglich sollten Sicherheitsteams ihre Bedrohungsmodelle aktualisieren, um KI-Agenten als potenziellen Ausführungsvektor für externe Daten einzubeziehen.
Um Ihre Entwicklungsumgebung vor Agentjacking und ähnlichen Injektionsangriffen zu schützen, sollten Sie die folgenden Schritte in Betracht ziehen:
Wir befinden uns in einer Phase der rasanten KI-Adoption, in der die Geschwindigkeit der Entwicklung oft die Entwicklung von Sicherheits-Frameworks übertrifft. Agentjacking ist eine Erinnerung daran, dass jede neue Integration einen neuen Pfad für einen Angreifer schafft. Die Agenten, denen wir vertrauen, um unser Leben einfacher zu machen, sind nur so sicher wie die Daten, mit denen wir sie füttern.
Quellen: Tenet Security Research Blog, Sentry Official Documentation, Model Context Protocol Specification, NIST AI Risk Management Framework.
Haftungsausschluss: Dieser Artikel dient nur zu Informations- und Bildungszwecken und ersetzt keinen professionellen Cybersicherheits-Audit oder Incident-Response-Service.



Unsere Ende-zu-Ende-verschlüsselte E-Mail- und Cloud-Speicherlösung bietet die leistungsfähigsten Mittel für den sicheren Datenaustausch und gewährleistet die Sicherheit und den Schutz Ihrer Daten.
/ Kostenloses Konto erstellen