ChatGPT: Wie OpenAI seine KI-Agenten vor Angriffen schützt

ChatGPT Agent: KI-Tool als „rechte Hand“ der Nutzer:innen. (Foto: Mehaniq/Shutterstock.com)
Am 17. Juli 2025 hat OpenAI mit ChatGPT Agent neue Funktionen für seinen KI-Chatbot vorgestellt. Dazu gehören etwa die E-Mail-Kommunikation, die Analyse großer Datenmengen sowie Buchungen oder Preisüberwachungen.
OpenAI: Maßnahmen zum Schutz von ChatGPT Agent
Das beinhaltet freilich, dass Nutzer:innen dem KI-Tool Zugang zu E-Mail-Konten oder Cloud-Plattformen gewähren müssen. Damit potenzielle Angreifer:innen dies nicht ausnutzen können, hat OpenAI das System mit einer Reihe von Maßnahmen entsprechend gehärtet.
OpenAI habe für ChatGPT Agent die „stärksten Sicherheitsvorkehrungen aktiviert“, so Keren Gu vom Safety Research Team der Firma via X. Wie die Entwickler:innen dabei vorgegangen sind, zeigt die ebenfalls veröffentlichte System-Card von ChatGPT Agent.
Angreifer könnten Infos zu Biowaffen finden
Demnach sei ein eigenes Red Team angesetzt worden, um mögliche Sicherheitslücken aufzuspüren und zu beseitigen. Die Alarmglocken hatten laut Gu wohl vor allem in den Bereichen Biologie und Chemie geschrillt, also der theoretischen Möglichkeit, dass Angreifer:innen sich per ChatGPT Agent Informationen zum Bau von biologischen oder chemischen Waffen besorgen könnten.
Wie Venturebeat berichtet, waren in dem Red Team, das ChatGPT Agent vor der Veröffentlichung auf Herz und Nieren geprüft hat, 16 Sicherheitsexpert:innen mit Doktortitel und Fachwissen in puncto Biosicherheit tätig. Sie hatten jeweils 40 Stunden Zeit, um bestimmte Angriffsversuche zu unternehmen und zu dokumentieren.
Britischer Geheimdienst in Tests involviert
Darüber hinaus mischte auch der britische Geheimdienst AISI mit, der Zugang zu den internen Argumentationsketten und Richtlinientexten von ChatGPT Agent hatte. Die so entdeckten möglichen Schwachstellen wurden von OpenAI daraufhin geschlossen und zusätzliche Sicherheitsebenen eingezogen.
Wenn es etwa um die potenziellen Gefahren durch biologische und chemische Waffen geht, hat OpenAI Warnsysteme eingerichtet, die den erzeugten Traffic nach entsprechenden Inhalten durchforsten. Darüber hinaus kann der OpenAI-Testlauf als Blaupause für Unternehmen in der KI-Branche genutzt werden.
Eingeschränkte Funktionen bei ChatGPT Agent
Auch wegen der Erkenntnisse aus den Sicherheitsüberprüfungen im Vorfeld sind etwa Finanztransaktionen bei ChatGPT Agent derzeit eingeschränkt. Zudem sorgt ein Watch-Mode dafür, dass sensible Seiten nur innerhalb des Agent-Tabs genutzt werden können.
ChatGPT-Nutzer:innen in der EU können den Agent-Modus allerdings ohnehin noch nicht verwenden. Hier steht ein offizieller Starttermin noch aus. Grund dürften die hierzulande geltenden strengeren Datenschutzauflagen sein.