Einen ChatGPT-Agenten zu erstellen klingt nach einer Nachmittagsaufgabe, und für einen ersten Prototyp stimmt das auch. Die eigentliche Frage ist eine andere: Was meint ihr überhaupt mit ChatGPT-Agent? Hinter dem Begriff stecken 2026 mindestens vier völlig verschiedene Werkzeuge, vom No-Code-Custom-GPT bis zum programmierten Agenten über die Schnittstelle. Welches davon das richtige ist, entscheidet sich an zwei Fragen: Wie viel Datenschutz braucht ihr, und soll der Agent dauerhaft skalieren?
Dazu kommt eine Besonderheit, die in fast keinem Tutorial steht: Zwei der scheinbar naheliegenden OpenAI-Wege werden 2026 abgeschaltet. Wer jetzt auf die Assistants API oder den frisch vorgestellten Agent Builder setzt, baut auf einem Fundament mit Ablaufdatum. Dieser Guide nimmt die Perspektive eines IT-Leiters oder Geschäftsführers im Mittelstand ein und zeigt die vier Wege nebeneinander, wie ein erster Agent konkret entsteht, was er kostet und welche rechtlichen Hürden in Deutschland zu beachten sind.
Wer den herstellerunabhängigen Überblick sucht, also den Vergleich zwischen OpenAI, Microsoft und Open-Source-Wegen, findet ihn im Leitfaden KI-Agenten erstellen. Dieser Beitrag geht den OpenAI-Weg konkret durch und ist das Gegenstück zu unserem Microsoft-Guide Copilot Agent erstellen.
OpenAI hat das Feld der Agenten 2025 und 2026 stark umgebaut. Vier Wege sind übrig, die sich in Aufwand, Datenschutz und Skalierbarkeit deutlich unterscheiden. Wer die vier auseinanderhält, trifft die Tool-Entscheidung in fünf Minuten statt nach drei Wochen Sackgasse.

Ein Custom GPT ist eine spezialisierte ChatGPT-Version mit eigenen Anweisungen, hochgeladenem Wissen, aktivierbaren Fähigkeiten und optionalen Aktionen, die externe Schnittstellen aufrufen. Er entsteht in Minuten über Explore GPTs und Create, ganz ohne Code. Bauen können ihn alle Bezahlpläne ab Plus, in der Free-Version geht es nicht. Pro Custom GPT lassen sich bis zu 20 Dateien mit je maximal 512 MB als Wissen hinterlegen. Das ist der schnellste Weg zu einem wiederverwendbaren internen Assistenten.
Der 2025 eingeführte Agent Mode lässt ChatGPT Aufgaben autonom mit einem virtuellen Computer und Browser erledigen: Websites navigieren, Dateien bearbeiten, Formulare ausfüllen, Tabellen pflegen. Eine Aufgabe dauert typischerweise fünf bis dreißig Minuten. Verfügbar ist der Agent Mode ab Plus und Business, nicht in Free oder Go, mit 40 Agenten-Nachrichten pro Monat bei Plus und Business und 400 bei Pro. Für wiederkehrende No-Code-Workflows im Team sind die neueren Workspace Agents gedacht, die sich in natürlicher Sprache definieren lassen und 2026 der empfohlene No-Code-Nachfolger für das eingestellte Agent-Builder-Tool sind.
Wer ein echtes Produkt oder eine skalierende Integration bauen will, nutzt die Responses API zusammen mit dem Open-Source Agents SDK. Die Responses API vereint die früheren Chat Completions und die Assistants API und bringt eingebaute Werkzeuge mit: Websuche, Dateisuche, Code Interpreter, Computer Use für die Steuerung von Browser und Software sowie die Anbindung externer Werkzeuge über das MCP-Protokoll. Das Agents SDK orchestriert dabei mehrere Agenten in einem Workflow und funktioniert sogar mit Fremdmodellen über kompatible Endpunkte.
Der vierte Weg führt aus der reinen OpenAI-Welt heraus. Wer maximale Datenhoheit, Self-Hosting oder Integrationen weit über OpenAI hinaus braucht, kombiniert ein Sprachmodell mit einer Orchestrierungs-Plattform wie n8n. Wer ohnehin in Microsoft 365 lebt, baut den Agenten in Copilot Studio. Beide Wege behandeln wir im Vergleich am Ende dieses Beitrags.
Bevor es ans Bauen geht, eine Warnung, die in den meisten Anleitungen fehlt. Zwei OpenAI-Werkzeuge, die 2025 noch als Zukunft gefeiert wurden, haben 2026 ein festes Ablaufdatum. Wer das nicht weiß, investiert Wochen in eine Lösung, die in wenigen Monaten nicht mehr läuft.
Die Assistants API wurde im August 2025 zum Auslaufen angekündigt und wird am 26. August 2026 abgeschaltet. Nachfolger ist die Responses API, in die sich bestehende Projekte migrieren lassen: Aus Assistants werden Prompts, aus Threads werden Conversations, aus Runs werden Responses. Wer heute neu beginnt, sollte gar nicht erst mit der Assistants API starten.
Noch frischer ist der Fall Agent Builder. Das visuelle No-Code-Workflow-Tool aus dem AgentKit-Bündel wurde erst im Oktober 2025 vorgestellt und im Juni 2026 bereits wieder abgekündigt: Ab dem 30. November 2026 ist es zusammen mit Evals und Reusable Prompts nicht mehr verfügbar. Der empfohlene Weg führt stattdessen zum Agents SDK für Entwickler oder zu Workspace Agents für No-Code. Viele Tutorials aus 2025 feiern noch genau dieses tote Pferd. Für wiederverwendbare No-Code-Agenten bleiben damit Custom GPTs und Workspace Agents, für Code die Responses API mit dem Agents SDK.
Für den Einstieg ist der Custom GPT der pragmatischste Weg. In sechs Schritten steht ein Assistent, der auf eigenes Wissen zugreift und über eine Aktion eine externe Schnittstelle aufruft, etwa das ERP oder das CRM.

Zuerst der Anwendungsfall: Wofür soll der Agent gut sein, und mit welchen Daten arbeitet er? Daraus folgt die Plan-Wahl. Zum reinen Ausprobieren reicht Plus. Sobald echte Firmen- oder Kundendaten ins Spiel kommen, braucht es mindestens Business, besser Enterprise, und einen abgeschlossenen Auftragsverarbeitungsvertrag. Mehr dazu im Datenschutz-Abschnitt.
Im Configure-Tab werden Rolle, Tonalität, klare Do's und Don'ts und das gewünschte Ausgabeformat definiert. Je präziser die Anweisungen, desto verlässlicher der Agent. Vage Beschreibungen sind die häufigste Ursache für enttäuschende Ergebnisse.
Relevante Dokumente kommen als Knowledge dazu, bis zu 20 Dateien. Wichtig: In einen geteilten oder öffentlichen Custom GPT gehören keine personenbezogenen Daten und keine Mandanteninformationen. Kleine, aktuelle Wissensdateien schlagen große, veraltete Sammlungen.
Eine Aktion verbindet den Agenten über ein OpenAPI-Schema mit einer externen Schnittstelle, abgesichert per API-Schlüssel oder OAuth. So kann der Agent etwa Artikelverfügbarkeiten im ERP abfragen. OpenAI bietet einen eigenen Helfer, der aus einer Beschreibung das passende Schema erzeugt.
Nur die wirklich nötigen Fähigkeiten aktivieren, denn jede zusätzlich aktivierte Funktion wie Websuche oder Code Interpreter kostet Latenz. Anschließend im Vorschau-Bereich gründlich testen, auch mit schwierigen und unerwarteten Eingaben.
Zum Schluss die richtige Sichtbarkeit wählen: privat, im Firmen-Workspace, per Link oder im GPT Store. Der öffentliche Store erfordert ein verifiziertes Profil und eine Privacy-Policy für Aktionen. Für die meisten Mittelständler ist das Teilen im eigenen Workspace die richtige Wahl.
Die Plan-Wahl entscheidet nicht nur über die Kosten, sondern auch darüber, ob Agenten überhaupt baubar und datenschutzkonform einsetzbar sind. Eine wichtige Umbenennung vorweg: Der frühere Team-Plan heißt jetzt Business.

| Plan | Preis | Agenten bauen? |
|---|---|---|
| Free | 0 EUR | Keine GPT-Erstellung, kein Agent Mode |
| Go | rund 8 EUR / Monat | Keine GPT-Erstellung, kein Agent Mode |
| Plus | rund 23 EUR / Monat | Custom GPTs und Agent Mode (40 Nachrichten / Monat) |
| Pro | rund 229 EUR / Monat | Alles, Agent Mode mit 400 Nachrichten / Monat |
| Business | rund 29 bis 34 EUR / Nutzer | Shared Workspace, firmenweit teilen, Workspace Agents, kein Training auf Kundendaten |
| Enterprise / Edu | auf Anfrage | Alles plus SSO, EU-Data- und Inference-Residency, Zero-Data-Retention-Option |
Für den Entwickler-Weg über die API zählt nicht der Seat-Preis, sondern der Tokenverbrauch. Die Modell-Landschaft ist 2026 zu GPT-5.4 und GPT-5.5 weitergewandert. GPT-5.4 liegt bei etwa 2,50 US-Dollar je Million Eingabe-Token und 15 US-Dollar je Million Ausgabe-Token, das kleinere GPT-5.4 mini deutlich darunter. Dazu kommen Werkzeugkosten: Websuche kostet rund 10 US-Dollar je 1.000 Aufrufe, die Dateisuche rund 2,50 US-Dollar je 1.000 Aufrufe plus Speicher. Prompt-Caching senkt die Kosten für wiederkehrende Eingaben deutlich.
Wer die Vollkostenrechnung für ein vergleichbares Microsoft-Szenario sucht, findet sie im Kosten-Guide zu Microsoft 365 Copilot, und den breiteren Tool-Vergleich im Deep-Dive zu ChatGPT Enterprise.
Hier entscheidet sich, ob ein ChatGPT-Agent im deutschen Mittelstand wirklich produktiv gehen darf. Die Plattform ist nutzbar, aber nur mit der richtigen Plan-Wahl und sauberer Konfiguration. Dieser Abschnitt ist das Kernstück.

Free und Plus sind für die geschäftliche Verarbeitung personenbezogener Daten nicht geeignet, weil in diesen Plänen Daten standardmäßig fürs Training genutzt werden können und kein passender Vertragsrahmen besteht. Erst ab Business, sowie bei Enterprise und der API, ist OpenAI sauber als Auftragsverarbeiter im Sinne von Artikel 28 DSGVO einsetzbar und trainiert standardmäßig nicht auf euren Daten. Der Auftragsverarbeitungsvertrag muss vor der ersten Verarbeitung personenbezogener Daten abgeschlossen sein, er enthält die EU-Standardvertragsklauseln für den US-Transfer.
Seit Februar 2025 bietet OpenAI Data Residency in Europa für ChatGPT Enterprise, Edu und die API-Plattform, die Daten ruhen dann in der Region. Seit Januar 2026 gilt zusätzlich die Inference Residency: Auch die Verarbeitung auf den GPUs bleibt in Europa. Wichtig zu wissen ist, dass diese Wahl nur Enterprise und Edu sowie neu angelegten API-Projekten offensteht. Plus, Go und Business haben keine Residency-Option. Zero Data Retention, also der Verzicht auf die sonst 30-tägige Aufbewahrung, ist ebenfalls Enterprise- und API-Kunden vorbehalten und kein Self-Service-Schalter.
Für Steuerkanzleien, Anwälte und Ärzte reicht ein Auftragsverarbeitungsvertrag allein nicht aus. Wer einem externen Anbieter geschützte Mandanten- oder Patientendaten offenbart, braucht zusätzlich eine berufsrechtliche Verschwiegenheitsverpflichtung mit Belehrung über die strafrechtlichen Folgen nach §203 StGB. Ohne diese Konstellation kann schon das Hochladen sensibler Daten strafbar sein. In der Praxis heißt das für Mandantendaten oft: eine spezialisierte, berufsrechtskonforme Lösung statt eines normalen Custom GPT. Wie Kanzleien das strukturieren, vertieft unser Beitrag KI für Steuerberater.
Ab dem 2. August 2026 greifen die Transparenzpflichten nach Artikel 50 des EU AI Act. Nutzer müssen darüber informiert werden, dass sie mit einer KI interagieren, und KI-generierte Inhalte müssen maschinenlesbar gekennzeichnet sein. Der sogenannte Digital Omnibus verschiebt zwar einige Hochrisiko-Pflichten auf Ende 2027, lässt die Transparenz- und Kennzeichnungsfristen aber unverändert. Für einen Agenten, der etwa Kundenmails entwirft, ist das praktisch relevant. Weitere Tiefe zum Thema bietet unser Überblick zu DSGVO-konformen KI-Tools.
Konkret wird der Nutzen erst an echten Aufgaben. Im Großhandel sind das vor allem Assistenten rund um Angebot, Bestellung und Produkt.
Ein Angebots-Assistent als Custom GPT bekommt Preislisten und Konditionen als Wissen und eine Aktion gegen das ERP oder PIM, und erstellt daraus Angebotsentwürfe. Eine Bestell-Triage klassifiziert eingehende Bestellmails und PDFs, extrahiert die relevanten Felder und bereitet sie für die Auftragserfassung vor. Ein Datenblatt-Assistent beantwortet dem Innendienst technische Rückfragen aus hinterlegten Produktdokumenten. Wie sich der gesamte Bestell- und Auftragsprozess automatisieren lässt, zeigt unser Leitfaden KI-Agenten mit n8n erstellen.
In der Steuerkanzlei entlasten Agenten bei der E-Mail-Klassifikation und bei Antwortentwürfen im Kanzleistil sowie bei der Dokumenten-Recherche auf internen Leitfäden und Gesetzen. Entscheidend bleibt die Trennlinie aus dem Datenschutz-Abschnitt: Mandantendaten gehören nicht in einen einfachen Custom GPT auf Plus-Basis, sondern brauchen den §203-konformen Rahmen.
Am Ende läuft alles auf eine Entscheidung hinaus. Die folgende Übersicht und die Matrix darunter helfen, den passenden Weg zu finden, ohne sich zu verzetteln.

| Weg | Code nötig | Am besten für |
|---|---|---|
| Custom GPT | Nein | Schneller interner Assistent |
| Workspace Agents | Nein | Wiederkehrender No-Code-Workflow im Team |
| Responses API plus Agents SDK | Ja | Produkt, volle Kontrolle, Skalierung |
| Copilot Studio | Wenig | Microsoft-365-Häuser mit Governance |
| n8n und eigenes LLM | Wenig bis mittel | Self-Hosting, DSGVO-Maximum, mehrere Modelle |
Als Faustregel: Zum Ausprobieren und für interne Helfer ein Custom GPT, für wiederkehrende Team-Workflows die Workspace Agents, für ein echtes Produkt die Responses API mit dem Agents SDK. Wer in Microsoft 365 lebt, ist mit Copilot Studio besser bedient, und wer maximale Datenhoheit oder mehrere Modelle braucht, mit einem Eigenbau nach Engineering-Bauplan.
Einen ChatGPT-Agenten zu erstellen ist 2026 keine Entwicklungsaufgabe mehr, sondern eine Frage der richtigen Entscheidung. Der schnellste Weg zum ersten Nutzen ist ein Custom GPT mit einer klar umrissenen Aufgabe, einer kleinen sauberen Wissensquelle und einer Pilotgruppe. Skalierung und tiefe Integration kommen danach über die Responses API.
Zwei Dinge entscheiden über Erfolg oder teuren Fehlstart: die Plan-Wahl mit Blick auf Datenschutz und das Wissen, welche Wege OpenAI gerade abschaltet. Wer auf Assistants API oder Agent Builder setzt, baut auf Sand. Wer Plus mit echten Kundendaten füttert, riskiert einen Datenschutzverstoß.
Ihr wollt den ersten Agenten nicht allein aufsetzen, sondern mit einem Partner, der den Weg von Scoping über Datenschutz bis zum produktiven Betrieb kennt? Sprecht uns an, und wir skizzieren gemeinsam den passenden Einstieg.
Hier finden Sie die Antworten auf häufig gestellte Fragen.
Nein, für einen Custom GPT oder die Workspace Agents nicht. Beide werden in natürlicher Sprache beschrieben, Wissen und Aktionen kommen über die Oberfläche dazu. Erst der Weg über die Responses API und das Agents SDK setzt Entwicklungskenntnisse voraus.
Custom GPTs und den Agent Mode gibt es ab Plus. Zum firmenweiten Teilen und für den datenschutzkonformen Einsatz mit Kundendaten braucht es mindestens Business, besser Enterprise. In Free und Go lassen sich keine Agenten erstellen.
Ja. Die Assistants API wird am 26. August 2026 abgeschaltet, Nachfolger ist die Responses API. Auch der 2025 vorgestellte Agent Builder wird zum 30. November 2026 eingestellt. Wer neu beginnt, sollte direkt auf die Responses API mit dem Agents SDK oder auf Workspace Agents setzen.
Mit der richtigen Plan-Wahl und Konfiguration ja. Nötig sind mindestens Business, ein vor der Verarbeitung abgeschlossener Auftragsverarbeitungsvertrag und die Beachtung der Training-Defaults. Echte EU-Datenhaltung samt Inference Residency gibt es nur bei Enterprise und Edu sowie für neue API-Projekte.
Nur unter strengen Bedingungen. Wegen §203 StGB reicht ein Auftragsverarbeitungsvertrag nicht aus, es braucht zusätzlich eine berufsrechtliche Verschwiegenheitsverpflichtung mit Strafbelehrung. In der Praxis sind für Mandantendaten oft spezialisierte, berufsrechtskonforme Lösungen statt eines einfachen Custom GPT die sichere Wahl.