Einen Google-KI-Agenten zu erstellen klingt nach einer Nachmittagsaufgabe, und für ein erstes Gem stimmt das auch. Die eigentliche Frage ist eine andere: Was meint ihr überhaupt mit Google-Agent? Hinter dem Begriff stecken 2026 mindestens vier völlig verschiedene Werkzeuge, vom No-Code-Gem in der Gemini-App bis zum programmierten Agenten im Agent Development Kit. Welches davon das richtige ist, entscheidet sich an zwei Fragen: Wie viel Datenschutz braucht ihr, und soll der Agent dauerhaft skalieren?
Dazu kommt eine Besonderheit, die in fast keinem Tutorial steht: Google hat seine Agenten-Marken 2025 und 2026 komplett umgebaut. Aus Vertex AI wurde die Gemini Enterprise Agent Platform, aus Google Agentspace wurde Gemini Enterprise, und die alte Dialogflow-Welt ist in eine neue Konsole gewandert. Wer jetzt ein zwei Jahre altes Tutorial googelt, baut auf Markennamen, die es so nicht mehr gibt. Dieser Guide nimmt die Perspektive eines IT-Leiters oder Geschäftsführers im Mittelstand ein und zeigt die vier Wege nebeneinander, wie ein erster Agent konkret entsteht, was er kostet und welche rechtlichen Hürden in Deutschland zu beachten sind.
Wer den herstellerunabhängigen Überblick sucht, also den Vergleich zwischen Google, OpenAI und Microsoft, findet ihn im Leitfaden KI-Agenten erstellen. Dieser Beitrag geht den Google-Weg konkret durch und ist das Gegenstück zu unseren Guides ChatGPT Agent erstellen und Copilot Agent erstellen.
Google hat das Feld der Agenten 2025 und 2026 stark umgebaut. Vier Wege sind übrig, die sich in Aufwand, Datenschutz und Skalierbarkeit deutlich unterscheiden. Wer die vier auseinanderhält, trifft die Tool-Entscheidung in fünf Minuten statt nach drei Wochen Sackgasse.

Ein Gem ist eine gespeicherte, wiederverwendbare Gemini-Version mit eigenem Namen, festen Anweisungen, optionalem Standard-Werkzeug und hochgeladenem Wissen. Es ist das Google-Pendant zu einem Custom GPT und entsteht in Minuten über das Profilmenü und den Punkt Gems, ganz ohne Code. Pro Gem lassen sich bis zu zehn Dateien als Wissen hinterlegen oder Google-Drive-Dokumente verknüpfen. Geteilte und vorgefertigte Gems sind auch in der kostenlosen Version nutzbar, für das volle Kontextfenster und höhere Limits braucht es einen Bezahlplan. Das ist der schnellste Weg zu einem wiederverwendbaren internen Assistenten.
Gemini Enterprise, bis Oktober 2025 als Google Agentspace bekannt, ist die Plattform für Agenten auf Unternehmensebene. Hier baut und orchestriert man Agenten in natürlicher Sprache über eine No-Code Workbench, nutzt vorgefertigte Google-Agenten wie Deep Research und durchsucht Firmendaten quer über Google Workspace, Microsoft 365, Salesforce und SAP. Dazu kommt ein zentrales Governance-Framework. Google-Cloud-Chef Thomas Kurian nennt es die neue Eingangstür für KI am Arbeitsplatz. Gedacht ist das für Organisationen, die Agenten kontrolliert und abteilungsübergreifend ausrollen wollen.
Wer ein echtes Produkt oder eine skalierende Integration bauen will, nutzt das Agent Development Kit (ADK) zusammen mit der Agent Engine. Das ADK ist ein quelloffenes, code-first Framework, das 2025 auf der Google I/O vorgestellt wurde und 2026 in Python, Java, TypeScript, Go und Kotlin verfügbar ist. Es orchestriert mehrere Agenten in sequenziellen, parallelen oder graphbasierten Workflows und unterstützt sowohl das Model Context Protocol (MCP) zum Anbinden externer Werkzeuge als auch das offene Agent2Agent-Protokoll (A2A) für die Zusammenarbeit von Agenten verschiedener Anbieter. Die Agent Engine ist die vollständig gemanagte, serverlose Runtime, die den fertigen Agenten in Produktion deployt und skaliert, samt Sitzungsverwaltung und Langzeitgedächtnis.
Zwischen No-Code und vollem Framework liegt der leichte Programmier-Einstieg. In Google AI Studio prototypt man im Browser kostenlos gegen die Gemini-Modelle und exportiert mit einem Klick den passenden API-Code. Die Gemini API bringt die Bausteine eines Agenten direkt mit: Function Calling zum Aufrufen externer Systeme, Grounding mit der Google-Suche für aktuelles Wissen, Code Execution und Datei-Upload. Der empfohlene Pfad lautet: in AI Studio ausprobieren, für Skalierung und Compliance später auf Vertex AI umziehen. Ein fünfter Weg führt ganz aus der Google-Welt heraus, der Eigenbau mit einer Orchestrierungs-Plattform wie n8n, den wir am Ende einordnen.
Bevor es ans Bauen geht, eine Warnung, die in den meisten Anleitungen fehlt. Google hat seine Agenten-Produkte 2025 und 2026 so umfassend umbenannt, dass fast jedes ältere Tutorial veraltete Begriffe nutzt. Wer das nicht weiß, sucht nach Menüpunkten, die es nicht mehr gibt, oder setzt auf eine Marke mit Ablaufdatum.

Die wichtigste Umbenennung betrifft Vertex AI. Auf der Google Cloud Next im April 2026 wurde die Plattform zur Gemini Enterprise Agent Platformweiterentwickelt. Technisch ist es dieselbe Plattform, der Name Vertex AI verschwindet aber zunehmend aus der Oberfläche. Parallel wurde Google Agentspace im Oktober 2025 zu Gemini Enterprise. Wichtig zu wissen: Das sind zwei verschiedene Dinge mit ähnlichem Namen. Gemini Enterprise ist die Workspace-nahe No-Code-Plattform, die Gemini Enterprise Agent Platform ist der Cloud- und Entwickler-Stack.
Dazu kommen echte Abkündigungen. Die Konsole von Dialogflow CX wurde Ende Oktober 2025 abgeschaltet, Nutzer landen jetzt in der zusammengeführten Konsole für Conversational Agents. Wichtig: Nur die Authoring-Oberfläche ist betroffen, die Programmierschnittstelle und bestehende Agenten laufen weiter. Echt tot ist dagegen die alte PaLM API, die bereits 2024 sowohl als Consumer- als auch als Vertex-Variante abgeschaltet wurde. Wer heute neu beginnt, sollte sich an den vier aktuellen Wegen orientieren und keine Zeit in Agentspace, Vertex AI Conversation oder den Generative AI App Builder investieren, denn all das wurde in die neuen Marken überführt.
Für den Einstieg ist das Gem der pragmatischste Weg. In sechs Schritten steht ein Assistent, der auf eigenes Wissen zugreift und im Team geteilt werden kann.

Zuerst die Datenschutz-Ebene klären, denn sie entscheidet alles Weitere. Zum reinen Ausprobieren ohne sensible Daten reicht ein Gem in der persönlichen Gemini-App. Sobald echte Firmendaten ins Spiel kommen, gehört der Agent in eine Gemini-Umgebung über Google Workspace oder gleich auf Vertex AI. Mehr dazu im Datenschutz-Abschnitt.
Über das Profilmenü den Punkt Gems öffnen und ein neues Gem anlegen. Name und kurze Beschreibung geben dem Agenten seinen Zweck und machen ihn im Team auffindbar.
In den Instructions werden Rolle, Tonalität, klare Do's und Don'ts und das gewünschte Ausgabeformat definiert. Je präziser die Anweisungen, desto verlässlicher der Agent. Ein Wand-Symbol lässt Gemini die Anweisungen auf Wunsch selbst verfeinern. Vage Beschreibungen sind die häufigste Ursache für enttäuschende Ergebnisse.
Relevante Dokumente kommen als Knowledge dazu, bis zu zehn Dateien pro Gem, alternativ als Verknüpfung auf Google Drive. Wichtig: In ein geteiltes Gem gehören keine personenbezogenen Daten und keine Mandanteninformationen, denn geteilte Gems folgen den Freigaberegeln von Drive. Kleine, aktuelle Wissensdateien schlagen große, veraltete Sammlungen.
Bei Bedarf ein Standard-Werkzeug festlegen, etwa Deep Research oder die Bildgenerierung, und das Gem anschließend in der Vorschau gründlich testen, auch mit schwierigen und unerwarteten Eingaben. Erst wenn die Antworten verlässlich passen, geht es weiter.
Zum Schluss die richtige Sichtbarkeit wählen: privat oder im Workspace geteilt. In der Firmenumgebung gelten die Drive-Freigaberegeln, und Administratoren können das Teilen von Gems organisationsweit steuern. Für die meisten Mittelständler ist das Teilen im eigenen Workspace die richtige Wahl.
Die Plan-Wahl entscheidet nicht nur über die Kosten, sondern auch darüber, ob ein Agent überhaupt datenschutzkonform mit Firmendaten arbeiten darf. Eine gute Nachricht vorweg: Seit Januar 2025 ist Gemini fest in die Google-Workspace-Tarife eingebündelt, die früheren Gemini-Add-ons sind weggefallen.

| Plan | Preis | Für Agenten |
|---|---|---|
| Gemini Free | 0 EUR | Geteilte und vorgefertigte Gems nutzen |
| Google AI Pro | rund 20 US-Dollar / Monat | Eigene Gems, großes Kontextfenster, höhere Limits |
| Google AI Ultra | rund 100 US-Dollar / Monat | Top-Tier mit höchsten Limits |
| Workspace Business Standard | 13,60 EUR / Nutzer / Monat | Gemini in allen Apps, kein Training auf euren Daten |
| Gemini Enterprise | auf Anfrage, plus Compute | No-Code Workbench, firmenweite Agenten, Governance |
Für den Entwickler-Weg über die API zählt nicht der Seat-Preis, sondern der Verbrauch. Bei den Gemini-Modellen liegt das schnelle Flash-Modell deutlich günstiger als das leistungsstärkere Pro-Modell, gerechnet wird je Million Token für Ein- und Ausgabe. Prompt-Caching und die asynchrone Batch-Verarbeitung senken die Kosten für wiederkehrende Aufgaben spürbar. Dazu kommen Werkzeugkosten: Das Grounding mit der Google-Suche ist bis zu einer monatlichen Freimenge kostenlos und wird danach je tausend Abfragen berechnet. Die Agent Engine als Runtime rechnet nach belegter Rechen- und Speicherzeit ab, eine einzelne Interaktion kann also mehrere Kostenarten gleichzeitig auslösen. Wer die Vollkostenrechnung für ein vergleichbares Microsoft-Szenario sucht, findet sie im Kosten-Guide zu Microsoft 365 Copilot.
Hier entscheidet sich, ob ein Google-Agent im deutschen Mittelstand wirklich produktiv gehen darf. Die Plattform ist nutzbar, aber nur auf der richtigen Ebene und mit sauberer Konfiguration. Dieser Abschnitt ist das Kernstück.

Der wichtigste Punkt zuerst, weil ihn kaum ein Tutorial sauber erklärt: Bei Google-KI gibt es drei klar getrennte Ebenen. In der persönlichen Gemini-App werden Eingaben gespeichert, ein Teil der Chats wird von Menschen zur Modellverbesserung überprüft, und solche Konversationen bleiben bis zu drei Jahre erhalten. Diese Ebene ist für Firmen- und Mandantendaten ungeeignet. Auch der kostenlose Tarif der Gemini API erlaubt Google, Eingaben zur Produktverbesserung zu nutzen. Erst auf der dritten Ebene, bei Vertex AI und dem bezahlten API-Tarif, gilt die klare Zusage: keine Nutzung eurer Daten fürs Training, weder der Eingaben noch der Antworten. Das ist die einzige Ebene, die für den produktiven Einsatz mit echten Geschäftsdaten in Frage kommt.
Auf der Cloud-Ebene wird Google sauber zum Auftragsverarbeiter im Sinne von Artikel 28 DSGVO, geregelt über das Cloud Data Processing Addendum, das fest im Google-Cloud-Vertrag verankert ist. Für den US-Transfer ist Google unter dem EU-US Data Privacy Framework zertifiziert und hält zusätzlich die Standardvertragsklauseln bereit. Entscheidend für deutsche Firmen ist der Datenstandort: In Vertex AI lassen sich europäische Regionen wie Frankfurt oder die Niederlande wählen, in denen die Daten nicht nur ruhen, sondern für die gelisteten Gemini-Modelle auch verarbeitet werden, ohne US-Server zu berühren. Wer noch strenger arbeiten muss, etwa im öffentlichen Sektor, findet mit der von T-Systems betriebenen Sovereign Cloud eine in Deutschland souverän gehostete Variante.
Für Steuerkanzleien, Anwälte und Ärzte reicht ein Auftragsverarbeitungsvertrag allein nicht aus. Wer einem externen Anbieter geschützte Mandanten- oder Patientendaten offenbart, braucht zusätzlich eine berufsrechtliche Verschwiegenheitsverpflichtung mit Belehrung über die strafrechtlichen Folgen nach §203 StGB, und zwar in Textform. Ohne diese Konstellation kann schon das Hochladen sensibler Daten strafbar sein. In der Praxis heißt das: Mandantendaten gehören auf die Vertex-AI-Ebene ohne Training, ergänzt um die §203-Vereinbarung, niemals in ein einfaches Gem in der Consumer-App. Wie Kanzleien das strukturieren, vertieft unser Beitrag KI für Steuerberater.
Ab dem 2. August 2026 greifen die Transparenzpflichten nach Artikel 50 des EU AI Act. Nutzer müssen erkennen können, dass sie mit einer KI interagieren, und KI-generierte Inhalte müssen als solche kenntlich sein. Für einen Agenten, der etwa Kundenmails entwirft oder im Chat antwortet, ist das praktisch relevant. Weitere Tiefe zum Thema bietet unser Überblick zu DSGVO-konformen KI-Tools.
Konkret wird der Nutzen erst an echten Aufgaben. Im Großhandel sind das vor allem Assistenten rund um Angebot, Bestellung und Produkt.
Ein Angebots-Assistent als Gem bekommt Preislisten und Konditionen als Wissen und erstellt daraus Angebotsentwürfe. Wo echte Live-Daten gebraucht werden, übernimmt ein ADK-Agent mit Function Calling gegen ERP oder PIM. Eine Bestell-Triage klassifiziert eingehende Bestellmails und PDFs, extrahiert die relevanten Felder und bereitet sie für die Auftragserfassung vor. Ein Datenblatt-Assistent beantwortet dem Innendienst technische Rückfragen aus hinterlegten Produktdokumenten, mit Grounding auf die eigenen Daten. Wie sich der gesamte Bestell- und Auftragsprozess automatisieren lässt, zeigt unser Leitfaden KI-Agenten mit n8n erstellen.
In der Steuerkanzlei entlasten Agenten bei der E-Mail-Klassifikation und bei Antwortentwürfen im Kanzleistil sowie bei der Dokumenten-Recherche auf internen Leitfäden und Gesetzen. Entscheidend bleibt die Trennlinie aus dem Datenschutz-Abschnitt: Mandantendaten gehören nicht in ein einfaches Gem in der Consumer-App, sondern brauchen die Vertex-AI-Ebene und den §203-konformen Rahmen.
Am Ende läuft alles auf eine Entscheidung hinaus. Die folgende Matrix hilft, den passenden Weg zu finden, ohne sich zu verzetteln.

| Weg | Code nötig | Am besten für |
|---|---|---|
| Gemini Gem | Nein | Schneller interner Assistent |
| Gemini Enterprise | Wenig | Firmenweite No-Code-Agenten mit Governance |
| ADK plus Agent Engine | Ja | Produkt, volle Kontrolle, Skalierung |
| Gemini API und AI Studio | Ja, leicht | Prototyp und leichte Integration |
| n8n und eigenes LLM | Wenig bis mittel | Self-Hosting, DSGVO-Maximum, mehrere Modelle |
Als Faustregel: Zum Ausprobieren und für interne Helfer ein Gem, für firmenweite No-Code-Agenten mit Governance Gemini Enterprise, für ein echtes Produkt das ADK mit der Agent Engine und für den leichten Code-Einstieg die Gemini API. Wer maximale Datenhoheit, Self-Hosting oder mehrere Modelle nebeneinander braucht, ist mit einem Eigenbau nach Engineering-Bauplan besser bedient.
Einen Google-Agenten zu erstellen ist 2026 keine Entwicklungsaufgabe mehr, sondern eine Frage der richtigen Entscheidung. Der schnellste Weg zum ersten Nutzen ist ein Gem mit einer klar umrissenen Aufgabe, einer kleinen sauberen Wissensquelle und einer Pilotgruppe. Skalierung und tiefe Integration kommen danach über das ADK und die Agent Engine.
Zwei Dinge entscheiden über Erfolg oder teuren Fehlstart: die Wahl der Datenschutz-Ebene und das Wissen um die aktuellen Markennamen. Wer ein altes Tutorial zu Agentspace oder Vertex AI Conversation befolgt, sucht nach Menüs, die es nicht mehr gibt. Wer ein Gem in der Consumer-App mit echten Kundendaten füttert, riskiert einen Datenschutzverstoß.
Ihr wollt den ersten Agenten nicht allein aufsetzen, sondern mit einem Partner, der den Weg von Scoping über Datenschutz bis zum produktiven Betrieb kennt? Sprecht uns an, und wir skizzieren gemeinsam den passenden Einstieg.
Hier finden Sie die Antworten auf häufig gestellte Fragen.
Nein, für ein Gemini Gem oder die No-Code-Workbench in Gemini Enterprise nicht. Beide werden in natürlicher Sprache beschrieben, Wissen und Werkzeuge kommen über die Oberfläche dazu. Erst der Weg über das Agent Development Kit und die Agent Engine setzt Entwicklungskenntnisse voraus.
Trotz ähnlichem Namen sind das zwei verschiedene Dinge. Gemini Enterprise, früher Google Agentspace, ist die Workspace-nahe No-Code-Plattform für firmenweite Agenten. Die Gemini Enterprise Agent Platform ist der umbenannte Vertex-AI-Stack für Entwickler, auf dem man mit dem ADK programmiert und über die Agent Engine deployt.
Geteilte und vorgefertigte Gems lassen sich auch in der kostenlosen Gemini-Version nutzen. Für das volle Kontextfenster, höhere Limits und das datenschutzkonforme Arbeiten mit Firmendaten empfiehlt sich ein Bezahlplan, idealerweise Gemini über Google Workspace, weil dort keine Daten fürs Training genutzt werden.
Auf der richtigen Ebene ja. Vertex AI und der bezahlte API-Tarif trainieren standardmäßig nicht auf euren Daten, Google wird über das Cloud Data Processing Addendum zum Auftragsverarbeiter, und es lassen sich EU-Regionen wählen, in denen die Daten auch verarbeitet werden. Die persönliche Gemini-App und der kostenlose API-Tarif sind dafür nicht geeignet.
Nur unter strengen Bedingungen. Wegen §203 StGB reicht ein Auftragsverarbeitungsvertrag nicht aus, es braucht zusätzlich eine berufsrechtliche Verschwiegenheitsverpflichtung mit Strafbelehrung in Textform. In der Praxis gehören Mandantendaten auf die Vertex-AI-Ebene ohne Training, niemals in ein einfaches Gem in der Consumer-App.