
Wer nach KI-Agenten Beispielen sucht, findet meistens dieselben austauschbaren Listen: zehnmal "spart Zeit", einmal "steigert die Effizienz", kein einziger nachprüfbarer Wert. Dieser Beitrag macht es anders. Er zeigt zwölf konkrete Anwendungsfälle, sortiert nach Abteilung, jeweils mit Auslöser, angebundenen Systemen und echtem Nutzen. Dazu kommen dokumentierte Fallzahlen aus dem deutschsprachigen Raum, drei durchgerechnete ROI-Beispiele und die ehrliche Antwort auf die Frage, die in den meisten Listen fehlt: Wann lohnt sich ein Agent, und wann reicht ein simpler Workflow?
Der Schwerpunkt liegt auf dem Großhandel und dem B2B-Mittelstand mit 50 bis 1.000 Mitarbeitern, weil dort die größten und am schlechtesten dokumentierten Hebel liegen. Wenn Sie nach einem passenden Beispiel den nächsten Schritt gehen wollen, also einen Agenten tatsächlich bauen, finden Sie im Hub KI-Agenten erstellen den tool-agnostischen Vergleich der Plattformen. Hier geht es zuerst um das Was, nicht um das Womit.
Der Begriff KI-Agent ist überladen. Vieles, was als Agent verkauft wird, ist in Wahrheit ein Chatbot oder ein fester Automatisierungs-Workflow. Die Unterscheidung ist nicht akademisch, sie entscheidet über Aufwand, Kosten und Risiko. Eine einfache Faustregel hilft: Ein Chatbot wird erst dann zum Agenten, wenn drei Dinge zusammenkommen.
Erstens Tool-Use, der Agent kann externe Systeme nicht nur lesen, sondern auch beschreiben, also Aufträge im ERP anlegen oder Datensätze im CRM ändern. Zweitens Planung, er zerlegt ein Ziel selbst in Teilschritte, statt eine vorgegebene Reihenfolge abzuarbeiten. Drittens Gedächtnis, sein Zustand überlebt die einzelne Anfrage, sodass mehrstufige Vorgänge über Tage laufen können. Fehlt einer dieser Punkte, reden wir über einen Assistenten oder einen Workflow, nicht über einen Agenten.
Der Kernsatz dazu: Einem Assistenten sagt man, wie etwas zu tun ist. Einem Agenten sagt man nur, was am Ende herauskommen soll. Und jetzt die unbequeme Wahrheit, die in Hype-Artikeln fehlt: Die meisten produktiven "Agenten" im Mittelstand sind eigentlich agentische Workflows. Das LLM entscheidet nur an einzelnen Stellen, der Rest ist ein klar definierter Ablauf mit eingebauter Eskalation. Das ist kein Makel, sondern oft genau richtig: robuster, günstiger und im Rahmen des EU AI Act leichter zu verantworten als ein vollautonomer Agent. Das theoretische Fundament dazu, von der Prompt-Chain bis zum echten Agenten, steht im Bauplan für KI-Agents nach Anthropic.

Die folgenden Beispiele sind nach Funktionsbereich gruppiert. Für jedes gilt: Es ist nur dann ein guter Kandidat, wenn das Volumen stimmt und die Stammdaten sauber genug sind. Beides klären wir weiter unten.
Bestelleingang aus Mail und PDF ins ERP. Der Klassiker und der stärkste Hebel im Großhandel. Der Agent liest eingehende Bestellungen aus E-Mail-Anhängen, also PDF, Excel, gescanntes Fax oder Freitext, extrahiert Artikelnummern, Mengen, Preise und Kundendaten, gleicht gegen die Stammdaten ab und legt den Auftrag im ERP an. Der Mitarbeiter macht nur noch die Endkontrolle. Angebunden sind Auftragspostfach, Dokumenten-KI, ERP und Artikelstammdaten. Den gesamten Prozess von der Bestellung bis zur Rechnung vertieft der Beitrag zur Auftragsabwicklung im Großhandel.
Angebotserstellung. Eine Anfrage kommt per Mail oder Portal herein, der Agent prüft Konditionen, Preise und Verfügbarkeit, erzeugt ein Angebot im ERP und formuliert die Antwortmail im Firmen-Ton. Schnellere Angebote bedeuten höhere Abschlussquoten, weil die Reaktionsgeschwindigkeit im B2B stark mit dem Auftrag korreliert. Verfügbarkeits- und Preisauskunft. Der Agent zieht Verfügbarkeit, Preise und Spezifikationen live aus mehreren Systemen und beantwortet Rückfragen direkt im Kundengespräch, oft mit Cross- und Upselling-Hinweisen. Reklamations- und Retourenbearbeitung. Der Agent klassifiziert eingehende Reklamationen, prüft anhand der Lieferhistorie, ob sie berechtigt sind, legt den Retourenvorgang an und dokumentiert ihn. Standardfälle laufen automatisch, Sonderfälle gehen an einen Menschen.
Lead-Qualifizierung. Der Agent analysiert eingehende Leads sofort, prüft Firmengröße, Branche und Kaufsignal, schreibt eine personalisierte Erst-Mail und bietet Terminslots an. Nur vorqualifizierte Leads landen beim Vertrieb, die Reaktionszeit sinkt von Stunden auf Minuten. Angebotsnachfass. Der Agent überwacht offene Angebote, fasst nach festgelegten Regeln automatisch nach, dokumentiert die Reaktionen im CRM und eskaliert heiße Leads an den zuständigen Verkäufer. CRM-Datenpflege. Kontakte und Firmen werden angereichert, Dubletten zusammengeführt, Felder aktualisiert und Aktivitäten aus Mails und Meeting-Transkripten protokolliert.
Rechnungsprüfung mit 3-Wege-Abgleich. Der Agent liest die Eingangsrechnung, extrahiert die Felder und gleicht Bestellung, Wareneingang und Rechnung ab. Bei fehlender Bestellnummer fordert er die Klärung an, wartet auf die Antwort und setzt den Workflow danach fort. Wie das in der Praxis als Service läuft, zeigt der Use-Case zur automatischen Rechnungsprüfung. E-Rechnungsverarbeitung. Strukturierte E-Rechnungen nach XRechnung oder ZUGFeRD wandern automatisch ins ERP, der Agent legt Buchungsvorschläge an. Das ist 2026 besonders relevant, weil die Empfangspflicht für B2B-E-Rechnungen seit dem 1. Januar 2025 gilt und die Ausstellungspflicht gestaffelt bis 2028 kommt. Mahnwesen. Der Agent überwacht offene Posten, erstellt und versendet gestufte Mahnungen und eskaliert bei Bedarf.
First-Level-Support mit Wissensdatenbank. Der Agent beantwortet Standardanfragen aus der Wissensdatenbank, wickelt einfache Vorgänge bis hin zu Bestellungen end-to-end ab, klassifiziert und routet Tickets und eskaliert sauber an Menschen. Hier zeigt sich der Wert der sauberen Eskalation am deutlichsten: Ein Service-Agent ohne klaren Übergabepfad richtet mehr Schaden an, als er Nutzen bringt.
Beschaffungsagent. Er überwacht Lieferantenpreise, vergleicht Angebote gegen historische Daten, erstellt Bestellvorschläge und formuliert Standard-Kommunikation mit Lieferanten, etwa Rückfragen oder Absagen. Reporting-Agent. Er zieht Daten aus mehreren Quellen und erstellt wiederkehrende Reports, was je nach Umfang vier bis zwölf Stunden pro Woche spart. Recherche- und Wissensagent. Er beantwortet interne Fragen quellenbasiert aus Verträgen und Dokumenten, etwa "Laut Rahmenvertrag mit Lieferant X gilt welche Staffel?". Ein Sonderfall mit Vorsicht ist das Bewerber-Screening im Recruiting: Es darf nur als Assistent vorsortieren, niemals als alleiniger Gatekeeper entscheiden, dazu mehr im Stolperfallen-Abschnitt.

Die Tabelle fasst die Beispiele mit Auslöser, angebundenen Systemen und der wichtigsten Frage zusammen: Braucht es einen echten Agenten oder reicht ein deterministischer Workflow mit ein, zwei LLM-Aufrufen?
| Beispiel | Bereich | Auslöser | Systeme | Agent oder Workflow? |
|---|---|---|---|---|
| Bestelleingang ins ERP | Auftragsabwicklung | Neue Mail im Auftragspostfach | Mail, Dokumenten-KI, ERP | Meist Workflow |
| Angebotserstellung | Auftragsabwicklung | Anfrage per Mail oder Portal | Mail, Preissystem, ERP, CRM | Workflow mit Agent-Anteil |
| Verfügbarkeitsauskunft | Vertrieb | Frage im Kundengespräch | ERP, Produktdaten, Historie | Assistent |
| Reklamation und Retoure | Auftragsabwicklung | Retouren-Mail oder Scan | ERP, Lieferhistorie, Lager | Agent |
| Lead-Qualifizierung | Vertrieb | Neuer Lead im CRM | CRM, Enrichment, Kalender | Agent |
| Angebotsnachfass | Vertrieb | Tage ohne Antwort | CRM, Mail, Kalender | Workflow |
| Rechnungsprüfung 3-Wege | Buchhaltung | Neue Eingangsrechnung | ERP, Bestell- und WE-Daten | Agent |
| E-Rechnungsverarbeitung | Buchhaltung | Eingehende E-Rechnung | ERP, Buchhaltung, DMS | Workflow |
| Mahnwesen | Buchhaltung | Fälligkeit überschritten | ERP, Debitoren, Mail | Workflow |
| First-Level-Support | Kundenservice | Chat, Mail oder Ticket | Wissensbasis, Ticketsystem | Agent |
| Beschaffungsagent | Einkauf | Mindestbestand erreicht | ERP, Lieferantendaten, Mail | Agent |
| Reporting-Agent | Interne Ops | Zeitplan oder Abruf | BI, ERP, Tabellen | Workflow |
Die Spalte ganz rechts ist die wichtigste. Sie zeigt, dass mehr als die Hälfte der typischen Mittelstands-Fälle gar keinen autonomen Agenten braucht. Ein robuster Workflow ist günstiger und vorhersehbarer. Wer den Unterschied im konkreten Tool umsetzen will, findet die Praxisanleitung in der n8n-Anleitung für KI-Agenten.
Theorie hilft wenig ohne Zahlen. Die folgenden drei Beispiele sind mit dokumentierten Werten aus dem deutschsprachigen Raum durchgerechnet. Die Annahmen stehen jeweils dabei, damit Sie sie auf Ihr eigenes Volumen übertragen können.
Der Elektro-Großhändler EVG aus Duisburg setzt für den Bestelleingang einen KI-Agenten ein, der Artikelnummern, Preise und Kundendaten automatisch ins ERP überträgt. Die Bearbeitungszeit pro Auftrag sank von 4,5 Minuten auf 16 Sekunden, das sind rund 96 Prozent weniger. Allein im ersten Quartal 2025 wurden so 68 Arbeitstage eingespart. Der Lebensmittelhersteller Zentis erreichte mit demselben Ansatz eine Dunkelverarbeitung von rund 80 Prozent und etwa 80 Prozent weniger Erfassungsfehler, obwohl die Aufträge durch Gebindegrößen und länderspezifische Produktnamen komplex sind.
Eine konservative Rechnung für einen mittleren Großhändler mit 2.000 Aufträgen pro Monat: Manuell sind das bei 4,5 Minuten je Auftrag rund 150 Stunden im Monat, also fast eine volle Innendienst-Stelle. Mit Agent und reiner Endkontrolle bleiben grob 9 bis 50 Stunden, je nach Dunkelverarbeitungsquote. Selbst vorsichtig gerechnet sind das rund 100 gesparte Stunden pro Monat, bei 35 Euro Vollkosten je Stunde also etwa 3.500 Euro monatlich. Bei marktüblichen Setup-Kosten im niedrigen einstelligen Tausenderbereich amortisiert sich das im Großhandel oft in wenigen Wochen bis drei Monaten.

Offene Angebote bleiben im Mittelstand oft liegen, weil das Nachfassen Fleißarbeit ist, die in stressigen Wochen als Erstes ausfällt. Ein Nachfass-Agent überwacht alle offenen Angebote, meldet sich nach einer festgelegten Frist mit einer freundlichen, kontextbezogenen Mail, trägt die Reaktion ins CRM ein und gibt nur die wirklich heißen Fälle an den Verkäufer zurück. Schon eine kleine Steigerung der Abschlussquote durch konsequentes Nachfassen trägt den Aufwand. Realistisch sind rund 40 gesparte Vertriebsstunden pro Monat bei einem mittleren Angebotsaufkommen, die Amortisation liegt typisch bei zwei bis vier Monaten.
Die Erfassung einer Retoure dauert manuell oft 15 bis 20 Minuten, mit einem Agenten rund 2 Minuten. Bei 1.000 Retouren im Monat ergeben Praxiswerte eine Ersparnis von 2.000 bis 3.500 Euro monatlich, der Break-even liegt bei drei bis sechs Monaten. In einem dokumentierten B2B-Fall wurden 38 Prozent der Reklamationen vollautomatisch abgewickelt, der Rest sauber an Menschen eskaliert. Das ist das gesunde Muster: nicht hundert Prozent Automatisierung anstreben, sondern den großen Standardanteil abräumen und die Sonderfälle bewusst beim Menschen lassen.

Die Tool-Wahl folgt dem Use-Case, nicht umgekehrt. Für Standard-Großhandelsfälle wie den Bestelleingang gibt es fertige Spezialanbieter wie Workist oder Turian, hier ist Kaufen oft schneller als Bauen. Für individuelle Workflows mit ERP- und Mail-Anbindung und dem Wunsch nach EU-Hosting ist n8n stark, weil es self-hostbar ist und sich gut mit Claude oder GPT als Modell dahinter kombinieren lässt. Wer ohnehin tief im Microsoft-Stack steckt, baut FAQ- und Support-Agenten sinnvoll mit Copilot Studio. Für den Kundenservice mit Voice und großen Volumina sind Plattformen wie Cognigy spezialisiert, und im reinen Salesforce-Umfeld bietet sich Agentforce an, das sich allerdings erst ab einigen hundert Konversationen im Monat rechnet.
Code-Frameworks wie LangChain oder LangGraph lohnen sich erst, wenn No-Code an Grenzen stößt und ein Entwicklerteam vorhanden ist. Den vollständigen Vergleich mit Preisen, DSGVO-Lage und Entscheidungshilfe liefert der Hub-Artikel KI-Agenten erstellen. Wer den strategischen Blick auf den gesamten Großhandel sucht, findet ihn in Agentic AI im Großhandel.
Die ehrliche Antwort gehört in jede seriöse Beispielsammlung. Ein Agent ist nicht immer die richtige Antwort, und ein schlecht eingesetzter Agent kostet mehr, als er spart. Vier Muster sollten Sie kennen.
Erstens kritische Daten ohne Prüfung. Die häufigste Fehlerquelle in Produktion ist der falsche Tool-Aufruf, etwa ein Wert ins falsche ERP-Feld geschrieben. Schreibzugriff auf kritische Systeme braucht deterministische Validierung gegen die Stammdaten, kein freies Generieren von Zahlen. Zweitens Halluzination bei Werten. Modelle raten selbstbewusst, statt "ich weiß es nicht" zu sagen. Bei Preisen, Mengen oder Lieferterminen ist eine erfundene Zahl teuer, deshalb gehören solche Werte aus den Systemen geholt und nie vom Modell erfunden. Drittens fehlende Eskalation. Ein Agent ohne klaren Human-in-the-Loop-Pfad fällt bei Sonderfällen still durch oder routet falsch. Die Eskalationsregel muss explizit sein. Viertens DSGVO und EU AI Act. Kunden- und Bewerberdaten gehören nicht ungeschützt auf US-Server, und HR-Entscheidungssysteme gelten ab August 2026 als Hochrisiko, dürfen also nur assistieren, nicht alleine aussortieren.
Und ganz pragmatisch: Bei kleinen Volumina trägt der ROI nicht, bei vollständig regelbaren Prozessen ist ein deterministischer Workflow robuster und billiger, und bei uneinheitlichen Stammdaten sollten Sie erst die Datenbasis aufräumen. Behandeln Sie jeden Agenten wie einen privilegierten Account: minimale Rechte, Rate-Limits, Logging und Monitoring.

Ein passendes Beispiel gefunden? Dann führt der Weg zum Piloten über vier Schritte. Erstens den Use-Case mit dem höchsten Volumen und dem geringsten Risiko wählen, im Großhandel ist das fast immer der Bestelleingang oder die Rechnungsprüfung. Zweitens ehrlich entscheiden, ob es ein Agent oder ein Workflow ist, im Zweifel mit dem einfacheren Workflow starten. Drittens einen Low-Risk-Pilot mit Human-in-the-Loop aufsetzen, also mit Endkontrolle durch Menschen in den ersten Monaten, um Vertrauen und Trainingsdaten aufzubauen. Viertens nach belegtem Nutzen die Automatisierungsquote schrittweise erhöhen und auf weitere Use-Cases ausrollen.
Wer diesen Weg konkret gehen will, findet die Tool-Entscheidung und den Bauplan im Hub KI-Agenten erstellen. Die Beispiele aus diesem Beitrag sind der Startpunkt, nicht das Ziel.
Hier finden Sie die Antworten auf häufig gestellte Fragen.
Ein Workflow arbeitet einen festen, vom Entwickler definierten Ablauf ab, das LLM füllt höchstens einzelne Knoten. Ein Agent entscheidet selbst, welche Werkzeuge er in welcher Reihenfolge nutzt, plant Teilschritte und behält einen Zustand über mehrere Schritte hinweg. Faustregel: Einem Workflow gibt man die Anleitung, einem Agenten nur das Ziel. Im Mittelstand sind viele produktive Lösungen in Wahrheit agentische Workflows, also Workflows mit einzelnen agentischen Entscheidungen und eingebauter Eskalation.
In den meisten Fällen der automatisierte Bestelleingang. Er hat hohes Volumen, klar messbaren Aufwand und dokumentierte Werte: Der Großhändler EVG senkte die Bearbeitungszeit von 4,5 Minuten auf 16 Sekunden pro Auftrag und sparte allein in einem Quartal 68 Arbeitstage. Bei 2.000 Aufträgen im Monat sind konservativ rund 100 Stunden monatlich realistisch, die Amortisation liegt oft bei wenigen Wochen bis drei Monaten.
Nein. Mehr als die Hälfte der typischen Mittelstands-Fälle lässt sich besser mit einem deterministischen Workflow lösen, der robuster und günstiger ist. Ein echter Agent lohnt sich vor allem dort, wo der Pfad nicht vorab feststeht, etwa bei Reklamationen mit Rückfragen, Lead-Qualifizierung oder mehrstufiger Rechnungsklärung. Bei klar regelbaren Abläufen wie Mahnwesen oder E-Rechnungsverarbeitung reicht ein Workflow.
Das hängt vom Use-Case ab. Für den Standard-Bestelleingang sind Fertiganbieter wie Workist oder Turian oft schneller als Eigenbau. Für individuelle Workflows mit EU-Hosting ist n8n stark, kombiniert mit Claude oder GPT als Modell. Im Microsoft-Umfeld passt Copilot Studio, für großen Kundenservice eine spezialisierte Plattform wie Cognigy. Code-Frameworks wie LangGraph lohnen sich erst mit eigenem Entwicklerteam.
Die häufigste Fehlerquelle in Produktion ist der falsche Tool-Aufruf, also ein Wert ins falsche Systemfeld geschrieben. Dazu kommen Halluzinationen bei kritischen Werten wie Preisen und Mengen, fehlende Eskalation an Menschen und DSGVO-Themen bei Kunden- und Bewerberdaten. Die Gegenmittel sind deterministische Validierung gegen Stammdaten, ein expliziter Human-in-the-Loop-Pfad, EU-Hosting mit Auftragsverarbeitungsvertrag und das Prinzip der minimalen Rechte.
Nur als Assistent, nicht als alleinigen Entscheider. Der EU AI Act stuft HR-Entscheidungssysteme als Hochrisiko ein, die entsprechenden Pflichten greifen ab August 2026. Ein Agent darf Lebensläufe vorsortieren und zusammenfassen, die finale Aussortierung echter Bewerber muss ein Mensch verantworten. Außerdem gelten Transparenzpflichten gegenüber den Bewerbern und in der Regel eine Datenschutz-Folgenabschätzung.
Das variiert stark nach Use-Case und Integrationstiefe. Für einen klar abgegrenzten Anwendungsfall wie den Bestelleingang liegen die Setup-Kosten häufig im niedrigen einstelligen Tausenderbereich plus laufende Kosten für Modell und Plattform. Über alle Use-Cases hinweg sind Payback-Zeiten von drei bis neun Monaten realistisch. Entscheidend ist, mit einem Pilot zu starten und den Nutzen zu belegen, bevor breit ausgerollt wird.