2025 wird allerorts zum „Jahr der KI-Agenten“ ausgerufen. Auf YouTube, X und in Konferenzvortraegen ueberschlagen sich die Versprechen: Agenten wuerden ganze Abteilungen ersetzen und bald als vollwertige Mitarbeiter gelten. Vieles davon ist schlicht falsch oder zumindest stark uebertrieben. In einem Gespraech des Podcasts „Marketing Against the Grain“ ordnet Joe Mora, CEO und Gruender von crewAI, die Lage nuechtern ein – inklusive einer ehrlichen Einschaetzung, was heute funktioniert und was eben noch nicht. Fuer Entscheider im Mittelstand ist genau diese Trennung zwischen Substanz und Marketing entscheidend, bevor Budgets fliessen.
- Ein KI-Agent ist mehr als ein Chatbot: Er bekommt eine Aufgabe, arbeitet autonom und nutzt dabei Gedaechtnis (Memory) und Werkzeuge (Tools), um auf Systeme wie CRM oder ERP zuzugreifen.
- Agenten sind real im Einsatz – aber langsamer und fehleranfaelliger als der Hype suggeriert. 2025 ist das Jahr des Ausprobierens, nicht der Vollautomatisierung ganzer Abteilungen.
- Richtig starten heisst: einfache Anwendungsfaelle mit geringer Praezisionsanforderung waehlen, nicht hochkritische Prozesse wie Steuerformulare.
- Mehr Menschen bleiben im Prozess („human in the loop“), als viele erwarten. Kontrolle und Nachvollziehbarkeit sind zentral.
- Erst rund 15 Prozent der befragten Unternehmen haben Agenten produktiv im Einsatz – wer jetzt beginnt, gehoert zu den frueh Bewegenden.

Was ein KI-Agent ueberhaupt ist
Grosse Sprachmodelle wie die hinter ChatGPT oder Claude sind im Kern sehr gut darin, das naechste Wort vorherzusagen und Inhalte zu erzeugen. Sie schreiben eine E-Mail, machen sie auf Wunsch lockerer und koennen sogar zwischen zwei Varianten mit Begruendung waehlen – eine Art rudimentaere Bewertung.
Ein Agent nutzt genau diese Faehigkeit, um ein Problem eigenstaendig zu durchdenken. Der Unterschied zum Chat: Sie geben dem Agenten eine Aufgabe und koennen den Raum verlassen. Er versucht dann autonom, ueber mehrere Schritte ein Ziel zu erreichen. Mora bringt es auf den Punkt: Ein Agent braucht agency, also Handlungsfaehigkeit.
Zwei Bausteine sind dafuer typisch:
- Memory (Gedaechtnis): Damit der Agent Informationen ueber die einzelnen Schritte hinweg behaelt – kurzfristig und langfristig.
- Tools (Werkzeuge): Schnittstellen zu anderen Systemen wie CRM, ERP oder Recherchediensten, damit der Agent stellvertretend handeln kann.
Der Realitaetscheck: langsam, aber im Hintergrund nuetzlich
Als Beispiel dient OpenAIs „Operator“, verfuegbar in der ChatGPT-Pro-Variante fuer rund 200 US-Dollar im Monat. Der Agent steuert einen Browser und kann etwa Hotels, Fluege oder Restaurants recherchieren. Das Urteil im Gespraech ist nuechtern: Operator ist langsam und teils umstaendlich – schaetzungsweise zehnmal langsamer als ein Mensch bei derselben Aufgabe.
Der entscheidende Punkt: Bei Aufgaben, die im Hintergrund laufen duerfen, spielt die Langsamkeit kaum eine Rolle. Mora beschreibt, wie er Agenten fuer seine Social-Media-Posts einsetzt: Idee eingeben, Kaffee holen, weiterarbeiten – und der Entwurf ist fertig, wenn er zurueckkommt. So erledigt er regelmaessig etwas, das er sonst aus Zeitgruenden liegen liess.
Kernidee: Latenz ist unkritisch, wenn ein kleines „Heer“ von Agenten Aufgaben im Hintergrund abarbeitet, waehrend Sie sich Wichtigerem widmen.
Vertrauen und Kontrolle: warum der Mensch sichtbar bleiben muss
Eine zentrale Frage autonomer Agenten ist die Bedienlogik: Soll der Agent eine Restaurantreservierung einfach als „erledigt“ melden, oder soll man ihm bei der Arbeit zusehen koennen? Operator setzt darauf, den Agenten sichtbar arbeiten zu lassen und jederzeit eingreifen zu koennen.
Das hat zwei Gruende: Sicherheit und Vertrauen. Man sieht, was passiert, und kann korrigieren. Ein warnendes Beispiel aus dem Gespraech: Ein frueher E-Mail-Agent sollte nur Entwuerfe anlegen, begann aber, teils kuriose Mails selbststaendig zu versenden. Gerade in Unternehmen gilt: Wer einen kritischen Prozess automatisiert, will ihn visualisieren, kontrollieren und spaeter pruefen koennen.
Richtig starten: niedrige Praezision zuerst
Die wohl praktischste Empfehlung betrifft die Auswahl der ersten Anwendungsfaelle. Mora unterscheidet zwischen niedriger und hoher Praezisionsanforderung:
- Niedrige Praezision (rund 90 Prozent Genauigkeit reichen): etwa ein Agent, der aus Gespraechstranskripten oder CRM-Daten Entwuerfe fuer Verkaufspraesentationen erstellt. Fehler sind hier verkraftbar und leicht korrigierbar.
- Hohe Praezision (99,99 Prozent noetig): etwa das Ausfuellen von Steuer- oder Behoerdenformularen. Mora nennt Formulare mit ueber 70 Seiten und Handbuechern von 620 Seiten – hier darf nichts schiefgehen.
Die klare Ansage: Starten Sie nicht bei hoher Praezision, sonst verbrennen Sie sich die Finger. Beginnen Sie einfach und skalieren Sie von dort.
Vier Leitlinien fuer den Einstieg
- Frueh adoptieren: Verschaffen Sie sich einen Vorsprung, statt abzuwarten.
- Nicht auf fremde Anwendungsfaelle warten: Schauen Sie nicht, was Konzern X tut – finden Sie Ihren eigenen, einfachen Startpunkt.
- Einfach beginnen: Zerlegen Sie eine Rolle in einzelne Aufgaben und greifen Sie sich die mit niedriger Praezisionsanforderung heraus.
- In Richtung „low risk, high impact“ ausbauen: Erweitern Sie schrittweise auf Faelle mit geringem Risiko und hohem Nutzen.
Ein praktischer Tipp aus dem Gespraech: Nehmen Sie eine konkrete Rolle – etwa die eines Vertriebsmitarbeiters (BDR) – und lassen Sie sich die Aufgaben in niedrige und hohe Praezision aufteilen. Genau die niedrig-praezisen Aufgaben sind ideale Experimentierfelder. Zum Bauen gibt es heute mehrere Wege: No-Code-Plattformen fuer weniger technische Nutzer ebenso wie Frameworks fuer Entwickler, die Agenten in Python programmieren.
Wie Unternehmen Agenten richtig einsetzen
Der falsche Ansatz ist, Agenten als reine 1:1-Kopie eines menschlichen Jobs zu bauen. Erfolgreicher ist es, einzelne Mikroaufgaben zu automatisieren, sodass Menschen fuer Wichtigeres frei werden – eine Art Befoerderung: Die Verantwortung fuer das Endergebnis bleibt beim Menschen, der Agent uebernimmt die Vorarbeit.
Ein Beispiel aus der Praxis: Ein Telekommunikationsunternehmen automatisiert die Vertragsanalyse. Bevor ein Vertrag bei der Rechtsabteilung landet, liefern Agenten bereits Empfehlungen und markierte Aenderungen („Red Lines“). So lassen sich Dinge skalieren, die zuvor zu teuer waren.
Zur Verankerung im Unternehmen zeichnet sich ein Muster ab: weg von einzelnen Mitarbeitern, die heimlich ChatGPT nutzen und dabei womoeglich sensible Daten preisgeben und Wissen in Silos einschliessen – hin zu einer zentralen Steuerung, oft unter CIO, CTO oder einem Head of AI. Das schafft Kontrolle darueber, welche Modelle genutzt werden und wie mit personenbezogenen Daten umgegangen wird. Den wirklich grossen Mehrwert heben technische Teams, weil komplexe Automatisierungen tief in unstrukturierte Daten und eigene Systeme eingebunden werden muessen.
Konkrete Anwendungsfaelle in Marketing und Vertrieb
Drei Beispiele aus dem Gespraech zeigen, wozu Agenten heute taugen:
- Lead-Anreicherung mit Hypothesen: Meldet sich jemand neu auf einer Website an, recherchieren Agenten die Person und das Unternehmen. Darueber hinaus bilden sie Hypothesen, wie diese Person das Produkt nutzen koennte, strukturieren das Ergebnis als JSON und spielen es nach HubSpot und in die Produktdatenbank. Resultat: hyperpersonalisierte E-Mails und passgenaue Produktvorschauen.
- Vertriebsvorbereitung: Agenten recherchieren Kunden im Vorfeld – etwa ueber Recherchewerkzeuge wie Perplexitys Sonar. So bereitet sich ein Vertriebsmitarbeiter zwar nicht unbedingt schneller, aber in der Breite besser vor und kann mehr Termine wahrnehmen. Reizvoll ist auch der Gedanke, die Vorgehensweise des besten Vertrieblers zu replizieren, sodass alle auf diesem Niveau vorbereitet sind.
- SEO- und Conversion-Optimierung: Agenten erstellen Screenshots der eigenen Website, analysieren Texte und Wettbewerber und leiten daraus Hypothesen ab, was sich aendern liesse. Der menschliche Input bleibt schlank: die eigene Website, eine Branchenbeschreibung und das Optimierungsziel. Den Rest erledigen die Agenten und liefern A/B-Test-Vorschlaege.
Wo Erwartung und Technik auseinanderklaffen
Der groesste Mismatch zwischen Hype und Realitaet liegt laut Mora in zwei Punkten:
- Mehr Mensch im Prozess als gedacht: Gerade 2025 wird es deutlich mehr „human in the loop“ geben. Vollstaendig durchgehende End-to-End-Automatisierung – besonders bei hochpraezisen Prozessen – ist noch nicht so weit. Agenten scheitern noch oft mittendrin.
- Integration ist aufwendiger als erwartet: In Unternehmen steckt viel „Klebstoff“ zwischen Systemen. Damit Agenten diese Pfade navigieren koennen, braucht es klaren Code und klare Anweisungen. Nicht zufaellig beginnt die Branche beim Browser – dort gibt es eine gemeinsame Schnittstelle. Viele Firmen nutzen jedoch Desktop-Software, die nicht einmal online ist.
Bemerkenswert ist die Adoptionszahl: Von rund 4.000 bis 4.500 befragten Personen hatten nur etwa 15 Prozent Agenten produktiv im Einsatz, bei grossen Unternehmen rund 23 Prozent. Da diese Befragten ohnehin technisch affin sind, duerfte die Zahl in der Gesamtwirtschaft niedriger liegen. Die Botschaft fuer Entscheider: Es ist sehr frueh – und wer jetzt startet, gehoert noch zu den schnellen Bewegenden.
Agenten als kuenftiges Einstellungskriterium
Ein Ausblick, der aufhorchen laesst: Microsoft-CEO Satya Nadella skizzierte, dass Menschen kuenftig auch wegen der Agenten eingestellt werden koennten, die sie sich gebaut haben – statt nur wegen Zertifikaten und frueherer Berufserfahrung. Mora stimmt zu, weniger wegen der Agenten selbst, sondern weil sie etwas ueber die Person aussagen. Bei crewAI duerfen Bewerber im Engineering-Interview ausdruecklich alle KI-Werkzeuge nutzen – wer es nicht tut, faellt durch. Wie gut jemand diese Werkzeuge einsetzt, fliesst massgeblich in die Einstellungsentscheidung ein.
Fazit
2025 ist real das Jahr, in dem viele Unternehmen Agenten ausprobieren und in Produktion bringen – aber nicht das Jahr, in dem Agenten die Belegschaft uebernehmen. Die nuechterne Realitaet: Agenten sind heute oft langsamer als Menschen, brauchen Aufsicht und scheitern noch regelmaessig. Ihr Wert entfaltet sich bei Hintergrundaufgaben, bei Mikroaufgaben innerhalb einer Rolle und ueberall dort, wo Fehler verkraftbar sind. Fuer Entscheider im Mittelstand bedeutet das: klein und einfach starten, bei niedriger Praezisionsanforderung beginnen, den Menschen sichtbar in der Schleife halten und schrittweise auf risikoarme, wirkungsstarke Faelle ausbauen. Wer so vorgeht, sammelt heute praktische Erfahrung – ohne dem Hype aufzusitzen.
