Was ist ein KI-Agent? Ein praxisnaher Leitfaden

Warum der Begriff so unscharf ist

Im Alltag verschwimmen die Begriffe schnell. Ein Support-Chat auf einer Website wirkt „intelligent“, also nennen viele ihn sofort Agent. Technisch steckt dahinter aber oft nur ein Sprachinterface über einem festen Ablauf oder einem LLM-Prompt.

Ein KI-Agent macht mehr als Text auszugeben. Er wählt den nächsten sinnvollen Schritt, löst Aktionen aus und treibt einen Prozess über mehrere Stationen weiter. Genau dort trennt sich Assistenz von Ausführung.

Die kürzeste Unterscheidung lautet deshalb: Ein Chatbot beantwortet eine Eingabe. Ein Agent verfolgt ein Ziel.

Eine praktische Definition

Ein KI-Agent ist ein Softwaresystem, das einen Zustand aufnimmt, daraus eine Entscheidung ableitet und eine Aktion ausführt. Danach prüft es das Ergebnis und setzt den Ablauf fort, bis ein Ziel erreicht ist oder eine Stop-Regel greift.

Dafür braucht es nicht zwingend ein großes Sprachmodell. Auch Regeln, klassische Entscheidungslogik oder kleinere Modelle können Teil eines Agentensystems sein. Entscheidend ist die Schleife aus Wahrnehmen, Entscheiden und Handeln.

In vielen modernen Anwendungen sitzt ein LLM im Entscheidungszentrum. Es interpretiert Anfragen, wählt Werkzeuge, füllt Parameter und plant den nächsten Schritt. Zum Agenten wird das System aber erst dann, wenn Zustand, Tools und kontrollierte Ausführung dazukommen.

Der Kernzyklus: Wahrnehmen, Entscheiden, Handeln

Jeder Agent folgt demselben Muster. Er liest einen Zustand ein, bewertet ihn und löst dann eine Aktion aus. Anschließend prüft er das Ergebnis und speist es in den nächsten Schritt zurück.

Genau dieser Kreislauf macht aus Textgenerierung ein arbeitendes System. Ein Agent stoppt nicht nach einer Antwort, sondern steuert auf ein Ziel zu. Scheitert ein Schritt, plant er um, stellt Rückfragen oder wählt einen anderen Weg.

In der Praxis verbindet sich dieser Zyklus mit Geschäftslogik: Welche Daten darf der Agent lesen, welche Tools darf er nutzen, wann braucht er eine Freigabe, und wann muss er abbrechen? Diese Steuerung bestimmt, ob ein System im Alltag trägt.

Der Agenten-Kreislauf: die Umgebung wahrnehmen, den nächsten Schritt entscheiden, handeln — und wieder von vorn.

agent_loop.py

while not ziel_erreicht:
    beobachtung = wahrnehmen(umgebung)
    aktion = entscheiden(llm, beobachtung, gedaechtnis)
    ergebnis = ausfuehren(aktion, tools)
    gedaechtnis.aktualisieren(ergebnis)

Tool-Use: Agenten mit der Welt verbinden

Damit ein Agent handelt, braucht er Werkzeuge. Dazu zählen Datenbankabfragen, API-Aufrufe, Dateioperationen oder Nachrichten an andere Systeme. Das Modell wählt ein Tool, setzt Parameter und stößt den Aufruf an.

Ohne Tools produziert ein Agent nur Text. Mit Tools ruft er Daten ab, verändert Zustände und stößt echte Prozesse an. Genau deshalb markiert Tool-Use oft den Schritt von der Demo zum produktiven Nutzen.

Ein CRM-Agent kann Kundendaten laden, einen Supportfall anlegen und im Anschluss eine E-Mail vorbereiten. Ein interner Wissensagent durchsucht Dokumente, zieht die relevanten Stellen heraus und leitet daraus eine Handlungsempfehlung ab. Sprache steuert den Ablauf, die angebundenen Systeme erzeugen die Wirkung.

Gute Architekturen geben einem Agenten dabei keinen freien Zugriff, sondern klar definierte Werkzeuge mit enger Verantwortung. Je präziser diese Schnittstellen formuliert sind, desto leichter lässt sich Verhalten testen, absichern und überwachen.

tools.py

from langchain.tools import tool

@tool
def crm_abfragen(kunden_id: str) -> dict:
    """Kundendatensatz aus dem CRM abrufen."""
    return crm_client.get(kunden_id)

@tool
def email_senden(an: str, betreff: str, text: str) -> str:
    """E-Mail über SendGrid versenden."""
    return sendgrid.send(an, betreff, text)

Gedächtnis: Kontext halten statt raten

Agenten brauchen Gedächtnis, damit sie nicht bei jedem Schritt neu anfangen. Ein Teil liegt im aktuellen Prompt. Ein anderer Teil steckt in externen Speichern wie Vektor-Datenbanken, Logs oder Zustandsobjekten.

In-Context-Gedächtnis hält den aktuellen Arbeitskontext im Prompt.

Externes Gedächtnis ruft Fakten, Dokumente oder frühere Zustände aus Datenbanken ab.

Episodisches Gedächtnis speichert frühere Abläufe und macht Fehler oder Muster sichtbar.

Semantisches Gedächtnis bündelt stabiles Wissen über Domänen, Begriffe und Beziehungen.

Produktive Systeme kombinieren meist Prompt-Kontext mit externem Retrieval. So bleibt der Agent fokussiert und kann trotzdem mehr Wissen nutzen, als in ein einzelnes Fenster passt.

Wichtig ist dabei: Gedächtnis heißt nicht, dass der Agent alles behalten muss. Er braucht den richtigen Kontext zum richtigen Zeitpunkt. Zu viel irrelevante Historie verwässert Entscheidungen eher, als dass sie hilft.

Deshalb wird gutes Gedächtnis bewusst entworfen: Was gehört in den aktuellen Zustand, was wird erst bei Bedarf nachgeladen, welche Fakten gelten dauerhaft und welche nur für einen Vorgang? Diese Fragen entscheiden oft darüber, ob ein Agent präzise arbeitet oder springt.

Einzel-Agenten vs. Multi-Agenten-Systeme

Ein einzelner Agent kann eine klar umrissene Aufgabe vollständig bearbeiten. Wird ein Prozess breiter, lohnt sich oft die Aufteilung. Dann recherchiert ein Agent, ein zweiter bewertet Ergebnisse und ein dritter führt Aktionen aus.

Diese Trennung macht Abläufe nachvollziehbarer und senkt oft die Fehlerquote. Frameworks wie LangGraph oder AutoGen koordinieren solche Rollen als Graph oder Gespräch.

Multi-Agenten-Setups sind aber nicht automatisch besser. Oft kommen sie zu früh ins Spiel, weil sie architektonisch attraktiv wirken. In vielen Geschäftsanwendungen reicht ein einzelner Agent mit guten Tools und sauberem Zustand völlig aus.

Mehrere Agenten zahlen sich vor allem dann aus, wenn Rollen wirklich verschieden denken müssen. Ein Recherche-Agent bewertet anders als ein Review-Agent. Ein Planungs-Agent verfolgt andere Ziele als ein Ausführungs-Agent. Fehlt dieser Unterschied, wächst nur die Komplexität.

multi_agent.py

from langgraph.graph import StateGraph

workflow = StateGraph(AgentenZustand)
workflow.add_node("recherche", recherche_agent)
workflow.add_node("schreiben", schreib_agent)
workflow.add_node("review", review_agent)

workflow.add_edge("recherche", "schreiben")
workflow.add_conditional_edges("schreiben", routing_nach_qualitaet)

app = workflow.compile()

Human-in-the-Loop

Agenten treffen nicht immer die richtige Wahl. Deshalb brauchen kritische Schritte eine Freigabe. Das gilt besonders für E-Mails an Kunden, Änderungen an Produktivdaten oder finanzielle Aktionen.

Ein Human-in-the-Loop-Design pausiert den Ablauf vor riskanten Schritten, zeigt die geplante Aktion an und lässt einen Menschen eingreifen. So bleibt der Prozess schnell und kontrollierbar.

Gerade im Unternehmenskontext ist das kein Notbehelf, sondern oft die beste Architektur. Ein Agent kann vorbereiten, priorisieren, zusammenfassen und vorentscheiden. Der Mensch greift nur dort ein, wo Risiko, Haftung oder Reputationsschaden ins Spiel kommen.

Das führt meist zu besseren Ergebnissen als die Extreme „alles automatisieren“ oder „alles manuell lassen“. Gute Agentensysteme verteilen Verantwortung bewusst.

Wann sich ein Agent lohnt

Nicht jede Aufgabe braucht einen Agenten. Wenn ein System nur eine Antwort erzeugen soll, reicht oft ein Prompt oder eine RAG-Pipeline. Ein Agent lohnt sich dort, wo ein System mehrere Schritte verbinden, Werkzeuge auswählen und den Prozess selbst steuern muss.

Typische Fälle sind Support-Automatisierung, Lead-Qualifizierung, interne Recherche, Terminplanung oder operative Workflows mit CRM, ERP und APIs.

Ein guter Indikator ist Wiederholung unter Unsicherheit: Der Ablauf ist nicht starr, folgt aber einem wiederkehrenden Ziel. Genau dort spielen Agenten ihre Stärke aus. Sie reagieren auf Varianten, ohne den Prozess aus der Spur zu tragen.

Weniger sinnvoll sind Agenten dort, wo Entscheidungen strikt deterministisch, regulatorisch eng vorgegeben oder kaum mehrschrittig sind. Dann schlägt klassische Software den Agenten oft bei Robustheit, Wartbarkeit und Kosten.

Was ein Produktions-Agent braucht

Ein produktiver Agent entsteht nicht aus einem einzelnen Prompt. Er braucht ein klares Ziel, definierte Werkzeuge, expliziten Zustand, Speicher und feste Grenzen. Erst diese Schichten machen Verhalten testbar und wiederholbar.

Ein produktiver Agent ist mehr als ein Modell: Werkzeuge, Gedächtnis, Leitplanken und ein Audit-Trail um einen LLM-Kern.

Dazu kommen Logging, Validierung und Abbruchregeln. Ein Agent muss jeden Schritt protokollieren, Schleifen beenden und Fehler sichtbar machen. Sonst beeindruckt er in der Demo, bricht aber im Alltag.

Ebenfalls wichtig sind klare Erfolgsmetriken. Ein Agent ist nicht gut, weil die Antworten klug klingen. Er ist gut, wenn er einen Geschäftsprozess schneller, sicherer oder günstiger macht. Dazu gehören Kennzahlen wie Bearbeitungszeit, Fehlerquote, Abschlussrate oder Entlastung des Teams.

Produktionsreife heißt deshalb auch Betriebsreife: Beobachtbarkeit, Rollback-Möglichkeiten, Zugriffskontrolle, Berechtigungskonzepte und eine saubere Trennung zwischen Test- und Live-Umgebung.

Nächste Schritte

Wer Agenten sinnvoll einsetzen will, sollte mit einem konkreten Geschäftsprozess starten. Dann lässt sich sauber festlegen, welche Entscheidungen der Agent trifft, welche Systeme er nutzt und an welchen Stellen Menschen freigeben.

Die beste erste Frage lautet meist nicht: „Wo können wir überall Agenten einsetzen?“ Sondern: „Welcher wiederkehrende Ablauf kostet uns heute Zeit und lässt sich Schritt für Schritt automatisieren?“ Genau dort entsteht der größte Hebel.

Wenn Sie prüfen möchten, ob ein Agent Abläufe in Ihrem Unternehmen beschleunigen kann, sprechen Sie mit uns. Wir entwerfen und implementieren Agentensysteme mit Fokus auf Integration, Kontrolle und geschäftlichen Nutzen.