Der Kernzyklus: Wahrnehmen, Entscheiden, Handeln

Jeder KI-Agent läuft auf demselben grundlegenden Zyklus. Er empfängt eine Eingabe — eine Benutzernachricht, eine Datenbankabfrage, einen Sensorwert oder eine API-Antwort. Er verarbeitet diese Eingabe durch ein Sprachmodell oder eine Entscheidungsfunktion. Dann handelt er: Er ruft ein Tool auf, schreibt eine Datei, sendet eine Anfrage oder generiert Output, der in die nächste Iteration einfließt.

Dieser Zyklus läuft, bis der Agent eine Abbruchbedingung erreicht — ein erreichtes Ziel, eine maximale Schrittanzahl oder ein expliziter menschlicher Eingriff. Der Zyklus ist das, was einen Agenten von einem einfachen Frage-Antwort-System unterscheidet.

agent_loop.py
while not ziel_erreicht:
    beobachtung = wahrnehmen(umgebung)
    aktion = entscheiden(llm, beobachtung, gedaechtnis)
    ergebnis = ausfuehren(aktion, tools)
    gedaechtnis.aktualisieren(ergebnis)

Agenten vs. Chatbots: Der entscheidende Unterschied

Ein Chatbot antwortet. Ein Agent handelt. Dieser Unterschied ist entscheidend, wenn Sie entscheiden, was Sie bauen wollen.

Wenn Sie einen Chatbot fragen „Buche mir einen Flug nach Berlin für nächsten Dienstag", schreibt er Anweisungen zurück. Wenn Sie einen Agenten dasselbe fragen, öffnet er Ihren Kalender, prüft Konflikte, fragt eine Flug-API ab, wählt das beste Angebot basierend auf Ihren Präferenzen aus und bestätigt die Buchung — ohne dass Sie dazwischen etwas tun müssen.

Agenten nutzen Tools: Funktionen, die sie aufrufen können, um mit der Welt zu interagieren. Ein Tool kann eine Datenbankabfrage, ein REST-API-Aufruf, ein Code-Executor, ein Web-Scraper oder ein Datei-Writer sein. Der Agent entscheidet, welches Tool er aufruft, mit welchen Argumenten und in welcher Reihenfolge.

Gedächtnis: Wie Agenten sich erinnern

Agenten arbeiten mit vier Gedächtnistypen. Diese zu verstehen ist entscheidend für das Design eines Produktionssystems.

In-Context-Gedächtnis — Alles im aktuellen Prompt-Fenster. Schnell, aber durch die Token-Anzahl begrenzt. Verschwindet, wenn die Sitzung endet.
Externes Gedächtnis — Eine Vektordatenbank oder ein Key-Value-Store, den der Agent während der Aufgabe abfragt. Ermöglicht Retrieval-Augmented Generation (RAG). Bleibt sitzungsübergreifend erhalten.
Episodisches Gedächtnis — Ein Protokoll vergangener Interaktionen, über das der Agent reflektieren kann. Ermöglicht Agenten, die aus Erfahrungen lernen.
Semantisches Gedächtnis — Strukturiertes Weltwissen, entweder in den Modellgewichten eingebettet oder in einem Wissensgraphen gespeichert. Wird zur Laufzeit selten verändert.

Die meisten Produktions-Agenten kombinieren In-Context-Gedächtnis mit einem externen Vektorstore. Der Agent ruft relevanten Kontext aus dem Store ab, fügt ihn in den Prompt ein und schlussfolgert über die kombinierte Eingabe.

Einzel-Agenten vs. Multi-Agenten-Systeme

Ein Einzel-Agent bearbeitet einen Aufgabenstrom. Ein Multi-Agenten-System koordiniert mehrere spezialisierte Agenten auf ein gemeinsames Ziel hin.

Betrachten Sie eine Vertriebsautomatisierungs-Pipeline. Ein Agent überwacht eingehende Leads und bewertet sie. Ein zweiter Agent entwirft personalisierte Outreach-E-Mails. Ein dritter verfolgt Antworten und plant Follow-ups. Jeder Agent ist klein und fokussiert. Das System als Ganzes leistet etwas, das kein einzelner Agent zuverlässig tun könnte.

Frameworks wie LangGraph implementieren dies als gerichteten Graphen: Knoten sind Agenten oder Tools, Kanten definieren Zustandsübergänge. AutoGen verfolgt einen gesprächsbasierten Ansatz, bei dem Agenten Nachrichten als strukturierte Turns austauschen.

multi_agent.py
from langgraph.graph import StateGraph

workflow = StateGraph(AgentenZustand)
workflow.add_node("recherche", recherche_agent)
workflow.add_node("schreiben", schreib_agent)
workflow.add_node("review", review_agent)

workflow.add_edge("recherche", "schreiben")
workflow.add_conditional_edges("schreiben", routing_nach_qualitaet)

app = workflow.compile()

Tool-Use: Agenten mit der Welt verbinden

Tools sind die Hände eines Agenten. Ohne sie kann ein Agent nur Text generieren. Mit ihnen kann er Ihre Datenbank abfragen, eine Slack-Nachricht senden, Python ausführen, eine externe API aufrufen oder Dateien schreiben und lesen.

Moderne Frameworks stellen Tools als typisierte Funktionssignaturen bereit. Das Sprachmodell sieht den Funktionsnamen, die Beschreibung und das Parameter-Schema. Es entscheidet, ob es die Funktion aufruft und mit welchen Argumenten. Das Framework führt den Aufruf aus und speist das Ergebnis in den Kontext des Agenten zurück.

tools.py
from langchain.tools import tool

@tool
def crm_abfragen(kunden_id: str) -> dict:
    """Kundendatensatz aus dem CRM abrufen."""
    return crm_client.get(kunden_id)

@tool
def email_senden(an: str, betreff: str, text: str) -> str:
    """E-Mail über SendGrid versenden."""
    return sendgrid.send(an, betreff, text)

Human-in-the-Loop

Vollständig autonome Agenten machen Fehler. Für risikobehaftete Operationen — E-Mails an Kunden senden, Finanztransaktionen ausführen, Produktionsdatenbanken ändern — brauchen Sie einen menschlichen Kontrollpunkt, bevor die Aktion ausgeführt wird.

LangGraph unterstützt dies nativ durch Interrupt-Punkte: Der Graph pausiert, zeigt die ausstehende Aktion einem Menschen an, wartet auf Genehmigung oder Korrektur und fährt dann fort. Dieses Muster ermöglicht es, Agenten in regulierten oder sensiblen Umgebungen sicher einzusetzen.

Wann einen Agenten bauen

Nicht jedes Problem braucht einen Agenten. Agenten fügen Komplexität hinzu: Sie sind schwerer zu debuggen, zu testen und zu verstehen als ein einfacher Funktionsaufruf. Bauen Sie einen Agenten, wenn:

  • Die Aufgabe mehrere Schritte erfordert, die voneinander abhängen
  • Die Schrittfolge nicht im Voraus bekannt ist und dynamisch bestimmt werden muss
  • Die Aufgabe reale Interaktion erfordert — APIs, Datenbanken, Dateisysteme
  • Die Aufgabe von iterativer Verfeinerung profitiert — Versuchen, Bewerten, Anpassen

Verwenden Sie einen einfachen Prompt oder eine RAG-Pipeline für einmalige Frage-Antwort-Szenarien. Verwenden Sie einen Agenten, wenn das Problem Urteilsvermögen über mehrere Aktionen hinweg erfordert.

Produktions-Checkliste

Bevor Sie einen Agenten in die Produktion deployen, prüfen Sie diese sieben Eigenschaften:

  1. Begrenzte Ausführung — Setzen Sie eine maximale Iterationsanzahl. Endlosschleifen vernichten Budgets.
  2. Typisierte Tools — Validieren Sie Inputs und Outputs an jeder Tool-Grenze.
  3. Strukturierter Zustand — Verwenden Sie ein typisiertes Zustandsschema (Pydantic). Lassen Sie keinen stillen Zustandsdrift zu.
  4. Idempotente Aktionen — Gestalten Sie Tools so, dass sie sicher wiederholt werden können, ohne Nebenwirkungen.
  5. Audit-Log — Protokollieren Sie jede Aktion, jeden Tool-Aufruf und jede Entscheidung. Das brauchen Sie für Debugging und Compliance.
  6. Menschliche Kontrollpunkte — Fügen Sie Genehmigungsstufen für irreversible Aktionen hinzu.
  7. Kostenkontrolle — Verfolgen Sie die Token-Nutzung pro Ausführung. Setzen Sie harte Ausgabenlimits pro Nutzer oder Aufgabe.

Nächste Schritte

Wenn Sie bereit sind, Ihren ersten Agenten zu bauen, beginnen Sie mit LangChain und einem einzigen Tool. Bringen Sie den Zyklus Ende-zu-Ende zum Laufen, bevor Sie Komplexität hinzufügen. Sobald Sie die Zustandsübergänge verstehen, wechseln Sie zu LangGraph für alles, was Verzweigungen, Schleifen oder mehrere spezialisierte Agenten erfordert.

Wenn Sie prüfen, ob ein Agent die richtige Lösung für Ihr Geschäftsproblem ist, kontaktieren Sie uns. Wir bewerten Ihren Anwendungsfall, identifizieren die richtige Architektur und liefern innerhalb von 48 Stunden ein Festpreisangebot.