TECHNOLOGIE

AI Agents

Software, die per LLM entscheidet, was als Nächstes zu tun ist, Tools aufruft, um es umzusetzen, und in der Schleife bleibt, bis das Ziel erreicht ist.

Zuletzt geprüft: 2026-05-24 vonKevin Riedl wiki ↗

Ein AI Agent ist die Schleife, nicht das Modell. Das Modell (Claude, GPT, Gemini, ein Open-Weights-LLM) ist der Entscheider. Der Agent ist die Runtime: Er gibt dem Modell ein Ziel, lässt es Tools (Datenbank, API, Code-Interpreter, anderer Agent) aufrufen, oft über MCP , beobachtet das Ergebnis und füttert die Schleife, bis fertig.

Die Unterscheidung zählt, weil agentische Systeme anders versagen als reine LLM-Anwendungen. Ein Chatbot, der irrt, ist ein Nutzer, der weiterzieht. Ein Agent, der irrt, schickt eine E-Mail, führt eine Transaktion durch oder löscht eine Datei. Production-Agents brauchen Authorisierungs-Gates, Observability und Circuit Breakers, die die meisten Prototypen weglassen.

Beispiel für das häufigste Production-Versagen: Ein Support-Agent bekommt ein „Ticket lösen"-Ziel und ein Set an Tools. Ein fehlerhaftes Ticket schickt ihn in eine Schleife, in der er dasselbe Lookup-Tool dutzende Male aufruft, an einem Nachmittag das Modellbudget verbrennt und nie zu einer Lösung kommt. Die Lösung ist kein klügerer Prompt, sondern Engineering: ein hartes Step-Limit, eine Kostendecke und ein Circuit Breaker, der die Schleife stoppt und an einen Menschen eskaliert. Alles, was schreibt (eine Nachricht sendet, eine Zahlung tätigt, einen Datensatz löscht), bekommt ein Human-in-the-Loop-Gate; reine Read-only-Schleifen können meist unbeaufsichtigt laufen.

Der ehrliche Trade-off und der zu vermeidende Founder-Fehler: Agents addieren Nicht-Determinismus, Latenz und einen weit größeren Blast Radius als eine feste Pipeline, im Tausch dafür, Aufgaben zu bewältigen, deren Schritte sich nicht vorab aufzählen lassen. Die meisten als „agentisch" gepitchten Workflows sind gut verstanden und besser in einer deterministischen Pipeline mit einem oder zwei LLM-Calls in der Mitte aufgehoben, oft gestützt durch RAG zur Erdung. Wavects Haltung: zuerst fragen, ob KI hier das richtige Werkzeug ist, dann, ob ein Agent die richtige Form von KI dafür ist. Wenn du die Schritte aufschreiben kannst, lass das Modell sie nicht improvisieren.

Brauche ich überhaupt einen Agent oder reicht ein LLM-Call? +

Wenn der Workflow deterministisch ist und das LLM nur einen Schritt entscheidet, reicht ein Call. Erst wenn das Modell mehrfach iterieren, Tool-Output bewerten und korrigieren muss, lohnt sich die Agent-Schleife. 80 Prozent der „Agent"-Projekte sind über-engineerte Pipelines.

Was geht in Production am häufigsten schief? +

Endlosschleifen, fehlende Authorisation auf Tool-Calls und keine Beobachtbarkeit. Ein Agent ohne Step-Limit dreht stundenlang im Kreis. Ohne Audit-Log ist jedes Postmortem Kaffeesatzlesen. Einbauen, bevor man live geht, nicht danach.

Welche Tasks eignen sich tatsächlich für Agents? +

Mehrstufige Recherche, Datenaggregation aus heterogenen Quellen, Code-Refactor mit Test-Feedback-Loop. Schlecht geeignet: alles mit hoher Konsequenz und niedriger Toleranz für Fehler (Geld bewegen, E-Mails an Kunden schicken ohne Human-Review).

Häufige Fragen