Multi-Agent-Systeme sind technologisch spannend. Bei der Implementierung für Kunden zeigt sich jedoch häufig, dass ein einfacherer Ansatz 90 % der Anforderungen für 20 % der Kosten abdecken würde. Hier ist die Entscheidungsmatrix, wann sich die Investition in Multi-Agent-Orchestrierung lohnt und wann nicht.
Single-Agent vs. Multi-Agent — wo liegt die Grenze
**Single-Agent** = ein LLM (Claude, GPT, Llama) mit einigen Tools. Beispiel: ein Chatbot, der in Dokumenten sucht, eine Antwort generiert und gegebenenfalls eine API aufruft.
**Multi-Agent** = Orchestrierung mehrerer Agenten, von denen jeder seine Spezialisierung hat, und ein Meta-Agent entscheidet, wer die Aufgabe weiterführt. Beispiel: Ein Agent plant, ein zweiter codiert, ein dritter testet, ein vierter reviewed.
Single-Agent ist immer günstiger — ein Modell, ein Flow, ein Audit-Log. Multi-Agent ist immer komplexer — 3–8× mehr Modellaufrufe, 5× mehr Latenz, 10× mehr potenzielle Fehlerquellen.
Aber Multi-Agent liefert Dinge, die ein Single-Agent nicht kann: lange Aufgaben mit mehreren Schritten, parallele Arbeit, Aufsicht über Entscheidungen.
Wann ein Single-Agent ausreicht
1. Der Use-Case hat eine klare, vorhersehbare Struktur.
Beispiel: „Beantworte die Kunden-E-Mail anhand des Kontexts im CRM." Wenige Schritte, einfache Entscheidungen, Antwortqualität wird durch einen menschlichen Reviewer geprüft.
Ein Single-Agent mit Prompt-Templates und 2–3 Tools (CRM-Suche, Kontext-Speicher, Formatierung) deckt 90 % des Volumens ab.
2. Das Team hat keine Kapazität für eine Orchestrierungs-Ebene.
Multi-Agent erfordert: Workflow-Engine (LangGraph, Temporal, Inngest), Agent-State-Management, Error-Handling, Retry-Logik, Observability. Ohne dedizierten AI-Engineer bleibt das System beim ersten degenerierten Schritt stehen.
Wenn Ihr Team weniger als 3 Ingenieure umfasst, ist Single-Agent die realistische Ebene.
3. Der Use-Case hat eine akzeptable Failure-Rate von 5–10 %.
Single-Agents schlagen graceful fehl — die Antwort ist schlechter, aber das UI bricht nicht. Multi-Agent-Systeme schlagen compound fehl — ein fehlerhafter Agent in der Kette zerstört alle nachfolgenden. Ohne ausgefeiltes Error-Handling liefert Multi-Agent schlechtere Ergebnisse als Single-Agent.
Wann Multi-Agent sinnvoll ist
1. Der Use-Case umfasst lange Aufgaben (10+ Schritte) mit unterschiedlichen Fähigkeiten.
Beispiel: eine Agent-Firma, die ein Feature implementiert: Planer analysiert die Anforderung, Entwickler schreibt Code, Tester schreibt Tests, Reviewer prüft den PR. Ein Single-Agent schafft das nicht mit vernünftiger Qualität — der Kontext verwässert, das Modell verliert den Faden.
2. Akzeptable Failure-Rate ist < 1 %, oder die Aufgabe ist business-critical.
Multi-Agent ermöglicht Human-in-the-Loop-Gates zwischen den Agenten. Planer entwirft Plan → Mensch genehmigt → Entwickler implementiert → Reviewer prüft → Mensch genehmigt Merge. Single-Agent bildet das nicht ab.
3. Parallele Arbeit bringt messbaren Nutzen.
Multi-Agent kann verzweigte Aufgaben (ein Agent untersucht 5 Quellen parallel, ein Agent generiert 3 Textvarianten). Single-Agent muss sequenziell arbeiten — langsamer, aber einfacher zu debuggen.
4. Audit-Trail ist eine regulatorische Anforderung.
In regulierten Branchen (Recht, Gesundheitswesen) ist ein Per-Step-Audit-Log Pflicht. Multi-Agent generiert von Natur aus ein Audit-Log pro Schritt — Agent A hat X gemacht, Agent B hat X geprüft, Agent C hat freigegeben. Das Single-Agent-Log lautet „die Antwort ist…" ohne Details dazwischen.
Die Kosten, die niemand erwähnt
Ein Multi-Agent-System ist nicht nur teurer in der Inference (5× mehr LLM-Calls). Kosten, die im 2.–6. Monat auftauchen:
- **Prompt-Drift**: Bei Änderung eines Agenten müssen alle nachfolgenden retestet werden. Ohne systematische Evals bedeutet das stundenlange manuelle Tests bei jeder Änderung.
- **State-Explosion**: Agent-State in komplexen Workflows hat 50+ Variablen. Ohne gutes State-Management wird das System unwartbar.
- **Observability**: Ohne detailliertes Logging können Sie nicht debuggen, warum das System schlechtere Antworten produziert. Observability-Stack (LangSmith, Helicone, Trackio, custom) kostet 200–1.500 € monatlich.
- **Human-in-the-Loop-UI**: Wenn Sie Human-Gates wollen, brauchen Sie ein UI, das sie ermöglicht. Custom-Dashboard für Approval-Flow kostet 5–15k EUR.
Praktisches Vorgehen
**Schritt 1**: Beginnen Sie mit Single-Agent. Deckt 60–80 % des Use-Cases ab. Identifiziert, welche Schritte schlecht laufen.
**Schritt 2**: Für genau diese Schritte fügen Sie spezialisierte Agenten hinzu. Multi-Agent-„Minimum" — 2 Agenten + ein Orchestrator.
**Schritt 3**: Weitere Agenten nur hinzufügen, wenn der messbare Nutzen > Kosten der zusätzlichen Komplexität ist.
Die meisten Multi-Agent-Systeme im produktiven Einsatz 2026 bestehen aus 2–4 Agenten, nicht 10+. Die Teamgröße ist kein Maß für Komplexität — sie ist ein Maß dafür, was Sie nicht optimiert haben.
Fazit
Multi-Agent ist nicht „besser" als Single-Agent. Es ist eine teurere Investition in Fähigkeiten, die manche Use-Cases brauchen, andere nicht.
- Wenn Ihr Use-Case vorhersehbar, kurz und risikoarm ist → Single-Agent.
- Wenn er lang, mehrstufig, business-critical ist → Multi-Agent ist die Investition wert.
- Wenn Sie dazwischen liegen — beginnen Sie mit Single-Agent und fügen Sie schrittweise spezialisierte Agenten hinzu.
---
*Wir implementieren sowohl Single-Agent- als auch Multi-Agent-Systeme. Die Wahl treffen wir über einen Business-Case-Audit, nicht über technologische Präferenz. Ein konkretes Use-Case-Beispiel gehen wir in einem 30-Minuten-Call durch.*