Agent Builder
Introduction
In den vorherigen Kapiteln haben wir gelernt, dass moderne KI-Systeme aus drei fundamentalen Komponenten bestehen: Prompts, Sampling und Tools (siehe Compound Systems). Die Evolution von KI-Assistenten fĂŒhrt uns von einfachen Chatbots ĂŒber intelligente Copiloten zu autonomen Agents â und schlieĂlich zu Multi-Agent-Systemen, in denen spezialisierte Agents zusammenarbeiten.
GemÀà der 4-Ebenen-Taxonomie befinden wir uns auf Level 4: Multi-Agent Systems. Hier orchestriert ein ĂŒbergeordneter Agent mehrere spezialisierte Sub-Agents, die jeweils spezifische Aufgaben ĂŒbernehmen. Diese Architektur ermöglicht komplexe Workflows, die ĂŒber die KapazitĂ€ten einzelner Agents hinausgehen.
Agent Builder ist OpenAI's visuelles Tool zur Erstellung solcher Multi-Agent-Workflows. In diesem Kapitel lernen Sie die Grundlagen von Multi-Agent-Architekturen, Orchestrierungsmuster und praktische Implementierungen kennen.
Agent Builder Fundamentals
Core Components
Agent Builder bietet eine visuelle Canvas, auf der Sie Workflows aus verschiedenen Komponenten zusammenstellen:
Komponente
Funktion
Mapping zu Compound Systems
Agent Nodes
Definieren eigenstÀndige Agents mit System Prompts
Prompts + Sampling (Model)
Tool Nodes
Integrieren externe APIs, Datenbanken, Custom Functions
Tools (Function Calling)
Logic Nodes
Implementieren Conditional Routing, Loops, Aggregation
Control Flow
Knowledge Bases
Stellen kontextspezifisches Wissen bereit (RAG)
Tools (Retrieval)
Memory Nodes
Speichern Konversations- und Workflow-State
Persistent Context
Single Agent Workflow
Bevor wir Multi-Agent-Systeme aufbauen, schauen wir uns einen einfachen Workflow mit einem einzelnen Agent an:
Dieser Workflow zeigt die Grundlogik:
Input wird an den Agent ĂŒbergeben
Agent entscheidet, ob ein Tool benötigt wird
Falls ja: Tool wird ausgefĂŒhrt, Ergebnis flieĂt zurĂŒck zum Agent
Agent generiert finalen Output
Multi-Agent Architecture Patterns
Multi-Agent-Systeme organisieren mehrere spezialisierte Agents nach unterschiedlichen Mustern. Die drei wichtigsten sind:
1. Sequential Pattern (Pipeline)
Konzept: Agents werden sequenziell in einer Pipeline ausgefĂŒhrt. Der Output von Agent A wird Input fĂŒr Agent B, usw.
Use Cases:
Datenverarbeitungs-Pipelines: Daten sammeln â bereinigen â analysieren â visualisieren
Content Creation: Recherche â Schreiben â Review â Formatierung
Research Assistant: Suche â Analyse â Zitierung
Vorteile
Nachteile
â Einfach zu verstehen und implementieren
â LĂ€ngere Gesamtlatenz (sequenziell)
â Klare Verantwortlichkeiten
â Fehler in frĂŒhen Stages blockieren nachfolgende
â Leicht zu debuggen (linear)
â Keine Parallelisierung möglich
2. Parallel Pattern (Fan-out/Fan-in)
Konzept: Ein Router verteilt Aufgaben an mehrere Agents parallel. Ein Aggregator sammelt und kombiniert die Ergebnisse.
Use Cases:
Multi-Source Research: Parallel Durchsuchen verschiedener Datenquellen
Consensus Systems: Mehrere Agents evaluieren denselben Input unabhÀngig
Load Distribution: GroĂe Aufgaben in parallele Teilaufgaben aufteilen
Vorteile
Nachteile
â Schneller durch Parallelisierung
â Komplexere Orchestrierung
â Fehlertoleranz (wenn ein Agent ausfĂ€llt)
â Aggregation kann komplex sein
â Skalierbar
â Höhere Kosten (parallele API-Calls)
3. Hierarchical Pattern (Supervisor/Worker)
Konzept: Ein Supervisor-Agent koordiniert mehrere Worker-Agents. Der Supervisor entscheidet dynamisch, welche Workers aktiviert werden.
Use Cases:
Research Assistant: Supervisor delegiert an Search/Analysis/Citation-Agents
Customer Support: Supervisor routet zu Billing/Technical/Refund-Spezialisten
Code Generation: Supervisor koordiniert Design/Implementation/Testing-Agents
Vorteile
Nachteile
â Flexible, dynamische Orchestrierung
â Supervisor ist Single Point of Failure
â Kann Sequential + Parallel kombinieren
â Komplexere Logik erforderlich
â Leicht erweiterbar (neue Workers hinzufĂŒgen)
â Supervisor muss "intelligent" sein
Communication & Handoff
Die Kommunikation zwischen Agents ist entscheidend fĂŒr funktionierende Multi-Agent-Systeme. Es gibt drei Hauptmuster:
Pattern 1: Structured Data Passing
Mechanismus: Agents kommunizieren ĂŒber JSON-strukturierte Daten. Jeder Agent definiert ein Output-Schema, das vom nĂ€chsten Agent als Input-Schema erwartet wird.
Beispiel:
Vorteile: Typsicherheit, Validierung, maschinelle Verarbeitbarkeit Nachteile: Weniger flexibel, Schema-Ănderungen brechen KompatibilitĂ€t
Pattern 2: Natural Language Handoff
Mechanismus: Agents ĂŒbergeben Informationen in natĂŒrlicher Sprache. Der empfangende Agent extrahiert relevante Informationen.
Beispiel:
Vorteile: Flexibel, robust gegen Schema-Ănderungen Nachteile: Informationsverlust möglich, Parsing-Fehler
Pattern 3: Workflow Variables (Agent Builder)
Mechanismus: Agent Builder verwendet Logic Nodes mit geteilten Variablen. Agents schreiben in und lesen aus einem gemeinsamen Workflow-State.
Beispiel in Agent Builder:
Agent A setzt Variable
search_resultsLogic Node prĂŒft
if search_results.count > 0Agent B liest Variable
search_results
Vorteile: Zentrale State-Verwaltung, keine expliziten Ăbergaben Nachteile: Erfordert Agent Builder-spezifische Konfiguration
Best Practices fĂŒr Agent Communication
Prinzip
Beschreibung
Clear Contracts
Definieren Sie Input/Output-Schemas fĂŒr jeden Agent
Context Preservation
Ăbergeben Sie relevanten Kontext (User Intent, Previous Steps)
Error Handling
Agents sollten ungĂŒltige Inputs erkennen und signalisieren
Validation
Validieren Sie Outputs vor der Weitergabe
Agent Builder Implementation
So erstellen Sie einen Multi-Agent-Workflow in Agent Builder:
Schritt 1: Agent Nodes erstellen
FĂŒr jeden spezialisierten Agent:
Neuen Agent Node auf der Canvas platzieren
System Prompt definieren (ROLLE, AUFGABE, FORMAT, EINSCHRĂNKUNGEN)
Model auswĂ€hlen (GPT-4 fĂŒr komplexe Reasoning, GPT-3.5 fĂŒr einfache Tasks)
Tools hinzufĂŒgen (z.B. Web Search, Custom APIs)
Schritt 2: Logic Nodes konfigurieren
FĂŒr Routing und Aggregation:
Router Node fĂŒr Conditional Logic:
Aggregator Node fĂŒr Result Synthesis:
Schritt 3: Workflow verbinden
Verbinden Sie Nodes mit Edges (Pfeile auf der Canvas)
Definieren Sie Data Mappings (welche Outputs zu welchen Inputs flieĂen)
Konfigurieren Sie Error Handling (Fallback-Pfade)
Schritt 4: Testen
Verwenden Sie Agent Builder's Test Runner
PrĂŒfen Sie Trace Viewer fĂŒr Execution Flow
Validieren Sie Outputs gegen erwartete Ergebnisse
Beispiel: Multi-Agent Workflow in Agent Builder Canvas
Cross-References & Next Steps
Grundlagen wiederholen
Compound Systems: Verstehen Sie Prompts + Sampling + Tools
Ontologie AI Chatbots: 4-Ebenen-Taxonomie von Chatbot zu Multi-Agent
Actions & API Integration: APIs als Tools in Agents einbinden
Vertiefen
Multi-Agent Orchestration: Theorie zu Koordination, Error Handling, Performance
Research Assistant Example: VollstÀndiges Praxisbeispiel mit 4 Agents
Ăben
Exercise: Research Assistant Team: Hands-on Implementierung eines Multi-Agent-Systems
Zusammenfassung:
Multi-Agent-Systeme erweitern Single-Agent-Capabilities durch Spezialisierung
Drei Hauptmuster: Sequential (Pipeline), Parallel (Fan-out/Fan-in), Hierarchical (Supervisor/Worker)
Communication ĂŒber Structured Data, Natural Language oder Workflow Variables
Agent Builder bietet visuelle Tools fĂŒr Implementation und Testing
Last updated