Agent Builder

Introduction

In den vorherigen Kapiteln haben wir gelernt, dass moderne KI-Systeme aus drei fundamentalen Komponenten bestehen: Prompts, Sampling und Tools (siehe Compound Systems). Die Evolution von KI-Assistenten fĂŒhrt uns von einfachen Chatbots ĂŒber intelligente Copiloten zu autonomen Agents – und schließlich zu Multi-Agent-Systemen, in denen spezialisierte Agents zusammenarbeiten.

GemĂ€ĂŸ der 4-Ebenen-Taxonomie befinden wir uns auf Level 4: Multi-Agent Systems. Hier orchestriert ein ĂŒbergeordneter Agent mehrere spezialisierte Sub-Agents, die jeweils spezifische Aufgaben ĂŒbernehmen. Diese Architektur ermöglicht komplexe Workflows, die ĂŒber die KapazitĂ€ten einzelner Agents hinausgehen.

Agent Builder ist OpenAI's visuelles Tool zur Erstellung solcher Multi-Agent-Workflows. In diesem Kapitel lernen Sie die Grundlagen von Multi-Agent-Architekturen, Orchestrierungsmuster und praktische Implementierungen kennen.

Agent Builder Fundamentals

Core Components

Agent Builder bietet eine visuelle Canvas, auf der Sie Workflows aus verschiedenen Komponenten zusammenstellen:

Komponente

Funktion

Mapping zu Compound Systems

Agent Nodes

Definieren eigenstÀndige Agents mit System Prompts

Prompts + Sampling (Model)

Tool Nodes

Integrieren externe APIs, Datenbanken, Custom Functions

Tools (Function Calling)

Logic Nodes

Implementieren Conditional Routing, Loops, Aggregation

Control Flow

Knowledge Bases

Stellen kontextspezifisches Wissen bereit (RAG)

Tools (Retrieval)

Memory Nodes

Speichern Konversations- und Workflow-State

Persistent Context

Single Agent Workflow

Bevor wir Multi-Agent-Systeme aufbauen, schauen wir uns einen einfachen Workflow mit einem einzelnen Agent an:

spinner

Dieser Workflow zeigt die Grundlogik:

  1. Input wird an den Agent ĂŒbergeben

  2. Agent entscheidet, ob ein Tool benötigt wird

  3. Falls ja: Tool wird ausgefĂŒhrt, Ergebnis fließt zurĂŒck zum Agent

  4. Agent generiert finalen Output

Multi-Agent Architecture Patterns

Multi-Agent-Systeme organisieren mehrere spezialisierte Agents nach unterschiedlichen Mustern. Die drei wichtigsten sind:

1. Sequential Pattern (Pipeline)

Konzept: Agents werden sequenziell in einer Pipeline ausgefĂŒhrt. Der Output von Agent A wird Input fĂŒr Agent B, usw.

spinner

Use Cases:

  • Datenverarbeitungs-Pipelines: Daten sammeln → bereinigen → analysieren → visualisieren

  • Content Creation: Recherche → Schreiben → Review → Formatierung

  • Research Assistant: Suche → Analyse → Zitierung

Vorteile

Nachteile

✅ Einfach zu verstehen und implementieren

❌ LĂ€ngere Gesamtlatenz (sequenziell)

✅ Klare Verantwortlichkeiten

❌ Fehler in frĂŒhen Stages blockieren nachfolgende

✅ Leicht zu debuggen (linear)

❌ Keine Parallelisierung möglich

2. Parallel Pattern (Fan-out/Fan-in)

Konzept: Ein Router verteilt Aufgaben an mehrere Agents parallel. Ein Aggregator sammelt und kombiniert die Ergebnisse.

spinner

Use Cases:

  • Multi-Source Research: Parallel Durchsuchen verschiedener Datenquellen

  • Consensus Systems: Mehrere Agents evaluieren denselben Input unabhĂ€ngig

  • Load Distribution: Große Aufgaben in parallele Teilaufgaben aufteilen

Vorteile

Nachteile

✅ Schneller durch Parallelisierung

❌ Komplexere Orchestrierung

✅ Fehlertoleranz (wenn ein Agent ausfĂ€llt)

❌ Aggregation kann komplex sein

✅ Skalierbar

❌ Höhere Kosten (parallele API-Calls)

3. Hierarchical Pattern (Supervisor/Worker)

Konzept: Ein Supervisor-Agent koordiniert mehrere Worker-Agents. Der Supervisor entscheidet dynamisch, welche Workers aktiviert werden.

spinner

Use Cases:

  • Research Assistant: Supervisor delegiert an Search/Analysis/Citation-Agents

  • Customer Support: Supervisor routet zu Billing/Technical/Refund-Spezialisten

  • Code Generation: Supervisor koordiniert Design/Implementation/Testing-Agents

Vorteile

Nachteile

✅ Flexible, dynamische Orchestrierung

❌ Supervisor ist Single Point of Failure

✅ Kann Sequential + Parallel kombinieren

❌ Komplexere Logik erforderlich

✅ Leicht erweiterbar (neue Workers hinzufĂŒgen)

❌ Supervisor muss "intelligent" sein

Communication & Handoff

Die Kommunikation zwischen Agents ist entscheidend fĂŒr funktionierende Multi-Agent-Systeme. Es gibt drei Hauptmuster:

Pattern 1: Structured Data Passing

Mechanismus: Agents kommunizieren ĂŒber JSON-strukturierte Daten. Jeder Agent definiert ein Output-Schema, das vom nĂ€chsten Agent als Input-Schema erwartet wird.

Beispiel:

Vorteile: Typsicherheit, Validierung, maschinelle Verarbeitbarkeit Nachteile: Weniger flexibel, Schema-Änderungen brechen KompatibilitĂ€t

Pattern 2: Natural Language Handoff

Mechanismus: Agents ĂŒbergeben Informationen in natĂŒrlicher Sprache. Der empfangende Agent extrahiert relevante Informationen.

Beispiel:

Vorteile: Flexibel, robust gegen Schema-Änderungen Nachteile: Informationsverlust möglich, Parsing-Fehler

Pattern 3: Workflow Variables (Agent Builder)

Mechanismus: Agent Builder verwendet Logic Nodes mit geteilten Variablen. Agents schreiben in und lesen aus einem gemeinsamen Workflow-State.

Beispiel in Agent Builder:

  • Agent A setzt Variable search_results

  • Logic Node prĂŒft if search_results.count > 0

  • Agent B liest Variable search_results

Vorteile: Zentrale State-Verwaltung, keine expliziten Übergaben Nachteile: Erfordert Agent Builder-spezifische Konfiguration

Best Practices fĂŒr Agent Communication

Prinzip

Beschreibung

Clear Contracts

Definieren Sie Input/Output-Schemas fĂŒr jeden Agent

Context Preservation

Übergeben Sie relevanten Kontext (User Intent, Previous Steps)

Error Handling

Agents sollten ungĂŒltige Inputs erkennen und signalisieren

Validation

Validieren Sie Outputs vor der Weitergabe

Agent Builder Implementation

So erstellen Sie einen Multi-Agent-Workflow in Agent Builder:

Schritt 1: Agent Nodes erstellen

FĂŒr jeden spezialisierten Agent:

  1. Neuen Agent Node auf der Canvas platzieren

  2. System Prompt definieren (ROLLE, AUFGABE, FORMAT, EINSCHRÄNKUNGEN)

  3. Model auswĂ€hlen (GPT-4 fĂŒr komplexe Reasoning, GPT-3.5 fĂŒr einfache Tasks)

  4. Tools hinzufĂŒgen (z.B. Web Search, Custom APIs)

Schritt 2: Logic Nodes konfigurieren

FĂŒr Routing und Aggregation:

  1. Router Node fĂŒr Conditional Logic:

  2. Aggregator Node fĂŒr Result Synthesis:

Schritt 3: Workflow verbinden

  1. Verbinden Sie Nodes mit Edges (Pfeile auf der Canvas)

  2. Definieren Sie Data Mappings (welche Outputs zu welchen Inputs fließen)

  3. Konfigurieren Sie Error Handling (Fallback-Pfade)

Schritt 4: Testen

  1. Verwenden Sie Agent Builder's Test Runner

  2. PrĂŒfen Sie Trace Viewer fĂŒr Execution Flow

  3. Validieren Sie Outputs gegen erwartete Ergebnisse

Beispiel: Multi-Agent Workflow in Agent Builder Canvas

Cross-References & Next Steps

Grundlagen wiederholen

Vertiefen

Üben


Zusammenfassung:

  • Multi-Agent-Systeme erweitern Single-Agent-Capabilities durch Spezialisierung

  • Drei Hauptmuster: Sequential (Pipeline), Parallel (Fan-out/Fan-in), Hierarchical (Supervisor/Worker)

  • Communication ĂŒber Structured Data, Natural Language oder Workflow Variables

  • Agent Builder bietet visuelle Tools fĂŒr Implementation und Testing

Last updated