Progressive Context Disclosure Uitproberen
Überblick
Progressive Context Disclosure ist das Muster, einem AI-System zuerst leichte Metadaten zu zeigen und detaillierteren Context nur bei Bedarf zu laden. In Agent- und RAG-Systemen heißt das oft: Summaries, File Paths, IDs, Table-of-Contents Trees, Tool Descriptions, Skill Names, Token Costs oder Manifests vor vollen Dokumenten, Code, Schemas, Tool Definitions oder Conversation History.
Anthropics Context-Engineering-Guidance beschreibt das als Just-in-Time-Ansatz: statt alle relevanten Daten upfront zu pre-processen, halten Agenten leichte Identifiers wie File Paths, gespeicherte Queries und Web Links und laden Daten zur Laufzeit dynamisch per Tools (Anthropic context engineering). Dieselbe Quelle sagt, autonome Navigation ermögliche Progressive Disclosure, weil Agenten relevanten Context durch Exploration schrittweise entdecken (Anthropic context engineering).
Progressive Context Disclosure steht auf Trial, weil es ein praktisches Context-Engineering-Pattern wurde, aber sorgfältig implementiert und gemessen werden muss. Alles in den Context zu dumpen ist teuer und unzuverlässig; zu wenig Context lässt Agenten wichtige Evidenz verpassen. Das Pattern trialen, wo Relevanz, Kosten und Permissions zählen.
Adoptionssignale
- Anthropic rahmt Context Engineering als Kunst und Wissenschaft, aus einem ständig wachsenden Universum möglicher Informationen zu kuratieren, was ins begrenzte Context Window kommt (Anthropic context engineering).
- Anthropic beschreibt Just-in-Time Context Loading über leichte Identifiers wie File Paths, gespeicherte Queries und Web Links, die Agenten dynamisch per Tools abrufen (Anthropic context engineering).
- Agent Skills nutzen Progressive Disclosure in drei Stufen: Discovery aus Skill Name und Description, Activation durch Laden des vollen
SKILL.md, Execution durch Laden von References oder Ausführen gebündelter Scripts nur bei Bedarf (Agent Skills overview). - Die Agent Skills Specification formalisiert das: Metadaten beim Start, volle Instructions bei Skill Activation, Resources unter
scripts/,references/oderassets/nur bei Bedarf (Agent Skills specification). - Claude-Mem dokumentiert einen dreistufigen Memory Workflow: zuerst Index, dann Details oder Timeline, volle Observations oder Source Files nur bei Bedarf, mit sichtbaren Token Costs im Index (Claude-Mem progressive disclosure).
- Anthropic nennt Compaction, strukturiertes Note-Taking und Sub-Agent-Architekturen als verwandte Context-Management-Techniken für Long-Horizon Agents, wo Context Pollution und Relevanz die Performance senken (Anthropic context engineering).
- Das Pattern passt zu Retrieval- und Document-Indexing-Trends wie TOC-Navigation, semantischen Bäumen, Tool Catalogs, Memory Indexes und Repository Manifests, wo das Modell zuerst sieht, was existiert, bevor es wählt, was zu inspizieren ist.
Risiken
- Metadatenqualität bestimmt Retrieval-Qualität. Claude-Mem betont, Titles müssen spezifisch, actionable, self-contained, searchable und kategorisiert sein; schwache Titles oder Summaries können relevanten Context unsichtbar machen (Claude-Mem progressive disclosure).
- Indizes ohne Retrieval Tools sind Sackgassen. Progressive Disclosure funktioniert nur mit zuverlässigen Wegen zur nächsten Schicht: Search, Timeline, Get-by-ID, File Read, Schema Read oder Tool-Detail Calls (Claude-Mem progressive disclosure).
- Kostensichtbarkeit kann irreführen. Ungefähre Token Counts helfen Agenten bei Trade-offs; Teams brauchen weiter echte Telemetrie für tatsächliche Token Usage, Latenz und nachgelagerte Qualität (Claude-Mem progressive disclosure).
- Permission Checks gelten auf jeder Schicht. Ein Index-Eintrag kann selbst sensible Existenz-Metadaten leaken; Summaries, References, Files oder Tool Schemas müssen Source Permissions, Tenant Boundaries und Audit Logs erhalten.
- Autonomes Retrieval kann wandern. Flexibilität beim Selbst-Fetch verbessert, aber ohne Budgets, Stop Conditions, Reranking und Evaluation können Agenten over-search, Quellen verpassen oder irrelevanten Context verfolgen.
- Compaction und Summaries können kritische Details verlieren. Anthropic beschreibt Compaction als Zusammenfassen nahe des Window Limits; jede Summary kann Edge Cases, Entscheidungen oder Constraints weglassen, die später zählen (Anthropic context engineering).
- Progressive Disclosure ersetzt keine Evaluation. Teams brauchen weiter Retrieval Precision, Recall, Grounding, Answer Faithfulness, Latenz und Kostenmessungen, um zu beweisen, dass gestufter Context besser ist als upfront Context oder konventionelles RAG.
Vorteile & Nachteile
Vorteile
- Reduziert Context Pollution durch leichte Indizes, Summaries, Manifests, Pfade oder Skill Descriptions vor dem Laden voller Dokumente, Tools, Schemas oder Repositories.
- Ermöglicht Just-in-Time-Retrieval und hält begrenzte Attention für hochwertige Informationen, während viele Ressourcen auffindbar bleiben.
- Funktioniert über RAG, Agent Skills, Memory Systems, Tool Catalogs, Codebases und Data Catalogs, wo das Modell entscheiden muss, was als Nächstes inspiziert wird.
Nachteile
- Schlechte Metadaten, schwache Summaries, fehlende Retrieval Paths oder falsche Token Costs können kritischen Context überspringen oder Irrelevantes laden.
- Progressive Disclosure löst keine Permissions, Provenance oder Retrieval Evaluation; jeder gestufte Lookup braucht Access Control und Auditability.
- Zusätzliche Design-Komplexität: Indizes, Metadata Schemas, Retrieval Tools, Compaction Rules und Metriken, um zu beweisen, dass Staging Qualität, Latenz und Kosten verbessert.
Empfehlung
Progressive Context Disclosure für Agent Workspaces, RAG-Systeme, Codebase Agents, Enterprise Memory, Tool Registries und Data Catalogs trialen, wo potenziell relevanter Context viel größer ist als das, was das Modell upfront laden sollte. Gute Kandidaten: Long-Running Coding Agents, dokumentlastiges RAG, Repository Onboarding, interne Wissenssysteme, Skill Libraries und Multi-Tool-Agent-Plattformen.
Schichten bewusst designen. Mit prägnanten, permission-gefilterten Meta-Feldern starten: Title, Type, Owner, Timestamp, Source, Scope, Token Cost, Retrieval ID. Ein-Schritt-Pfade für Summaries, Full Content, Source Files, Schemas, Examples oder ausführbare Helpers. Context Costs sichtbar halten, Summaries spezifisch, verwandte Einträge gruppieren; jede Schicht braucht Provenance und Access Control.
Den Trade-off messen. Gestufte Disclosure gegen Baseline RAG oder upfront Context Loading an Retrieval Precision, Answer Faithfulness, Task Completion Rate, Latenz, Token Cost, Missed-Evidence Incidents und Review-Aufwand für Nutzer. Von Trial zu Adopt nur wechseln, wenn das Pattern Qualität oder Kosten zuverlässig verbessert, ohne essenziellen Context zu verbergen.