Bash-Tool-Laufzeitumgebung

Dieses Dokument beschreibt den Laufzeitpfad des bash-Tools, der von Agent-Tool-Aufrufen verwendet wird – von der Befehlsnormalisierung über die Ausführung, Trunkierung/Artefakte bis hin zum Rendering.

Es weist zudem auf Verhaltensunterschiede im interaktiven TUI, im Print-Modus, im RPC-Modus und bei der vom Benutzer initiierten Bang-(!)-Shell-Ausführung hin.

Geltungsbereich und Laufzeitoberflächen

Es gibt zwei verschiedene Bash-Ausführungsoberflächen in coding-agent:

Tool-Aufruf-Oberfläche (toolName: "bash"): wird verwendet, wenn das Modell das Bash-Tool aufruft.
- Einstiegspunkt: BashTool.execute().
Benutzer-Bang-Befehl-Oberfläche (!cmd aus interaktiver Eingabe oder RPC-bash-Befehl): Hilfspfad auf Session-Ebene.
- Einstiegspunkt: AgentSession.executeBash().

Beide verwenden letztendlich executeBash() in src/exec/bash-executor.ts für die Nicht-PTY-Ausführung, aber nur der Tool-Aufruf-Pfad führt Normalisierung/Interception und Tool-Renderer-Logik aus.

End-to-End-Tool-Aufruf-Pipeline

1) Eingabenormalisierung und Parameter-Zusammenführung

BashTool.execute() normalisiert zunächst den Rohbefehl über normalizeBashCommand():

extrahiert nachgestelltes | head -n N, | head -N, | tail -n N, | tail -N in strukturierte Limits,
entfernt führende/nachgestellte Leerzeichen,
behält interne Leerzeichen bei.

Anschließend werden extrahierte Limits mit expliziten Tool-Argumenten zusammengeführt:

explizite head/tail-Argumente überschreiben extrahierte Werte,
extrahierte Werte dienen nur als Fallback.

Einschränkung

Kommentare in bash-normalize.ts erwähnen das Entfernen von 2>&1, aber die aktuelle Implementierung entfernt es nicht. Das Laufzeitverhalten ist dennoch korrekt (stdout/stderr werden bereits zusammengeführt), aber das Normalisierungsverhalten ist enger als die Kommentare vermuten lassen.

2) Optionale Interception (Blockierte-Befehle-Pfad)

Wenn bashInterceptor.enabled aktiv ist, lädt BashTool Regeln aus den Einstellungen und führt checkBashInterception() gegen den normalisierten Befehl aus.

Interception-Verhalten:

ein Befehl wird nur dann blockiert, wenn:
- eine Regex-Regel übereinstimmt, und
- das vorgeschlagene Tool in ctx.toolNames vorhanden ist.
ungültige Regex-Regeln werden stillschweigend übersprungen.
bei Blockierung wirft BashTool einen ToolError mit der Nachricht:
- Blocked: ...
- der ursprüngliche Befehl ist enthalten.

Standard-Regelmuster (im Code definiert) zielen auf häufige Fehlverwendungen ab:

Dateileser (cat, head, tail, …)
Suchwerkzeuge (grep, rg, …)
Dateifinder (find, fd, …)
In-Place-Editoren (sed -i, perl -i, awk -i inplace)
Shell-Umleitungsschreibvorgänge (echo ... > file, Heredoc-Umleitung)

Einschränkung

InterceptionResult enthält suggestedTool, aber BashTool gibt derzeit nur den Nachrichtentext aus (kein strukturiertes Suggested-Tool-Feld in details).

3) CWD-Validierung und Timeout-Begrenzung

cwd wird relativ zum Session-cwd aufgelöst (resolveToCwd) und dann über stat validiert:

fehlender Pfad -> ToolError("Working directory does not exist: ...")
kein Verzeichnis -> ToolError("Working directory is not a directory: ...")

Der Timeout wird auf [1, 3600] Sekunden begrenzt und in Millisekunden umgerechnet.

4) Artefakt-Zuweisung

Vor der Ausführung weist das Tool einen Artefaktpfad/-ID (Best-Effort) für die Speicherung trunkierter Ausgaben zu.

ein Fehler bei der Artefakt-Zuweisung ist nicht-fatal (die Ausführung wird ohne Artefakt-Spilldatei fortgesetzt),
Artefakt-ID/Pfad werden in den Ausführungspfad übergeben, um die vollständige Ausgabe bei Trunkierung zu persistieren.

5) PTY- vs. Nicht-PTY-Ausführungsauswahl

BashTool wählt PTY-Ausführung nur, wenn alle Bedingungen erfüllt sind:

bash.virtualTerminal === "on"
PI_NO_PTY !== "1"
der Tool-Kontext hat eine UI (ctx.hasUI === true und ctx.ui gesetzt)

Andernfalls wird die nicht-interaktive executeBash()-Funktion verwendet.

Das bedeutet, dass der Print-Modus und Nicht-UI-RPC/Tool-Kontexte immer Nicht-PTY verwenden.

Nicht-interaktive Ausführungs-Engine (`executeBash`)

Shell-Session-Wiederverwendungsmodell

executeBash() cached native Shell-Instanzen in einer prozessglobalen Map, die anhand folgender Schlüssel indiziert wird:

Shell-Pfad,
konfiguriertes Befehlspräfix,
Snapshot-Pfad,
serialisierte Shell-Umgebung,
optionaler Agent-Session-Schlüssel.

Für Ausführungen auf Session-Ebene übergibt AgentSession.executeBash() den Parameter sessionKey: this.sessionId, wodurch die Wiederverwendung pro Session isoliert wird.

Der Tool-Aufruf-Pfad übergibt keinen sessionKey, sodass der Wiederverwendungsbereich auf Shell-Konfiguration/Snapshot/Umgebung basiert.

Shell-Konfiguration und Snapshot-Verhalten

Bei jedem Aufruf lädt der Executor die Shell-Konfiguration aus den Einstellungen (shell, env, optionales prefix).

Wenn die ausgewählte Shell bash enthält, wird getOrCreateSnapshot() versucht:

der Snapshot erfasst Aliase/Funktionen/Optionen aus der Benutzer-RC,
die Snapshot-Erstellung erfolgt nach dem Best-Effort-Prinzip,
bei Fehler wird auf keinen Snapshot zurückgefallen.

Wenn prefix konfiguriert ist, wird der Befehl zu:

<prefix> <command>

Streaming und Abbruch

Shell.run() streamt Chunks an einen Callback. Der Executor leitet jeden Chunk an OutputSink und einen optionalen onChunk-Callback weiter.

Abbruch:

ein abgebrochenes Signal löst shellSession.abort(...) aus,
ein Timeout aus dem nativen Ergebnis wird auf cancelled: true + Annotationstext abgebildet,
ein expliziter Abbruch gibt ebenfalls cancelled: true + Annotation zurück.

Innerhalb des Executors wird bei Timeout/Abbruch keine Exception geworfen; er gibt ein strukturiertes BashResult zurück und überlässt dem Aufrufer die Fehlersemantik.

Interaktiver PTY-Pfad (`runInteractiveBashPty`)

Wenn PTY aktiviert ist, führt das Tool runInteractiveBashPty() aus, das eine Overlay-Konsolen-Komponente öffnet und eine native PtySession steuert.

Verhaltens-Highlights:

xterm-headless virtuelles Terminal rendert den Viewport im Overlay,
Tastatureingaben werden normalisiert (einschließlich Kitty-Sequenzen und Application-Cursor-Modus-Behandlung),
esc während der Ausführung beendet die PTY-Session,
Terminal-Größenänderungen werden an das PTY weitergegeben (session.resize(cols, rows)).

Standardmäßige Umgebungs-Härtungen werden für unbeaufsichtigte Ausführungen injiziert:

Pager deaktiviert (PAGER=cat, GIT_PAGER=cat, etc.),
Editor-Eingabeaufforderungen deaktiviert (GIT_EDITOR=true, EDITOR=true, …),
Terminal-/Authentifizierungs-Eingabeaufforderungen reduziert (GIT_TERMINAL_PROMPT=0, SSH_ASKPASS=/usr/bin/false, CI=1),
Paketmanager-/Tool-Automatisierungsflags für nicht-interaktives Verhalten.

PTY-Ausgaben werden normalisiert (CRLF/CR zu LF, sanitizeText) und in OutputSink geschrieben, einschließlich Artefakt-Spill-Unterstützung.

Bei PTY-Start-/Laufzeitfehlern erhält der Sink eine PTY error: ...-Zeile und der Befehl wird mit undefiniertem Exit-Code finalisiert.

Ausgabebehandlung: Streaming, Trunkierung, Artefakt-Spill

Sowohl PTY- als auch Nicht-PTY-Pfade verwenden OutputSink.

OutputSink-Semantik

hält einen In-Memory-UTF-8-sicheren Tail-Puffer (DEFAULT_MAX_BYTES, derzeit 50KB),
verfolgt die insgesamt gesehenen Bytes/Zeilen,
wenn ein Artefaktpfad existiert und die Ausgabe überläuft (oder die Datei bereits aktiv ist), wird der vollständige Stream in die Artefaktdatei geschrieben,
wenn der Speicherschwellenwert überschritten wird, wird der In-Memory-Puffer auf den Tail gekürzt (UTF-8-Grenz-sicher),
markiert truncated, wenn ein Überlauf/Datei-Spill auftritt.

dump() gibt zurück:

output (möglicherweise mit annotiertem Präfix),
truncated,
totalLines/totalBytes,
outputLines/outputBytes,
artifactId, falls eine Artefaktdatei aktiv war.

Einschränkung bei langer Ausgabe

Die Laufzeit-Trunkierung basiert auf dem Byte-Schwellenwert in OutputSink (standardmäßig 50KB). In diesem Codepfad wird kein hartes 2000-Zeilen-Limit erzwungen.

Live-Tool-Updates

Für die Nicht-PTY-Ausführung verwendet BashTool einen separaten TailBuffer für partielle Updates und gibt onUpdate-Snapshots aus, während der Befehl läuft.

Für die PTY-Ausführung wird das Live-Rendering durch ein benutzerdefiniertes UI-Overlay gehandhabt, nicht durch onUpdate-Text-Chunks.

Ergebnisformung, Metadaten und Fehlerzuordnung

Nach der Ausführung:

cancelled-Behandlung:
- wenn das Abort-Signal abgebrochen ist -> wirft ToolAbortError (Abbruch-Semantik),
- andernfalls -> wirft ToolError (wird als Tool-Fehler behandelt).
PTY timedOut -> wirft ToolError.
Head/Tail-Filter auf den finalen Ausgabetext anwenden (applyHeadTail, Head dann Tail).
leere Ausgabe wird zu (no output).
Trunkierungs-Metadaten über toolResult(...).truncationFromSummary(result, { direction: "tail" }) anhängen.
Exit-Code-Zuordnung:
- fehlender Exit-Code -> ToolError("... missing exit status")
- Exit-Code ungleich Null -> ToolError("... Command exited with code N")
- Exit-Code Null -> Erfolgsergebnis.

Erfolgs-Payload-Struktur:

content: Textausgabe,
details.meta.truncation bei Trunkierung, einschließlich:
- direction, truncatedBy, Gesamt-/Ausgabe-Zeilen+Byte-Zähler,
- shownRange,
- artifactId wenn verfügbar.

Da integrierte Tools mit wrapToolWithMetaNotice() umschlossen werden, wird der Trunkierungshinweis-Text automatisch an den finalen Textinhalt angehängt (zum Beispiel: Full: artifact://<id>).

Rendering-Pfade

Tool-Aufruf-Renderer (`bashToolRenderer`)

bashToolRenderer wird für Tool-Aufruf-Nachrichten (toolCall / toolResult) verwendet:

der eingeklappte Modus zeigt eine visuell zeilentrunkierte Vorschau,
der ausgeklappte Modus zeigt den gesamten derzeit verfügbaren Ausgabetext,
die Warnzeile enthält den Trunkierungsgrund und artifact://<id> bei Trunkierung,
der Timeout-Wert (aus den Argumenten) wird in der Fußzeilen-Metadatenzeile angezeigt.

Einschränkung: Vollständige Artefakt-Erweiterung

BashRenderContext hat isFullOutput, aber der aktuelle Renderer-Kontext-Builder setzt es nicht für Bash-Tool-Ergebnisse. Die erweiterte Ansicht verwendet weiterhin den bereits im Ergebnisinhalt vorhandenen Text (Tail-/trunkierte Ausgabe), es sei denn, ein anderer Aufrufer stellt den vollständigen Artefaktinhalt bereit.

Benutzer-Bang-Befehl-Komponente (`BashExecutionComponent`)

BashExecutionComponent ist für Benutzer-!-Befehle im interaktiven Modus gedacht (nicht für Modell-Tool-Aufrufe):

streamt Chunks live,
die eingeklappte Vorschau behält die letzten 20 logischen Zeilen,
Zeilenbegrenzung bei 4000 Zeichen pro Zeile,
zeigt Trunkierungs- und Artefaktwarnungen an, wenn Metadaten vorhanden sind,
markiert abgebrochene/Fehler-/Exit-Zustände separat.

Diese Komponente wird von CommandController.handleBashCommand() verdrahtet und von AgentSession.executeBash() gespeist.

Modusspezifische Verhaltensunterschiede

Oberfläche	Einstiegspfad	PTY-fähig	Live-Ausgabe-UX	Fehlermeldung
Interaktiver Tool-Aufruf	`BashTool.execute`	Ja, wenn `bash.virtualTerminal=on` und UI vorhanden und `PI_NO_PTY!=1`	PTY-Overlay (interaktiv) oder gestreamte Tail-Updates	Tool-Fehler werden zu `toolResult.isError`
Print-Modus Tool-Aufruf	`BashTool.execute`	Nein (kein UI-Kontext)	Kein TUI-Overlay; Ausgabe erscheint im Event-Stream/finalen Assistenten-Textfluss	Gleiche Tool-Fehler-Zuordnung
RPC Tool-Aufruf (Agent-Tooling)	`BashTool.execute`	Üblicherweise keine UI -> Nicht-PTY	Strukturierte Tool-Events/Ergebnisse	Gleiche Tool-Fehler-Zuordnung
Interaktiver Bang-Befehl (`!`)	`AgentSession.executeBash` + `BashExecutionComponent`	Nein (verwendet Executor direkt)	Dedizierte Bash-Ausführungskomponente	Controller fängt Exceptions ab und zeigt UI-Fehler
RPC-`bash`-Befehl	`rpc-mode` -> `session.executeBash`	Nein	Gibt `BashResult` direkt zurück	Consumer behandelt zurückgegebene Felder

Operationelle Einschränkungen

Der Interceptor blockiert Befehle nur, wenn das vorgeschlagene Tool derzeit im Kontext verfügbar ist.
Wenn die Artefakt-Zuweisung fehlschlägt, findet die Trunkierung trotzdem statt, aber es ist keine artifact://-Rückreferenz verfügbar.
Der Shell-Session-Cache hat in diesem Modul keine explizite Bereinigung; die Lebensdauer ist prozessbezogen.
PTY- und Nicht-PTY-Timeout-Oberflächen unterscheiden sich:
- PTY stellt ein explizites timedOut-Ergebnisfeld bereit,
- Nicht-PTY bildet Timeout auf cancelled + Annotation-Zusammenfassung ab.

Implementierungsdateien

src/tools/bash.ts — Tool-Einstiegspunkt, Normalisierung/Interception, PTY/Nicht-PTY-Auswahl, Ergebnis-/Fehlerzuordnung, Bash-Tool-Renderer.
src/tools/bash-normalize.ts — Befehlsnormalisierung und Head/Tail-Filterung nach der Ausführung.
src/tools/bash-interceptor.ts — Interceptor-Regelabgleich und Blockierte-Befehle-Nachrichten.
src/exec/bash-executor.ts — Nicht-PTY-Executor, Shell-Session-Wiederverwendung, Abbruch-Verdrahtung, Output-Sink-Integration.
src/tools/bash-interactive.ts — PTY-Laufzeitumgebung, Overlay-UI, Eingabenormalisierung, nicht-interaktive Umgebungs-Standardwerte.
src/session/streaming-output.ts — OutputSink-Trunkierung/Artefakt-Spill und Zusammenfassungs-Metadaten.
src/tools/output-utils.ts — Artefakt-Zuweisungs-Hilfsfunktionen und Streaming-Tail-Puffer.
src/tools/output-meta.ts — Trunkierungs-Metadaten-Struktur + Hinweis-Injektions-Wrapper.
src/session/agent-session.ts — executeBash auf Session-Ebene, Nachrichtenaufzeichnung, Abbruch-Lebenszyklus.
src/modes/components/bash-execution.ts — Interaktive !-Befehlsausführungskomponente.
src/modes/controllers/command-controller.ts — Verdrahtung für interaktiven !-Befehl-UI-Stream/Update-Abschluss.
src/modes/rpc/rpc-mode.ts — RPC-bash- und abort_bash-Befehlsoberfläche.
src/internal-urls/artifact-protocol.ts — artifact://<id>-Auflösung.

Bash-Tool-Laufzeitumgebung

Geltungsbereich und Laufzeitoberflächen

End-to-End-Tool-Aufruf-Pipeline

1) Eingabenormalisierung und Parameter-Zusammenführung

Einschränkung

2) Optionale Interception (Blockierte-Befehle-Pfad)

Einschränkung

3) CWD-Validierung und Timeout-Begrenzung

4) Artefakt-Zuweisung

5) PTY- vs. Nicht-PTY-Ausführungsauswahl

Nicht-interaktive Ausführungs-Engine (executeBash)

Shell-Session-Wiederverwendungsmodell

Shell-Konfiguration und Snapshot-Verhalten

Streaming und Abbruch

Interaktiver PTY-Pfad (runInteractiveBashPty)

Ausgabebehandlung: Streaming, Trunkierung, Artefakt-Spill

OutputSink-Semantik

Einschränkung bei langer Ausgabe

Live-Tool-Updates

Ergebnisformung, Metadaten und Fehlerzuordnung

Rendering-Pfade

Tool-Aufruf-Renderer (bashToolRenderer)

Einschränkung: Vollständige Artefakt-Erweiterung

Benutzer-Bang-Befehl-Komponente (BashExecutionComponent)

Modusspezifische Verhaltensunterschiede

Operationelle Einschränkungen

Implementierungsdateien

Nicht-interaktive Ausführungs-Engine (`executeBash`)

Interaktiver PTY-Pfad (`runInteractiveBashPty`)

Tool-Aufruf-Renderer (`bashToolRenderer`)

Benutzer-Bang-Befehl-Komponente (`BashExecutionComponent`)