Compaction et résumés de branches

La compaction et les résumés de branches sont les deux mécanismes qui permettent de maintenir l’utilisabilité des sessions longues sans perdre le contexte des travaux antérieurs.

La compaction réécrit l’historique ancien sous forme de résumé sur la branche courante.
Le résumé de branche capture le contexte d’une branche abandonnée lors de la navigation /tree.

Les deux sont persistés sous forme d’entrées de session et reconvertis en messages de contexte utilisateur lors de la reconstruction de l’entrée LLM.

Fichiers d’implémentation clés

src/session/compaction/compaction.ts
src/session/compaction/branch-summarization.ts
src/session/compaction/pruning.ts
src/session/compaction/utils.ts
src/session/session-manager.ts
src/session/agent-session.ts
src/session/messages.ts
src/extensibility/hooks/types.ts
src/config/settings-schema.ts

Modèle d’entrée de session

La compaction et les résumés de branches sont des entrées de session de premier ordre, et non de simples messages assistant/utilisateur.

CompactionEntry
- type: "compaction"
- summary, shortSummary optionnel
- firstKeptEntryId (limite de compaction)
- tokensBefore
- details, preserveData, fromExtension optionnels
BranchSummaryEntry
- type: "branch_summary"
- fromId, summary
- details, fromExtension optionnels

Lors de la reconstruction du contexte (buildSessionContext) :

La dernière compaction sur le chemin actif est convertie en un message compactionSummary.
Les entrées conservées depuis firstKeptEntryId jusqu’au point de compaction sont réintégrées.
Les entrées ultérieures sur le chemin sont ajoutées.
Les entrées branch_summary sont converties en messages branchSummary.
Les entrées custom_message sont converties en messages custom.

Ces rôles personnalisés sont ensuite transformés en messages utilisateur destinés au LLM dans convertToLlm() à l’aide des modèles statiques :

prompts/compaction/compaction-summary-context.md
prompts/compaction/branch-summary-context.md

Pipeline de compaction

Déclencheurs

La compaction peut s’exécuter de trois façons :

Manuelle : /compact [instructions] appelle AgentSession.compact(...).
Récupération automatique de dépassement : après une erreur assistant correspondant à un dépassement de contexte.
Compaction automatique par seuil : après un tour réussi lorsque le contexte dépasse le seuil.

Forme de la compaction (visuelle)

Avant compaction :

  entrée:  0     1     2     3      4     5     6      7      8     9
        ┌─────┬─────┬─────┬──────┬─────┬─────┬──────┬──────┬─────┬──────┐
        │ hdr │ usr │ ass │ tool │ usr │ ass │ tool │ tool │ ass │ tool │
        └─────┴─────┴─────┴──────┴─────┴─────┴──────┴──────┴─────┴──────┘
                └────────┬───────┘ └──────────────┬──────────────┘
               messagesToSummarize            messages conservés
                                   ↑
                          firstKeptEntryId (entrée 4)

Après compaction (nouvelle entrée ajoutée) :

  entrée:  0     1     2     3      4     5     6      7      8     9      10
        ┌─────┬─────┬─────┬──────┬─────┬─────┬──────┬──────┬─────┬──────┬─────┐
        │ hdr │ usr │ ass │ tool │ usr │ ass │ tool │ tool │ ass │ tool │ cmp │
        └─────┴─────┴─────┴──────┴─────┴─────┴──────┴──────┴─────┴──────┴─────┘
               └──────────┬──────┘ └──────────────────────┬───────────────────┘
                 non envoyé au LLM                    envoyé au LLM
                                                         ↑
                                              commence depuis firstKeptEntryId

Ce que voit le LLM :

  ┌────────┬─────────┬─────┬─────┬──────┬──────┬─────┬──────┐
  │ system │ summary │ usr │ ass │ tool │ tool │ ass │ tool │
  └────────┴─────────┴─────┴─────┴──────┴──────┴─────┴──────┘
       ↑         ↑      └─────────────────┬────────────────┘
    prompt   from cmp          messages depuis firstKeptEntryId

Compaction par dépassement avec reprise vs compaction par seuil

Les deux chemins automatiques sont intentionnellement différents :

Compaction par dépassement avec reprise
- Déclencheur : une erreur assistant du modèle courant est détectée comme dépassement de contexte.
- Le message d’erreur assistant défaillant est retiré de l’état actif de l’agent avant la reprise.
- La compaction automatique s’exécute avec reason: "overflow" et willRetry: true.
- En cas de succès, l’agent continue automatiquement (agent.continue()) après la compaction.
Compaction par seuil
- Déclencheur : contextTokens > contextWindow - compaction.reserveTokens.
- S’exécute avec reason: "threshold" et willRetry: false.
- En cas de succès, si compaction.autoContinue !== false, injecte une invite synthétique :
  - "Continue if you have next steps."

Élagage avant compaction

Avant les vérifications de compaction, un élagage des résultats d’outils peut s’exécuter (pruneToolOutputs).

Politique d’élagage par défaut :

Protéger les 40 000 tokens de sortie d’outils les plus récents.
Exiger au moins 20 000 tokens d’économies totales estimées.
Ne jamais élaguer les résultats d’outils provenant de skill ou read.

Les résultats d’outils élagués sont remplacés par :

[Output truncated - N tokens]

Si l’élagage modifie des entrées, le stockage de session est réécrit et l’état des messages de l’agent est actualisé avant les décisions de compaction.

Logique de limite et de point de coupure

prepareCompaction() ne considère que les entrées depuis la dernière entrée de compaction (le cas échéant).

Trouver l’index de compaction précédent.
Calculer boundaryStart = prevCompactionIndex + 1.
Adapter keepRecentTokens en utilisant le ratio d’utilisation mesuré lorsqu’il est disponible.
Exécuter findCutPoint() sur la fenêtre de limite.

Les points de coupure valides incluent :

les entrées de message avec les rôles : user, assistant, bashExecution, hookMessage, branchSummary, compactionSummary
les entrées custom_message
les entrées branch_summary

Règle absolue : ne jamais couper à toolResult.

Si des entrées de métadonnées non-message se trouvent immédiatement avant le point de coupure (model_change, thinking_level_change, libellés, etc.), elles sont intégrées dans la région conservée en déplaçant l’index de coupure vers l’arrière jusqu’à atteindre un message ou une limite de compaction.

Gestion des tours fractionnés

Si le point de coupure ne se trouve pas au début d’un tour utilisateur, la compaction le traite comme un tour fractionné.

La détection du début de tour considère ces éléments comme des limites de tour utilisateur :

message.role === "user"
message.role === "bashExecution"
entrée custom_message
entrée branch_summary

La compaction de tour fractionné génère deux résumés :

Résumé d’historique (messagesToSummarize)
Résumé de préfixe de tour (turnPrefixMessages)

Le résumé final stocké est fusionné comme suit :

<history summary>

---

**Turn Context (split turn):**

<turn prefix summary>

Génération de résumés

compact(...) construit des résumés à partir du texte de conversation sérialisé :

Convertir les messages via convertToLlm().
Sérialiser avec serializeConversation().
Envelopper dans <conversation>...</conversation>.
Inclure optionnellement <previous-summary>...</previous-summary>.
Injecter optionnellement le contexte de hook sous forme de liste <additional-context>.
Exécuter l’invite de résumé avec SUMMARIZATION_SYSTEM_PROMPT.

Sélection de l’invite :

première compaction : compaction-summary.md
compaction itérative avec résumé antérieur : compaction-update-summary.md
deuxième passe de tour fractionné : compaction-turn-prefix.md
résumé court pour l’interface : compaction-short-summary.md

Mode de résumé distant :

Si compaction.remoteEndpoint est défini, la compaction envoie une requête POST :
- { systemPrompt, prompt }
Attend du JSON contenant au moins { summary }.

Contexte des opérations sur fichiers dans les résumés

La compaction suit l’activité cumulée sur les fichiers à l’aide des appels d’outils assistant :

read(path) → ensemble lu
write(path) → ensemble modifié
edit(path) → ensemble modifié

Comportement cumulatif :

Inclut les détails de compaction antérieurs uniquement si l’entrée précédente est générée par pi (fromExtension !== true).
Dans les tours fractionnés, inclut également les opérations sur fichiers du préfixe de tour.
readFiles exclut les fichiers également modifiés.

Des balises de fichiers sont ajoutées au texte du résumé via le modèle d’invite :

<read-files>
...
</read-files>
<modified-files>
...
</modified-files>

Persistance et rechargement

Après la génération du résumé (ou un résumé fourni par hook), la session agent :

Ajoute CompactionEntry avec appendCompaction(...).
Reconstruit le contexte via buildSessionContext().
Remplace les messages agent actifs par le contexte reconstruit.
Émet l’événement hook session_compact.

Pipeline de résumé de branche

Le résumé de branche est lié à la navigation dans l’arbre, et non au dépassement de tokens.

Déclencheur

Lors de navigateTree(...) :

Calculer les entrées abandonnées depuis l’ancienne feuille jusqu’à l’ancêtre commun à l’aide de collectEntriesForBranchSummary(...).
Si l’appelant a demandé un résumé (options.summarize), générer le résumé avant de changer de feuille.
Si un résumé existe, l’attacher à la cible de navigation avec branchWithSummary(...).

En pratique, ceci est généralement déclenché par le flux /tree lorsque branchSummary.enabled est activé.

Forme du changement de branche (visuelle)

Arbre avant navigation :

         ┌─ B ─ C ─ D (ancienne feuille, abandonnée)
    A ───┤
         └─ E ─ F (cible)

Ancêtre commun : A
Entrées à résumer : B, C, D

Après navigation avec résumé :

         ┌─ B ─ C ─ D ─ [résumé de B,C,D]
    A ───┤
         └─ E ─ F (nouvelle feuille)

Préparation et budget de tokens

generateBranchSummary(...) calcule le budget comme suit :

tokenBudget = model.contextWindow - branchSummary.reserveTokens

prepareBranchEntries(...) effectue ensuite :

Premier passage : collecter les opérations cumulées sur les fichiers depuis toutes les entrées résumées, y compris les détails branch_summary antérieurs générés par pi.
Deuxième passage : parcourir du plus récent au plus ancien, en ajoutant des messages jusqu’à atteindre le budget de tokens.
Préférer la préservation du contexte récent.
Peut tout de même inclure de grandes entrées de résumé proches de la limite du budget pour la continuité.

Les entrées de compaction sont incluses sous forme de messages (compactionSummary) lors de l’entrée en résumé de branche.

Génération et persistance du résumé

Le résumé de branche :

Convertit et sérialise les messages sélectionnés.
Enveloppe dans <conversation>.
Utilise des instructions personnalisées si fournies, sinon branch-summary.md.
Appelle le modèle de résumé avec SUMMARIZATION_SYSTEM_PROMPT.
Préfixe avec branch-summary-preamble.md.
Ajoute les balises d’opérations sur fichiers.

Le résultat est stocké sous forme de BranchSummaryEntry avec des détails optionnels (readFiles, modifiedFiles).

Points de contact avec les extensions et les hooks

`session_before_compact`

Hook de pré-compaction.

Peut :

annuler la compaction ({ cancel: true })
fournir un payload de compaction personnalisé complet ({ compaction: CompactionResult })

`session.compacting`

Hook de personnalisation de l’invite/contexte pour la compaction par défaut.

Peut retourner :

prompt (remplace l’invite de résumé de base)
context (lignes de contexte supplémentaires injectées dans <additional-context>)
preserveData (stocké sur l’entrée de compaction)

`session_compact`

Notification post-compaction avec compactionEntry sauvegardé et indicateur fromExtension.

`session_before_tree`

S’exécute lors de la navigation dans l’arbre avant la génération du résumé de branche par défaut.

Peut :

annuler la navigation
fournir un { summary: { summary, details } } personnalisé utilisé lorsque l’utilisateur a demandé un résumé

`session_tree`

Événement post-navigation exposant la nouvelle/ancienne feuille et l’entrée de résumé optionnelle.

Comportement à l’exécution et sémantique des erreurs

La compaction manuelle interrompt d’abord l’opération agent en cours.
abortCompaction() annule les contrôleurs de compaction manuelle et automatique.
La compaction automatique émet des événements de session de début/fin pour les mises à jour de l’interface/état.
La compaction automatique peut essayer plusieurs modèles candidats et relancer en cas d’échec transitoire.
Les erreurs de dépassement sont exclues du chemin de reprise générique car elles sont gérées par la compaction.
En cas d’échec de la compaction automatique :
- le chemin de dépassement émet Context overflow recovery failed: ...
- le chemin par seuil émet Auto-compaction failed: ...
Le résumé de branche peut être annulé via un signal d’abandon (par ex. Échap), retournant un résultat de navigation annulé/abandonné.

Paramètres et valeurs par défaut

Depuis settings-schema.ts :

compaction.enabled = true
compaction.reserveTokens = 16384
compaction.keepRecentTokens = 20000
compaction.autoContinue = true
compaction.remoteEndpoint = undefined
branchSummary.enabled = false
branchSummary.reserveTokens = 16384

Ces valeurs sont consommées à l’exécution par AgentSession et les modules de compaction/résumé de branches.