Scoperta e selezione degli agenti di task

Questo documento descrive come il sottosistema di task individua le definizioni degli agenti, unisce più sorgenti e risolve un agente richiesto al momento dell’esecuzione.

Copre il comportamento a runtime come implementato attualmente, inclusi la precedenza, la gestione delle definizioni non valide e i vincoli di spawn/profondità che possono rendere un agente effettivamente non disponibile.

File di implementazione

Struttura della definizione dell’agente

Gli agenti di task si normalizzano in AgentDefinition (src/task/types.ts):

name, description, systemPrompt (obbligatori per un agente caricato valido)
facoltativi: tools, spawns, model, thinkingLevel, output
source: "bundled" | "user" | "project"
facoltativo: filePath

Il parsing proviene dal frontmatter tramite parseAgentFields() (src/discovery/helpers.ts):

name o description mancanti => non valido (null), il chiamante lo tratta come errore di parsing
tools accetta CSV o array; se fornito, submit_result viene aggiunto automaticamente
spawns accetta *, CSV o array
comportamento di compatibilità con versioni precedenti: se spawns è assente ma tools include task, spawns diventa *
output viene trasmesso come dato di schema opaco

Agenti integrati

Gli agenti integrati sono incorporati al momento della build (src/task/agents.ts) tramite import testuali.

EMBEDDED_AGENT_DEFS definisce:

explore, plan, designer, reviewer dai file di prompt
task e quick_task dal corpo condiviso task.md con frontmatter iniettato

Percorso di caricamento:

loadBundledAgents() effettua il parsing del markdown incorporato con parseAgent(..., "bundled", "fatal")
i risultati vengono memorizzati nella cache in memoria (bundledAgentsCache)
clearBundledAgentsCache() è un reset della cache solo per i test

Poiché il parsing integrato usa level: "fatal", il frontmatter integrato malformato genera un’eccezione e può causare il fallimento della scoperta.

Scoperta tramite filesystem e plugin

discoverAgents(cwd, home) (src/task/discovery.ts) unisce gli agenti da più posizioni prima di aggiungere le definizioni integrate.

Input di scoperta

Directory degli agenti dalla configurazione utente tramite getConfigDirs("agents", { project: false })
Directory di configurazione del progetto più vicine tramite findAllNearestProjectConfigDirs("agents", cwd)
Root dei plugin Claude (listClaudePluginRoots(home)) con sottodirectory agents/
Agenti integrati (loadBundledAgents())

Ordine effettivo delle sorgenti

L’ordine delle famiglie di sorgenti proviene da getConfigDirs("", { project: false }), derivato da priorityList in src/config.ts:

.xcsh
.claude
.codex
.gemini

Per ogni famiglia di sorgenti, l’ordine di scoperta è:

directory del progetto più vicina per quella sorgente (se trovata)
directory utente per quella sorgente

Dopo tutte le directory delle famiglie di sorgenti, le directory agents/ dei plugin vengono aggiunte in fondo (prima i plugin con scope progetto, poi quelli con scope utente).

Gli agenti integrati vengono aggiunti per ultimi.

Avvertenza importante: commenti obsoleti vs codice attuale

I commenti nell’intestazione di discovery.ts menzionano ancora .pi e non menzionano .codex/.gemini. L’ordine effettivo a runtime è determinato da src/config.ts e attualmente usa .xcsh, .claude, .codex, .gemini.

Regole di unione e collisione

La scoperta utilizza la deduplicazione “primo-vince” per agent.name esatto:

Un Set<string> tiene traccia dei nomi già visti.
Gli agenti caricati vengono appiattiti nell’ordine delle directory e mantenuti solo se il nome non è già stato visto.
Gli agenti integrati vengono filtrati rispetto allo stesso insieme e aggiunti solo se ancora non presenti.

Implicazioni:

Il progetto sovrascrive l’utente per la stessa famiglia di sorgenti.
La famiglia di sorgenti con priorità più alta sovrascrive quella con priorità più bassa (.xcsh prima di .claude, ecc.).
Gli agenti non integrati sovrascrivono gli agenti integrati con lo stesso nome.
La corrispondenza dei nomi è sensibile alle maiuscole (Task e task sono distinti).
All’interno di una directory, i file markdown vengono letti in ordine lessicografico del nome file prima della deduplicazione.

Comportamento in caso di file agente non valido o mancante

Per directory (loadAgentsFromDir):

directory illeggibile/mancante: trattata come vuota (readdir(...).catch(() => []))
errore di lettura o parsing del file: viene registrato un avviso, il file viene saltato
il percorso di parsing usa parseAgent(..., level: "warn")

Il comportamento in caso di errore del frontmatter proviene da parseFrontmatter:

un errore di parsing al livello warn registra un avviso
il parser torna a un semplice parser di righe key: value
se i campi obbligatori sono ancora mancanti, parseAgentFields fallisce, quindi AgentParsingError viene generato e catturato dal chiamante (il file viene saltato)

Effetto netto: un file agente personalizzato non valido non interrompe la scoperta degli altri file.

Ricerca e selezione dell’agente

La ricerca è una ricerca lineare per nome esatto:

getAgent(agents, name) => agents.find(a => a.name === name)

Nell’esecuzione del task (TaskTool.execute):

gli agenti vengono riscoperti al momento della chiamata (discoverAgents(this.session.cwd))
il params.agent richiesto viene risolto tramite getAgent
un agente mancante restituisce una risposta immediata dello strumento:
- Unknown agent "...". Available: ...
- nessun sottoprocesso viene avviato

Descrizione vs scoperta al momento dell’esecuzione

TaskTool.create() costruisce la descrizione dello strumento dai risultati della scoperta al momento dell’inizializzazione (buildDescription).

execute() riscopre nuovamente gli agenti. Pertanto, l’insieme a runtime può differire da quello elencato nella descrizione dello strumento precedente se i file degli agenti sono cambiati durante la sessione.

Guardrail dell’output strutturato e precedenza dello schema

Precedenza dello schema di output a runtime in TaskTool.execute:

output del frontmatter dell’agente
params.schema della chiamata al task
outputSchema della sessione padre

(effectiveOutputSchema = effectiveAgent.output ?? outputSchema ?? this.session.outputSchema)

Il testo di guardrail nel prompt in src/prompts/tools/task.md avverte del comportamento in caso di mancata corrispondenza per gli agenti con output strutturato (explore, reviewer): le istruzioni sul formato dell’output in prosa possono entrare in conflitto con lo schema integrato e produrre output null.

Questa è una guida, non una logica di validazione rigida a runtime in discoverAgents.

Interazione con la scoperta dei comandi

src/task/commands.ts è un’infrastruttura parallela per i comandi del flusso di lavoro (non le definizioni degli agenti), ma segue lo stesso schema generale:

scoperta prima dai provider di capacità
deduplicazione per nome con primo-vince
aggiunta dei comandi integrati se ancora non presenti
ricerca per nome esatto tramite getCommand

In src/task/index.ts, i helper dei comandi vengono riesportati insieme agli helper della scoperta degli agenti. La scoperta degli agenti non dipende dalla scoperta dei comandi a runtime.

Vincoli di disponibilità oltre la scoperta

Un agente può essere individuabile ma comunque non disponibile per l’esecuzione a causa dei guardrail di esecuzione.

Policy di spawn del padre

TaskTool.execute controlla session.getSessionSpawns():

"*" => consenti qualsiasi
"" => nega tutto
lista CSV => consenti solo i nomi elencati

Se negato: risposta immediata Cannot spawn '...'. Allowed: ....

Guardia ambientale contro la ricorsione su se stesso

PI_BLOCKED_AGENT viene letto alla costruzione dello strumento. Se la richiesta corrisponde, l’esecuzione viene rifiutata con un messaggio di prevenzione della ricorsione.

Limitazione della profondità di ricorsione (disponibilità dello strumento task nelle sessioni figlio)

In runSubprocess (src/task/executor.ts):

la profondità viene calcolata da taskDepth
task.maxRecursionDepth controlla il limite
quando alla profondità massima:
- lo strumento task viene rimosso dall’elenco degli strumenti del figlio
- l’env spawns del figlio viene impostato su vuoto

Pertanto, i livelli più profondi non possono generare ulteriori task anche se la definizione dell’agente include spawns.

Avvertenza sulla modalità piano (implementazione attuale)

TaskTool.execute calcola un effectiveAgent per la modalità piano (antepone il prompt della modalità piano, forza un sottoinsieme di strumenti in sola lettura, azzera gli spawn), ma runSubprocess viene chiamato con agent anziché effectiveAgent.

Effetto attuale:

l’override del modello / il livello di pensiero / lo schema di output sono derivati da effectiveAgent
il prompt di sistema e le restrizioni su strumenti/spawn di effectiveAgent non vengono trasmessi in questo percorso di chiamata

Questa è un’avvertenza implementativa da tenere a mente quando si analizzano le aspettative sul comportamento della modalità piano.