Provider 串流內部機制

本文件說明 @f5-sales-demo/pi-ai 中 token/工具串流的標準化方式，以及如何透過 @f5-sales-demo/pi-agent-core 和 coding-agent 的工作階段事件進行傳播。

端對端流程

streamSimple()（packages/ai/src/stream.ts）映射通用選項並分派至 provider 串流函式。
Provider 串流函式（anthropic.ts、openai-responses.ts、google.ts）將 provider 原生串流事件轉換為統一的 AssistantMessageEvent 序列。
每個 provider 將事件推送至 AssistantMessageEventStream（packages/ai/src/utils/event-stream.ts），該元件會節流 delta 事件並提供：
- 用於增量更新的非同步迭代
- result() 用於取得最終的 AssistantMessage
agentLoop（packages/agent/src/agent-loop.ts）消費這些事件，變更進行中的助理狀態，並發出攜帶原始 assistantMessageEvent 的 message_update 事件。
AgentSession（packages/coding-agent/src/session/agent-session.ts）訂閱代理事件、持久化訊息、驅動擴充掛鉤，並套用工作階段行為（重試、壓縮、TTSR、串流編輯中止檢查）。

`@f5-sales-demo/pi-ai` 中的統一串流契約

所有 provider 發出相同的結構（packages/ai/src/types.ts 中的 AssistantMessageEvent）：

start
內容區塊生命週期三元組：
- 文字：text_start → text_delta* → text_end
- 思考：thinking_start → thinking_delta* → thinking_end
- 工具呼叫：toolcall_start → toolcall_delta* → toolcall_end
終端事件：
- done，附帶 reason: "stop" | "length" | "toolUse"
- 或 error，附帶 reason: "aborted" | "error"

AssistantMessageEventStream 保證：

最終結果由終端事件（done 或 error）解析
delta 事件會批次/節流處理（約 50ms）
緩衝的 delta 在非 delta 事件之前以及完成之前會被清空

Delta 節流與協調行為

AssistantMessageEventStream 將 text_delta、thinking_delta 和 toolcall_delta 視為可合併事件：

緩衝的 delta 僅在 type + contentIndex 匹配時才會合併
合併保留最新的 partial 快照
非 delta 事件會強制立即清空緩衝

這能平滑高頻 provider 串流以供 TUI/事件消費者使用，但並非 provider 背壓機制：provider 仍以全速產出，本地串流僅進行緩衝。

Provider 標準化細節

Anthropic（`anthropic-messages`）

來源：packages/ai/src/providers/anthropic.ts

標準化要點：

message_start 初始化使用量（輸入/輸出/快取 token）
content_block_start 映射至文字/思考/工具呼叫的開始事件
content_block_delta 映射：
- text_delta → text_delta
- thinking_delta → thinking_delta
- input_json_delta → toolcall_delta
- signature_delta 僅更新 thinkingSignature（不發出事件）
content_block_stop 發出對應的 *_end
message_delta.stop_reason 透過 mapStopReason() 映射

工具呼叫參數串流：

每個工具區塊攜帶內部 partialJson
每個 JSON delta 追加至 partialJson
arguments 在每次 delta 時透過 parseStreamingJson() 重新解析
toolcall_end 再次重新解析，然後移除 partialJson

OpenAI Responses（`openai-responses`）

來源：packages/ai/src/providers/openai-responses.ts

標準化要點：

response.output_item.added 開始推理/文字/函式呼叫區塊
推理摘要事件（response.reasoning_summary_text.delta）成為 thinking_delta
輸出/拒絕 delta 成為 text_delta
response.function_call_arguments.delta 成為 toolcall_delta
response.output_item.done 發出 thinking_end / text_end / toolcall_end
response.completed 將狀態映射至停止原因和使用量

工具呼叫參數串流：

與 Anthropic 相同的 partialJson 累積模式
僅發送 response.function_call_arguments.done 的 provider 仍會填充最終參數
工具呼叫 ID 標準化為 "<call_id>|<item_id>"

Google Generative AI（`google-generative-ai`）

來源：packages/ai/src/providers/google.ts

標準化要點：

迭代 candidate.content.parts
文字部分透過 isThinkingPart(part) 區分思考與文字
區塊轉換時會先關閉前一個區塊再開始新區塊
part.functionCall 被視為完整的工具呼叫（立即發出 start/delta/end）
結束原因透過 google-shared.ts 中的 mapStopReason() 映射

工具呼叫參數串流：

函式呼叫參數以結構化物件到達，非增量 JSON 文字
實作發出一個合成的 toolcall_delta，包含 JSON.stringify(arguments)
此路徑中 Google 不需要部分 JSON 解析器

部分工具呼叫 JSON 累積與恢復

Anthropic/OpenAI Responses 的共用行為使用 parseStreamingJson()（packages/ai/src/utils/json-parse.ts）：

嘗試 JSON.parse
退回使用 partial-json 解析器處理不完整片段
若兩者都失敗，回傳 {}

影響：

格式錯誤或截斷的參數 delta 不會立即導致串流處理崩潰
進行中的 arguments 可能暫時為 {}
後續有效的 delta 可以恢復結構化參數，因為每次追加都會重新嘗試解析
最終的 toolcall_end 在發出前會執行最後一次解析嘗試

停止原因 vs 傳輸/執行期錯誤

Provider 停止原因映射至標準化的 stopReason：

Anthropic：end_turn→stop、max_tokens→length、tool_use→toolUse、安全/拒絕情況→error
OpenAI Responses：completed→stop、incomplete→length、failed/cancelled→error
Google：STOP→stop、MAX_TOKENS→length、安全/禁止/格式錯誤函式呼叫類別→error

錯誤語意分為兩個階段：

模型完成語意（provider 回報的結束原因/狀態）
傳輸/執行期失敗（網路/客戶端/解析器/中止例外）

若 provider 串流拋出例外或發出失敗訊號，每個 provider 包裝器會捕獲並發出終端 error 事件，包含：

當中止訊號被設定時 stopReason = "aborted"
否則 stopReason = "error"
errorMessage = formatErrorMessageWithRetryAfter(error)

格式錯誤的區塊 / SSE 解析失敗行為

對於這些 provider 路徑，區塊/SSE 框架處理由供應商 SDK 串流負責（Anthropic SDK、OpenAI SDK、Google SDK）。此程式碼在此處不實作自訂 SSE 解碼器。

目前實作中觀察到的行為：

SDK 層級的格式錯誤區塊/SSE 解析會以例外或串流 error 事件浮現
Provider 包裝器將其轉換為統一的終端 error 事件
串流函式本身內部不進行 provider 特定的恢復/重試
更高層級的重試在 AgentSession 自動重試邏輯中處理（訊息層級重試，非串流區塊重播）

取消邊界

取消機制是分層的：

AI provider 請求：options.signal 傳入 provider 客戶端串流呼叫。
Provider 包裝器：串流迴圈結束後，已中止的訊號強制進入錯誤路徑（"Request was aborted"）。
代理迴圈：在處理每個 provider 事件之前檢查 signal.aborted，並可從最新的部分內容合成已中止的助理訊息。
工作階段/代理控制：AgentSession.abort() -> agent.abort() -> 共用中止控制器取消。

工具執行取消與模型串流取消是分開的：

工具執行器使用 AbortSignal.any([agentSignal, steeringAbortSignal])
導向中斷可以中止剩餘的工具執行，同時保留已產出的工具結果

背壓邊界

Provider SDK 串流與下游消費者之間沒有硬性背壓機制：

EventStream 使用無最大大小限制的記憶體內佇列
節流降低 UI 更新頻率但不會減緩 provider 的接收速度
若消費者顯著落後，排隊的事件可能會持續增長直到完成

目前的設計偏好回應性和簡單的排序，而非有界緩衝區的流量控制。

串流事件如何以代理/工作階段事件呈現

agentLoop.streamAssistantResponse() 將 AssistantMessageEvent 橋接至 AgentEvent：

於 start：推送佔位的助理訊息並發出 message_start
於區塊事件（text_*、thinking_*、toolcall_*）：更新最後的助理訊息，發出附帶原始 assistantMessageEvent 的 message_update
於終端事件（done/error）：從 response.result() 解析最終訊息，發出 message_end

AgentSession 隨後消費這些事件以進行工作階段層級的行為：

TTSR 監看 message_update.assistantMessageEvent 中的 text_delta 和 toolcall_delta
串流編輯防護檢查 edit 呼叫上的 toolcall_delta/toolcall_end 並可提前中止
持久化在 message_end 時寫入已完成的訊息
自動重試檢查助理的 stopReason === "error" 加上 errorMessage 啟發式規則

統一 vs provider 特定的職責

統一（共用契約）：

事件結構（AssistantMessageEvent）
最終結果擷取（done/error）
delta 節流 + 合併規則
代理/工作階段事件傳播模型

Provider 特定（未完全抽象化）：

上游事件分類法和映射邏輯
停止原因轉換表
工具呼叫 ID 慣例
推理/思考區塊語意和簽章
使用量 token 語意和可用性時機
每個 API 的訊息轉換限制

實作檔案

../../ai/src/stream.ts — provider 分派、選項映射、API 金鑰/工作階段配管。
../../ai/src/utils/event-stream.ts — 通用串流佇列 + 助理 delta 節流。
../../ai/src/utils/json-parse.ts — 串流工具參數的部分 JSON 解析。
../../ai/src/providers/anthropic.ts — Anthropic 事件轉換和工具 JSON delta 累積。
../../ai/src/providers/openai-responses.ts — OpenAI Responses 事件轉換和狀態映射。
../../ai/src/providers/google.ts — Gemini 串流區塊到區塊的轉換。
../../ai/src/providers/google-shared.ts — Gemini 結束原因映射和共用轉換規則。
../../agent/src/agent-loop.ts — provider 串流消費和 message_update 橋接。
../src/session/agent-session.ts — 串流更新、中止、重試和持久化的工作階段層級處理。

Provider 串流內部機制

端對端流程

@f5-sales-demo/pi-ai 中的統一串流契約

Delta 節流與協調行為

Provider 標準化細節

Anthropic（anthropic-messages）

OpenAI Responses（openai-responses）

Google Generative AI（google-generative-ai）

部分工具呼叫 JSON 累積與恢復

停止原因 vs 傳輸/執行期錯誤

格式錯誤的區塊 / SSE 解析失敗行為

取消邊界

背壓邊界

串流事件如何以代理/工作階段事件呈現

統一 vs provider 特定的職責

實作檔案

`@f5-sales-demo/pi-ai` 中的統一串流契約

Anthropic（`anthropic-messages`）

OpenAI Responses（`openai-responses`）

Google Generative AI（`google-generative-ai`）