Stream Modes · LangChain.js Agent 指南

模块 05 - Agent 架构 | 前置知识：createAgent 入门、LangGraph 入门

为什么单独讲一节流式

把 Agent 包成一个 HTTP 接口、做一个 ChatGPT 一样的实时打字效果，绕不开 LangGraph 的流式 API。这一节会拆透两套 API：

graph.stream(input, options)：节点级流式，8 种 stream mode
graph.streamEvents(input, options)：事件级流式，token 级别推送

createAgent 返回的 Agent 也是一个 graph，所以本节方法对它同样适用。

stream mode 一览

stream() 的 streamMode 选项决定推什么粒度的数据。LangGraph 1.x 共 8 个值：

Mode	推什么	用在哪里
`values`	每次 state 更新后的完整 state	调试、状态可视化
`updates`	每个节点产出的增量 state	日志、审计、节点级监控
`messages`	模型 token 级流（message + metadata）	聊天 UI
`debug`	所有 internal 事件 + 节点输入输出	深度调试
`custom`	用户自定义事件（用 `dispatchCustomEvent`）	业务级埋点
`checkpoints`	每次 checkpoint 写入后的快照	持久化进度监控、时间旅行调试
`tasks`	任务级开始/结束日志（含 interrupt）	节点任务粒度的追踪
`tools`	工具调用专用流	单独监听工具执行

可以传多个：streamMode: ["updates", "messages"]，事件流里每个 chunk 带 (mode, data) 元组。

`values`：完整快照


import { createAgent } from "langchain";
import { ChatAnthropic } from "@langchain/anthropic";
 
const agent = createAgent({
  model: new ChatAnthropic({ model: "claude-sonnet-4-6" }),
  tools: [/* ... */],
  systemPrompt: "...",
});
 
for await (const snapshot of agent.stream(
  { messages: [{ role: "user", content: "..." }] },
  { streamMode: "values" }
)) {
  console.log("state snapshot:", snapshot);
  // snapshot.messages 是当前完整的消息列表
}

每次有节点完成，就推一份当前完整的 state。数据量大，主要用于状态可视化。

`updates`：增量更新


for await (const update of agent.stream(input, { streamMode: "updates" })) {
  // update 是 { 节点名: 该节点输出的增量 } 的形式
  // 例如 { model_request: { messages: [新 AI 消息] } }（createAgent 内部模型节点名）
  console.log(JSON.stringify(update, null, 2));
}

最常用于审计日志和节点级监控。能清晰看到”模型刚说了啥”、“工具刚返回了啥”。

`messages`：token 级流


for await (const [chunk, metadata] of agent.stream(input, {
  streamMode: "messages",
})) {
  // chunk 是 AIMessageChunk
  // metadata 含节点名、tags 等（createAgent 内部模型节点名是 "model_request"）
  if (metadata.langgraph_node === "model_request") {
    process.stdout.write(chunk.contentBlocks?.[0]?.text ?? "");
  }
}

这是做”ChatGPT 实时打字”效果的官方方式。每个 chunk 是模型的部分 token，按节点过滤后写到 stdout 或 SSE 通道。

`custom`：业务级埋点

在 tool 或 middleware 里手动发事件：


import { dispatchCustomEvent } from "@langchain/core/callbacks/dispatch";
 
const mySlowTool = tool(
  async ({ url }) => {
    await dispatchCustomEvent("download_started", { url });
    const data = await downloadFile(url);
    await dispatchCustomEvent("download_finished", { url, size: data.length });
    return `Downloaded ${data.length} bytes`;
  },
  { name: "download", description: "...", schema: /* ... */ }
);
 
// 消费端：
for await (const event of agent.stream(input, { streamMode: "custom" })) {
  console.log("custom event:", event);
}

适合给前端推业务进度，比如”正在下载…”/“已下载 80%“。

直接产出 SSE（Server-Sent Events）

把 LangGraph 的事件流包成 HTTP SSE 是常见需求。stream() 直接支持：


const sseStream = await agent.stream(input, {
  streamMode: "messages",
  encoding: "text/event-stream",
});
 
// sseStream 是 ReadableStream<Uint8Array>，每个 chunk 已经是 SSE 格式
//   data: {"event":"on_chat_model_stream","data":{...}}\n\n

在 Hono / Express / Next.js Route Handler 里直接当作 response body 返回：


// Hono 示例
import { Hono } from "hono";
 
const app = new Hono();
 
app.post("/chat", async (c) => {
  const { message } = await c.req.json();
  const sseStream = await agent.stream(
    { messages: [{ role: "user", content: message }] },
    { streamMode: "messages", encoding: "text/event-stream" }
  );
  return new Response(sseStream, {
    headers: {
      "Content-Type": "text/event-stream",
      "Cache-Control": "no-cache",
      Connection: "keep-alive",
    },
  });
});

前端用 EventSource 或 fetch + ReadableStream 消费。完整的生产部署细节在流式接口 SSE / WebSocket。

`streamEvents` 详解

streamEvents 比 stream 更细：拿到的不是节点级数据，而是事件级（每个组件的开始 / 流式 chunk / 结束）。


for await (const event of agent.streamEvents(input, { version: "v2" })) {
  // event = { event, name, data, run_id, parent_ids, tags, metadata }
  switch (event.event) {
    case "on_chat_model_start":
      console.log(`模型 ${event.name} 开始调用`);
      break;
    case "on_chat_model_stream":
      // event.data.chunk 是 AIMessageChunk
      process.stdout.write(event.data.chunk.contentBlocks?.[0]?.text ?? "");
      break;
    case "on_chat_model_end":
      console.log(`\n模型调用结束，total tokens:`, event.data.output.usage_metadata);
      break;
    case "on_tool_start":
      console.log(`工具 ${event.name} 被调用，参数:`, event.data.input);
      break;
    case "on_tool_end":
      console.log(`工具 ${event.name} 返回:`, event.data.output);
      break;
  }
}

streamEvents 事件类型完整列表（v2）：


on_chat_model_start / on_chat_model_stream / on_chat_model_end
on_llm_start / on_llm_stream / on_llm_end
on_chain_start / on_chain_stream / on_chain_end
on_tool_start / on_tool_end
on_retriever_start / on_retriever_end
on_prompt_start / on_prompt_end
on_custom_event

createAgent 返回的 Agent 还支持 streamEvents(input, { version: "v3" })，返回一个 AgentRunStream，提供 run.messages / run.toolCalls / run.middleware / run.output 等类型化投影，比 v2 手动 switch 事件名更省心。v3 目前标注为实验性，API 可能调整，未来会成为默认；想要稳定接口仍用 version: "v2"。

`stream` vs `streamEvents` 怎么选

维度	`stream`	`streamEvents`
数据粒度	节点级（粗）	组件级（细）
事件流量	中（每节点 1-N 条）	大（每组件 3+ 条）
上手难度	低	高（事件类型多）
适用场景	聊天 UI、节点监控、SSE	深度调试、复杂前端可视化
性能	好	一般（事件多）

同样一次”模型生成 + 一次工具调用”的执行，两套 API 推出来的事件粒度差异如图 5-8 所示——stream 一个节点推一条（粗），streamEvents 把每个组件的开始/流式/结束都拆出来（细）。

图 5-8：stream 与 streamEvents 的事件粒度对比。同一段执行，stream 每个节点只推一条增量，streamEvents 把每个组件的生命周期事件全推出来——流量大但能做精细的前端可视化。

原则：先用 stream，遇到 stream 拿不到的东西再上 streamEvents。生产环境的聊天 UI 99% 用 stream({ streamMode: "messages" }) 就够了。

几个常见陷阱

1. messages 模式拿不到某些事件

messages 模式只推模型节点的 token chunk。如果你想看工具执行进度，需要：

加 streamMode: ["messages", "updates"]，从 updates 里看工具结果
或者在 tool 里 dispatchCustomEvent，用 custom mode 拿

2. token chunk 里的 `contentBlocks`

1.x 用 contentBlocks 取代旧的 content（多模态统一）。聊天 UI 里要这样取文本：


// 正确（1.x 多模态统一）
const text = chunk.contentBlocks
  ?.filter((b) => b.type === "text")
  .map((b) => b.text)
  .join("") ?? "";
 
// 老式写法（仅纯文本场景，1.x 仍可用但不推荐）
const text = typeof chunk.content === "string" ? chunk.content : "";

如果用户上传图片、Claude 用 thinking blocks，contentBlocks 是唯一安全的读法。

3. SSE 反向代理 buffering

如果用 Nginx / Cloudflare 在前面，必须关掉 buffering：


# Nginx
proxy_buffering off;
proxy_cache off;

# Cloudflare：用 Workers 直接转发，不要走 page rules 的缓存

否则会出现”全部 token 攒到一起，几秒后一次性吐出来”。

4. 客户端断开后清理


const abortController = new AbortController();
 
req.on("close", () => abortController.abort());
 
const stream = await agent.stream(input, {
  streamMode: "messages",
  signal: abortController.signal,
});

不传 signal 的话，客户端断开后 Agent 仍然会跑完整个循环，浪费 token。

把这一切组合：一个生产级流式接口


// app.ts (Hono)
import { Hono } from "hono";
import { createAgent } from "langchain";
import { ChatAnthropic } from "@langchain/anthropic";
 
const agent = createAgent({
  model: new ChatAnthropic({ model: "claude-sonnet-4-6" }),
  tools: [/* ... */],
  systemPrompt: "...",
});
 
const app = new Hono();
 
app.post("/chat/stream", async (c) => {
  const { messages, thread_id } = await c.req.json();
  const abortController = new AbortController();
 
  c.req.raw.signal.addEventListener("abort", () => abortController.abort());
 
  const stream = await agent.stream(
    { messages },
    {
      streamMode: "messages",
      encoding: "text/event-stream",
      configurable: { thread_id },
      signal: abortController.signal,
    }
  );
 
  return new Response(stream, {
    headers: {
      "Content-Type": "text/event-stream",
      "Cache-Control": "no-cache",
      "X-Accel-Buffering": "no", // Nginx 禁 buffering
    },
  });
});
 
export default app;

前端用标准 EventSource：


const es = new EventSource("/chat/stream", { method: "POST", body: JSON.stringify({...}) });
es.onmessage = (e) => {
  const event = JSON.parse(e.data);
  if (event.event === "on_chat_model_stream") {
    appendToUI(event.data.chunk.contentBlocks?.[0]?.text ?? "");
  }
};

完整的部署细节（包括 WebSocket 备选方案、负载均衡时的 sticky session 配置）在流式接口 SSE / WebSocket。

小结

LangGraph 的流式 API 分两层：stream() 用 8 种 mode 推节点级或 token 级数据，streamEvents() 推组件级事件。聊天 UI 默认用 stream({ streamMode: "messages", encoding: "text/event-stream" })，调试用 streamMode: "updates"，业务埋点用 dispatchCustomEvent + streamMode: "custom"。

下一节 Deep Agents 进入更复杂的 Agent 形态：规划、子代理、虚拟文件系统，专门对付长周期任务。

本文摘自《LangChain.js Agent 开发权威指南》，作者递归客。

本书资源

源码仓库 · github.com/diguike/book-langchain-agent
在线阅读 · inferloop.dev/langchain-agent
所有书目 · inferloop.dev

继续阅读 · 同作者其他书

《Transformer 工程实战》
从注意力机制到生产部署
《自己动手写 AI Agent》
从 Claude Code 开源架构到你的第一个编程助手
《AI 时代的 CLI 工具开发实战》
用 TypeScript 构建现代 CLI 工具
《LLM Infra 工程实战》
从入门到实践
《Hermes Agent 实战》
构建会成长的个人 AI Agent
《OpenClaw 源码解析》
现代 Agent 系统的架构设计与工程实践
《Agent Memory 工程实战》
从 claude-mem 源码到企业级记忆平台
《AI Token 中转站实战》
从 0 搭建企业级 LLM 网关
《百万级 AI Agent 平台架构》
智能客服 SaaS 实战
《AI Agent 评测工程实战》
从 0 用 TypeScript 构建你的评测平台
《Agent Harness 评测工程》
用评测建设并守护一个 agent harness
《源码精读》
每章一个开源仓库 · 从架构到品味
《Claude Code Skill 指南》
《Claude 插件官方指南》