Skip to content

Streaming 流式输出

流式输出可以让用户更快看到模型回答,类似 ChatGPT 一个字一个字输出。

适用场景

  • 聊天机器人。
  • 长文本生成。
  • 报告生成。
  • 代码生成。

后端实现方式

常见方式:

  • Python FastAPI + StreamingResponse。
  • Java Spring Boot + SseEmitter。
  • WebFlux + Server-Sent Events。
  • WebSocket。

注意事项

  1. 流式输出过程中也要记录完整结果。
  2. 用户断开连接时要能中断或清理资源。
  3. 敏感内容过滤如果放在输出后,会有边生成边泄露风险。
  4. Agent 工具调用的中间事件也可以流式展示,用于提升可解释性。

非官方声明

本站为个人维护的非官方中文学习文档,不代表 LangChain 官方。页面内容是基于公开文档、源码实践和中文开发者视角重新整理的学习资料。涉及 API 细节时,请以官方文档和实际安装版本为准。

参考来源

  • LangChain / LangGraph 官方文档:https://docs.langchain.com/
  • LangChain API Reference:https://reference.langchain.com/
  • 本站内容为中文学习整理,不做官方身份声明。

本站为非官方中文学习站点,不代表 LangChain 官方。部分内容参考官方文档并重新整理为中文学习笔记。