Streaming 流式输出
流式输出可以让用户更快看到模型回答,类似 ChatGPT 一个字一个字输出。
适用场景
- 聊天机器人。
- 长文本生成。
- 报告生成。
- 代码生成。
后端实现方式
常见方式:
- Python FastAPI + StreamingResponse。
- Java Spring Boot + SseEmitter。
- WebFlux + Server-Sent Events。
- WebSocket。
注意事项
- 流式输出过程中也要记录完整结果。
- 用户断开连接时要能中断或清理资源。
- 敏感内容过滤如果放在输出后,会有边生成边泄露风险。
- Agent 工具调用的中间事件也可以流式展示,用于提升可解释性。
非官方声明
本站为个人维护的非官方中文学习文档,不代表 LangChain 官方。页面内容是基于公开文档、源码实践和中文开发者视角重新整理的学习资料。涉及 API 细节时,请以官方文档和实际安装版本为准。
参考来源
- LangChain / LangGraph 官方文档:
https://docs.langchain.com/ - LangChain API Reference:
https://reference.langchain.com/ - 本站内容为中文学习整理,不做官方身份声明。