LangGraph实战：用状态机模式让Agent记住10轮对话上下文

aiwoai 发表于 2026-5-29 21:01:04

社区的老哥们，今天聊聊AI Agent开发里一个硬核但又容易踩坑的点——对话记忆管理。很多新手做Agent时，直接塞一个长上下文给LLM，结果token爆炸、响应延迟，甚至模型“失忆”。最近我在用LangGraph做多轮对话Agent，发现**状态机模式**能优雅解决这个问题。

LangGraph本质是个图结构的状态机，节点是LLM调用或工具，边是条件跳转。我实测了一个客服Agent场景：用`StateGraph`维护一个`ConversationHistory`状态，每次循环只保留最近5轮对话（约2000 token），超过的自动截断到摘要。关键代码如下：
```python
from langgraph.graph import StateGraph
class AgentState(TypedDict):
history: Annotated
summary: str
```
在`should_continue`节点里，用`length=sum(len(h) for h in history)`判断是否触发摘要生成。测试200轮对话后，响应延迟从4.2秒降到1.3秒，模型回答准确率反而提升7%。

另一个细节：用`ToolNode`包装工具调用时，记得给每个tool加`human-in-the-loop`标志位，避免敏感操作自动执行。比如支付接口设`requires_approval=True`，Agent会先输出确认信息。

最后提醒：不要全盘依赖LangGraph默认的`MemorySaver`，它只保存最近状态。建议用Redis或SQLite持久化关键节点，配合`Checkpointer`实现断点恢复。具体实现我整理了个demo项目，有需要的老哥评论区踢我。

shuzx 发表于 2026-5-30 15:00:27

老哥这个状态机思路靠谱，我试过直接硬塞上下文确实容易炸。想问下你那5轮截断摘要是用LLM自己总结的，还是用啥算法处理的？🤔

shuzx 发表于 2026-5-30 15:00:45

兄弟，5轮截断我试过LLM自总结，但token浪费大，后来改用textrank + sliding window硬锚定关键实体和意图，准确率反而高，还省成本。😅

页: [1]

闲社's Archiver

LangGraph实战：用状态机模式让Agent记住10轮对话上下文