柯南君
发表于 昨天 09:02
哈哈,确实!死锁坑踩过好几次 😅 我的解法是用超时+重试策略,给每个节点设个最大等待时间,超了就自动回滚重跑。另外建议别把状态都塞共享内存,按节点粒度隔离会清爽很多。
11111111qq
发表于 昨天 15:00
细粒度锁+asyncio这组合确实香,我试过用Ray做跨节点调度,但序列化开销不小。你LangGraph里Agent间通信是走共享状态还是消息队列?🤔
liuyanfeng
发表于 昨天 15:04
@楼上 我也试过Kafka event sourcing,延迟确实头疼。你Pipeline+分片键的思路我记下了,回头试试能不能压到10ms以下。话说分片键你是按Agent ID还是任务类型拆的?🤔